JP2023029945A - 癌のエピジェネティックプロファイリング - Google Patents
癌のエピジェネティックプロファイリング Download PDFInfo
- Publication number
- JP2023029945A JP2023029945A JP2022193109A JP2022193109A JP2023029945A JP 2023029945 A JP2023029945 A JP 2023029945A JP 2022193109 A JP2022193109 A JP 2022193109A JP 2022193109 A JP2022193109 A JP 2022193109A JP 2023029945 A JP2023029945 A JP 2023029945A
- Authority
- JP
- Japan
- Prior art keywords
- enhancer
- super
- cancer
- biological sample
- enhancers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims description 324
- 201000011510 cancer Diseases 0.000 title claims description 279
- 230000001973 epigenetic effect Effects 0.000 title description 3
- 239000003623 enhancer Substances 0.000 claims abstract description 634
- 239000012472 biological sample Substances 0.000 claims abstract description 174
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 78
- 230000004048 modification Effects 0.000 claims abstract description 76
- 238000012986 modification Methods 0.000 claims abstract description 76
- 108010033040 Histones Proteins 0.000 claims abstract description 69
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 61
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 61
- 238000013507 mapping Methods 0.000 claims abstract description 52
- 230000008859 change Effects 0.000 claims abstract description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 26
- 210000004027 cell Anatomy 0.000 claims description 221
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 111
- 206010017758 gastric cancer Diseases 0.000 claims description 111
- 201000011549 stomach cancer Diseases 0.000 claims description 111
- 108090000623 proteins and genes Proteins 0.000 claims description 99
- 108091023040 Transcription factor Proteins 0.000 claims description 62
- 102000040945 Transcription factor Human genes 0.000 claims description 61
- 210000001519 tissue Anatomy 0.000 claims description 47
- 230000000694 effects Effects 0.000 claims description 38
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 33
- 108010077544 Chromatin Proteins 0.000 claims description 26
- 210000003483 chromatin Anatomy 0.000 claims description 26
- 230000004083 survival effect Effects 0.000 claims description 25
- 102100038447 Claudin-4 Human genes 0.000 claims description 20
- 101000882890 Homo sapiens Claudin-4 Proteins 0.000 claims description 20
- 239000003112 inhibitor Substances 0.000 claims description 20
- 239000000090 biomarker Substances 0.000 claims description 17
- 208000018522 Gastrointestinal disease Diseases 0.000 claims description 16
- 208000010643 digestive system disease Diseases 0.000 claims description 15
- 208000018685 gastrointestinal system disease Diseases 0.000 claims description 15
- 101001139130 Homo sapiens Krueppel-like factor 5 Proteins 0.000 claims description 14
- 102100020680 Krueppel-like factor 5 Human genes 0.000 claims description 14
- 108700026220 vif Genes Proteins 0.000 claims description 14
- 238000004393 prognosis Methods 0.000 claims description 11
- 108020004459 Small interfering RNA Proteins 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 9
- 101000677831 Homo sapiens Protein ABHD11 Proteins 0.000 claims description 8
- -1 KLH38 Proteins 0.000 claims description 8
- 102100021499 Protein ABHD11 Human genes 0.000 claims description 8
- 108010083123 CDX2 Transcription Factor Proteins 0.000 claims description 6
- 102000006277 CDX2 Transcription Factor Human genes 0.000 claims description 6
- 230000030833 cell death Effects 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 102100024152 Cadherin-17 Human genes 0.000 claims description 5
- 102100038631 E3 ubiquitin-protein ligase SMURF1 Human genes 0.000 claims description 5
- 101000762247 Homo sapiens Cadherin-17 Proteins 0.000 claims description 5
- 101000664993 Homo sapiens E3 ubiquitin-protein ligase SMURF1 Proteins 0.000 claims description 5
- 101000793956 Homo sapiens Putative uncharacterized protein encoded by LINC00299 Proteins 0.000 claims description 5
- 102100029914 Putative uncharacterized protein encoded by LINC00299 Human genes 0.000 claims description 5
- 230000004663 cell proliferation Effects 0.000 claims description 5
- 102100032296 A disintegrin and metalloproteinase with thrombospondin motifs 12 Human genes 0.000 claims description 4
- 108091005671 ADAMTS12 Proteins 0.000 claims description 4
- 102100039864 ATPase family AAA domain-containing protein 2 Human genes 0.000 claims description 4
- 102100022117 Abnormal spindle-like microcephaly-associated protein Human genes 0.000 claims description 4
- 102100022144 Achaete-scute homolog 2 Human genes 0.000 claims description 4
- 102000004000 Aurora Kinase A Human genes 0.000 claims description 4
- 108090000461 Aurora Kinase A Proteins 0.000 claims description 4
- 102100037904 CD9 antigen Human genes 0.000 claims description 4
- 102100026252 Calcium/calmodulin-dependent protein kinase II inhibitor 1 Human genes 0.000 claims description 4
- 102100024485 Cell division cycle-associated protein 7 Human genes 0.000 claims description 4
- 102100032920 Chromobox protein homolog 2 Human genes 0.000 claims description 4
- 102100040836 Claudin-1 Human genes 0.000 claims description 4
- 102100032857 Cyclin-dependent kinase 1 Human genes 0.000 claims description 4
- 101710106279 Cyclin-dependent kinase 1 Proteins 0.000 claims description 4
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 claims description 4
- 208000031448 Genomic Instability Diseases 0.000 claims description 4
- 102100040782 Glycerophosphodiester phosphodiesterase domain-containing protein 5 Human genes 0.000 claims description 4
- 102100034221 Growth-regulated alpha protein Human genes 0.000 claims description 4
- 101000887284 Homo sapiens ATPase family AAA domain-containing protein 2 Proteins 0.000 claims description 4
- 101000900939 Homo sapiens Abnormal spindle-like microcephaly-associated protein Proteins 0.000 claims description 4
- 101000901109 Homo sapiens Achaete-scute homolog 2 Proteins 0.000 claims description 4
- 101000738354 Homo sapiens CD9 antigen Proteins 0.000 claims description 4
- 101000913913 Homo sapiens Calcium/calmodulin-dependent protein kinase II inhibitor 1 Proteins 0.000 claims description 4
- 101000980893 Homo sapiens Cell division cycle-associated protein 7 Proteins 0.000 claims description 4
- 101000797586 Homo sapiens Chromobox protein homolog 2 Proteins 0.000 claims description 4
- 101000749331 Homo sapiens Claudin-1 Proteins 0.000 claims description 4
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 claims description 4
- 101001038855 Homo sapiens Glycerophosphodiester phosphodiesterase domain-containing protein 5 Proteins 0.000 claims description 4
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 claims description 4
- 101001023271 Homo sapiens Laminin subunit gamma-2 Proteins 0.000 claims description 4
- 101000624631 Homo sapiens M-phase inducer phosphatase 2 Proteins 0.000 claims description 4
- 101000601048 Homo sapiens Nidogen-2 Proteins 0.000 claims description 4
- 101000923322 Homo sapiens Phospholipid-transporting ATPase IH Proteins 0.000 claims description 4
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 claims description 4
- 101000817237 Homo sapiens Protein ECT2 Proteins 0.000 claims description 4
- 101000634179 Homo sapiens Protein N-terminal glutamine amidohydrolase Proteins 0.000 claims description 4
- 101000620365 Homo sapiens Protein TMEPAI Proteins 0.000 claims description 4
- 101001096355 Homo sapiens Replication factor C subunit 3 Proteins 0.000 claims description 4
- 101000651309 Homo sapiens Retinoic acid receptor responder protein 1 Proteins 0.000 claims description 4
- 101000757378 Homo sapiens Transcription factor AP-2-alpha Proteins 0.000 claims description 4
- 101000866292 Homo sapiens Transcription factor E2F7 Proteins 0.000 claims description 4
- 101000655155 Homo sapiens Transmembrane protein 158 Proteins 0.000 claims description 4
- 101000637916 Homo sapiens Transmembrane protein 270 Proteins 0.000 claims description 4
- 102100035159 Laminin subunit gamma-2 Human genes 0.000 claims description 4
- 102100023325 M-phase inducer phosphatase 2 Human genes 0.000 claims description 4
- 102100037371 Nidogen-2 Human genes 0.000 claims description 4
- 102100032688 Phospholipid-transporting ATPase IH Human genes 0.000 claims description 4
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 claims description 4
- 102100040437 Protein ECT2 Human genes 0.000 claims description 4
- 102100029278 Protein N-terminal glutamine amidohydrolase Human genes 0.000 claims description 4
- 102100022429 Protein TMEPAI Human genes 0.000 claims description 4
- 102100037855 Replication factor C subunit 3 Human genes 0.000 claims description 4
- 102100027682 Retinoic acid receptor responder protein 1 Human genes 0.000 claims description 4
- 108091006941 SLC39A10 Proteins 0.000 claims description 4
- 102100022972 Transcription factor AP-2-alpha Human genes 0.000 claims description 4
- 102100031556 Transcription factor E2F7 Human genes 0.000 claims description 4
- 102100033036 Transmembrane protein 158 Human genes 0.000 claims description 4
- 102100032004 Transmembrane protein 270 Human genes 0.000 claims description 4
- 102100035243 Zinc transporter ZIP10 Human genes 0.000 claims description 4
- ZPCCSZFPOXBNDL-ZSTSFXQOSA-N [(4r,5s,6s,7r,9r,10r,11e,13e,16r)-6-[(2s,3r,4r,5s,6r)-5-[(2s,4r,5s,6s)-4,5-dihydroxy-4,6-dimethyloxan-2-yl]oxy-4-(dimethylamino)-3-hydroxy-6-methyloxan-2-yl]oxy-10-[(2r,5s,6r)-5-(dimethylamino)-6-methyloxan-2-yl]oxy-5-methoxy-9,16-dimethyl-2-oxo-7-(2-oxoe Chemical compound O([C@H]1/C=C/C=C/C[C@@H](C)OC(=O)C[C@H]([C@@H]([C@H]([C@@H](CC=O)C[C@H]1C)O[C@H]1[C@@H]([C@H]([C@H](O[C@@H]2O[C@@H](C)[C@H](O)[C@](C)(O)C2)[C@@H](C)O1)N(C)C)O)OC)OC(C)=O)[C@H]1CC[C@H](N(C)C)[C@@H](C)O1 ZPCCSZFPOXBNDL-ZSTSFXQOSA-N 0.000 claims description 4
- 230000033115 angiogenesis Effects 0.000 claims description 4
- 108700021031 cdc Genes Proteins 0.000 claims description 4
- 230000004709 cell invasion Effects 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 4
- 230000003833 cell viability Effects 0.000 claims description 3
- 238000001114 immunoprecipitation Methods 0.000 claims description 3
- 210000001124 body fluid Anatomy 0.000 claims description 2
- 230000001976 improved effect Effects 0.000 claims description 2
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical group CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 claims description 2
- 229960003105 metformin Drugs 0.000 claims description 2
- 238000010837 poor prognosis Methods 0.000 claims description 2
- 101150068639 Hnf4a gene Proteins 0.000 claims 3
- 102100022054 Hepatocyte nuclear factor 4-alpha Human genes 0.000 claims 2
- 101001045740 Homo sapiens Hepatocyte nuclear factor 4-alpha Proteins 0.000 claims 2
- 230000002491 angiogenic effect Effects 0.000 claims 1
- 230000000392 somatic effect Effects 0.000 description 94
- 230000014509 gene expression Effects 0.000 description 77
- 230000003993 interaction Effects 0.000 description 70
- 238000012217 deletion Methods 0.000 description 52
- 230000037430 deletion Effects 0.000 description 52
- 238000004458 analytical method Methods 0.000 description 43
- 101100331535 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DIB1 gene Proteins 0.000 description 37
- 230000000306 recurrent effect Effects 0.000 description 34
- 201000010099 disease Diseases 0.000 description 29
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 28
- 108091027544 Subgenomic mRNA Proteins 0.000 description 22
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 21
- 230000001105 regulatory effect Effects 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 238000012360 testing method Methods 0.000 description 21
- 230000000875 corresponding effect Effects 0.000 description 19
- 238000012790 confirmation Methods 0.000 description 18
- 230000002496 gastric effect Effects 0.000 description 18
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 18
- 238000007480 sanger sequencing Methods 0.000 description 17
- 108700028369 Alleles Proteins 0.000 description 16
- 210000002784 stomach Anatomy 0.000 description 15
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 14
- 230000004075 alteration Effects 0.000 description 14
- 230000007067 DNA methylation Effects 0.000 description 13
- 230000030279 gene silencing Effects 0.000 description 13
- 108091033409 CRISPR Proteins 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 238000003753 real-time PCR Methods 0.000 description 11
- 239000004055 small Interfering RNA Substances 0.000 description 11
- 206010009944 Colon cancer Diseases 0.000 description 10
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 10
- 238000009826 distribution Methods 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 9
- 108700020796 Oncogene Proteins 0.000 description 9
- 238000000692 Student's t-test Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 238000012353 t test Methods 0.000 description 9
- 230000003350 DNA copy number gain Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 230000001747 exhibiting effect Effects 0.000 description 8
- 238000001558 permutation test Methods 0.000 description 8
- 230000035755 proliferation Effects 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 241000282575 Gorilla Species 0.000 description 7
- 238000010222 PCR analysis Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000003252 repetitive effect Effects 0.000 description 7
- 102100035079 ETS-related transcription factor Elf-3 Human genes 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 101000877379 Homo sapiens ETS-related transcription factor Elf-3 Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 102000043276 Oncogene Human genes 0.000 description 6
- 238000003559 RNA-seq method Methods 0.000 description 6
- 238000003491 array Methods 0.000 description 6
- 238000000546 chi-square test Methods 0.000 description 6
- 230000003211 malignant effect Effects 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 description 5
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 description 5
- 206010054949 Metaplasia Diseases 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 5
- 210000000981 epithelium Anatomy 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000001325 log-rank test Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 102100038423 Claudin-3 Human genes 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102000006947 Histones Human genes 0.000 description 4
- 101000882908 Homo sapiens Claudin-3 Proteins 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 108091027967 Small hairpin RNA Proteins 0.000 description 4
- 230000001594 aberrant effect Effects 0.000 description 4
- 230000031018 biological processes and functions Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000003828 downregulation Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002962 histologic effect Effects 0.000 description 4
- 230000000968 intestinal effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- 102210027851 rs10505477 Human genes 0.000 description 4
- 210000001082 somatic cell Anatomy 0.000 description 4
- 230000008093 supporting effect Effects 0.000 description 4
- 230000003827 upregulation Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 102100040685 14-3-3 protein zeta/delta Human genes 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 206010061968 Gastric neoplasm Diseases 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101000964898 Homo sapiens 14-3-3 protein zeta/delta Proteins 0.000 description 3
- 101001012951 Homo sapiens EH domain-binding protein 1 Proteins 0.000 description 3
- 101000819074 Homo sapiens Transcription factor GATA-4 Proteins 0.000 description 3
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 3
- 241000204031 Mycoplasma Species 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 3
- 102100021380 Transcription factor GATA-4 Human genes 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000009274 differential gene expression Effects 0.000 description 3
- 230000004076 epigenetic alteration Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 210000002460 smooth muscle Anatomy 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 102100028358 ADP-ribosylation factor-like protein 8A Human genes 0.000 description 2
- 102100020962 Actin-binding LIM protein 2 Human genes 0.000 description 2
- 102100032126 Aminopeptidase B Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 102100024119 CDK5 and ABL1 enzyme substrate 1 Human genes 0.000 description 2
- 208000005623 Carcinogenesis Diseases 0.000 description 2
- 206010009900 Colitis ulcerative Diseases 0.000 description 2
- 102100029652 EH domain-binding protein 1 Human genes 0.000 description 2
- HEVGGTGPGPKZHF-UHFFFAOYSA-N Epilaurene Natural products CC1C(=C)CCC1(C)C1=CC=C(C)C=C1 HEVGGTGPGPKZHF-UHFFFAOYSA-N 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 2
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 2
- 101000769035 Homo sapiens ADP-ribosylation factor-like protein 8A Proteins 0.000 description 2
- 101000783800 Homo sapiens Actin-binding LIM protein 2 Proteins 0.000 description 2
- 101000775829 Homo sapiens Aminopeptidase B Proteins 0.000 description 2
- 101000910461 Homo sapiens CDK5 and ABL1 enzyme substrate 1 Proteins 0.000 description 2
- 101000866287 Homo sapiens Excitatory amino acid transporter 2 Proteins 0.000 description 2
- 101000829958 Homo sapiens N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Proteins 0.000 description 2
- 101000830414 Homo sapiens Probable ATP-dependent RNA helicase DDX47 Proteins 0.000 description 2
- 101000662690 Homo sapiens Trafficking protein particle complex subunit 10 Proteins 0.000 description 2
- 101000658581 Homo sapiens Transmembrane 4 L6 family member 4 Proteins 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- 108091007767 MALAT1 Proteins 0.000 description 2
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102100024771 Probable ATP-dependent RNA helicase DDX47 Human genes 0.000 description 2
- 238000011530 RNeasy Mini Kit Methods 0.000 description 2
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 2
- 102000012980 SLC1A2 Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102100037456 Trafficking protein particle complex subunit 10 Human genes 0.000 description 2
- 102100034897 Transmembrane 4 L6 family member 4 Human genes 0.000 description 2
- 201000006704 Ulcerative Colitis Diseases 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000003782 apoptosis assay Methods 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 230000036952 cancer formation Effects 0.000 description 2
- 231100000504 carcinogenesis Toxicity 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000010201 enrichment analysis Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000005522 programmed cell death Effects 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 210000000813 small intestine Anatomy 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 102100036009 5'-AMP-activated protein kinase catalytic subunit alpha-2 Human genes 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 102100030379 Acyl-coenzyme A synthetase ACSM2A, mitochondrial Human genes 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 208000023665 Barrett oesophagus Diseases 0.000 description 1
- 102100039887 Beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,6-N-acetylglucosaminyltransferase 4 Human genes 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 206010004659 Biliary cirrhosis Diseases 0.000 description 1
- 102100031184 C-Maf-inducing protein Human genes 0.000 description 1
- 102100034798 CCAAT/enhancer-binding protein beta Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 206010010774 Constipation Diseases 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 102100029021 DBIRD complex subunit ZNF326 Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000026641 DNA hypermethylation Effects 0.000 description 1
- 230000006429 DNA hypomethylation Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010013554 Diverticulum Diseases 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 208000000289 Esophageal Achalasia Diseases 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 208000004930 Fatty Liver Diseases 0.000 description 1
- 102100038664 Fibrinogen-like protein 1 Human genes 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 108010088742 GATA Transcription Factors Proteins 0.000 description 1
- 102000009041 GATA Transcription Factors Human genes 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 206010019708 Hepatic steatosis Diseases 0.000 description 1
- 102100029283 Hepatocyte nuclear factor 3-alpha Human genes 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 101000783681 Homo sapiens 5'-AMP-activated protein kinase catalytic subunit alpha-2 Proteins 0.000 description 1
- 101100054737 Homo sapiens ACSM2A gene Proteins 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000887642 Homo sapiens Beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,6-N-acetylglucosaminyltransferase 4 Proteins 0.000 description 1
- 101000993081 Homo sapiens C-Maf-inducing protein Proteins 0.000 description 1
- 101000945963 Homo sapiens CCAAT/enhancer-binding protein beta Proteins 0.000 description 1
- 101000915665 Homo sapiens DBIRD complex subunit ZNF326 Proteins 0.000 description 1
- 101001031635 Homo sapiens Fibrinogen-like protein 1 Proteins 0.000 description 1
- 101001062353 Homo sapiens Hepatocyte nuclear factor 3-alpha Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101001135086 Homo sapiens Leiomodin-1 Proteins 0.000 description 1
- 101001033211 Homo sapiens Methyltransferase-like protein 27 Proteins 0.000 description 1
- 101000598416 Homo sapiens Mitochondrial import inner membrane translocase subunit Tim17-A Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101000754911 Homo sapiens Serine/threonine-protein kinase RIO3 Proteins 0.000 description 1
- 101000658574 Homo sapiens Transmembrane 4 L6 family member 1 Proteins 0.000 description 1
- 102000016844 Immunoglobulin-like domains Human genes 0.000 description 1
- 108050006430 Immunoglobulin-like domains Proteins 0.000 description 1
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 1
- 102100033519 Leiomodin-1 Human genes 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100039067 Methyltransferase-like protein 27 Human genes 0.000 description 1
- 102100037824 Mitochondrial import inner membrane translocase subunit Tim17-A Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 206010030136 Oesophageal achalasia Diseases 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- 208000008469 Peptic Ulcer Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 239000012083 RIPA buffer Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 239000012721 SDS lysis buffer Substances 0.000 description 1
- 108091006959 SLC35D3 Proteins 0.000 description 1
- 238000010818 SYBR green PCR Master Mix Methods 0.000 description 1
- 102100022109 Serine/threonine-protein kinase RIO3 Human genes 0.000 description 1
- 102100032281 Solute carrier family 35 member D3 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 102100034902 Transmembrane 4 L6 family member 1 Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 238000001772 Wald test Methods 0.000 description 1
- 238000001790 Welch's t-test Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 201000000621 achalasia Diseases 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 101150036080 at gene Proteins 0.000 description 1
- 230000006472 autoimmune response Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 201000001883 cholelithiasis Diseases 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 108010045512 cohesins Proteins 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000002247 constant time method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000003831 deregulation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000007784 diverticulitis Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 208000010706 fatty liver disease Diseases 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 208000001130 gallstones Diseases 0.000 description 1
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 1
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000013412 genome amplification Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 208000002551 irritable bowel syndrome Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 208000008275 microscopic colitis Diseases 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000000683 nonmetastatic effect Effects 0.000 description 1
- 230000008266 oncogenic mechanism Effects 0.000 description 1
- 108091008820 oncogenic transcription factors Proteins 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000003068 pathway analysis Methods 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 208000000689 peptic esophagitis Diseases 0.000 description 1
- 208000011906 peptic ulcer disease Diseases 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 208000022131 polyp of large intestine Diseases 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 229960002633 ramucirumab Drugs 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000025053 regulation of cell proliferation Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001235 sensitizing effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 231100000240 steatosis hepatitis Toxicity 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000013520 translational research Methods 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/5308—Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6875—Nucleoproteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Veterinary Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Tropical Medicine & Parasitology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
【課題】癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法を提供する。【解決手段】非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップとを備える、方法である。【選択図】なし
Description
関連出願の相互参照
この出願は、シンガポール出願第10201601141X号、2016年2月16日出願およびシンガポール出願第10201606828P号、2016年8月16日出願の優先権の利益を主張し、これらの内容は、すべての目的で参照によりその全体が本明細書に組み込まれる。
この出願は、シンガポール出願第10201601141X号、2016年2月16日出願およびシンガポール出願第10201606828P号、2016年8月16日出願の優先権の利益を主張し、これらの内容は、すべての目的で参照によりその全体が本明細書に組み込まれる。
技術分野
本発明は、癌、特に、癌における調節エレメントに関する。
本発明は、癌、特に、癌における調節エレメントに関する。
異常な遺伝子発現パターンは、増殖、浸潤および転移のような臨床的に重要な形質を生じさせるヒト悪性腫瘍の普遍的なホールマークである。体細胞変異、コピー数変化、および構造多型を含むDNA配列ベースの変化は、シグナリング分子および転写因子(TF:transcription factor)の活性および発現を変化させることによって癌トランスクリプトームを再プログラムする能力を有する。タンパク質コード遺伝子に加えて、非コード・ゲノム領域におけるシス調節エレメント、例えば、エンハンサーもTFアクセシビリティを促進または制限することによって転写プログラムに影響を及ぼすことができる。
エンハンサーは、プロモーターおよび転写開始点(TSS:transcription start site)より遠位に局在化された調節エレメントである。エンハンサーは、ヒトゲノムのうちの10~15%を占め、遠い距離(>1Mb)にある1つ以上の遺伝子を調節することによって細胞アイデンティティーおよび組織特異的な発現に重要な役割を果たすことが示された。エンハンサーは、ヒト疾患において重要な役割を果たし、それらの重要性は、異なる細胞タイプおよび病状におけるエンハンサーのカタログに対するニーズを高める。癌における調節エレメントをプロファイリングするための研究が存在したが、現在までのこれらの研究の大部分は、インビトロで培養された癌細胞株に依存し、2つの限界を有する。第1に、インビトロの細胞株は、継代の繰り返し後に実質的なエピゲノム変化を経験することが知られている。第2に、多くの癌細胞株では、対応する(matched)正常カウンターパートがしばしば入手できず、真の体細胞変化を同定する能力を複雑化させる。従って、上記の不利点の1つ以上を克服または少なくとも寛解する癌における調節エレメントをプロファイリングする方法が必要である。
一態様において、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える、方法が提供される。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える、方法が提供される。
一態様において、被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
一態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、バイオマーカーが提供される。
一態様において、被験者における癌の予後を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
一態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を細胞へ投与するステップを備える、方法が提供される。
一態様において、正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。
一態様において、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬が提供される。
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用が提供される。
一態様において、被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
定義
本明細書に用いられる以下の単語および用語は、示された意味を有するものとする。
本明細書に用いられる以下の単語および用語は、示された意味を有するものとする。
用語「スーパーエンハンサー」は、互いに近接して発生するDNAエンハンサーエレメントのクラスターを指す。DNAエンハンサーエレメントは、エフェクター遺伝子発現プログラムを調節するために多様な細胞およびシグナル伝達入力を統合することが可能なDNAの領域である。典型的なエンハンサーと比較して、スーパーエンハンサーは、サイズが大きくてよく、高い転写因子結合密度を示してよく、遺伝子座調節領域(LCR:locus control region)、DNAメチル化バレー(methylation valley)、転写開始プラットフォームおよび伸長エンハンサー(stretch enhancer)と同様に、主要な細胞アイデンティティー・レギュレーターとさらに強く関連付けられうる。スーパーエンハンサーは、疾患関連遺伝子変異体に濃縮されてもよく、癌細胞によって主要な癌遺伝子中に獲得されてよく、治療上の擾乱に対してさらに感受性がありうる。
用語「ヒストン修飾」は、ヒストンタンパク質の共有結合修飾を指す。ヒストン修飾は、メチル化、リン酸化、アセチル化、ユビキチン化およびSUMO化を含むが、それらには限定されない。ヒストンの修飾は、クロマチン構造を変化させて、遺伝子発現に影響を及ぼしうる。ヒストンの修飾は、1つ以上のヒストン中の1つ以上のアミノ酸において発生しうると一般に理解されている。
用語「アノテートされたゲノム配列」は、コードおよび非コード領域、調節領域またはモチーフ、転写開始点および遺伝子を含むがそれらには限定されない情報が同定されたゲノム配列を指す。用語「アノテートされた転写開始点」は、同定された転写開始点を指す。
用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる試料または被験者を指す。「参照」、「対照」または「標準」の例は、同じ被験者から得られた非癌試料、非転移腫瘍から得られた試料、癌を有さない被験者から得られた試料、または異なる癌サブタイプを有する被験者から得られた試料を含む。用語「参照」、「対照」または「標準」は、本明細書ではクロマチン修飾の平均シグナル強度も指してよい。用語「参照」、「対照」または「標準」は、本明細書では癌を患っていない被験者、または異なるタイプの癌を患う被験者も指してよい。用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる核酸配列も指してよい。例えば、参照もしくは対照または標準は、トランスフェクトされない細胞であってもよい。
用語「癌の(cancerous)」は、本明細書では癌特有の異常によって影響されるかまたはそれらの異常を示すことに関する。
用語「抗体」または「複数の抗体」は、本明細書では免疫グロブリンのようなドメインをもつ分子を指し、抗原結合フラグメント、モノクロナール、リコンビナント、ポリクローナル、キメラ、完全ヒト、ヒト化、二重特異性、およびヘテロ共役抗体;単一可変ドメイン、単一鎖Fv、ドメイン抗体、免疫学的に効果的なフラグメントおよび二重特異性抗体を含む。
用語「単離された(isolated)」または「単離する(isolating)」は、本明細書では、構成要素がその中で天然に発生する生物の細胞における他の生体構成要素、すなわち、他の染色体および染色体外DNAおよびRNA、タンパク質ならびに細胞小器官から実質的に分離または精製された生体構成要素(例えば、核酸分子、タンパク質または細胞小器官)に関する。「単離された」核酸およびタンパク質は、標準的な精製方法によって精製された核酸およびタンパク質を含む。この用語は、宿主細胞における組み換え発現によって調製された核酸およびタンパク質ならびに化学的に合成された核酸も包含する。
用語「核酸」は、本明細書では、一本鎖または二重鎖のいずれかの形態におけるデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指し、別に限定されない限り、天然に発生するヌクレオチドと同様の仕方で核酸へハイブリダイズする、天然ヌクレオチドの既知の類似体を包含する。「ヌクレオチド」は、以下には限定されないが、ピリミジン、プリンもしくはそれらの合成類似体のような、糖に連結された塩基、またはペプチド核酸(PNA:peptide nucleic acid)におけるように、アミノ酸に連結された塩基を含むモノマーを含む。ヌクレオチドは、ポリヌクレオチドにおける1つのモノマーである。ヌクレオチド配列は、ポリヌクレオチドにおける塩基の配列を指す。
用語「バイオマーカー」は、本明細書では、生物学的状態または状況の指標を指す。
用語「試料」または「生体試料」は、本明細書では、被験者から得られた、被験者から除去もしくは単離された1つ以上の細胞、細胞のフラグメント、組織または流体を指す。用語「から得られるまたは由来する(obtained or deprived from)」は、本明細書では、包含的に用いられることを意味する。すなわち、生体試料から直接に単離されたいずれかのヌクレオチド配列または試料に由来するいずれかのヌクレオチド配列を包含することが意図される。試料の例は、腫瘍組織バイオプシーである。試料は、凍結新鮮組織、パラフィン包埋組織、またはホルマリン固定パラフィン包埋組織(FFPE:formalin fixed paraffin embedded tissue)であってもよい。生体試料または流体試料の例は、以下には限定されないが、血液、糞便、血清、唾液、尿、脳脊髄液および骨髄液を含む。
用語「予後」、またはその文法的変異形は、本明細書では、臨床状態または疾患の確からしい経過およびアウトカムの予測を指す。患者の予後は、通常、疾患の好ましい、もしくは好ましくない経過またはアウトカムを示す疾患の要因または症状を評価することによって行われる。用語「予後」は、状態の経過またはアウトカムを100%の精度で予測する能力を指すものではない。その代わりに、用語「予後」は、ある特定の経過またはアウトカムが発生するであろう確率、すなわち、所与の状態を示す患者にある経過またはアウトカムが生じることが、その状態を示していない患者と比較したときに、より確からしい確率の増加を指す。
用語「癌への感受性」は、本明細書では、被験者が癌を発生させるであろう尤度または確率を指す。癌に感受性が高い被験者は、癌をすでに患っていてもいなくてもよく、異なるタイプの癌を患っていてもよい。
用語「阻害薬」は、本明細書では生物活性を減少させるかまたは抑制する薬剤を指す。例えば、阻害薬は、遺伝子の発現を減少またはサイレンスさせうる。阻害薬は、タンパク質、酵素または転写因子の活性も減少させうる。阻害薬の例は、以下には限定されないが、オリゴヌクレオチド、小分子または化合物を含む。オリゴヌクレオチドは、以下には限定されないが、低分子干渉RNA(siRNA:small interfering RNA)または低分子ヘアピン型RNA(shRNA:short hairpin RNA)を含めて、干渉RNA(iRNA:interfering RNA)であってよい。小分子は、当技術分野では低分子量を有する化合物として一般に理解されるであろう。阻害薬の別の例は、クラスター化され、規則的に間隔が置かれた短いパリンドローム・リピート(CRISPR:clustered regularly interspaced short palindromic repeat)ゲノム編集システムであってもよい。CRISPRゲノム編集システムは、CRISPR/Casシステムであってよい。CRISPR/Casシステムは、ゲノムを修飾することによって遺伝子発現を阻害しうる。ゲノムの修飾は、以下には限定されないが、ヌクレオチドの欠失、挿入または置換を含む。CRISPR/Casシステムは、さらに、1つ以上のヒストンの翻訳後修飾によって遺伝子発現を阻害しうる。いくつかの実施形態において、CRISPR/Casシステムは、CRISPR/Cas9であってよい。
この開示を通じて、ある実施形態は、範囲形式で開示されてよい。範囲形式における開示は、専ら便利さおよび簡潔さのためであり、開示される範囲の視野に対する融通性のない限定として解釈されるべきではないことを理解されたい。従って、範囲の記述は、具体的に開示されるすべての可能な部分的範囲ならびにその範囲内の個々の数値を有すると見做されるべきである。例えば、1~6のような範囲の記述は、1~3、1~4、1~5、2~4、2~6、3~6などのような具体的に開示された部分的範囲、ならびにその範囲内の個々の数、例えば、1、2、3、4、5、および6を有すると見做されるべきである。このことが範囲の幅に係わらず適用される。
本明細書ではいくつかの実施形態が概括的かつ一般的に記載されてもよい。属の開示の範囲内にあるより狭い種および亜属集団の各々も本開示の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う実施形態の属の記載を含む。
文脈が別の解釈を必要とするか、または具体的に逆に明記されない限り、本明細書に単数の整数、ステップまたは要素として列挙される本発明の整数、ステップ、または要素は、列挙される整数、ステップまたは要素の単数および複数の両方の形態を明確に包含する。
単語「実質的に」は、「完全に」を除外せず、例えば、Yが「実質的に」ない組成物は、Yが完全になくてもよい。必要なところでは、単語「実質的に」が本発明の定義から省略されてよい。
本明細書に例示的に記載される本発明は、本明細書に具体的には開示されないいずれかの1つまたは複数の要素、1つまたは複数の限定の存在なしに適切に実行されてもよい。従って、例えば、用語「備える(comprising)」、「含む(including)」、「含む(containing)などは、拡張的に限定なしに読まれるものとする。加えて、本明細書に採用された用語および表現は、限定ではなく説明の用語として用いられ、かかる用語および表現の使用には、図示され、記載された特徴またはそれらの部分のいずれかの均等物を排除する意図はないが、請求される本発明の範囲内で様々な変更が可能であることが認識される。従って、本発明は、好ましい実施形態および随意的な特徴によって具体的に開示されたが、本明細書に開示され、そこに具現された本発明の変更形態および変形形態が当業者によって用いられてもよく、かかる変更形態および変形形態がこの発明の範囲内にあると見做されることを理解されたい。
本発明は、本明細書に広く一般的に記載された。属の開示の範囲内にあるより狭い種および亜族集団の各々も本発明の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う本発明の属の記載を含む。
他の実施形態は、添付される特許請求の範囲および非限定例の範囲内にある。加えて、本発明の特徴または態様がマーカッシュ群の観点から記載されるところでは、本発明がそれによってマーカッシュ群のいずれかの個々のメンバーまたはメンバーのサブグループの観点からも記載されることを当業者は認識するであろう。
本発明は、詳細な記載を参照し、非限定例および添付図面と併せて考察したときにさらによく理解されるであろう。
一態様において、本発明は、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法に関し、方法は、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える。
一実施形態において、癌および非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備えてよい。一実施形態において、癌および非癌生体試料は、同じ被験者から得られてよい。
一実施形態において、癌および非癌生体試料は、各々が異なる被験者から得られてもよい。
本明細書に記載されるような方法による接触させるステップは、ヒストン修飾に対して特異的な少なくとも1つの抗体を備えてよい。ヒストン修飾の例は、以下には限定されないが、H3K27ac、H3K4me3、H3K4me1およびH2BK20acを含む。ある好ましい実施形態では、ヒストン修飾は、H3K27acである。
本明細書に記載されるような方法による単離ステップは、クロマチンの免疫沈降によって核酸を癌生体試料から単離するステップを備えてよい。一実施形態において、単離された核酸は、ヒストン修飾に特異的な少なくとも1つの領域を備える。ヒストン修飾の例は、以下には限定されないが、H3K27ac、H3K4me3、H3K4me1およびH2BK20acを含む。ある好ましい実施形態では、ヒストン修飾に特異的な少なくとも1つの領域は、ヒストン修飾H3K27acに特異的な領域である。
本明細書に記載されるような方法によるマッピングするステップは、ヒストン修飾のシグナル強度に基づいてアノテートされたゲノム配列を用いるステップを備えてよい。一実施形態において、ヒストン修飾は、H327acである。一実施形態において、アノテートされたゲノム配列は、公的に利用可能な配列である。一実施形態において、アノテートされたゲノム配列は、エピゲノムロードマップである。別の実施形態では、アノテートされたゲノム配列は、GENCODEv19である。
本明細書に記載されるような方法によるマッピングするステップは、アノテートされた転写開始点から少なくとも1kb、少なくとも1.5kb、少なくとも2kb、少なくとも2.5kb、少なくとも3kb、少なくとも3.5kb、少なくとも4kb、少なくとも4.5kb、少なくとも5kb、少なくとも5.5kb、少なくとも6kb、少なくとも6.5kb、少なくとも7kb、少なくとも7.5kb、少なくとも8kb、少なくとも8.5kb、少なくとも9kb、少なくとも9.5kbまたは少なくとも10kbにある少なくとも1つのエンハンサーも備えてよい。
方法は、癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップをさらに備えてよい。
いくつかの実施形態において、少なくとも1つの参照核酸配列は、i)アノテートされたゲノム配列、ii)de novoトランスクリプトームアセンブリ、および/またはiii)非癌核酸配列ライブラリまたはデータベースに由来する核酸配列を備えてよい。
一実施形態において、少なくとも1つの参照核酸配列は、少なくとも1つの癌細胞株から得られる。
一実施形態において、少なくとも1つのスーパーエンハンサーのシグナル強度は、ヒストン修飾H3K27acのReads Per Kilobase of transcript per million(RPKM:100万当たり、トランスクリプトのキロベース当たりのリード)値に基づく。一実施形態において、少なくとも1つのスーパーエンハンサーのシグナル強度は、ヒストン修飾H3K27acのFragments Per Kilobase of transcript per Million(FPKM:100万当たり、トランスクリプトのキロベース当たりのフラグメント)値に基づく。
一実施形態において、癌生体試料におけるその少なくとも1つのスーパーエンハンサーは、ROSE(Ranking of Super Enhancer:エンハンサーのランキング)アルゴリズムを用いて同定される。
いくつかの実施形態において、癌生体試料における少なくとも1つのスーパーエンハンサーは、少なくとも1つの参照核酸試料における少なくとも1つのエンハンサーと重複している、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個または少なくとも10個の核酸塩基対を備える。
ある好ましい実施形態において、癌生体試料における少なくとも1つのスーパーエンハンサーは、少なくとも1つの参照核酸試料における少なくとも1つのエンハンサーと重複している少なくとも1つの核酸塩基対を備える。
一実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも1つのスーパーエンハンサーに対するRPKM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、RPKM値における1.5倍より大きい倍率変化、2倍より大きい倍率変化、3倍より大きい倍率変化、4倍より大きい倍率変化、5倍より大きい倍率変化、6倍より大きい倍率変化、7倍より大きい倍率変化、8倍より大きい倍率変化、9倍より大きい倍率変化または10倍より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、0.5RPKMより大きい、1.0RPKMより大きい、1.5RPKMより大きい、2.0RPKMより大きい、2.5RPKMより大きい、3.0RPKMより大きい、3.5RPKMより大きい、4.0RPKMより大きい、4.5RPKMより大きいかまたは5.0RPKMより大きい絶対値差分であることを判定するステップを備えてよい。
ある好ましい実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも1つのスーパーエンハンサーに対するRPKM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、RPKM値における2より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、0.5RPKMより大きい絶対値差分であることを判定するステップを備える。
一実施形態において、非癌生体試料のRPKM値と比較して、癌生体試料からのRPKM値における増加は、癌生体試料における少なくとも1つのスーパーエンハンサーの存在を示す。
一実施形態において、非癌生体試料のRPKM値と比較して、癌生体試料からのRPKM値における減少は、癌生体試料における少なくとも1つのスーパーエンハンサーの非存在を示す。
いくつかの実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも1つのスーパーエンハンサーに対するFKPM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、FPKM値における1.5より大きい倍率変化、2より大きい倍率変化、3より大きい倍率変化、4より大きい倍率変化、5より大きい倍率変化、6より大きい倍率変化、7より大きい倍率変化、8より大きい倍率変化、9より大きい倍率変化かまたは10より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、0.5FPKMより大きい、1.0FPKMより大きい、1.5FPKMより大きい、2.0FPKMより大きい、2.5FPKMより大きい、3.0FPKMより大きい、3.5FPKMより大きい、4.0FPKMより大きい、4.5FPKMより大きいかまたは5.0RPKMより大きい絶対値差分であることを判定するステップを備えてよい。
ある好ましい実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも1つのスーパーエンハンサーに対するFKPM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、FPKM値における2より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、0.5FPKMより大きい絶対値差分であることを判定するステップを備える。
一実施形態において、非癌生体試料のFPKM値と比較して、癌生体試料からのFPKM値における増加は、癌生体試料における少なくとも1つのスーパーエンハンサーの存在を示す。
一実施形態において、非癌生体試料のFPKM値と比較して、癌生体試料からのFPKM値における減少は、癌生体試料における少なくとも1つのスーパーエンハンサーの非存在を示す。
いくつかの実施形態において、少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して500kb、600kb、700kb、800kb、900kb、1000kb、1100kb、1200kb、1300kb、1400kb、1500kbまたは2000kb以内に配置される。ある好ましい実施形態では、少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して1000kb以内に配置される。
一実施形態において、遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子(cellular energetics gene)、細胞周期遺伝子または腫瘍促進遺伝子である。
いくつかの実施形態において、遺伝子は、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択される。
一実施形態において、癌生体試料は、胃癌である。
本発明の別の態様において、被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
本発明の別の態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度の有する少なくとも1つをスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌を検出するためのバイオマーカーが提供される。いくつかの実施形態において、癌関連転写因子結合部位は、胃癌関連転写因子結合部位である。
いくつかの実施形態において、胃癌関連転写因子は、CDX2、KLF5およびHNF4αからなる群から選択される。いくつかの実施形態において、胃癌関連転写因子は、CDX2、KLF5、HNF4αおよびそれらの組み合わせからなる群から選択される。
本発明の別の態様において、被験者における癌の予後を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
一実施形態において、癌生体試料における少なくとも1つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す。
一実施形態において、癌生体試料における少なくとも1つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す。
一実施形態において、少なくとも1つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上と関連付けられる。
一実施形態において、少なくとも1つの癌関連スーパーエンハンサーは、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる。
本発明の別の態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
一実施形態において、胃腸疾患は、アカラシア、バレット食道、肝硬変、胆汁性肝硬変、セリアック病、結腸直腸ポリープ、クローン病、憩室症、憩室炎、脂肪肝、胆石、胃炎、ヘリコバクター・ピロリ、ヘモクロマトーシス、肝炎、過敏性腸症候群、顕微鏡的大腸炎、食道癌、膵炎、消化性潰瘍、逆流性食道炎、潰瘍性大腸炎、大腸癌および便秘のうちの1つ以上から選択される。
一実施形態において、癌は、胃癌、食道癌、結腸直腸癌、乳癌および前立腺癌のうちの1つ以上から選択される。
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を細胞へ投与するステップを備える、方法が提供される。
一実施形態において、阻害薬は、低分子干渉RNA(siRNA)である。別の実施形態では、阻害薬は、低分子ヘアピン型RNA(shRNA)である。
一実施形態において、阻害薬は、小分子または抗体である。
一実施形態において、阻害薬は、メトホルミンである。
一実施形態において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性は、CRISPRゲノム編集システムによって調節されうる。別の実施形態では、CRISPRゲノム編集システムは、CRISPR/Cas9である。
一実施形態において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性は、CRISPRゲノム編集システムによって阻害されうる。別の実施形態では、CRISPRゲノム編集システムは、CRISPR/Cas9である。
本発明の別の態様では、正常非癌生体試料と比較して、癌生体試料におけるH3KH27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。
本発明の別の態様では、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬が提供される。
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用が提供される。
一態様において、被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
本明細書に例示的に記載される本発明は、本明細書に具体的には開示されないいずれかの1つまたは複数の要素、1つまたは複数の限定の存在なしに適切に実行されてもよい。従って、例えば、用語「備える(comprising)」、「含む(including)」、「含む(containing)などは、拡張的に限定なしに読まれるものとする。加えて、本明細書に採用された用語および表現は、限定ではなく説明の用語として用いられ、かかる用語および表現の使用には、図示され、記載された特徴またはそれらの部分のいずれかの均等物を排除する意図はないが、請求される本発明の範囲内で様々な変更が可能であることが認識される。従って、本発明は、好ましい実施形態および随意的な特徴によって具体的に開示されたが、本明細書に開示され、そこに具現された本発明の変更形態および変形形態が当業者によって用いられてもよく、かかる変更形態および変形形態がこの発明の範囲内にあると見做されることを理解されたい。
本発明は、本明細書に広く一般的に記載された。属の開示の範囲内にあるより狭い種および亜族集団の各々も本発明の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う本発明の属の記載を含む。
他の実施形態は、添付される特許請求の範囲および非限定例の範囲内にある。加えて、本発明の特徴または態様がマーカッシュ群の観点から記載されるところでは、本発明がそれによってマーカッシュ群のいずれかの個々のメンバーまたはメンバーのサブグループの観点からも記載されることを当業者は認識するであろう。
本発明の範囲を何らか限定すると解釈されるべきではない具体的な実施例を参照することによって、本発明の非限定例および比較例がさらにより詳細に記載される。
方法
1次組織試料および細胞株
1次患者試料は、SingHealth Centralised Institutional Review Boardからの認可および患者署名入りインフォームド・コンセントを伴ってSingHealth組織リポジトリから得た。この研究に用いた「正常」(すなわち、非悪性)試料は、胃から、腫瘍から遠く離れ、外科的評価の際に腫瘍または腸上皮化生/異形成の視認できる証拠を示していない部位から収集した試料を指す。腫瘍試料は、40%超の腫瘍細胞を含むことを凍結切片によって確認した。FU97、MKN7、OCUM-1およびRERF-GC-1B細胞は、Japan Health Science Research Bank(ヒューマンサイエンス研究資源バンク)から得た。KATO-IIIおよびSNU16細胞は、American Type Culture Collectionから得た。NCC-59は、Korean Cell Line Bankから得た。YCC3、YCC7、YCC21、YCC22は、Yonsei Cancer Centre,韓国から贈られた。細胞株の同一性は、Centre for Translational Research and Diagnostics(Cancer Science Institute of Singapore,シンガポール)で行ったSTR DNAプロファイリングによって確認した。STRプロファイルを標準ANSI/ATCC ASN-0002-2011命名法に従って評価し、本発明者らの細胞株のプロファイルは、参照データベースに対して80%超の類似性を示した。MKN7細胞-ICLAC(http://iclac.org/databases/cross-contaminations/)により概して誤認される1つの株は、Japanese Collection of Research Bioresources Cell Bank(JCRB細胞バンク)におけるMKN7参照プロファイルとの完全な一致(100%)を示すことによってこれを確認した。マイコプラズマ汚染を検出するために、MycoAlert(登録商標)Mycoplasma Detection Kit(Lonza)およびMycoSensor qPCRアッセイキット(アジレント・テクノロジー)を用いた。すべての細胞株がマイコプラズマ汚染について陰性であった。この研究のために、OCUM-1およびSNU16細胞を2つの理由で主要細胞株モデルとして選択した。第1に、OCUM-1およびSNU16細胞は、低分化胃腺癌をもつ患者から元々単離され、この研究における1次GCの過半数が低分化である(63%)。第2に、OCUM-1およびSNU16は、これまでに多くの他の公表された研究で胃癌(GC)モデルとして用いられ、従って、この分野で受け入れられたGCモデルであると見做される。従って、Capture-C、4C、エンハンサーCRISPR、転写因子結合、および転写因子ノックダウンを含めて、いくつかの実験のための一貫した細胞株モデルとしてOCUM-1およびSNU16を用いた。
1次組織試料および細胞株
1次患者試料は、SingHealth Centralised Institutional Review Boardからの認可および患者署名入りインフォームド・コンセントを伴ってSingHealth組織リポジトリから得た。この研究に用いた「正常」(すなわち、非悪性)試料は、胃から、腫瘍から遠く離れ、外科的評価の際に腫瘍または腸上皮化生/異形成の視認できる証拠を示していない部位から収集した試料を指す。腫瘍試料は、40%超の腫瘍細胞を含むことを凍結切片によって確認した。FU97、MKN7、OCUM-1およびRERF-GC-1B細胞は、Japan Health Science Research Bank(ヒューマンサイエンス研究資源バンク)から得た。KATO-IIIおよびSNU16細胞は、American Type Culture Collectionから得た。NCC-59は、Korean Cell Line Bankから得た。YCC3、YCC7、YCC21、YCC22は、Yonsei Cancer Centre,韓国から贈られた。細胞株の同一性は、Centre for Translational Research and Diagnostics(Cancer Science Institute of Singapore,シンガポール)で行ったSTR DNAプロファイリングによって確認した。STRプロファイルを標準ANSI/ATCC ASN-0002-2011命名法に従って評価し、本発明者らの細胞株のプロファイルは、参照データベースに対して80%超の類似性を示した。MKN7細胞-ICLAC(http://iclac.org/databases/cross-contaminations/)により概して誤認される1つの株は、Japanese Collection of Research Bioresources Cell Bank(JCRB細胞バンク)におけるMKN7参照プロファイルとの完全な一致(100%)を示すことによってこれを確認した。マイコプラズマ汚染を検出するために、MycoAlert(登録商標)Mycoplasma Detection Kit(Lonza)およびMycoSensor qPCRアッセイキット(アジレント・テクノロジー)を用いた。すべての細胞株がマイコプラズマ汚染について陰性であった。この研究のために、OCUM-1およびSNU16細胞を2つの理由で主要細胞株モデルとして選択した。第1に、OCUM-1およびSNU16細胞は、低分化胃腺癌をもつ患者から元々単離され、この研究における1次GCの過半数が低分化である(63%)。第2に、OCUM-1およびSNU16は、これまでに多くの他の公表された研究で胃癌(GC)モデルとして用いられ、従って、この分野で受け入れられたGCモデルであると見做される。従って、Capture-C、4C、エンハンサーCRISPR、転写因子結合、および転写因子ノックダウンを含めて、いくつかの実験のための一貫した細胞株モデルとしてOCUM-1およびSNU16を用いた。
Nano ChIPseq
Nano ChIPseqをわずかな修正を伴って記載したように行った。1次組織については、ChIPごとに約5mgサイズの小片を得るために、剃刀の刃を用いて新鮮冷凍癌および正常組織を液体窒素中で切開した。組織片を室温において10分間、1%ホルムアルデヒト/PBSバッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。組織片をTBSEバッファーで3回洗浄した。細胞株ついては、100万個の新鮮な収集細胞を室温において10分(min)間、1%ホルムアルデヒト/溶媒バッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。固定した細胞をTBSEバッファーで3回洗浄して、遠心分離した(5,000r.p.m.,5分)。ペレット状の細胞および粉砕した組織を100μlの1%SDS溶解バッファー中に溶解して、Bioruptor(Diagenode)を用いて300~500bpへ超音波処理した。ChIPは、次の抗体:H3K4me3(07-473,ミリポア)、H3K4me1(ab8895,アブカム)、H3K27ac(ab4729,アブカム)を用いて行った。
Nano ChIPseqをわずかな修正を伴って記載したように行った。1次組織については、ChIPごとに約5mgサイズの小片を得るために、剃刀の刃を用いて新鮮冷凍癌および正常組織を液体窒素中で切開した。組織片を室温において10分間、1%ホルムアルデヒト/PBSバッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。組織片をTBSEバッファーで3回洗浄した。細胞株ついては、100万個の新鮮な収集細胞を室温において10分(min)間、1%ホルムアルデヒト/溶媒バッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。固定した細胞をTBSEバッファーで3回洗浄して、遠心分離した(5,000r.p.m.,5分)。ペレット状の細胞および粉砕した組織を100μlの1%SDS溶解バッファー中に溶解して、Bioruptor(Diagenode)を用いて300~500bpへ超音波処理した。ChIPは、次の抗体:H3K4me3(07-473,ミリポア)、H3K4me1(ab8895,アブカム)、H3K27ac(ab4729,アブカム)を用いて行った。
ChIPおよび入力DNAの回収後に、WGA4キット(シグマ・アルドリッチ)およびBpmI-WGAプライマーを用いて全ゲノム増幅を行った。増幅したDNAをPCR精製カラム(QIAGEN)を用いて精製し、WGAアダプターを除去するためにBpmI(ニュー・イングランド・バイオラボ)で消化した。増幅したDNAのうちの30ngを各シークエンシングライブラリ調製(ニュー・イングランド・バイオラボ)のために用いた。8つのライブラリを多重化(ニュー・イングランド・バイオラボ)して、Hiseq2500(イルミナ)の2つのレーン上でライブラリごとに2,000~3,000万リードの平均深さへシークエンシングした。
配列マッピングおよびChIP-seq濃度解析
アラインメント前に最初および最後の10個の塩基をトリミングした後に、Burrows-Wheeler Aligner(BWA-MEM,バージョン0.7.0)を用いて配列リードをヒト参照ゲノム(hg19)に対してマッピングした。高品質のマッピングリード(MAPQ≧10)のみを下流解析のために維持した。MAPQ値(≧10)を選んだが、その理由は、i)この値が、良好/確信的なリードマッピングに用いるのに良い値であることが先に報告され、ii)MAPQ≧10が、彼らのソフトウェアを用いた確信的なマッピングに用いるのに適した閾値であることもBWAアルゴリズムの開発者らによって示され、iii)リードアラインメントに関する様々なアルゴリズムを評価する研究が、マッピング品質スコアは、リードマッピングが真/正確である尤度と良好には相関付けられないことも示し、かつマッピング精度について得られる精度のレベルが10~12MAPQの閾値間で横這いになることを示したためである。この研究は、複数の試料で確実に検出され、解析のロバスト性を高める反復性予測エンハンサーおよびスーパーエンハンサーに焦点を合わせる。配列カバレッジは、ウィンドウサイズが50bpで、リード長を200bpに延長したMEDIPSを用いて計算した。入力ライブラリと比較して著しいChIP濃縮(FDR<5%)を伴うピークをCCAT(バージョン3)を用いて検出した。ライブラリおよび領域サイズによって正規化したマッピングリードの総数、キロベース当たり、100万マッピングリード当たりのリード(RPKM)と等価なメトリックをカウントすることによって、領域内のピーク密度を計算した。この正規化法は、リードが長い方の領域に入る確率が高くなることによるバイアスを調整し、これまでの研究に適用されてきた。この研究は、研究を他の研究と比較可能にするためにRPKMベースの正規化を適用することを選んだ。バックグラウンド・シグナルを考慮するために、各ChIPライブラリのリード密度を対応する入力ライブラリに対して補正した。COMBATを用い、試料変動を確実に等しくするために、複数の試料にわたってリード密度を潜在的なバッチ効果(例えば、ChIPアッセイのデータ)について補正した。2つ以上の細胞株で検出した17,360個の反復性予測エンハンサーのうちで、98%が少なくとも1つの1次試料(正常またはGC)中に存在した。
アラインメント前に最初および最後の10個の塩基をトリミングした後に、Burrows-Wheeler Aligner(BWA-MEM,バージョン0.7.0)を用いて配列リードをヒト参照ゲノム(hg19)に対してマッピングした。高品質のマッピングリード(MAPQ≧10)のみを下流解析のために維持した。MAPQ値(≧10)を選んだが、その理由は、i)この値が、良好/確信的なリードマッピングに用いるのに良い値であることが先に報告され、ii)MAPQ≧10が、彼らのソフトウェアを用いた確信的なマッピングに用いるのに適した閾値であることもBWAアルゴリズムの開発者らによって示され、iii)リードアラインメントに関する様々なアルゴリズムを評価する研究が、マッピング品質スコアは、リードマッピングが真/正確である尤度と良好には相関付けられないことも示し、かつマッピング精度について得られる精度のレベルが10~12MAPQの閾値間で横這いになることを示したためである。この研究は、複数の試料で確実に検出され、解析のロバスト性を高める反復性予測エンハンサーおよびスーパーエンハンサーに焦点を合わせる。配列カバレッジは、ウィンドウサイズが50bpで、リード長を200bpに延長したMEDIPSを用いて計算した。入力ライブラリと比較して著しいChIP濃縮(FDR<5%)を伴うピークをCCAT(バージョン3)を用いて検出した。ライブラリおよび領域サイズによって正規化したマッピングリードの総数、キロベース当たり、100万マッピングリード当たりのリード(RPKM)と等価なメトリックをカウントすることによって、領域内のピーク密度を計算した。この正規化法は、リードが長い方の領域に入る確率が高くなることによるバイアスを調整し、これまでの研究に適用されてきた。この研究は、研究を他の研究と比較可能にするためにRPKMベースの正規化を適用することを選んだ。バックグラウンド・シグナルを考慮するために、各ChIPライブラリのリード密度を対応する入力ライブラリに対して補正した。COMBATを用い、試料変動を確実に等しくするために、複数の試料にわたってリード密度を潜在的なバッチ効果(例えば、ChIPアッセイのデータ)について補正した。2つ以上の細胞株で検出した17,360個の反復性予測エンハンサーのうちで、98%が少なくとも1つの1次試料(正常またはGC)中に存在した。
Nano-ChIPseqデータの品質管理評価
2つの異なる方法を用いて、ChIPライブラリ(H3K27ac、H3K4me3およびH3K4me1)の品質を評価した。第1に、ChIP品質、特にH3K27acおよびH3K4me3をタンパク質コード遺伝子のアノテートされたプロモーターにおけるそれらの濃縮レベルを調べることによって推定した。具体的には、本研究は、高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力補正ChIPシグナルのメジアン・リード密度を計算した。試料ごとに、データ品質のサロゲートとしてH3K27ac割る入力のリード密度比を比較し、H3K27ac/入力比が4倍より大きかった試料のみを維持した。この基準を用いると、50個のH3K27ac試料(GC株および1次試料)のうち48個が4倍より大きい濃縮を示し、好結果の濃縮を示した。H3K4me3ライブラリ(プロモーターマーク)についても同様の解析を行い、すべての42個のライブラリがこの品質管理基準を満たした。第2に、CHANCE(CHip-seq Analytics and Confidence Estimation(CHip-seqアナリティクスおよび信頼推定))、CHip-seq品質管理および好結果または弱い濃縮を用いたことをライブラリが示すかどうかを指示するプロトコル最適化のためのソフトウェアを用いた。本研究における試料の大多数(85%)がCHANCEによって評価した通り好結果の濃縮を示すことがわかった。両方の方法によって評価した、ライブラリごとの評価状況を表1に報告する。
2つの異なる方法を用いて、ChIPライブラリ(H3K27ac、H3K4me3およびH3K4me1)の品質を評価した。第1に、ChIP品質、特にH3K27acおよびH3K4me3をタンパク質コード遺伝子のアノテートされたプロモーターにおけるそれらの濃縮レベルを調べることによって推定した。具体的には、本研究は、高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力補正ChIPシグナルのメジアン・リード密度を計算した。試料ごとに、データ品質のサロゲートとしてH3K27ac割る入力のリード密度比を比較し、H3K27ac/入力比が4倍より大きかった試料のみを維持した。この基準を用いると、50個のH3K27ac試料(GC株および1次試料)のうち48個が4倍より大きい濃縮を示し、好結果の濃縮を示した。H3K4me3ライブラリ(プロモーターマーク)についても同様の解析を行い、すべての42個のライブラリがこの品質管理基準を満たした。第2に、CHANCE(CHip-seq Analytics and Confidence Estimation(CHip-seqアナリティクスおよび信頼推定))、CHip-seq品質管理および好結果または弱い濃縮を用いたことをライブラリが示すかどうかを指示するプロトコル最適化のためのソフトウェアを用いた。本研究における試料の大多数(85%)がCHANCEによって評価した通り好結果の濃縮を示すことがわかった。両方の方法によって評価した、ライブラリごとの評価状況を表1に報告する。
本研究は、KATO-III細胞を用いてH3K27ac Nano-ChIP-seqの第2の生物学的レプリケートを実験的に発生させて、さらに通常のChIP-seqプロトコルから発生させた独立したH3K27ac KATO-IIIデータに対して結果を比較した。配列トリミングを除いて、公開されたシークエンシングリードをNanoChIP-seqライブラリと同様に処理した。CCATによって検出したピークをFDR<5%で比較した。
クロマチンアクセシビリティ、保存および結合濃縮
エピゲノムロードマップ正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibusから得た(GSM1027325,GSM1027320)。クロマチンアクセシビリティ・プロファイルのリード密度を予測エンハンサー領域について計算し、RPKM単位で100,000個のランダムに選択した領域に対して比較した。本研究は、25個のロードマップ・クロマチンアクセシビリティおよびH3K27acプロファイルから、オープンクロマチン領域(.narrowPeak)および活性な調節エレメント(H3K27ac,.gappedPeak)と重複する予測エンハンサーの割合も計算した。転写因子結合濃縮解析については、ENCODE(wgEncodeRegTfbsClusteredV3.bed)によってキュレートしたP300および他の転写因子の結合座標をUCSCゲノムブラウザからダウンロードした。BEDTools交差を用いて少なくとも1bpの重複を同定した。進化的塩基配列保存性(evolutionary sequence conservation)のレベルをPhastConstスコア(Castelo R.phastCons100way.UCSC.hg19:UCSC phastCons conservation scores for hg19. R package version 3.2.0)を用いて評価した。エンハンサー中間点から500bp以内の最高スコアをエンハンサー保存スコアとして用いた。予め検出したエンハンサー領域を除いて、10,000個のランダムに選択した領域についても保存スコアを計算した。
エピゲノムロードマップ正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibusから得た(GSM1027325,GSM1027320)。クロマチンアクセシビリティ・プロファイルのリード密度を予測エンハンサー領域について計算し、RPKM単位で100,000個のランダムに選択した領域に対して比較した。本研究は、25個のロードマップ・クロマチンアクセシビリティおよびH3K27acプロファイルから、オープンクロマチン領域(.narrowPeak)および活性な調節エレメント(H3K27ac,.gappedPeak)と重複する予測エンハンサーの割合も計算した。転写因子結合濃縮解析については、ENCODE(wgEncodeRegTfbsClusteredV3.bed)によってキュレートしたP300および他の転写因子の結合座標をUCSCゲノムブラウザからダウンロードした。BEDTools交差を用いて少なくとも1bpの重複を同定した。進化的塩基配列保存性(evolutionary sequence conservation)のレベルをPhastConstスコア(Castelo R.phastCons100way.UCSC.hg19:UCSC phastCons conservation scores for hg19. R package version 3.2.0)を用いて評価した。エンハンサー中間点から500bp以内の最高スコアをエンハンサー保存スコアとして用いた。予め検出したエンハンサー領域を除いて、10,000個のランダムに選択した領域についても保存スコアを計算した。
予測スーパーエンハンサーの同定
予測エンハンサーは、アノテートされた転写開始点(TSS)から少なくとも2.5kbにあり、H3K4me1の濃縮およびH3K4me3の枯渇も示す、濃縮されたH3K27acの領域として定義した。この研究のためのTSSアノテーションは、GENCODEバージョン19に由来した。H3K4me3/H3K4me1対数比をGC細胞株および1次試料から集約したH3K4me3およびH3K4me1シグナルを用いて計算した。高いH3K27acシグナルを示すが、高いH3K4me3/H3K4me1対数比(>2.4)を示す遠位予測エンハンサーは、誤った予測として分類し、従って、解析から除外した。次に、ROSEアルゴリズムを用いて、予測エンハンサーを予測スーパーエンハンサーまたは典型エンハンサーへ再分割した。複数のGC株にわたって少なくとも1つの塩基重複をもつ予測スーパーエンハンサー領域をBEDToolsを用いてマージし、予測スーパーエンハンサー領域とは別個の領域に局在している予測エンハンサーを予測典型エンハンサーと名付けた。個々の試料における予測典型または予測スーパーエンハンサーの存在をバックグラウンド超のH3K27ac濃縮のレベル(P<0.01,経験的検定)によって判定し、このレベルは、100,000個のランダムに選択した領域からのH3K27acシグナル(RPKM単位)であった。予測エンハンサー/スーパーエンハンサーを遺伝子へ割り当てるために、予測エンハンサー/スーパーエンハンサー中心から、ランダムに選んだ領域を超えるH3K27ac濃縮を伴うプロモーター(TSSにおける500bpのフランキング)として定義される、最近接の活性な転写開始点(TSS)への距離を算出した。反復性予測スーパーエンハンサーと関連付けられた遺伝子をフィシャーの片側正確検定を用いて癌遺伝子濃縮について試験した。上位500個の癌遺伝子を用いた。反復性予測エンハンサーおよび予測スーパーエンハンサーを同定するために、各GC株における領域をシグナル強度に従ってランク付けした。ランクプロダクト(rank prduct)を計算するために、複数の株にわたって各予測エンハンサー/スーパーエンハンサーのランクを乗算した。ランクプロダクトの統計学的有意性を判定するために、観測したランクプロダクトを帰無分布に対して比較し-各株におけるランクをリシャッフルして、ランクプロダクトを計算した。10,000回の反復についてリシャッフル手順を繰り返した。帰無分布未満の観測したランクプロダクトを統計学的に有意であると見做した。
予測エンハンサーは、アノテートされた転写開始点(TSS)から少なくとも2.5kbにあり、H3K4me1の濃縮およびH3K4me3の枯渇も示す、濃縮されたH3K27acの領域として定義した。この研究のためのTSSアノテーションは、GENCODEバージョン19に由来した。H3K4me3/H3K4me1対数比をGC細胞株および1次試料から集約したH3K4me3およびH3K4me1シグナルを用いて計算した。高いH3K27acシグナルを示すが、高いH3K4me3/H3K4me1対数比(>2.4)を示す遠位予測エンハンサーは、誤った予測として分類し、従って、解析から除外した。次に、ROSEアルゴリズムを用いて、予測エンハンサーを予測スーパーエンハンサーまたは典型エンハンサーへ再分割した。複数のGC株にわたって少なくとも1つの塩基重複をもつ予測スーパーエンハンサー領域をBEDToolsを用いてマージし、予測スーパーエンハンサー領域とは別個の領域に局在している予測エンハンサーを予測典型エンハンサーと名付けた。個々の試料における予測典型または予測スーパーエンハンサーの存在をバックグラウンド超のH3K27ac濃縮のレベル(P<0.01,経験的検定)によって判定し、このレベルは、100,000個のランダムに選択した領域からのH3K27acシグナル(RPKM単位)であった。予測エンハンサー/スーパーエンハンサーを遺伝子へ割り当てるために、予測エンハンサー/スーパーエンハンサー中心から、ランダムに選んだ領域を超えるH3K27ac濃縮を伴うプロモーター(TSSにおける500bpのフランキング)として定義される、最近接の活性な転写開始点(TSS)への距離を算出した。反復性予測スーパーエンハンサーと関連付けられた遺伝子をフィシャーの片側正確検定を用いて癌遺伝子濃縮について試験した。上位500個の癌遺伝子を用いた。反復性予測エンハンサーおよび予測スーパーエンハンサーを同定するために、各GC株における領域をシグナル強度に従ってランク付けした。ランクプロダクト(rank prduct)を計算するために、複数の株にわたって各予測エンハンサー/スーパーエンハンサーのランクを乗算した。ランクプロダクトの統計学的有意性を判定するために、観測したランクプロダクトを帰無分布に対して比較し-各株におけるランクをリシャッフルして、ランクプロダクトを計算した。10,000回の反復についてリシャッフル手順を繰り返した。帰無分布未満の観測したランクプロダクトを統計学的に有意であると見做した。
予測相互作用の検証
スーパーエンハンサー/遺伝子の割り当ては、3つの直交する相互作用データセットを用いて検証した。これらは、以下を含んだ。
i)12個の細胞株からPreSTIGEによって検出した所定の相互作用。シス調節エレメントおよび標的遺伝子を含む、PreSTIGE相互作用データは、PreSTIGEウェブサイト(prestige.case.edu)からダウンロードした。
ii)デフォルト・パラメータを用いたGREATによるシス調節エレメント/遺伝子の割り当て
iii)K562、HCT-116、NB4、MCF-7、HeLa-S3およびGM12878細胞におけるRNAPII ChIA-PET研究からのエンハンサー-プロモーター相互作用の参照セット。ChIA-PET相互作用データは、encodeproject.orgおよびGSE72816からダウンロードした。各生物学的レプリケートで同定したすべての相互作用を検証のために考慮した。これらの相互作用は、2つの遺伝子座(アンカー)を含み、一方は、TSSの2.5kb以内にあり、他方のアンカーは、本発明者らの研究において見出した予測スーパーエンハンサー領域と重複する。
スーパーエンハンサー/遺伝子の割り当ては、3つの直交する相互作用データセットを用いて検証した。これらは、以下を含んだ。
i)12個の細胞株からPreSTIGEによって検出した所定の相互作用。シス調節エレメントおよび標的遺伝子を含む、PreSTIGE相互作用データは、PreSTIGEウェブサイト(prestige.case.edu)からダウンロードした。
ii)デフォルト・パラメータを用いたGREATによるシス調節エレメント/遺伝子の割り当て
iii)K562、HCT-116、NB4、MCF-7、HeLa-S3およびGM12878細胞におけるRNAPII ChIA-PET研究からのエンハンサー-プロモーター相互作用の参照セット。ChIA-PET相互作用データは、encodeproject.orgおよびGSE72816からダウンロードした。各生物学的レプリケートで同定したすべての相互作用を検証のために考慮した。これらの相互作用は、2つの遺伝子座(アンカー)を含み、一方は、TSSの2.5kb以内にあり、他方のアンカーは、本発明者らの研究において見出した予測スーパーエンハンサー領域と重複する。
i)~iii)に加えて、GC株に対してCapture-C解析を用いて追加の検証を行った(図4を参照)。
機能的濃縮解析
反復性予測スーパーエンハンサー/遺伝子プロモーターまたは予測典型エンハンサー/遺伝子プロモーター相互作用において強化された生物学的プロセスを同定するために、GOrilla(遺伝子オントロジー・アノテーション)を用いた。デフォルトGOrillaパラメータを用い、GENCODE v19からの遺伝子をバックグラウンドとして用いた。比較可能性を確保するために、反復性予測スーパーエンハンサーと同数に一致させるべく、複数の細胞株にわたって最も高いH3K27acをもつ予測典型エンハンサーを選択した。前者を選択するために、予測典型エンハンサーを各株でランク付けして、ランクプロダクト・スコアに基づいてそれらを選んだ。次に、反復性予測スーパーエンハンサーと関連付けられた最も有意な項目(1.5倍超の濃縮)を上位の予測典型エンハンサーと関連付けられた濃縮レベルに対して比較した。より大きい遺伝子間領域が隣接する遺伝子に対してはGREATが補正を提供するため、GORillaに加えて、デフォルト・パラメータを用いたGREATを利用して、反復性予測スーパーエンハンサーおよび上位の予測典型エンハンサーと関連付けられた機能的濃縮をさらに調べた。有意な(濃縮も1.5倍超の)項目を二項p値(Binomial p-value)に基づいて順序付けた。
反復性予測スーパーエンハンサー/遺伝子プロモーターまたは予測典型エンハンサー/遺伝子プロモーター相互作用において強化された生物学的プロセスを同定するために、GOrilla(遺伝子オントロジー・アノテーション)を用いた。デフォルトGOrillaパラメータを用い、GENCODE v19からの遺伝子をバックグラウンドとして用いた。比較可能性を確保するために、反復性予測スーパーエンハンサーと同数に一致させるべく、複数の細胞株にわたって最も高いH3K27acをもつ予測典型エンハンサーを選択した。前者を選択するために、予測典型エンハンサーを各株でランク付けして、ランクプロダクト・スコアに基づいてそれらを選んだ。次に、反復性予測スーパーエンハンサーと関連付けられた最も有意な項目(1.5倍超の濃縮)を上位の予測典型エンハンサーと関連付けられた濃縮レベルに対して比較した。より大きい遺伝子間領域が隣接する遺伝子に対してはGREATが補正を提供するため、GORillaに加えて、デフォルト・パラメータを用いたGREATを利用して、反復性予測スーパーエンハンサーおよび上位の予測典型エンハンサーと関連付けられた機能的濃縮をさらに調べた。有意な(濃縮も1.5倍超の)項目を二項p値(Binomial p-value)に基づいて順序付けた。
1次試料における細胞株由来スーパーエンハンサー
2倍以上のH3K27ac濃縮または枯渇を示し、絶対値差分が0.5RPKMより大きい領域は、GCと対応する正常試料との間で差次的に存在すると見做した。主成分分析(PCA:principle component analysis)のために、2人以上の患者において体細胞増加を示す予測スーパーエンハンサーからのシグナルを用いた。PCA分析は、Rを用いて行い、「pca3d」パッケージを用いてプロットした。腫瘍および正常試料からの100個の予測スーパーエンハンサー(表2)の平均シグナルに基づいて、検定力80%および第1種の誤り5%(http://powerandsamplesize.com/)を達成するために必要なサンプルサイズを推定した。この結果は、推奨サンプルサイズ13(平均)をもたらし、本研究(19N/T)ではこれを満たした。1次試料に基づいて、3つのクラスの予測スーパーエンハンサー:i)体細胞増加、ii)体細胞欠失、およびiii)非変化を定義した。i)、ii)およびiii)と関連付けられた遺伝子を先にHnisz,2013において報告された遺伝子群へマッピングし、各遺伝子群がいくつかの遺伝子オントロジー・カテゴリーの編集物であり、様々な癌ホールマークの代わりとして用いられる。Rにおいてフィシャーの片側正確検定を用いて統計学的有意性を計算した。反復的に増加する体細胞予測スーパーエンハンサーの系列特異性を異なる組織タイプにわたって評価するために、胃の予測スーパーエンハンサー間の重複を他の非胃組織に対して計算した。観測した全重複対偶然による全重複に基づいて、各非胃組織との濃縮比を計算した。
2倍以上のH3K27ac濃縮または枯渇を示し、絶対値差分が0.5RPKMより大きい領域は、GCと対応する正常試料との間で差次的に存在すると見做した。主成分分析(PCA:principle component analysis)のために、2人以上の患者において体細胞増加を示す予測スーパーエンハンサーからのシグナルを用いた。PCA分析は、Rを用いて行い、「pca3d」パッケージを用いてプロットした。腫瘍および正常試料からの100個の予測スーパーエンハンサー(表2)の平均シグナルに基づいて、検定力80%および第1種の誤り5%(http://powerandsamplesize.com/)を達成するために必要なサンプルサイズを推定した。この結果は、推奨サンプルサイズ13(平均)をもたらし、本研究(19N/T)ではこれを満たした。1次試料に基づいて、3つのクラスの予測スーパーエンハンサー:i)体細胞増加、ii)体細胞欠失、およびiii)非変化を定義した。i)、ii)およびiii)と関連付けられた遺伝子を先にHnisz,2013において報告された遺伝子群へマッピングし、各遺伝子群がいくつかの遺伝子オントロジー・カテゴリーの編集物であり、様々な癌ホールマークの代わりとして用いられる。Rにおいてフィシャーの片側正確検定を用いて統計学的有意性を計算した。反復的に増加する体細胞予測スーパーエンハンサーの系列特異性を異なる組織タイプにわたって評価するために、胃の予測スーパーエンハンサー間の重複を他の非胃組織に対して計算した。観測した全重複対偶然による全重複に基づいて、各非胃組織との濃縮比を計算した。
Capture-Cおよびデータ解析
Capture-Cを先に簡潔に記載したように行い、1×107個の細胞を2%ホルムアルデヒドによって架橋し、溶解、均質化、DpnII消化、ライゲーションおよび解架橋がそれに続いた。オリゴキャプチャに適したDNAを生成するためにCovarisを用いてDNAを150~200bpへ超音波処理した。シークエンシングライブラリ調製(ニュー・イングランド・バイオラボ)のために3μgの剪断DNAを用いた。カスタマイズしたビオチン標識オリゴ(IDT,表3)への逐次的ハイブリダイゼーションおよびDynabeads(LifeTech)を用いた濃縮により、予測スーパーエンハンサー配列のダブルキャプチャ(double captured)を行った。キャプチャしたDNAをIllumina MiSEQ上で150bpペアエンド構成を用いてシークエンシングした。
Capture-Cを先に簡潔に記載したように行い、1×107個の細胞を2%ホルムアルデヒドによって架橋し、溶解、均質化、DpnII消化、ライゲーションおよび解架橋がそれに続いた。オリゴキャプチャに適したDNAを生成するためにCovarisを用いてDNAを150~200bpへ超音波処理した。シークエンシングライブラリ調製(ニュー・イングランド・バイオラボ)のために3μgの剪断DNAを用いた。カスタマイズしたビオチン標識オリゴ(IDT,表3)への逐次的ハイブリダイゼーションおよびDynabeads(LifeTech)を用いた濃縮により、予測スーパーエンハンサー配列のダブルキャプチャ(double captured)を行った。キャプチャしたDNAをIllumina MiSEQ上で150bpペアエンド構成を用いてシークエンシングした。
アダプター配列を除去するために生のリードの前処理を行い(trim_galore,http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)、FLASHを用いて重複リードをマージした。hg19参照ゲノムへのショートリード・マッピングを達成するために、前処理の結果として生じたリードを、次に、DpnIIによってインシリコで消化し、Bowtie(p1,m2,best,およびstrata設定)を用いてアラインした。アラインしたリードは、Capture-C解析を用いてそれらを処理し、(i)PCRデュプリケートを除去して、(ii)サブフラグメントがキャプチャフラグメント内に含まれた場合にはそれらを「キャプチャ」として、それらがキャプチャフラグメントのいずれかの側の1kb以内にあった場合には「近接性除外(proximity exclusion)」として、またはそれらが「キャプチャ」および「近接性除外」の外部にあった場合には「レポータ」として分類した。加えて、この研究は、スケーリングしたバックグラウンドに対するビューポイントの有意な相互作用(Q<0.05,FDR)を同定し、さらに、異なる細胞株間で相互作用プロファイルを比較するために、キャプチャおよびレポーター・フラグメントに対してr3Cseqパッケージを用いた。
4C-seqおよびデータ解析
4Cテンプレートをわずかな修正を伴う先に公表されたプロトコルを用いて調製した。手短かに言えば、培養細胞を単一細胞の懸濁物中に希釈し、クロマチンを室温において10分間、1%ホルムアルデヒトで架橋した。細胞を溶解し、架橋したDNAを主要な制限酵素HindIII-HF[R3104L,ニュー・イングランド・バイオラボ(NEB)]で消化した。次に、HindIII-で消化したDNAがT4 DNAリガーゼ(EL0013,サーモサイエンティフィック)を用いた近接性ライゲーション(proximity ligation)を受けて、Proteinase K(AM2546,アンビオン)を用いた架橋除去がそれに続き、3Cライブラリをもたらした。3Cライブラリは、次に、DpnII(R0543L,NEB)を用いた第2の制限酵素消化を受けて、T4 DNAリガーゼを用いた環状化反応がそれに続いた。ビューポイントごとに、スケールアップ・インバース、ネステッドPCR(scale-up inverse,nested PCR)(表4)を行うために3.2μgの結果として生じた4Cテンプレートを用いて、そのうちの32個の反応(各々が100ng)をプールし、MinElute PCR Purification kit(Qiagen)を用いて精製した。10μgのPCR産物を、次に、4~20% TBE PAGEゲル上に流した(ウェル当たり5μg)。ゲル上で、200bp~600bpのスメアを切り取り、不要なPCR産物のバンドを除去した。次に、Illumina MiSeq上の次世代シークエンシングのために、切り取ったゲル片からDNAを抽出した(2x250bp)。
4Cテンプレートをわずかな修正を伴う先に公表されたプロトコルを用いて調製した。手短かに言えば、培養細胞を単一細胞の懸濁物中に希釈し、クロマチンを室温において10分間、1%ホルムアルデヒトで架橋した。細胞を溶解し、架橋したDNAを主要な制限酵素HindIII-HF[R3104L,ニュー・イングランド・バイオラボ(NEB)]で消化した。次に、HindIII-で消化したDNAがT4 DNAリガーゼ(EL0013,サーモサイエンティフィック)を用いた近接性ライゲーション(proximity ligation)を受けて、Proteinase K(AM2546,アンビオン)を用いた架橋除去がそれに続き、3Cライブラリをもたらした。3Cライブラリは、次に、DpnII(R0543L,NEB)を用いた第2の制限酵素消化を受けて、T4 DNAリガーゼを用いた環状化反応がそれに続いた。ビューポイントごとに、スケールアップ・インバース、ネステッドPCR(scale-up inverse,nested PCR)(表4)を行うために3.2μgの結果として生じた4Cテンプレートを用いて、そのうちの32個の反応(各々が100ng)をプールし、MinElute PCR Purification kit(Qiagen)を用いて精製した。10μgのPCR産物を、次に、4~20% TBE PAGEゲル上に流した(ウェル当たり5μg)。ゲル上で、200bp~600bpのスメアを切り取り、不要なPCR産物のバンドを除去した。次に、Illumina MiSeq上の次世代シークエンシングのために、切り取ったゲル片からDNAを抽出した(2x250bp)。
インバースプライマー(inverse primer)をビューポイントの概念に従って設計した。関心領域の位置を決めるためにUCSCゲノムブラウザ[assembly:Feb.2009(GRCh37/hg19)]を用いた。HindIIIおよびDpnIIトラックの追加の際に、関心領域に隣接する2つHindIII制御部位を同定して、最近接のHindIIIおよびDpnII制限部位間の配列をビューポイント領域として選択した。この領域に基づいて、デフォルト設定に対する以下のアダプテーション、すなわち、58℃の最適プライマー融解温度、最低55℃および最高60℃;39および60%の間のGC含有量とともに、Primer-BLASTプログラム[National Center for Biotechnology Information(NCBI)]を用いて、プライマーの2つの対(アウターおよびネステッド)を設計した。次に、適切なアダプター(Nextera(登録商標)Index Kit-PCRプライマー,Nextera(登録商標)トランスポサーゼ配列)およびインデックス配列をネステッドプライマー対に追加した。この研究に用いたアウターおよびネステッドプライマーをそれぞれ表5および表4に提示する。
シークエンシングリードの5’末端におけるプライマー配列をTagDust2を用いてトリミングして、Bowtie2(2.2.6)を用いて参照ゲノム(hg19)へマッピングした。アラインされないリードは、それらを参照ゲノムへリアラインする前に、最初の50個の塩基対でトリミングした。MAPQ≧30によるユニークなマッピングリードのみを下流解析に用いた。非重複ウィンドウ・アプローチ(ウィンドウサイズ=5kb)を使用したr3Cseqを用いて、統計学的に有意な相互作用(Q<0.05,FDR)を検出した。Basic4CSeqを用いて4Cデータのシグナル・プロットを生成した。DNA増幅領域内で検出した相互作用は、除外した。次に、相互作用と重複するプロモーター(GENCODEv19からのアノテートされた転写開始点から+/-2.5kb)を用いて、相互作用を遺伝子に対してマッピングした。
CRISPR/Cas9エンハンサー欠失
Feng Zhang研究室によって作成されたオンラインソフトウェア(http://tools.genome-engineering.org)を用いてCRISPR sgRNA標的検索を行った。sgRNA対は、欠失について同定したエンハンサーに隣接する配列を標的とするように設計した。端的には、エンハンサーの5’末端の100bp上流/20bp下流に対応する配列、およびエンハンサーの3’末端の20bp上流/100bp下流に対応する配列を検索のために用いた。コード領域オフターゲット(off-target)予測の最低レベルとのトップヒットを選んだ。sgRNAをpSpCas9(BB)-2A-GFPまたは-Puroベクター(Addgene)へクローニングした。端的には、オリゴヌクレオチドの対をCRISPR標的ごとに設計して、Integrated DNA Technologies,Inc.から調達した。次に、クローニングを容易にするために両側にオーバーハングを含むDNAデューレックスを形成すべくオリゴヌクレオチド対をアニールした。個々のエンハンサーの5’末端を標的とするために用いるガイドRNAをBbsI-消化pSpCas9(BB)-2A-GFPベクター中へクローニングし、一方で各エンハンサーの3’末端を標的とするsgRNAをBbsI消化pSpCas9(BB)-2A-Puroベクター中へクローニングした。インサートおよびベクターをT4 DNAリガーゼ(ニュー・イングランド・バイオラボ)を用いて連結した。DH5α細胞をライゲーション産物により形質転換して、アンピシリンを補充したLB寒天上に蒔いた。コロニーを選び取り、培養して、Wizard Plus SV Minipreps DNA Purification System(プロメガ)を用いてプラスミドを抽出した。サンガーシークエンシングを行うことによってプラスミドの配列を確認した。これらの実験に用いたオリゴヌクレオチドを表6にリストする。
Feng Zhang研究室によって作成されたオンラインソフトウェア(http://tools.genome-engineering.org)を用いてCRISPR sgRNA標的検索を行った。sgRNA対は、欠失について同定したエンハンサーに隣接する配列を標的とするように設計した。端的には、エンハンサーの5’末端の100bp上流/20bp下流に対応する配列、およびエンハンサーの3’末端の20bp上流/100bp下流に対応する配列を検索のために用いた。コード領域オフターゲット(off-target)予測の最低レベルとのトップヒットを選んだ。sgRNAをpSpCas9(BB)-2A-GFPまたは-Puroベクター(Addgene)へクローニングした。端的には、オリゴヌクレオチドの対をCRISPR標的ごとに設計して、Integrated DNA Technologies,Inc.から調達した。次に、クローニングを容易にするために両側にオーバーハングを含むDNAデューレックスを形成すべくオリゴヌクレオチド対をアニールした。個々のエンハンサーの5’末端を標的とするために用いるガイドRNAをBbsI-消化pSpCas9(BB)-2A-GFPベクター中へクローニングし、一方で各エンハンサーの3’末端を標的とするsgRNAをBbsI消化pSpCas9(BB)-2A-Puroベクター中へクローニングした。インサートおよびベクターをT4 DNAリガーゼ(ニュー・イングランド・バイオラボ)を用いて連結した。DH5α細胞をライゲーション産物により形質転換して、アンピシリンを補充したLB寒天上に蒔いた。コロニーを選び取り、培養して、Wizard Plus SV Minipreps DNA Purification System(プロメガ)を用いてプラスミドを抽出した。サンガーシークエンシングを行うことによってプラスミドの配列を確認した。これらの実験に用いたオリゴヌクレオチドを表6にリストする。
SNU16およびOCUM-1細胞を10%FBS、1×P/Sおよび0.5×NEAAを補充したRPMI中で80~90%のコンフルエンスへ成長させた。細胞を収集し、遠心沈殿させて、37度で5分間Typsinを用いて処理し、単一細胞の懸濁物を達成するためにピペッティングによって再懸濁した。細胞数をカウントし、細胞をResuspension(再懸濁)バッファー(R)中に1×107細胞/mlで再懸濁する前に1×PBSで一回洗浄した。1mlのResuspensionバッファー中の1×107細胞ごとに、25μgのpCas9-GFP-sgRNAおよび25μgのpCas9-Puro-sgRNAプラスミドをSNU16またはOCUM-1細胞と混合した。3mlのElectrolytic Buffer(電解質バッファー)(E2)を含んだNeonチューブ中で100μlのNeonピペットを用いて100μlの各細胞懸濁物のエレクトロポレーションを行った。エレクトロポレーション条件は、Pulse,V1050,MS30,Number2であった。エレクトロポレーション後に、10%FBS、1×P/Sおよび0.5×NEAAを補充した8mlのRPMI上に細胞を蒔いた。最初のトランスフェクションの24時間後に、細胞を10μgのピュロマイシンで48時間処理して、残りのGFP陽性細胞をFACSを用いてソートした。次に、残りの生存細胞(GFP陽性およびピュロマイシン耐性の両方)をノックアウト効率を推定するためにqPCRを用いて引き続き解析した。
CRISPR/Cas9標的細胞における個々のエンハンサーの欠失の効率を判定するために、定量的PCR(qPCR:Quantitative PCR)を行った。標的および(プールした)非標的細胞のゲノムDNAをAllPrep DNA Micro Kit(QIAGEN)を用いて抽出し、CFX96 TouchリアルタイムPCR検出システム(バイオ・ラッドラボラトリーズ社)上でKAPA SYBR FAST qPCR Master Mix(Kapa Biosystems)を用いてテクニカルトリプリケート(technical triplicates)でqPCRに供した。これらの反応に用いたプライマーを表6にリストする(それらの名前に「Int」が付いたプライマーをこの目的に用いた)。GAPDH遺伝子に対して正規化して非標的化細胞と比較した、比較CT(ΔΔCT)法を用いてゲノムDNA試料中に存在する特異的標的化領域の相対量を算出した。
前述のプロトコルを用いて、ソートした細胞からゲノムDNAを抽出した。端的には、細胞を0.5×Direct-Lyseバッファー(10mM Tris pH8.0,2.5mM EDTA,0.2M NaCl,0.15%SDS,0.3%Tween-20)中で粉砕して、65℃30秒間、8℃30秒間、65℃1.5分間、97℃3分間、8℃1分間、65℃3分間、97℃1分間、65℃1分間、および80℃10分間の加熱冷却プログラムに供した。その後、ライセートを水中でおよそ4倍に希釈し、Taq DNAポリメラーゼ(ライフテクノロジーズ)を用いて20μlのPCR反応を行うために3μlの稀釈したライセートを用いた。用いたプライマーは、表6中にある(エンハンサーごとに「5’F」および「3’R」のプライマー対)。
遺伝子発現レベルを測定するためのRT-qPCR
GFP陽性細胞に対して細胞をFACSソートし、AllPrep DNA/RNA Micro Kit(QIAGEN)を用いて細胞からすべてのRNAを抽出した。iScript Select cDNA Synthesis Kit (バイオ・ラッド)をランダムプライマーとともに用いて、プールした細胞に対して逆転写を行った。CFX384 TouchリアルタイムPCR解析システム(バイオ・ラッド)上でTaqMan Gene Expression Master MixおよびTaqManプローブ(アプライドバイオシステムズ)を用いてqPCRを実施した。すべてのqPCR実験をトリプリケートで実行し、mRNAレベルを判定するために平均値を用いた。参照遺伝子としてGAPDHおよび式2-ΔΔCTを用いた比較CT法を利用して相対的定量化を行った。
GFP陽性細胞に対して細胞をFACSソートし、AllPrep DNA/RNA Micro Kit(QIAGEN)を用いて細胞からすべてのRNAを抽出した。iScript Select cDNA Synthesis Kit (バイオ・ラッド)をランダムプライマーとともに用いて、プールした細胞に対して逆転写を行った。CFX384 TouchリアルタイムPCR解析システム(バイオ・ラッド)上でTaqMan Gene Expression Master MixおよびTaqManプローブ(アプライドバイオシステムズ)を用いてqPCRを実施した。すべてのqPCR実験をトリプリケートで実行し、mRNAレベルを判定するために平均値を用いた。参照遺伝子としてGAPDHおよび式2-ΔΔCTを用いた比較CT法を利用して相対的定量化を行った。
コピー数変化およびDNAメチル化
胃腫瘍および対応する正常胃組織からのゲノムDNAをAffymetrix SNP6.0アレイ上でハイブリダイズした。(Affymetrix,サンタクララ,カリフォルニア,米国)。.CELフォーマットのデータを以下の順序で処理した、(1)正規化:Affymetrix Genotyping Console4.2を用いて、生の.CELファイルを処理した。ハイブリダイゼーション・バッチによる正常胃組織のSNP6.0プロファイルから参照モデルを作成した。1次正常試料からの参照モデルを用いて、細胞株および1次腫瘍試料におけるコピー数の変化を判定した。(2)セグメンテーション:DNAcopy Rパッケージに実装されたcircular binary segmentation(CBS)アルゴリズムを用いて、コピー数のセグメンテーション・データを生成した。変化点を検出するためのp値カットオフが0.01、順列数が10,000であった。コピー数増加および欠失領域を、それぞれ、平均対数比>0.6および<-1.0を示すために定義した。DNAメチル化レベルをアッセイするために、さらにIllumina HumanMethylation450(HM450)Infinium DNAメチル化アレイを用いた。methylumi R BioConductorパッケージを用いて、メチル化β値を算出し、バックグラウンドを補正した。BMIQ法(Rにおけるwatermelonパッケージ)を用いて正規化を行った。
胃腫瘍および対応する正常胃組織からのゲノムDNAをAffymetrix SNP6.0アレイ上でハイブリダイズした。(Affymetrix,サンタクララ,カリフォルニア,米国)。.CELフォーマットのデータを以下の順序で処理した、(1)正規化:Affymetrix Genotyping Console4.2を用いて、生の.CELファイルを処理した。ハイブリダイゼーション・バッチによる正常胃組織のSNP6.0プロファイルから参照モデルを作成した。1次正常試料からの参照モデルを用いて、細胞株および1次腫瘍試料におけるコピー数の変化を判定した。(2)セグメンテーション:DNAcopy Rパッケージに実装されたcircular binary segmentation(CBS)アルゴリズムを用いて、コピー数のセグメンテーション・データを生成した。変化点を検出するためのp値カットオフが0.01、順列数が10,000であった。コピー数増加および欠失領域を、それぞれ、平均対数比>0.6および<-1.0を示すために定義した。DNAメチル化レベルをアッセイするために、さらにIllumina HumanMethylation450(HM450)Infinium DNAメチル化アレイを用いた。methylumi R BioConductorパッケージを用いて、メチル化β値を算出し、バックグラウンドを補正した。BMIQ法(Rにおけるwatermelonパッケージ)を用いて正規化を行った。
RNAseqおよび解析
すべてのRNAをQiagen RNeasy Miniキットを用いて抽出した。RNA-seqライブラリを、製造業者の使用説明書に従って、Illumina Stranded Total RNA Sample Prep Kit v2(イルミナ,サンディエゴ,カリフォルニア,米国)、Ribo-Zero Goldオプション(Epicentre,マジソン,ウィスコンシン,米国)および1μgトータルRNAを用いて構築した。完成したライブラリをAgilent Bioanalyzer(アジレント・テクノロジー,パロアルト,カリフォルニア)を用いて検証し、Illumina Cluster Stationを介してIlluminaフローセルへ適用した。ペアードエンド101bpリードオプションを用いてシークエンシングを行った。TopHat2-2.0.12(デフォルト・パラメータおよび--library-type fr-firststrand)を用いて、RNA-seqリードをヒトゲノム(hg19)へアラインした。マッピングリードの塩基配列ごとの品質および配列ごとの品質スコアをFastQCバージョン0.10.1(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)を用いて評価した。遺伝子レベルにおける転写物存在量をCufflinksによって推定した。ゼロより大きい変動を示す1次サンプルからの遺伝子発現をComBatを用いて潜在的なバッチ効果に対して補正した。遺伝子発現値は、FPKM単位で測定した。群間の差次的な発現を少なくとも2倍変化した発現および0.5FPKMの絶対値差分を示す遺伝子として同定した。
すべてのRNAをQiagen RNeasy Miniキットを用いて抽出した。RNA-seqライブラリを、製造業者の使用説明書に従って、Illumina Stranded Total RNA Sample Prep Kit v2(イルミナ,サンディエゴ,カリフォルニア,米国)、Ribo-Zero Goldオプション(Epicentre,マジソン,ウィスコンシン,米国)および1μgトータルRNAを用いて構築した。完成したライブラリをAgilent Bioanalyzer(アジレント・テクノロジー,パロアルト,カリフォルニア)を用いて検証し、Illumina Cluster Stationを介してIlluminaフローセルへ適用した。ペアードエンド101bpリードオプションを用いてシークエンシングを行った。TopHat2-2.0.12(デフォルト・パラメータおよび--library-type fr-firststrand)を用いて、RNA-seqリードをヒトゲノム(hg19)へアラインした。マッピングリードの塩基配列ごとの品質および配列ごとの品質スコアをFastQCバージョン0.10.1(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)を用いて評価した。遺伝子レベルにおける転写物存在量をCufflinksによって推定した。ゼロより大きい変動を示す1次サンプルからの遺伝子発現をComBatを用いて潜在的なバッチ効果に対して補正した。遺伝子発現値は、FPKM単位で測定した。群間の差次的な発現を少なくとも2倍変化した発現および0.5FPKMの絶対値差分を示す遺伝子として同定した。
生存解析
k-medoidsアプローチを用いて7つの独立した研究からのGC試料をクラスター化した。すべての7つの研究において発現値をもつ遺伝子のみを解析に用いた。アウトカム・メトリック(outcome metric)として全生存期間を用いたカプランマイヤー生存解析を採用した。カプランマイヤー曲線の有意性を評価するためにログランク検定を用いた。コックス回帰を用いて、年齢、腫瘍段階、Laurenの組織学的サブタイプおよび地域性(アジア人対非アジア人)のような、追加変数を伴う多変量解析を行った。
k-medoidsアプローチを用いて7つの独立した研究からのGC試料をクラスター化した。すべての7つの研究において発現値をもつ遺伝子のみを解析に用いた。アウトカム・メトリック(outcome metric)として全生存期間を用いたカプランマイヤー生存解析を採用した。カプランマイヤー曲線の有意性を評価するためにログランク検定を用いた。コックス回帰を用いて、年齢、腫瘍段階、Laurenの組織学的サブタイプおよび地域性(アジア人対非アジア人)のような、追加変数を伴う多変量解析を行った。
疾患関連SNP解析
形質関連SNPをゲノムワイド関連研究(2015年8月27日)のUCSCブラウザからダウンロードした。この研究のために、本発明者らは、非コード領域で発生するSNPに焦点を合わせて、コード領域内のSNPを除外した。各形質/疾患からのSNPと体細胞予測スーパーエンハンサーとの間の重複をBEDtools‘intersect(交差)’を用いて計算し(nGWAS)、nGWASを予測スーパーエンハンサーの外部の疾患関連SNPの総数(nGWAS’)に対して比較した。追加の対照として、一般に用いられる2つのSNPアレイ(Illumina HumanHap550およびAffymetrix SNP6)からのすべてのSNPのセットを用いて、「SNPバックグラウンド」モデルを作成した。予測スーパーエンハンサーと重複するSNPバックグラウンドからのSNPの数を算出して(nBackground)、予測スーパーエンハンサーの外部のバックグラウンドSNPの総数(nBackground’)に対して比較した。予測スーパーエンハンサーにおける正常SNPの比をnBackground/nBackground’として計算した。予測スーパーエンハンサーにおける疾患関連SNP数の増加がこれらの領域におけるSNPの高出現率と関連付けられると予想すると、本発明者らの帰無仮説は、結果として、疾患関連SNPの比と正常SNPの比(濃縮比)との間に何も差がないということである。統計学的に有意と見做される濃縮p値<0.01を用いて、カイ二乗検定を実施した。リスク関連SNPとヒストン修飾との間の関係を理解するために、本研究は、少なくとも2つの独立した研究において疾患と関連付けられるがわかった胃腸疾患(例えば、潰瘍性大腸炎および結腸直腸癌)で検証されたSNPを同定した。GATK Unified Genotyperを用いて、試料を疾患関連SNPの存在に基づいて2つの群に分類した。疾患関連SNP有りまたは無しの試料において腫瘍と、対応する正常との間でH3K27acシグナルの差を比較した。
形質関連SNPをゲノムワイド関連研究(2015年8月27日)のUCSCブラウザからダウンロードした。この研究のために、本発明者らは、非コード領域で発生するSNPに焦点を合わせて、コード領域内のSNPを除外した。各形質/疾患からのSNPと体細胞予測スーパーエンハンサーとの間の重複をBEDtools‘intersect(交差)’を用いて計算し(nGWAS)、nGWASを予測スーパーエンハンサーの外部の疾患関連SNPの総数(nGWAS’)に対して比較した。追加の対照として、一般に用いられる2つのSNPアレイ(Illumina HumanHap550およびAffymetrix SNP6)からのすべてのSNPのセットを用いて、「SNPバックグラウンド」モデルを作成した。予測スーパーエンハンサーと重複するSNPバックグラウンドからのSNPの数を算出して(nBackground)、予測スーパーエンハンサーの外部のバックグラウンドSNPの総数(nBackground’)に対して比較した。予測スーパーエンハンサーにおける正常SNPの比をnBackground/nBackground’として計算した。予測スーパーエンハンサーにおける疾患関連SNP数の増加がこれらの領域におけるSNPの高出現率と関連付けられると予想すると、本発明者らの帰無仮説は、結果として、疾患関連SNPの比と正常SNPの比(濃縮比)との間に何も差がないということである。統計学的に有意と見做される濃縮p値<0.01を用いて、カイ二乗検定を実施した。リスク関連SNPとヒストン修飾との間の関係を理解するために、本研究は、少なくとも2つの独立した研究において疾患と関連付けられるがわかった胃腸疾患(例えば、潰瘍性大腸炎および結腸直腸癌)で検証されたSNPを同定した。GATK Unified Genotyperを用いて、試料を疾患関連SNPの存在に基づいて2つの群に分類した。疾患関連SNP有りまたは無しの試料において腫瘍と、対応する正常との間でH3K27acシグナルの差を比較した。
転写因結合モチーフ解析
本研究は、ReMapデータベースを用いて、体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける転写因子の濃縮を調べた。予測スーパーエンハンサーと少なくとも60%が重複した転写因子部位をカウントして、上位10個の最も濃縮された転写因子のランクを比較した。転写因子の結合密度は、領域の100万塩基対(Mbp)の単位のトータルサイズで除した、その領域で検出した全結合部位として計算した。CDX2については、他の転写因子の近接した結合を予測するために、HOMERをデフォルト・パラメータとともに用いて反復的に増加する体細胞予測スーパーエンハンサーにおいてCDX2結合部位を検査した。HOMER出力から同定した上位20個の転写因子を発現相関解析のために用いた。加えて、PScanChIPをJASPAR2016とともに用いてCDX2共結合モチーフも同定した。CDX2と潜在的な共結合パートナーとの間の発現相関(スピアマンの相関)を評価した。
本研究は、ReMapデータベースを用いて、体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける転写因子の濃縮を調べた。予測スーパーエンハンサーと少なくとも60%が重複した転写因子部位をカウントして、上位10個の最も濃縮された転写因子のランクを比較した。転写因子の結合密度は、領域の100万塩基対(Mbp)の単位のトータルサイズで除した、その領域で検出した全結合部位として計算した。CDX2については、他の転写因子の近接した結合を予測するために、HOMERをデフォルト・パラメータとともに用いて反復的に増加する体細胞予測スーパーエンハンサーにおいてCDX2結合部位を検査した。HOMER出力から同定した上位20個の転写因子を発現相関解析のために用いた。加えて、PScanChIPをJASPAR2016とともに用いてCDX2共結合モチーフも同定した。CDX2と潜在的な共結合パートナーとの間の発現相関(スピアマンの相関)を評価した。
siRNAトランスフェクション
製造業者の使用説明書に従って、Dharmafect 1トランスフェクト剤を用い、6ウェルプレートにおいて細胞(2×105)に50nMでトランスフェクトするために、ON-TARGETplus Human siRNA SMARTpools(HNF4αおよびCDX2)、individual ON-TARGETplus Human individual siRNAs(HNF4α)ならびにON-TARGETplus Non-targeting siRNA対照(Dharmacon/サーモフィッシャーサイエンティフィック)を用いた。定量的RT-PCRおよび/またはウエスタンブロット解析を用いて、72時間のRNAi処理後のノックダウン効率を検査した(図23)。
製造業者の使用説明書に従って、Dharmafect 1トランスフェクト剤を用い、6ウェルプレートにおいて細胞(2×105)に50nMでトランスフェクトするために、ON-TARGETplus Human siRNA SMARTpools(HNF4αおよびCDX2)、individual ON-TARGETplus Human individual siRNAs(HNF4α)ならびにON-TARGETplus Non-targeting siRNA対照(Dharmacon/サーモフィッシャーサイエンティフィック)を用いた。定量的RT-PCRおよび/またはウエスタンブロット解析を用いて、72時間のRNAi処理後のノックダウン効率を検査した(図23)。
ウエスタンブロッティング
細胞(2×105)をRIPAバッファー(シグマ)中に収集して、氷上で10分間溶解させた。Pierce BCAタンパク質アッセイ(サーモサイエンティフィック)を用いて上清の濃度を測定した。ライセートを探索するために、CDX2(1:500;MU392A-UC,Biogenex),HNF4α(1:1000;sc-8987,Santa Cruz Biotechnology)およびGAPDH(1:3000;60004-1-Ig,Proteintech Group)抗体を用いた。
細胞(2×105)をRIPAバッファー(シグマ)中に収集して、氷上で10分間溶解させた。Pierce BCAタンパク質アッセイ(サーモサイエンティフィック)を用いて上清の濃度を測定した。ライセートを探索するために、CDX2(1:500;MU392A-UC,Biogenex),HNF4α(1:1000;sc-8987,Santa Cruz Biotechnology)およびGAPDH(1:3000;60004-1-Ig,Proteintech Group)抗体を用いた。
定量的RT-PCR
すべてのRNAをRNeasy Mini Kit(Qiagen)を用いて単離して、DNAをRNase-Free DNase Set(Qiagen)を用いて除去した。Superscript III First Strand Synthesis System (Invitrogen)を用いて2ugのRNAを逆転写し、相補的DNAをSYBRGreen PCR Master Mix(アプライドバイオシステムズ)を用いて増幅した。倍率変化をGAPDHへ正規化した。プライマー配列は、次の通りである。HNF4α:F1-5’GTGCGGAAGAACCACATGTACTC3’(SEQ ID NO:143)、R1-5’CGGAAGCATTTCTTGAGCCTG3’(SEQ ID NO:144)、F2-5’CTGCAGGCTCAAGAAATGCTT3’(SEQ ID NO:145)、R2-5’TCATTCTGGACGGCTTCCTT3’(SEQ ID NO:146)、F3-5’TGTCCCGACAGATCACCTC3’(SEQ ID NO:147)、R3-5’CACTCAACGAGAACCAGCAG3’(SEQ ID NO:148);CDX2:F1-5’GCAGCCAAGTGAAAACCAGG3’(SEQ ID NO:149)、R1-5’CCTCCGGATGGTGATGTAGC3’(SEQ ID NO:150)、F2-5’AGTCGCTACATCACCATCCG3’(SEQ ID NO:151)、R2-5’TTCCTCTCCTTTGCTCTGCG3’(SEQ ID NO:152);GAPDH:F-5’CCAGGGCTGCTTTTAACTC3’(SEQ ID NO:153)、R-5’GCTCCCCCCTGCAAATGA3’(SEQ ID NO:154)。
すべてのRNAをRNeasy Mini Kit(Qiagen)を用いて単離して、DNAをRNase-Free DNase Set(Qiagen)を用いて除去した。Superscript III First Strand Synthesis System (Invitrogen)を用いて2ugのRNAを逆転写し、相補的DNAをSYBRGreen PCR Master Mix(アプライドバイオシステムズ)を用いて増幅した。倍率変化をGAPDHへ正規化した。プライマー配列は、次の通りである。HNF4α:F1-5’GTGCGGAAGAACCACATGTACTC3’(SEQ ID NO:143)、R1-5’CGGAAGCATTTCTTGAGCCTG3’(SEQ ID NO:144)、F2-5’CTGCAGGCTCAAGAAATGCTT3’(SEQ ID NO:145)、R2-5’TCATTCTGGACGGCTTCCTT3’(SEQ ID NO:146)、F3-5’TGTCCCGACAGATCACCTC3’(SEQ ID NO:147)、R3-5’CACTCAACGAGAACCAGCAG3’(SEQ ID NO:148);CDX2:F1-5’GCAGCCAAGTGAAAACCAGG3’(SEQ ID NO:149)、R1-5’CCTCCGGATGGTGATGTAGC3’(SEQ ID NO:150)、F2-5’AGTCGCTACATCACCATCCG3’(SEQ ID NO:151)、R2-5’TTCCTCTCCTTTGCTCTGCG3’(SEQ ID NO:152);GAPDH:F-5’CCAGGGCTGCTTTTAACTC3’(SEQ ID NO:153)、R-5’GCTCCCCCCTGCAAATGA3’(SEQ ID NO:154)。
CDX2およびHNF4α ChIP-seqおよび解析
細胞を室温において10分間、1%ホルムアルデヒトで架橋し、0.2Mの最終濃度までグリシンを添加することにより停止した。クロマチンを抽出して、500bpへ超音波処理した。クロマチン免疫沈澱(ChIP)のために、CDX2(MU392A-UC,Biogenex)およびHNF4α(sc-8987,Santa Cruz Biotechnology)抗体を用いた。ChIPのために、製造業者のプロトコル(ニュー・イングランド・バイオラボ)に従ってChIPed DNA(10ng)をDNAシークエンシング(ChIP-seq)ライブラリ・コンストラクション(library construction)とともに用いた。ChIP-seqピーク抽出(peak calling)を正規化するために、免疫沈降前の細胞からの入力DNAを用いた。シークエンシング前に、陽性および陰性対照ChIP領域が線形範囲内で増幅したことを検証するためにqPCRを用いた。バイオアナライザー(アジレント・エクノロジー)を用いて、ライブラリ試料のサイズ分布をチェックした。腸型およびびまん型GC(腸型10個,びまん6個)に特異的な反復的に増加する予測スーパーエンハンサーを比較した最初の解析では、2つのサブタイプ間でCDX2結合における有意差は何も観測されなかった。しかしながら、CDX2発現には同じサブタイプの個々の腫瘍間で高いサブタイプ内の変動性があることをより深い解析が明らかにし、これは、CDX2発現が腸サブタイプGCと絶対的に関連付けられるわけではないというこれまでの報告と一貫性がある。従って、この研究は、GCをそれらの個々のCDX2発現レベルによって順序付けて調べる、相補的な解析を行った。次に、高(n=8)および低(n=8)CDX2発現を示したGC試料において同定した反復性体細胞増加予測スーパーエンハンサーにおけるCDX2結合密度を計算した。差次的な結合シグナル解析は、1次試料において体細胞増加を示すか、もしくは何も変化を示さず、OCUM-1またはSNU16細胞株においても検出されたそれらの予測スーパーエンハンサーに跨る200ビンについてCDX2およびHNF4αに対する結合シグナルを計算した。シグナルは、RPKM単位で測定した。H3K27ac強度に対する転写因子(TF)ノックダウンの効果を推定するために、独立した野生型(WT:wild type)試料間で観測したH3K27acシグナル変動を備える内部標準を定義した。TFサイレンスした(siCDX2、siHNF4α、およびダブルTF)試料に対するWT試料間の差を測定し、次に、それらの差をこのバックグラウンド変動に対して比較した。バックグラウンド変動の差>99%のサブ領域をH3K27ac枯渇と称し、一方でバックグラウンド変動の差<1%をH3K27ac増加と称した。予測スーパーエンハンサーに対応するH3K27ac枯渇サブ領域の統計学的な濃縮をフィシャーの片側正確検定を用いて実施した。差次的な領域と、近接するCDX2/HNF4α結合部位へのそれらの距離との関係を調べるために、領域をそれらの距離分布に基づいて3つのカテゴリー(近い、中間、遠位)にさらに分離した。H3K27ac枯渇サブ領域と、CDX2-HNF4α共結合部位との間の距離を解析するために、CDX2およびHNF4α頂点間の中点位置を用いた。TFサイレンスした細胞における遺伝子発現と体細胞増加予測スーパーエンハンサーとの間の関連付けを調べるために、本発明者らは、1次試料においてH3K27ac予測スーパーエンハンサー・シグナルと有意な正の発現相関を示し(r>0.4;P<0.05;両側t検定)、GC細胞株においても観測した予測スーパーエンハンサーに連結された遺伝子を選択した。予測スーパーエンハンサー標的遺伝子発現に対する転写因子ノックダウンの有意性を評価するために、順列アプローチを用いた。具体的には、TFサイレンシング後にH3K27ac枯渇を示す予測スーパーエンハンサーに焦点を合わせて、本発明者らは、遺伝子への実際のスーパーエンハンサーの割り当てを10,000回並べ替えた。次に、並べ替えた遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の数が、実際の遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の実験的に観測した数を超過する回数をカウントすることによって、経験的なP値を導出した。
細胞を室温において10分間、1%ホルムアルデヒトで架橋し、0.2Mの最終濃度までグリシンを添加することにより停止した。クロマチンを抽出して、500bpへ超音波処理した。クロマチン免疫沈澱(ChIP)のために、CDX2(MU392A-UC,Biogenex)およびHNF4α(sc-8987,Santa Cruz Biotechnology)抗体を用いた。ChIPのために、製造業者のプロトコル(ニュー・イングランド・バイオラボ)に従ってChIPed DNA(10ng)をDNAシークエンシング(ChIP-seq)ライブラリ・コンストラクション(library construction)とともに用いた。ChIP-seqピーク抽出(peak calling)を正規化するために、免疫沈降前の細胞からの入力DNAを用いた。シークエンシング前に、陽性および陰性対照ChIP領域が線形範囲内で増幅したことを検証するためにqPCRを用いた。バイオアナライザー(アジレント・エクノロジー)を用いて、ライブラリ試料のサイズ分布をチェックした。腸型およびびまん型GC(腸型10個,びまん6個)に特異的な反復的に増加する予測スーパーエンハンサーを比較した最初の解析では、2つのサブタイプ間でCDX2結合における有意差は何も観測されなかった。しかしながら、CDX2発現には同じサブタイプの個々の腫瘍間で高いサブタイプ内の変動性があることをより深い解析が明らかにし、これは、CDX2発現が腸サブタイプGCと絶対的に関連付けられるわけではないというこれまでの報告と一貫性がある。従って、この研究は、GCをそれらの個々のCDX2発現レベルによって順序付けて調べる、相補的な解析を行った。次に、高(n=8)および低(n=8)CDX2発現を示したGC試料において同定した反復性体細胞増加予測スーパーエンハンサーにおけるCDX2結合密度を計算した。差次的な結合シグナル解析は、1次試料において体細胞増加を示すか、もしくは何も変化を示さず、OCUM-1またはSNU16細胞株においても検出されたそれらの予測スーパーエンハンサーに跨る200ビンについてCDX2およびHNF4αに対する結合シグナルを計算した。シグナルは、RPKM単位で測定した。H3K27ac強度に対する転写因子(TF)ノックダウンの効果を推定するために、独立した野生型(WT:wild type)試料間で観測したH3K27acシグナル変動を備える内部標準を定義した。TFサイレンスした(siCDX2、siHNF4α、およびダブルTF)試料に対するWT試料間の差を測定し、次に、それらの差をこのバックグラウンド変動に対して比較した。バックグラウンド変動の差>99%のサブ領域をH3K27ac枯渇と称し、一方でバックグラウンド変動の差<1%をH3K27ac増加と称した。予測スーパーエンハンサーに対応するH3K27ac枯渇サブ領域の統計学的な濃縮をフィシャーの片側正確検定を用いて実施した。差次的な領域と、近接するCDX2/HNF4α結合部位へのそれらの距離との関係を調べるために、領域をそれらの距離分布に基づいて3つのカテゴリー(近い、中間、遠位)にさらに分離した。H3K27ac枯渇サブ領域と、CDX2-HNF4α共結合部位との間の距離を解析するために、CDX2およびHNF4α頂点間の中点位置を用いた。TFサイレンスした細胞における遺伝子発現と体細胞増加予測スーパーエンハンサーとの間の関連付けを調べるために、本発明者らは、1次試料においてH3K27ac予測スーパーエンハンサー・シグナルと有意な正の発現相関を示し(r>0.4;P<0.05;両側t検定)、GC細胞株においても観測した予測スーパーエンハンサーに連結された遺伝子を選択した。予測スーパーエンハンサー標的遺伝子発現に対する転写因子ノックダウンの有意性を評価するために、順列アプローチを用いた。具体的には、TFサイレンシング後にH3K27ac枯渇を示す予測スーパーエンハンサーに焦点を合わせて、本発明者らは、遺伝子への実際のスーパーエンハンサーの割り当てを10,000回並べ替えた。次に、並べ替えた遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の数が、実際の遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の実験的に観測した数を超過する回数をカウントすることによって、経験的なP値を導出した。
データ利用可能性
本研究の間に発生させたヒストンNanoChIP-seq(GSE76153およびGSE75898)、SNPアレイ(GSE85466)、RNA-seq(GSE85465)およびDNAメチル化データ(GSE85464)は、Gene Expression Omnibusに寄託した。先に寄託し、この研究に用いたヒストンChIP-seq(GSE51776およびGSE75595)ならびにSNPアレイ(GSE31168およびGSE36138)は、Gene Expression Omnibusにおいて入手可能である。エピゲノムロードマップからの正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibus(GSM1027325、GSM1027320)から得た。この研究において解析したRNAPII ChIA-PETデータは、encodeproject.orgおよびGene Expression Omnibus(GSE72816)から得た。
本研究の間に発生させたヒストンNanoChIP-seq(GSE76153およびGSE75898)、SNPアレイ(GSE85466)、RNA-seq(GSE85465)およびDNAメチル化データ(GSE85464)は、Gene Expression Omnibusに寄託した。先に寄託し、この研究に用いたヒストンChIP-seq(GSE51776およびGSE75595)ならびにSNPアレイ(GSE31168およびGSE36138)は、Gene Expression Omnibusにおいて入手可能である。エピゲノムロードマップからの正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibus(GSM1027325、GSM1027320)から得た。この研究において解析したRNAPII ChIA-PETデータは、encodeproject.orgおよびGene Expression Omnibus(GSE72816)から得た。
結果
GC細胞株の遠位予測エンハンサーの景観
Nano-ChIPseqを用いて、19個の1次GC、19個の対応する正常胃組織、および複数のヒストンH3修飾(H3K27ac、H3K4me3、H3K4me1)をカバーする11個のGC細胞株から110個のクロマチン・プロファイル(プロファイル当たり平均約3.3×107リード)を発生させた。1次GCの臨床情報および分子分類を表8に、シークエンシング統計データを表1に、GC株に関する臨床病理学的詳細を表9に提示する。このシリーズは、腺癌を形成する10個の腺(53%、腸型)、高浸潤性孤立細胞をもつ6個の試料(32%、びまん型)および混合組織の3個のGC試料(15%)を含んだ。腫瘍(n=12)のうちの60%超がステージ3以上(AJCC第7版)であった。マッピング品質フィルターにおける変更、生物学的レプリケートおよびプロモーターChIP濃縮の解析、ならびに品質管理ソフトウェアCHANCE(CHip-seq ANalytics and Confidence Estimation)による評価を含めて、Nano-ChIPseqデータの広範な品質管理解析を行った。マッピング閾値の厳しさを(MAPQ≧10から20へ)増加させても、マッピング統計を感知できるほど変化させることはなく-全マッピングリードのうちの90%超が維持されて、それぞれ、ChIP濃縮ピークのうちの85%および予測エンハンサーのうちの98%を再発見した(図7)。Nano-ChIPseqによって発生させたKATO-III細胞の生物学的レプリケート間の、さらに従来のChIP-seqによって発生させた独立したKATO-III H3K27acデータに対する、ヒストンピークの一致は、高い再現性(約85%および約90%の重複)(図8)を確認した。高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力で補正したH3K27acならびにH3K4me3シグナルの比較は、それぞれ、50個のうちの48個(96%)のH3K27acおよび42個のうちの42個(100%)のH3K4me3ライブラリにおける好結果の濃縮を明らかにした。ChIP濃縮のCHANCE解析は、特に(プロモーターにおいて枯渇した)H3K4me1について、試料の大多数(85%)が好結果の濃縮を示すことを明らかにした(方法)。これらの結果は、Nano-ChIPseqコホートの良好な技術的品質を実証する。Nano-ChIPseqに加えて、さらに、DNAメチル化解析(Infinium HumanMethylation 450K BeadChipアレイ)、コピー数解析(AffymetrixSNPアレイ)およびIllumina RNA-シークエンシングのために試料を処理した。
GC細胞株の遠位予測エンハンサーの景観
Nano-ChIPseqを用いて、19個の1次GC、19個の対応する正常胃組織、および複数のヒストンH3修飾(H3K27ac、H3K4me3、H3K4me1)をカバーする11個のGC細胞株から110個のクロマチン・プロファイル(プロファイル当たり平均約3.3×107リード)を発生させた。1次GCの臨床情報および分子分類を表8に、シークエンシング統計データを表1に、GC株に関する臨床病理学的詳細を表9に提示する。このシリーズは、腺癌を形成する10個の腺(53%、腸型)、高浸潤性孤立細胞をもつ6個の試料(32%、びまん型)および混合組織の3個のGC試料(15%)を含んだ。腫瘍(n=12)のうちの60%超がステージ3以上(AJCC第7版)であった。マッピング品質フィルターにおける変更、生物学的レプリケートおよびプロモーターChIP濃縮の解析、ならびに品質管理ソフトウェアCHANCE(CHip-seq ANalytics and Confidence Estimation)による評価を含めて、Nano-ChIPseqデータの広範な品質管理解析を行った。マッピング閾値の厳しさを(MAPQ≧10から20へ)増加させても、マッピング統計を感知できるほど変化させることはなく-全マッピングリードのうちの90%超が維持されて、それぞれ、ChIP濃縮ピークのうちの85%および予測エンハンサーのうちの98%を再発見した(図7)。Nano-ChIPseqによって発生させたKATO-III細胞の生物学的レプリケート間の、さらに従来のChIP-seqによって発生させた独立したKATO-III H3K27acデータに対する、ヒストンピークの一致は、高い再現性(約85%および約90%の重複)(図8)を確認した。高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力で補正したH3K27acならびにH3K4me3シグナルの比較は、それぞれ、50個のうちの48個(96%)のH3K27acおよび42個のうちの42個(100%)のH3K4me3ライブラリにおける好結果の濃縮を明らかにした。ChIP濃縮のCHANCE解析は、特に(プロモーターにおいて枯渇した)H3K4me1について、試料の大多数(85%)が好結果の濃縮を示すことを明らかにした(方法)。これらの結果は、Nano-ChIPseqコホートの良好な技術的品質を実証する。Nano-ChIPseqに加えて、さらに、DNAメチル化解析(Infinium HumanMethylation 450K BeadChipアレイ)、コピー数解析(AffymetrixSNPアレイ)およびIllumina RNA-シークエンシングのために試料を処理した。
一次組織における間質性汚染がゲノム結果に影響を及ぼしかねないことをこれまでの研究が示し、細胞株が本質的に純粋に上皮性であり、最も高いデータ品質を有することから、GCにおける癌関連遠位エンハンサーを発見するための発見コホートとしてGC細胞株を選んだ。本研究は、複数のGC試料中に存在し、個別化された細胞株の特徴と関連付けられた「プライベートな」エピジェネティック変化の導入を低減する、反復性エピジェネティック変化にも焦点を合わせる。第1に、活性なプロモーターおよびエンハンサーをマークすることがこれまでに示されたH3K27acシグナルに基づいて、ゲノムワイド・シス調節エレメントをマッピングした。エンハンサーエレメントを濃縮するために、本研究は、既知のアノテートされた転写開始点(図1a)から遠く離れた位置にある(TSS;>2.5kb)H3K27acシグナルに焦点を合わせた。本研究は、次に、集約したH3K4me1およびH3K4me3データを用い、高H3K4me3/H3K4me1対数比(>2.4)を示す予測エンハンサーを解析から除外して、エンハンサー予測をさらに精緻化した。このアプローチを用いて、GC株において3,017~14,338個の推定上の遠位エンハンサーを同定し(図1b)、平均ゲノムフットプリントは、25Mb/株であった。
合計すると、本研究は、約140Mbまたはヒトゲノムのおよそ5%に及ぶ、36,973個の予測遠位エンハンサー領域を検出した。予測エンハンサーは、二峰性H3K27acシグナル分布(図1b)を示し、H3K4me3が枯渇し、H3K4me1シグナル(図1cおよび図9)が濃縮された。これらのH3K27ac濃縮領域の目視比較は、いくつかの領域が複数の株において活性(「反復性」)であり、一方で他の領域は、1つの株のみで活性(「プライベート」)であることを明らかにした。予測エンハンサーのうちのおよそ47%が反復性であり、少なくとも2つのGC細胞株において活性を示した(図1d)。反復性エンハンサーのパーセンテージは、プロモーターと比較して著しくより低く(67%対47%,P<2.2×10-16,片側比率検定)、エンハンサー活性が複数のGC細胞株にわたって非常に可変的であることを示す。
予測エンハンサーを公的に利用可能なエピゲノム・データセットを統合することによって検証した。エピゲノムロードマップからの正常胃組織のDNaseI高感受性データを用いると、予測エンハンサーではDHSシグナル分布(log変換したRPKM)がランダムに選択した領域より著しくより大きく(P<2.2×10-16,ウェルチの片側t検定;図1e,方法)、予測エンハンサーがオープンクロマチンと関連付けられることを示すことがわかった。9個の異なる組織および細胞カテゴリーのDHSおよびH3K27acデータに対して比較したときに、予測エンハンサーは、消化および上皮組織(胎児の腸、胃、および小腸)からのDHS陽性およびH3K27ac陽性領域と最も高い重複を示し、血液またはT細胞のような非上皮組織タイプとは別個であった(図1f)。それらの調節潜在力を支持して、予測エンハンサーのうちの54%(n=20,127)がEP300結合部位と関連付けられ(図1g;P<0.001、経験的検定)、92%が転写因子(TF)結合部位と関連付けられた。DNA配列レベルでは、予測エンハンサー配列のうちの63%が進化的に保存されていた(図1h;P<0.0001、経験的検定)。
スーパーエンハンサーは、癌シグネチャー(cancer signature)中に濃縮される
ROSEアルゴリズムを用いて、全体として3,759個の非冗長予測スーパーエンハンサーを包含する、GC株当たり133~1,318個の予測スーパーエンハンサーを同定した(図2a)。従って、GC細胞株の予測エンハンサーのうちの約10%が予測スーパーエンハンサー活性と関連付けられると推定される。予測典型エンハンサーと比較して、予測スーパーエンハンサーは、反復性が著しくより強い傾向を示し(図2b;片側比率検定,P<2.2×10-16)、3,345個の予測スーパーエンハンサーが少なくとも2つのGC細胞株において活性であった。注目したのは、既知のタンパク質コードGC癌遺伝子(例えば、MYCおよびKLF5;図10a)と関連付けられた予測スーパーエンハンサー、さらに、長鎖非コードRNA(lncRNA:long-noncoding RNA)をコードする、MALAT1遺伝子座(図2c)のような非タンパク質コード遺伝子領域にある予測スーパーエンハンサーがGC増殖を促進することが最近示されたことである。
ROSEアルゴリズムを用いて、全体として3,759個の非冗長予測スーパーエンハンサーを包含する、GC株当たり133~1,318個の予測スーパーエンハンサーを同定した(図2a)。従って、GC細胞株の予測エンハンサーのうちの約10%が予測スーパーエンハンサー活性と関連付けられると推定される。予測典型エンハンサーと比較して、予測スーパーエンハンサーは、反復性が著しくより強い傾向を示し(図2b;片側比率検定,P<2.2×10-16)、3,345個の予測スーパーエンハンサーが少なくとも2つのGC細胞株において活性であった。注目したのは、既知のタンパク質コードGC癌遺伝子(例えば、MYCおよびKLF5;図10a)と関連付けられた予測スーパーエンハンサー、さらに、長鎖非コードRNA(lncRNA:long-noncoding RNA)をコードする、MALAT1遺伝子座(図2c)のような非タンパク質コード遺伝子領域にある予測スーパーエンハンサーがGC増殖を促進することが最近示されたことである。
最近接の活性TSSを示す領域(プロモーターにおいて、アノテートされたTSSの500bp以内におけるH3K27ac濃縮として定義される)に基づいて、予測スーパーエンハンサーを標的遺伝子へ割り当てた。予測スーパーエンハンサー/遺伝子相互作用のうちの53%のみが最も近い近位遺伝子(closest proximal gene)を伴った(方法を参照、平均距離76kb)。予測スーパーエンハンサー/遺伝子の割り当ては、3つの直交する相互作用データセット:(i)PreSTIGEによって予測された所定の相互作用、(ii)GREAT、および(iii)公表されたRNAPII ChIP-PETデータ(encodeproject.org,GSE72816)を用いて検証した。タンパク質コード遺伝子との2,677個の予測相互作用のうちで、88%がこれら3つのデータセットのうちの少なくとも1つによって支持された(図11)。i)~iii)における後者の検証データのための生体試料が胃組織を含まなかったので(後続セクションを参照)、この数は、下限値であると思われる。予測スーパーエンハンサーと関連付けられた生物学的テーマを理解するために、本研究は、GOrillaパスウェイ解析を適用し、癌発生とおそらく関係する生物学的プロセス、例えば、シグナル伝達、プログラム細胞死、および細胞増殖が予測スーパーエンハンサー連結遺伝子と強く関連付けられることを見出した(p値6.7×10-22~2.3×10-13,GOrillaによる超幾何検定)(図2d)。これらのプロセスの多く(例えば、プログラム細胞死、細胞増殖の調節)は、反復性予測スーパーエンハンサーをGREATによって解析したときに有意に関連付けられたままであり、これらの濃縮は、大きい遺伝子間領域が隣接した遺伝子に対するバイアスには起因しないことを示した(図12)。上位の予測典型エンハンサーに連結された遺伝子を採用した同様の解析は、より少ない度合いの濃縮をもたらした(図2d)。予測スーパーエンハンサー関連遺伝子は、癌遺伝子についても濃縮された(P=1.7×10-8,フィシャーの片側正確検定)。遺伝子発現へ相関付けられたときには、反復性予測スーパーエンハンサーおよび典型エンハンサーと関連付けられた遺伝子がいずれもRNA発現と有意に相関付けられた(図10b)。
1次腫瘍におけるスーパーエンハンサーの異質性
どの細胞株の予測スーパーエンハンサーが体細胞変化とも関連付けられるかをインビボで判定するために、本研究は、19個の1次GCおよび対応する正常胃組織にわたってH3K27ac濃縮レベルをこれらの領域について比較した。これまでの研究が、限られた標本サイズに起因して、GCの個別的な分子サブタイプの存在を示唆したのに対して、現在の研究は、対応する正常組織と比較して、複数のGC組織中に保存された予測エンハンサーの差に焦点を合わることを選んだ(考察を参照)。解析の前に、公表されたプロファイルに対する相関付け(セクション「エピゲノムロードマップに対する1次胃非悪性試料の比較」を参照)によって、1次胃正常試料が胃上皮を確かに反映していることを確認した。3,759個の細胞株の予測スーパーエンハンサーのうちで、3分の2が腫瘍と対応する正常試料との間で差次的な濃縮を示した(図3a、表2、以降は体細胞が変化したと称する)。予測スーパーエンハンサーのうちの半数近く(n=1,748;47%)が2つ以上の1次GCにおいて体細胞増加(腫瘍における2倍超の濃縮,最小0.5RPKMの差)を示し、これらの増加した予測スーパーエンハンサーを用いた主成分分析(PCA)は、GCと対応する正常組織との間の分離を確認した(図3b)。これらの結果の一貫性を支持して、すべての品質管理基準に合格したそれらの正常/腫瘍(N/T)1次対(14対、前を参照)のみを用いたときに、これらの反復性体細胞増加予測スーパーエンハンサーのうちの圧倒的多数(85%、1.5超の倍率変化閾値)を再発見した。予想外に、癌細胞株におけるそれらの活性にも係わらず、予測スーパーエンハンサーのうちの実質的な比率(18%)が、1次GCにおける増加ではなく、むしろ体細胞欠失と関連付けられた(図3a)。これらの後者の領域は、1次腫瘍ではエピジェネティックにサイレンスされたが、インビトロ培養の間に細胞株中で再活性化された領域を表すかもしれない可能性がある(図13a)。予測スーパーエンハンサーのうちの11%(n=416)は、GCおよび正常組織間で変化しないH3K27acレベルを示し(図3a、図13b)、これらの領域は、癌関連ではないが「ハウスキーピング」または一般的な組織機能に関係することと一貫性があった。最後に、細胞株の予測スーパーエンハンサーのうちの21%(n=808)は、解析のための1次試料において十分なH3K27ac濃縮を示さなかった(RPKM<0.5)(図13c)。興味深いことに、このクラスは、GC株における低反復性とも関連付けられた(図3a-黒いヒストグラム)。全体として解釈すると、これらの結果は、細胞株に由来する予測スーパーエンハンサーを1次腫瘍および対応する正常対照からのヒストン修飾データを用いて少なくとも3つのカテゴリー-体細胞増加、体細胞欠失、および非変化へさらに下位分類できることを実証する。上位100個の体細胞予測スーパーエンハンサーのリストを表2に提示する。
どの細胞株の予測スーパーエンハンサーが体細胞変化とも関連付けられるかをインビボで判定するために、本研究は、19個の1次GCおよび対応する正常胃組織にわたってH3K27ac濃縮レベルをこれらの領域について比較した。これまでの研究が、限られた標本サイズに起因して、GCの個別的な分子サブタイプの存在を示唆したのに対して、現在の研究は、対応する正常組織と比較して、複数のGC組織中に保存された予測エンハンサーの差に焦点を合わることを選んだ(考察を参照)。解析の前に、公表されたプロファイルに対する相関付け(セクション「エピゲノムロードマップに対する1次胃非悪性試料の比較」を参照)によって、1次胃正常試料が胃上皮を確かに反映していることを確認した。3,759個の細胞株の予測スーパーエンハンサーのうちで、3分の2が腫瘍と対応する正常試料との間で差次的な濃縮を示した(図3a、表2、以降は体細胞が変化したと称する)。予測スーパーエンハンサーのうちの半数近く(n=1,748;47%)が2つ以上の1次GCにおいて体細胞増加(腫瘍における2倍超の濃縮,最小0.5RPKMの差)を示し、これらの増加した予測スーパーエンハンサーを用いた主成分分析(PCA)は、GCと対応する正常組織との間の分離を確認した(図3b)。これらの結果の一貫性を支持して、すべての品質管理基準に合格したそれらの正常/腫瘍(N/T)1次対(14対、前を参照)のみを用いたときに、これらの反復性体細胞増加予測スーパーエンハンサーのうちの圧倒的多数(85%、1.5超の倍率変化閾値)を再発見した。予想外に、癌細胞株におけるそれらの活性にも係わらず、予測スーパーエンハンサーのうちの実質的な比率(18%)が、1次GCにおける増加ではなく、むしろ体細胞欠失と関連付けられた(図3a)。これらの後者の領域は、1次腫瘍ではエピジェネティックにサイレンスされたが、インビトロ培養の間に細胞株中で再活性化された領域を表すかもしれない可能性がある(図13a)。予測スーパーエンハンサーのうちの11%(n=416)は、GCおよび正常組織間で変化しないH3K27acレベルを示し(図3a、図13b)、これらの領域は、癌関連ではないが「ハウスキーピング」または一般的な組織機能に関係することと一貫性があった。最後に、細胞株の予測スーパーエンハンサーのうちの21%(n=808)は、解析のための1次試料において十分なH3K27ac濃縮を示さなかった(RPKM<0.5)(図13c)。興味深いことに、このクラスは、GC株における低反復性とも関連付けられた(図3a-黒いヒストグラム)。全体として解釈すると、これらの結果は、細胞株に由来する予測スーパーエンハンサーを1次腫瘍および対応する正常対照からのヒストン修飾データを用いて少なくとも3つのカテゴリー-体細胞増加、体細胞欠失、および非変化へさらに下位分類できることを実証する。上位100個の体細胞予測スーパーエンハンサーのリストを表2に提示する。
それらの生物学的特殊性を支持して、3つのカテゴリーに属する予測スーパーエンハンサーは、インビボで他のエピジェネティックな差も示す。例えば、H3K27acにおける予測スーパーエンハンサーの変化は、H3K4mea1のエンハンサーマークの変化と同様に相関付けられ(図3c)、DNAメチル化レベルにおいては体細胞増加予測スーパーエンハンサーが著しくより低いDNAメチル化レベルを示し、一方で体細胞欠失スーパーエンハンサーは、増加したDNAメチル化を示した(P=3.8×10-229、ウェルチ片側t検定)。非変化予測スーパーエンハンサーは、中間領域を占めた(図3d)。視覚的な例として、ABLIM2遺伝子座において体細胞増加予測スーパーエンハンサーへマッピングした、GC T2000721ではその対応する正常(N2000721)と比較して減少したDNAメチル化(より低いベータ値によって示される)を観測した(図3e)。対照的に、T2000639ではSLC1A2予測スーパーエンハンサーにおけるH3K27acシグナルの体細胞欠失がN2000639と比較して増加したDNAメチル化を示した(図3f)。これらの結果は、胃組織における予測スーパーエンハンサーの生物学的および分子的異質性をさらに支持する。
スーパーエンハンサーは、複雑なクロマチン相互作用を示す
コピー数データとの統合は、体細胞予測スーパーエンハンサーのうちの過半数がコピー数中立領域に局在化されることを明らかにした(図14a~c、「胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け」と題するセクション)。予測スーパーエンハンサーと遺伝子発現との間の関連付けを検討するために、本研究は、先のパスウェイ解析(図2)と同じ予測スーパーエンハンサー/遺伝子の割り当てを用いて、同じ1次試料からのRNA-seq情報を調べた。体細胞増加予測スーパーエンハンサーは、対応する正常試料と比較して、高められた遺伝子発現と関連付けられ、一方で体細胞欠失予測スーパーエンハンサーは、減少した発現と関連付けられた(P<2.2×10-16、ウェルチ片側t検定;図4a)。
コピー数データとの統合は、体細胞予測スーパーエンハンサーのうちの過半数がコピー数中立領域に局在化されることを明らかにした(図14a~c、「胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け」と題するセクション)。予測スーパーエンハンサーと遺伝子発現との間の関連付けを検討するために、本研究は、先のパスウェイ解析(図2)と同じ予測スーパーエンハンサー/遺伝子の割り当てを用いて、同じ1次試料からのRNA-seq情報を調べた。体細胞増加予測スーパーエンハンサーは、対応する正常試料と比較して、高められた遺伝子発現と関連付けられ、一方で体細胞欠失予測スーパーエンハンサーは、減少した発現と関連付けられた(P<2.2×10-16、ウェルチ片側t検定;図4a)。
これまでの調査は、エンハンサーが複数の遺伝子の発現に影響を及ぼしうる長距離クロマチン相互作用にしばしば関与することも示した。GCにおける体細胞予測スーパーエンハンサーと関連付けられた長距離相互作用を同定するために、本研究は、1次腫瘍試料では反復性体細胞増加を示し、さらにGC株では活性を実証する領域から選択した、36個の予測スーパーエンハンサーについて相互作用を調査すべく、Capture-C技術を適用した。3つのGC細胞株(OCUM-1,SNU16,KATO-III)を解析し、36個の予測スーパーエンハンサーにわたって複数のゲノム位置(n=92,「キャプチャポイント」と呼ばれる)を探索して、有意な相互作用を伴う88個のキャプチャポイントを同定した(Q<0.05,r3Cseqパッケージ)。図4bは、20個のキャプチャポイントをカバーする12個の代表的な予測スーパーエンハンサーを示す。平均すると、各予測スーパーエンハンサーは、それぞれ他のゲノム位置およびプロモーターとの20~26および5~7の相互作用を示した。キャプチャポイントと検出した相互作用との間の平均距離は、およそ17.0kb(標準偏差:30.5kb)であった。本研究は、OCUM-1細胞における約100kbの距離のTM4SF4プロモーターとの予測スーパーエンハンサー相互作用を含めて、より長距離の相互作用も同定した(図15)。注目すべきことに、情報を与える相互作用データをもつ領域については、実験的なCapture-C情報の利用可能性が元の予測スーパーエンハンサー/遺伝子相互作用のうちの93%(n=62)のさらなる検証も許容する。細胞株からの発現データの統合は、相互作用するプロモーターのうちの約70%が検出可能な遺伝子発現(FPKM>0)と関連付けられることを明らかにした。
代表的な例として、図4cは、SNU16細胞におけるCLDN4ゲノム領域の長距離相互作用の景観(他の例については図16)を示す。CLDN4発現がGCの進行および予後とこれまでに関連付けられていたので、この領域を選択し、CLDN4予測スーパーエンハンサーの反復性の増加を複数の1次GCにおいて観測した(図14d)。具体的には、本研究は、高いH3K27acシグナルと、さらにCDX2およびHNF4α共結合(以下を参照)とを示す2つの予測サブ・スーパーエンハンサー領域を伴う相互作用を検討することを目指した。CLDN4プロモーターとの相互作用に加えて、他の遠位プロモーター(約100kbまで)、例えば、WBSCR27、CLDN3、ABHD11およびABHD11-AS1との相互作用も検出した。ABHD11-AS1は、長い非コードRNAであり、胃癌において高発現することがこれまでに示された。Capture-Cデータを検証するために、本研究は、2つのGC株(OCUM-1,SNU16)における4つの選択された予測スーパーエンハンサーに対して環状染色体コンフォメーション・キャプチャアッセイ)(4C:circularized chromozome conformation capture asays)も行った(図17)。4C実験レプリケート間の一致率と同様の、Capture-Cおよび4Cデータ間の75%の一致を観測した(図18)。4Cシークエンシングが著しくより奥深いことに起因して、さらなる相互作用、例えば、約350kbの距離における予測スーパーエンハンサーとKLF5プロモーターとの間の長距離相互作用(図17b)も検出した。
これまでの報告は、いくつかの長距離相互作用がスーパーエンハンサー活性と関連付けられ、一方では他の相互作用がより不変で細胞系譜を反映することを示唆した。これらの知見と一致して、GC株間で差次的な活性を呈する(36個からの)22個の予測スーパーエンハンサーのうちで、4個の予測スーパーエンハンサーは、予測スーパーエンハンサー活性と長距離相互作用の存在との間の良好な相関を示した(図4dおよび図19)。残りの18個の予測スーパーエンハンサーについては、予測スーパーエンハンサー活性とは独立して長距離相互作用を観測した。
予測スーパーエンハンサーと遺伝子発現との間の因果的役割を検討するために、本研究は、CLDN4予測スーパーエンハンサー領域内の2つのエンハンサー領域(e1およびe2;図4cを参照)を欠失させるべくCRISPR/Cas9ゲノム編集を用いた。OCUM-1およびSNU16細胞におけるCRISPR欠失効率を確認した後に(図20a~c)、エンハンサー欠失および野生型細胞間の予測標的遺伝子発現レベルをRT-qPCRによって比較した。両方の細胞株において、e1のCRISPR欠失は、ABHD11、CLDN3、およびCLDN4(SNU16細胞におけるCLDN4,図20d)を含めて、複数のCLDN4座位遺伝子の下方制御を生じさせた。同様の仕方で、本研究は、OCUM-1細胞におけるe2欠失後に、ABHD11、CLDN3、およびCLDN4の下方制御も観測した(e2欠失SNU16細胞は生存可能ではなく、従って遺伝子発現解析ができなかった;図20e)。これらの結果を拡張するために、本研究は、ELF3がいくつかの悪性腫瘍における癌遺伝子としては報告されていることから、次に、OCUM-1細胞におけるELF3予測スーパーエンハンサーから2つの他の予測エンハンサーエレメント(e3およびe4)をCRISPR失欠させた(図17a,図20c)。e3およびe4の欠失は、いずれもARL8A、ELF3、RNPEPおよびTIMM17Aを含めて複数のFLF3座位遺伝子の下方制御をもたらした(図20f)。全体として解釈すると、これらの結果は、予測スーパーエンハンサー活性と腫瘍遺伝子発現との間の因果的関係を支持する。
体細胞スーパーエンハンサーおよび臨床的アウトカム
予測スーパーエンハンサーの異質性の生物学的および臨床的関連性をさらに探索すべく、本研究は、体細胞修飾状況(増加、欠失、非変化)によってカテゴリー化した癌ホールマーク解析を行った。10個の癌ホールマークのうちで、体細胞増加予測スーパーエンハンサーは、浸潤(P=8.6×10-11,フィシャーの片側正確検定)、血管新生(P=2.4×10-4,フィシャーの片側正確検定)、細胞死抵抗性(P=7.8×10-3,フィシャーの片側正確検定)に関係する遺伝子中で著しく濃縮されて、体細胞欠失および予測非変化スーパーエンハンサーを1桁超過した(図5a)。これらの結果は、体細胞増加予測スーパーエンハンサーが進行性GCと関連付けられた形質に関与しうることを示唆する。86個の細胞および組織試料の予測スーパーエンハンサー・プロファイルに対して比較したときに、GCにおける体細胞増加予測スーパーエンハンサーのうちの60%超が高組織特異性を示した。他の癌タイプ、例えば、結腸直腸癌、乳癌、子宮頸管癌および膵臓癌においてこれまでに記載された予測スーパーエンハンサーとの有意な重複(図21)(P<0.001,経験的検定)も観測し、いくつかのGC関連予測スーパーエンハンサーが他の癌タイプにおいても活性でありうることを示唆した。
予測スーパーエンハンサーの異質性の生物学的および臨床的関連性をさらに探索すべく、本研究は、体細胞修飾状況(増加、欠失、非変化)によってカテゴリー化した癌ホールマーク解析を行った。10個の癌ホールマークのうちで、体細胞増加予測スーパーエンハンサーは、浸潤(P=8.6×10-11,フィシャーの片側正確検定)、血管新生(P=2.4×10-4,フィシャーの片側正確検定)、細胞死抵抗性(P=7.8×10-3,フィシャーの片側正確検定)に関係する遺伝子中で著しく濃縮されて、体細胞欠失および予測非変化スーパーエンハンサーを1桁超過した(図5a)。これらの結果は、体細胞増加予測スーパーエンハンサーが進行性GCと関連付けられた形質に関与しうることを示唆する。86個の細胞および組織試料の予測スーパーエンハンサー・プロファイルに対して比較したときに、GCにおける体細胞増加予測スーパーエンハンサーのうちの60%超が高組織特異性を示した。他の癌タイプ、例えば、結腸直腸癌、乳癌、子宮頸管癌および膵臓癌においてこれまでに記載された予測スーパーエンハンサーとの有意な重複(図21)(P<0.001,経験的検定)も観測し、いくつかのGC関連予測スーパーエンハンサーが他の癌タイプにおいても活性でありうることを示唆した。
本研究は、次に、体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子発現パターンがGC患者の生存と関連付けられうるかどうかを尋ねた。複数のGC患者において両方の反復性体細胞増加を示し、標的遺伝子発現との最も高い相関も示す領域から、上位50個の予測スーパーエンハンサーと関連付けられた遺伝子を選択した。このアプローチの妥当性を支持して、このように選択したいくつかの遺伝子、例えば、CDH17およびCCAT1がGCにおいて過剰発現されることがこれまでに示されたことに注目した。遺伝子リストは、潜在的に新規なGC関連遺伝子、例えば、SMURF1およびLINC00299も含んだ(表10)。
生存解析は、848人のGC患者からなる3つの非アジア人GCおよび4つのアジア人GCコホートにわたって行った。予測スーパーエンハンサー関連遺伝子が高発現を示すGCをもつ患者は、これらの遺伝子が比較的低く発現されるGC試料と比較して劣る全生存期間を示した(図5b,P=1.8×10-2,ログランク検定)。この関連付けのロバスト性を支持して、患者生存との関係は、予測スーパーエンハンサーの数を変化させた後でも有意なままであった(n=30,P=0.02,ログランク検定;n=60,P=0.03,ログランク検定)。多変量解析では、さらに他のリスク要因、例えば、年齢、段階、患者地域性および組織学的サブタイプについて調整した後でも、生存期間との関連付けが統計学的に有意なままであった(P=0.044,ワルド検定)。このデータは、GCにおいて体細胞増加予測スーパーエンハンサーによって駆動される遺伝子が臨床的に重要でありうることを示す。
異なる予測スーパーエンハンサー・カテゴリーと疾患リスクとの間の関係を扱うために、疾患関連一塩基多型(SNP:single nucleotide polymorphism)が調節エレメントにおいて濃縮されること示す、これまでのゲノムワイド関連研究(GWAS:genome-wide association studies)(studies (GWAS) studies)を考慮した。本研究は、1470件のゲノムワイド関連研究から報告された疾患関連SNPのカタログを、反復性体細胞変化(増加または欠失)を示すそれらの予測スーパーエンハンサーまたは非変化予測スーパーエンハンサーに対してマッピングした。体細胞予測スーパーエンハンサーは、様々な癌(前立腺癌、結腸直腸癌、乳癌;濃縮比=3.0~7.2;P<4.4×10-3,カイ2乗検定)、および潰瘍性大腸炎のような胃腸疾患(濃縮比=3.3;P<5.2×10-4,カイ2乗検定)と関連付けられた疾患リスクSNPに対して濃縮された(図5c)。対照的に、非変化予測スーパーエンハンサーは、同様の濃縮を示さなかった。予想外に、本発明者らは、体細胞変化予測スーパーエンハンサーにおける多発性硬化症SNPの濃縮(濃縮比=4.3;P=1.8×10-7,カイ2乗検定)も観測し、これは、癌と自己免疫性応答との間の相互関連を示唆した。予測スーパーエンハンサーの疾患SNPがクロマチン修飾における局所的な変化と関連付けられうるかどうかを探索するために、本研究は、次に、少なくとも2つの研究において報告された結腸直腸癌と関連付けられ、さらにGC患者のうちの少なくとも1/3において異型接合性を示すSNPに焦点を合わせた(考察を参照)。2つのSNPがこれらの基準を満たした(rs10411210およびrs10505477)。rs10411210 SNPをもつ試料は、対応する正常なものに対して腫瘍では著しくより高いH3K27acシグナルを示し(図5d;P=0.01,片側ウェルチの片側t検定)、rs10505477 SNPをもつ試料においても同様の傾向を観測した(P=0.07,ウェルチの片側t検定)。かかる関連付けは、疾患関連リスクSNPと癌関連ヒストン修飾との間の関係を示唆する。
スーパーエンハンサーは、高密度の転写因子占有を示す
最後に、体細胞増加予測スーパーエンハンサーと関連付けられたトランス作用因子を探索した。GC予測スーパーエンハンサーは、他のゲノム領域と比較して、著しく濃縮されたENCODE TF結合プロファイルを示し、TF「ホットスポット」としての前者を支持した(P<2.2×10-16,片側比率検定)。ReMapデータベースを調べて、本研究は、次に、異なる予測スーパーエンハンサー・カテゴリーと関連付けられた特異的なTFを同定した。体細胞増加および非変化予測スーパーエンハンサーの両方がCEBPB、MYC、およびFOXA1結合における濃縮を示した。しかしながら、上位10個の濃縮されたTFの中で、CDX2は、体細胞増加予測スーパーエンハンサーにおいて濃縮の上昇を示し(ランク#2)、非変化予測スーパーエンハンサー(ランク#8)と比較して結合密度がおよそ30%増加した(図6aおよび6b)。
最後に、体細胞増加予測スーパーエンハンサーと関連付けられたトランス作用因子を探索した。GC予測スーパーエンハンサーは、他のゲノム領域と比較して、著しく濃縮されたENCODE TF結合プロファイルを示し、TF「ホットスポット」としての前者を支持した(P<2.2×10-16,片側比率検定)。ReMapデータベースを調べて、本研究は、次に、異なる予測スーパーエンハンサー・カテゴリーと関連付けられた特異的なTFを同定した。体細胞増加および非変化予測スーパーエンハンサーの両方がCEBPB、MYC、およびFOXA1結合における濃縮を示した。しかしながら、上位10個の濃縮されたTFの中で、CDX2は、体細胞増加予測スーパーエンハンサーにおいて濃縮の上昇を示し(ランク#2)、非変化予測スーパーエンハンサー(ランク#8)と比較して結合密度がおよそ30%増加した(図6aおよび6b)。
TFは、しばしば協同的な仕方で機能するので、HOMER、de novoモチーフ発見アルゴリズムを用いることによって潜在的なCDX2パートナーを同定した。HOMER解析は、CDX2結合と関連付けられたHNF4α、KLF5、およびGATA4結合モチーフを同定した(図6c)。本研究は、PScanChIPをJASPAR2016とともに用いてCDX2共結合モチーフも解析した。PScanChIPを用いて、本研究は、HNF4α、KLF5、およびGATA4を再び含む、潜在的なCDX2パートナーとして367個のタンパク質を予測した(表7)。遺伝子同時発現解析は、HNF4α(スピアマン相関、r=0.80)およびKLF5(r=0.58)がCDX2発現と最も強く相関付けられた候補であることを明らかにして、HNF4αおよびKLF5が確からしいCDX2パートナーでありうることを示唆した(図6d)。とりわけ、CDX2は、腸上皮化生のドライバーとしてこれまでにGCにおいて同定され、KLF5およびGATA4/6は、HNF4αを上方制御するために協同するGCにおける発癌性転写因子としてこれまでに報告された。
CDX2のHNF4α(最も高く相関付けられた因子)とのゲノム共同専有(co-occupancy)を実験的に確認するために、CDX2およびHNF4α ChIP-seqをOCM-1胃細胞に対して行い、TF結合位置を予測スーパーエンハンサー位置と統合した。OCUM-1細胞では、CDX2およびHNF4α結合頂点(binding summit)(q<0.01,MACS2)が高い共同専有(500bpウィンドウ)を示し、CDX2結合のうちの76%がHNF4αと同時に発生した(CDX2/HNF4α部位として知られる)(図6e)。高CDX2発現GCのうちの上位50%を下位50%に対して比較して、本発明者らは、前者のサンプルでは、反復性体細胞増加予測スーパーエンハンサーが高い方のCDX2結合密度と確かに関連付けられることを見出した(100万塩基対当たり123個の結合,Mbp対92Mbp;方法を参照)。CDX2/HNF4α部位は、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーに選択的に局在化し(P=2.4×10-4,カイ2乗検定)、CDX2およびHNF4α結合シグナルの両方が、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいて増加した(図6f)。SNU16細胞においても同様のCDX2およびHNF4α ChIP-seq結果を得た(図22a)。この結果は、GCにおける体細胞増加予測スーパーエンハンサーがCDX2およびHNF4α占有と関連付けられることを示す。
CDX2およびHNF4αがGCスーパーエンハンサーの維持に役割を果たしうるかどうかを試験するために、各TFのサイレンシングを単独かあるいは両方の因子で同時に行い、ゲノムワイドなH3K27acのプロファイリングがその後に続いた。いずれかの因子の単独かあるいは組み合わせの枯渇は、OCUM-1細胞におけるH3K27acの全体的な変化は誘発しなかった(図22b)。しかしながら、CDX2およびHNF4αのサイレンシングは、それぞれゲノムのうちの9.7Mbおよび4.3Mbにおける特異的なH3K27acの変化につながり、ダブルTFノックダウンは、著しくより大きいH3K27ac枯渇を誘発した(CDX2およびHNF4α単独と比較してP=3.4×10-29および1.2×10-88,ウィルコクソン片側順位和検定)(図22c)。シングルTFおよびダブルTFサイレンシングの両方に対して、H3K27ac枯渇は、予測典型エンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいてより顕著に発生し、TF枯渇に対するスーパーエンハンサー活性の感受性が高められたことを示唆する(図6g,図2d,表11a~11d;それぞれCDX2,HNF4αおよびCDX2/HNF4αに対してP=5.3×10-7;P=1.8×10-17;P=1.5×10-10,ウィルコクソン片側順位和検定)。これらの効果の特異性を支持して、予測スーパーエンハンサーにおけるH3K27ac枯渇は、CDX2またはHNF4α結合部位に中心がある領域において、特に、両方の因子によって共同で専有された部位においてより顕著であった(図6h)。SNU16細胞においても同様の結果を得た(図22e)。次に、予測スーパーエンハンサーと遺伝子発現との間の関係を評価するために、本研究は、TFサイレンシング後にH3K27ac枯渇を示す予測スーパーエンハンサーに焦点を合わせた。予測スーパーエンハンサー標的遺伝子のうちの60%超がTFサイレンシング後に発現の減少も示すことに注目した(siCDX2,P=4×10-4,経験的検定;siHNF4α,P<1×10-4,経験的検定;si(CDX2/HNF4α),P<1×10-4,経験的検定;図22f)。この比率は、順列解析(「方法」)によって評価されるような、偶然に予想される比率を著しく超過した。全体として解釈すると、これらの結果は、GCスーパーエンハンサーの維持におけるCDX2およびHNF4αに対する機能要件を支持する。
癌における系譜特異的エンハンサーエレメント
いくつかのエンハンサーサブ領域が癌特異的な必須性を呈しうるというコンセプトの証明として、この研究は、GC細胞または正常ES細胞のいずれかにおいてCLDN4サブエンハンサー領域(e1)を欠失させることができる程度を試験した(図15,16;表12)。図24に示すように、CLDN4 e1エンハンサーサブ領域のホモ接合型欠失は、H1 ES細胞(図26,27)では容易に達成されたが、SNU16 GC細胞では達成されず(図25,28)、SNU16癌細胞の生存にとってCLDN4 e1の1つのコピーの維持が必須でありうることを示唆した。
いくつかのエンハンサーサブ領域が癌特異的な必須性を呈しうるというコンセプトの証明として、この研究は、GC細胞または正常ES細胞のいずれかにおいてCLDN4サブエンハンサー領域(e1)を欠失させることができる程度を試験した(図15,16;表12)。図24に示すように、CLDN4 e1エンハンサーサブ領域のホモ接合型欠失は、H1 ES細胞(図26,27)では容易に達成されたが、SNU16 GC細胞では達成されず(図25,28)、SNU16癌細胞の生存にとってCLDN4 e1の1つのコピーの維持が必須でありうることを示唆した。
これは、chr7:73,262,400~73,266,700の周りの欠失を許容する。欠失のサイズは、実際の実験中に変動する。それゆえに、前述の欠失領域は、単にsgRNA設計に基づく推定である。sgRNAの配列を表13に示す。
遺伝子発現と遠位予測調節エレメントとの間の相関
Nano-ChIPseqによって定義した遠位予測調節エレメントを遺伝子発現へ相関付けるために、複数の株にわたって高反復性を示す80個の予測スーパーエンハンサーを同定した(P<0.0001,経験的検定)。高反復性予測典型エンハンサーを同定するためにも同じアプローチを用いた。予測スーパーエンハンサーおよび予測典型エンハンサーの両方に対して、遠位調節エレメントと関連付けられた遺伝子は、ランダムに選択された遺伝子より高発現(higher expression that)を示した(図10b)。予測スーパーエンハンサー/典型エンハンサー関連遺伝子の発現の比較は、予測スーパーエンハンサー関連遺伝子に対してより高い全体的な発現レベル(パーセンタイル単位)を明らかにした(P=5.2×10-3,ウィルコクソン片側順位和検定)。これらの結果は、予測スーパーエンハンサーおよび予測典型エンハンサーにおけるH3K27ac濃縮と、標的遺伝子発現との間の正の関連付けを示唆する。
Nano-ChIPseqによって定義した遠位予測調節エレメントを遺伝子発現へ相関付けるために、複数の株にわたって高反復性を示す80個の予測スーパーエンハンサーを同定した(P<0.0001,経験的検定)。高反復性予測典型エンハンサーを同定するためにも同じアプローチを用いた。予測スーパーエンハンサーおよび予測典型エンハンサーの両方に対して、遠位調節エレメントと関連付けられた遺伝子は、ランダムに選択された遺伝子より高発現(higher expression that)を示した(図10b)。予測スーパーエンハンサー/典型エンハンサー関連遺伝子の発現の比較は、予測スーパーエンハンサー関連遺伝子に対してより高い全体的な発現レベル(パーセンタイル単位)を明らかにした(P=5.2×10-3,ウィルコクソン片側順位和検定)。これらの結果は、予測スーパーエンハンサーおよび予測典型エンハンサーにおけるH3K27ac濃縮と、標的遺伝子発現との間の正の関連付けを示唆する。
1次胃非悪性試料のエピゲノムロードマップとの比較
この研究における非悪性胃組織が筋肉、免疫細胞などではなく、胃上皮を確かに反映することを確認するために、この研究からの非悪性胃H3K27acプロファイルを先に公表された正常胃プロファイルと比較し、胃平滑筋プロファイルとも比較した。Nano-ChIPseqプロファイルごとに、H3K27acシグナルのうちの70%(平均)が公表された正常胃プロファイルと重複し、一方で34%(平均)のみが胃平滑筋と重複した。結果は、非悪性胃試料が胃平滑筋ではなく胃上皮を確かに反映することを示唆する。
この研究における非悪性胃組織が筋肉、免疫細胞などではなく、胃上皮を確かに反映することを確認するために、この研究からの非悪性胃H3K27acプロファイルを先に公表された正常胃プロファイルと比較し、胃平滑筋プロファイルとも比較した。Nano-ChIPseqプロファイルごとに、H3K27acシグナルのうちの70%(平均)が公表された正常胃プロファイルと重複し、一方で34%(平均)のみが胃平滑筋と重複した。結果は、非悪性胃試料が胃平滑筋ではなく胃上皮を確かに反映することを示唆する。
胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け
本研究は、反復性体細胞変化予測スーパーエンハンサーが体細胞コピー数の変化(sCNA:somatic copy number alterations)と関連付けられうる程度を検討した。予測スーパーエンハンサー間の重複、ならびに細胞株および1次GCからのコピー数情報をインハウスで発生させたAffymetrix SNP6.0アレイデータを用いて計算した。sCNAの領域を確信的に同定することを許容するために、解析を(平均ゲノムワイド・カバレッジより2倍高い)10kb当たり少なくとも6個のSNPプローブによってカバーした領域に制限した。sCNA解析の信頼性を確認し、後者において見出したGC細胞株(FU97,KATO-III,MKN7,OCUM-1,RERFGC1B,SNU16)について、解析における平均98%のコピー数増加および82%のコピー数欠失をCancer Cell Line Encyclopediaにも報告した。
本研究は、反復性体細胞変化予測スーパーエンハンサーが体細胞コピー数の変化(sCNA:somatic copy number alterations)と関連付けられうる程度を検討した。予測スーパーエンハンサー間の重複、ならびに細胞株および1次GCからのコピー数情報をインハウスで発生させたAffymetrix SNP6.0アレイデータを用いて計算した。sCNAの領域を確信的に同定することを許容するために、解析を(平均ゲノムワイド・カバレッジより2倍高い)10kb当たり少なくとも6個のSNPプローブによってカバーした領域に制限した。sCNA解析の信頼性を確認し、後者において見出したGC細胞株(FU97,KATO-III,MKN7,OCUM-1,RERFGC1B,SNU16)について、解析における平均98%のコピー数増加および82%のコピー数欠失をCancer Cell Line Encyclopediaにも報告した。
これらの細胞株では、予測スーパーエンハンサーのうちの5~6%(±6%標準偏差)のみがコピー数増加と関連付けられることがわかった(平均log2比>0.6)。例えば、KATO-IIIにおいて検出したFGFR2関連予測スーパーエンハンサーは、コピー数増加と重複し(図14b)、遺伝子座において観測したより高いH3K27acリード密度が領域的なゲノム増幅によって潜在的に駆動されたことを示唆する。他方では、GC細胞株において検出した予測スーパーエンハンサーのうちの過半数は、コピー数中立領域に局在して、予測スーパーエンハンサーの確立が体細胞コピー数事象から独立していることを示唆する。この割合は、ランダムな偶然によるより大きい(P<0.01,経験的検定)。
同様に、1次GCにおいて、この研究は、19個の1次T/N対における1,748個の反復性体細胞増加予測スーパーエンハンサーに対してCNA/SE補正を計算することが可能であった。体細胞増加予測スーパーエンハンサーのごく一部のみ(<2%±3%s.d)がコピー数増加と重複し(図14c)、個々のT/N対において見出した体細胞増加予測スーパーエンハンサーのうちの90%超がコピー数中立領域内で検出される(図14a)ことがわかった。この結果は、予測スーパーエンハンサーにおけるH3K27acの体細胞増加とコピー数変化との間に強い関連付けがないこと、および腫瘍試料における予測スーパーエンハンサーでのH3K27ac獲得がおそらくコピー数変化とは別のメカニズムによって駆動されることを示唆する。
考察
GCは、臨床的に異質性のある疾患であり、外科手術および化学療法に加えて、トラスツズマブ(抗HER2)およびラムシルマブ(抗VEGFR2)のみが臨床的に認可され、他の分子標的剤は、現在まで不成功であることが判明している。胃腫瘍発生における重要なパスウェイとしてエピゲノム調節解除が出現して、GCではクロマチン修飾遺伝子(例えば、ARID1A)が頻繁に変異し、エピジェネティックな変化が胃前悪性と関連付けられる。しかしながら、現在まで、GCエピゲノム研究のうちの圧倒的多数が腫瘍抑制遺伝子のサイレンシングの文脈におけるプロモーターDNAメチル化に焦点を合わせてきた。対照的に、GCにおける遠位調節エレメント(すなわち、エンハンサー)については、現在、ごくわずかしか知られていない。
GCは、臨床的に異質性のある疾患であり、外科手術および化学療法に加えて、トラスツズマブ(抗HER2)およびラムシルマブ(抗VEGFR2)のみが臨床的に認可され、他の分子標的剤は、現在まで不成功であることが判明している。胃腫瘍発生における重要なパスウェイとしてエピゲノム調節解除が出現して、GCではクロマチン修飾遺伝子(例えば、ARID1A)が頻繁に変異し、エピジェネティックな変化が胃前悪性と関連付けられる。しかしながら、現在まで、GCエピゲノム研究のうちの圧倒的多数が腫瘍抑制遺伝子のサイレンシングの文脈におけるプロモーターDNAメチル化に焦点を合わせてきた。対照的に、GCにおける遠位調節エレメント(すなわち、エンハンサー)については、現在、ごくわずかしか知られていない。
この研究は、1次胃腫瘍、対応する非悪性組織、およびGC細胞株のマイクロスケール・ヒストン修飾プロファイリングを通じて同定した35k超の予測エンハンサーエレメントを解析した。小規模ChIPプロトコルは、技術的にチャレンジングなものとして知られ、時として著しい試料間変動をもたらしかねない。安心させるように、本発明者らは、腫瘍および正常試料間のNano-ChIPシグナルが、直交するChIP-qPCRの結果と良好な一致を示すことを先に実証し、本研究において、本発明者らは、Nano-ChIPseqライブラリのうちの圧倒的多数(85~100%)が許容しうる品質であることを確認すべく、マッピングの厳しさの変化、生物学的レプリケート解析、プロモーターChIP濃縮およびCHANCE解析を含む、広範な品質管理解析をさらに行った。解析をプロモーター・ベースおよびCHANCE品質解析の両方をパスした「高品質」腫瘍/正常の対のみに限ったときには反復性体細胞増加予測スーパーエンハンサーのうちの84%が依然として再発見されたという観測によって示されるように、複数の試料に存在する反復性エピゲノム変化に焦点を合わせることによって、生物学的結論がさらに確実にロバストになりうる。
この研究では、反復性予測スーパーエンハンサーは、主として、既知の癌遺伝子および発癌過程に関与している遺伝子に現れた(図2d)。近位プロモーターエレメントを超える、個々の試料間の高レベルのエンハンサーの変動(図1d)も観測した。他の組織および腫瘍タイプに対して比較したときに、GC予測スーパーエンハンサーのうちのほとんど60%が組織特異的であった(図21)。注目に値するのは、現研究ではGCを対応する非悪性胃組織に対する一般的なカテゴリーとして最大感受性について研究したことである。しかしながら、別個の病理組織学的および分子的GCサブタイプが存在し、GCの異なる組織学的サブタイプには別個のエンハンサー変化が存在しうることを示唆する。かかる知見は、エンハンサーエレメントの絶妙な組織特異的性質と、拡大する患者コホートおよび多くの異なる腫瘍タイプにおける包括的なエンハンサー・カタログを発生させる必然的なニーズとを反映する。
本研究において解析した試料のうちの過半数は、インビトロで培養した細胞株ではなく、患者に直接に由来する1次組織であった。予測エンハンサー活性(H3K27ac)を腫瘍と対応する正常なものとの間で比較することによって、細胞株の予測スーパーエンハンサーをそれらの体細胞変化状況(体細胞増加、体細胞欠失および非変化)に従ってさらに下位分類することが可能であった。それらの生物学的特殊性を支持して、サブカテゴリー化した予測スーパーエンハンサーは、エピゲノムパターン(H3K4me1,DNAメチル化)、遺伝子転写、および癌ホールマークを含めて、他の直交する特徴における特異的差異も呈した。とりわけ、本発明者らのデータでは、体細胞増加予測スーパーエンハンサーのごく一部のみがコピー数増幅の領域に局在した。予測スーパーエンハンサーを真の体細胞増加または欠失に従って下位分類する能力が癌におけるスーパーエンハンサーの確立を担う発癌メカニズムを正確に指摘するための下流の試みを改善すると思われる。かかるアプローチは、おそらく他の病状にも拡張可能である。
先験的な考察から予測スーパーエンハンサーの異質性が疾患リスクと関連付けられた生殖系列変異体を解析するときにも有用であることがわかるであろう。これまでの知見は、疾患関連SNPが一般に調節エレメントにおいて過剰提示されることを報告したが、わかったことは、非変化予測スーパーエンハンサーではなく、体細胞変化予測スーパーエンハンサーが癌および炎症性胃腸疾患と関連付けられたSNP(胃腸癌に対する既知のリスクファクター)において特異的に濃縮されることである。これらの領域におけるSNPは、TF結合モチーフの修飾、長距離クロマチン相互作用の調節、またはH3K27acレベルの変化を含めて、いくつかの非排他的メカニズムを通じて疾患リスクおよび癌発生を変化させうる。実際に、この研究では、結腸直腸癌(CRC:colorectal cancer)リスクと関連付けられた2つのSNP(rs10505477およびrs10411210)が1次GCにおけるクロマチン修飾の局所的な変化との関連付けられることに注目した。CRCリスクデータをGCと統合することが尤もないくつかの理由がある。第1に、これらのCRCリスクSNPのうちの少なくとも1つ(rs10505477)が治療反応および患者生存の両方においてGCの臨床的アウトカムに影響を及ぼすことも報告されている。第2に、GC予測スーパーエンハンサーと関連付けられた主要な転写因子(CDX2、HNF4α)が結腸発生を調節することも知られている。第3に、GCに対する前悪性リスクファクタとしての腸上皮化生(IM:intestinal metaplasia)の役割がよく確立され、IMでは胃上皮細胞が結腸上皮と同様の細胞アーキテクチャおよび外観を採る。これらの遺伝子変異体が、生殖系列DNAに存在する一方で、腫瘍におけるクロマチン構造および遺伝子発現に影響を及ぼしうるという観測がCRCでも認められている。これらの結果は、疾患素因の根底にある生殖系列過程を本発明者らが精密に理解するために、異常なエピジェネティック状態を研究する重要性をさらに際立たせる。
本研究の結果は、GCにおける個々のスーパーエンハンサーがシスおよびトランス作用転写機構とどのように相互作用しうるかに関していくつかの一般原理を示唆する。2つの別個の長距離クロマチン相互作用アッセイ(Capture-Cおよび4C)を用いて、高められた腫瘍発現を示す近位および遠位遺伝子の両方に係わる体細胞増加予測スーパーエンハンサーのいくつかの例を観測した。体細胞増加予測スーパーエンハンサーに連結された遺伝子は、コヒーシン介在エンハンサー-プロモーターループを通じて確立された、同様のトポロジカルな会合ドメイン(topological associating domain)をおそらく占めることが提案された。近位および遠位遺伝子発現の両方に影響を及ぼす体細胞増加予測スーパーエンハンサーの能力は、予測スーパーエンハンサーを、疾患の進行および化学応答に寄与しうる、胃腫瘍における異常遺伝子発現の枢要なレギュレーターとして関係付ける(図5b)。トランス・レベルでは、GCにおける体細胞増加予測スーパーエンハンサーがCDX2およびHNF4α占有と関連付けられることをデータが明らかにした。これまでの研究は、胃における異常なCDX2の発現が粘膜上皮細胞の腸上皮化生、胃腫瘍形成の重要な初期事象と関連付けられること、およびCDX2がGC癌遺伝子として機能する可能性を有することを示した。HNF4αも、最近、GCにおいて系譜特異的癌遺伝子KLF5およびGATA因子の両方の標的として、ならびにAMPKシグナル伝達パスウェイとして関係付けられた。1次ヒト腫瘍における結果は、CDX2が腸遺伝子発現を制御するためにHNF4α占有率を調節することがわかった、マウス小腸における最近の知見によって支持される。これらの研究を反映して、CDX2/HNF4α枯渇がCDX2および/またはHNF4α結合部位に濃縮された局所領域におけるクロマチンの変化に影響を与えることもわかった。
結論として、この研究は、予測スーパーエンハンサーにおける異質性に対する役割および生体調節(regulatory biology)を分析するために1次組織および細胞株からのクロマチン・プロファイルを交差させる有用性を実証する。GC遠位エンハンサーのこの第1世代ロードマップは、GC予測エンハンサー(eRNA)と関連付けられた転写特徴を含み、予測スーパーエンハンサー活性を乱す体細胞調節変異を同定する将来の統合的な研究を今や可能にする。
Claims (34)
- 非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの存在または非存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える方法。 - 前記癌および非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備える、請求項1に記載の方法。
- 前記癌および非癌生体試料は、同じ被験者から得られる、請求項1~2のいずれか一項に記載の方法。
- 前記癌および非癌生体試料は、各々が異なる被験者から得られる、請求項1~3のいずれか一項に記載の方法。
- 前記核酸は、クロマチンの免疫沈降によって前記癌生体試料から単離される、請求項1~4のいずれか一項に記載の方法。
- 前記少なくとも1つのスーパーエンハンサーの前記シグナル強度は、前記ヒストン修飾H3K27acのReads Per Kilobase of transcript per Million(RPKM:100万当たり、トランスクリプトのキロベース当たりのリード)値に基づく、請求項1~5のいずれか一項に記載の方法。
- 前記少なくとも1つの参照核酸配列は、少なくとも1つの癌細胞株から得られる、請求項1~6のいずれか一項に記載の方法。
- 前記癌生体試料における前記少なくとも1つのスーパーエンハンサーは、ROSE(Ranking of Super Enhancer)アルゴリズムを用いて同定される、請求項1~7のいずれか一項に記載の方法。
- 前記癌生体試料における前記少なくとも1つのスーパーエンハンサーは、前記少なくとも1つの参照核酸配列中の前記少なくとも1つのエンハンサーと重複する少なくとも1つの核酸塩基対を備える、請求項8に記載の方法。
- 前記少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーに対する前記RPKM値が、
i)前記非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの前記RPKM値と比較して、RPKM値における2より大きい倍率変化、および
ii)前記非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの前記RPKM値と比較して、0.5RPKMより大きい絶対値差分
であることを判定するステップを備える、請求項6に記載の方法。 - 前記非癌生体試料の前記RPKM値と比較して、前記癌生体試料からのRPKM値における増加は、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの存在を示す、請求項10に記載の方法。
- 前記非癌生体試料の前記RPKM値と比較して、前記癌生体試料からのRPKM値における減少は、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの非存在を示す、請求項10に記載の方法。
- 前記少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して1000kb以内に配置される、請求項1~12のいずれか1項に記載の方法。
- 前記遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上である、請求項13に記載の方法。
- 前記遺伝子は、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択される、請求項13に記載の方法。
- 前記癌生体試料は、胃癌である、請求項1~15のいずれか一項に記載の方法。
- 被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)前記被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法。 - 被験者における癌を検出するためのバイオマーカーであって、前記バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、バイオマーカー。
- 前記癌関連転写因子結合部位は、胃癌関連転写因子結合部位である、請求項18に記載のバイオマーカー。
- 前記胃癌関連転写因子は、CDX2、KLF5およびHNF4αからなる群から選択される、請求項19に記載のバイオマーカー。
- 被験者における癌の予後を判定するための方法であって、
a)前記被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、前記被験者における前記癌の予後を示す、方法。 - 前記癌生体試料における前記少なくとも1つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す、請求項21に記載の方法。
- 前記癌生体試料における前記少なくとも1つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す、請求項21に記載の方法。
- 前記少なくとも1つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上と関連付けられる、請求項21に記載の方法。
- 前記少なくとも1つの癌関連スーパーエンハンサーは、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる、請求項21に記載の方法。
- 癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)前記被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を対照生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)前記少なくとも1つのスーパーエンハンサーの存在または非存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)前記少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップとを備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた前記少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法。 - 細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を前記細胞に投与するステップを備える、方法。
- CDX2および/またはHNF4αの前記阻害薬は、siRNAである、請求項27に記載の方法。
- 前記阻害薬は、メトホルミンである、請求項27に記載の方法。
- 正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカー。
- 正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用。
- 細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬。
- 細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用。
- 被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)前記癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG10201601141X | 2016-02-16 | ||
SG10201601141X | 2016-02-16 | ||
SG10201606828P | 2016-08-16 | ||
SG10201606828P | 2016-08-16 | ||
JP2018543192A JP7189020B2 (ja) | 2016-02-16 | 2017-02-16 | 癌のエピジェネティックプロファイリング |
PCT/SG2017/050073 WO2017142485A1 (en) | 2016-02-16 | 2017-02-16 | Cancer epigenetic profiling |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543192A Division JP7189020B2 (ja) | 2016-02-16 | 2017-02-16 | 癌のエピジェネティックプロファイリング |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023029945A true JP2023029945A (ja) | 2023-03-07 |
Family
ID=59625365
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543192A Active JP7189020B2 (ja) | 2016-02-16 | 2017-02-16 | 癌のエピジェネティックプロファイリング |
JP2022193109A Pending JP2023029945A (ja) | 2016-02-16 | 2022-12-01 | 癌のエピジェネティックプロファイリング |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543192A Active JP7189020B2 (ja) | 2016-02-16 | 2017-02-16 | 癌のエピジェネティックプロファイリング |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210223249A1 (ja) |
EP (1) | EP3417076B1 (ja) |
JP (2) | JP7189020B2 (ja) |
KR (1) | KR20180108820A (ja) |
CN (1) | CN109072312A (ja) |
SG (2) | SG11201806945SA (ja) |
WO (1) | WO2017142485A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108085395A (zh) * | 2018-02-24 | 2018-05-29 | 韩林志 | 基于高通量测序的宫颈癌多基因甲基化检测的引物组、试剂盒及方法 |
CN109735539B (zh) * | 2019-01-22 | 2022-06-03 | 南通大学 | 一种基于pdl1/pdl2超增强子的调控pdl1和pdl2表达的控方法 |
CN112111576A (zh) * | 2020-09-29 | 2020-12-22 | 杨帆 | 用于筛查鼻咽癌的方法及应用 |
CN114164210B (zh) * | 2021-08-19 | 2023-10-10 | 上海海洋大学 | 一种调控原癌基因myb的长链非编码rna及其应用 |
CN114525249A (zh) * | 2022-03-31 | 2022-05-24 | 广西大学 | 一种用于分离牛肌肉干细胞的肌肉组织提取方法及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140287932A1 (en) * | 2012-10-25 | 2014-09-25 | Whitehead Institute For Biomedical Research | Super-enhancers and methods of use thereof |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112012004281A2 (pt) * | 2009-08-25 | 2016-03-08 | Harvard College | uso de metformina tratamento e prevenção de câncer |
CN106103739B (zh) * | 2013-12-30 | 2019-12-06 | 新加坡科技研究局 | 用于测量胃肠癌中的生物标记物的方法 |
US20190005191A1 (en) * | 2015-07-14 | 2019-01-03 | Whitehead Institute For Biomedical Research | Chromosome neighborhood structures and methods relating thereto |
-
2017
- 2017-02-16 JP JP2018543192A patent/JP7189020B2/ja active Active
- 2017-02-16 CN CN201780023350.1A patent/CN109072312A/zh active Pending
- 2017-02-16 US US15/999,378 patent/US20210223249A1/en not_active Abandoned
- 2017-02-16 KR KR1020187026079A patent/KR20180108820A/ko unknown
- 2017-02-16 EP EP17753596.0A patent/EP3417076B1/en active Active
- 2017-02-16 WO PCT/SG2017/050073 patent/WO2017142485A1/en active Application Filing
- 2017-02-16 SG SG11201806945SA patent/SG11201806945SA/en unknown
- 2017-02-16 SG SG10202007867PA patent/SG10202007867PA/en unknown
-
2022
- 2022-12-01 JP JP2022193109A patent/JP2023029945A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140287932A1 (en) * | 2012-10-25 | 2014-09-25 | Whitehead Institute For Biomedical Research | Super-enhancers and methods of use thereof |
Non-Patent Citations (1)
Title |
---|
LEE, H.-J. ET AL.: "Gene expression profiling of metaplastic lineages identifies CDH17 as a prognostic marker in early-s", GASTROENTEROLOGY, vol. 139, no. 1, JPN6021003648, 2010, pages 213 - 225, XP002663351, ISSN: 0005186981, DOI: 10.1053/J.GASTRO.2010.04.008 * |
Also Published As
Publication number | Publication date |
---|---|
JP2019514344A (ja) | 2019-06-06 |
CN109072312A (zh) | 2018-12-21 |
SG10202007867PA (en) | 2020-09-29 |
SG11201806945SA (en) | 2018-09-27 |
WO2017142485A1 (en) | 2017-08-24 |
JP7189020B2 (ja) | 2022-12-13 |
EP3417076A1 (en) | 2018-12-26 |
EP3417076B1 (en) | 2022-11-09 |
US20210223249A1 (en) | 2021-07-22 |
EP3417076A4 (en) | 2019-10-23 |
KR20180108820A (ko) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ooi et al. | Epigenomic profiling of primary gastric adenocarcinoma reveals super-enhancer heterogeneity | |
Ding et al. | Genomic and epigenomic features of primary and recurrent hepatocellular carcinomas | |
JP6683752B2 (ja) | 血漿による胎児または腫瘍のメチロームの非侵襲的決定 | |
JP7189020B2 (ja) | 癌のエピジェネティックプロファイリング | |
Cheng et al. | Bladder cancer: translating molecular genetic insights into clinical practice | |
US20230349000A1 (en) | Classification and prognosis of cancer | |
Hrašovec et al. | TMEM25 is a candidate biomarker methylated and down-regulated in colorectal cancer | |
Jiang et al. | Multi-omics analysis identifies osteosarcoma subtypes with distinct prognosis indicating stratified treatment | |
Britton et al. | Open chromatin profiling identifies AP1 as a transcriptional regulator in oesophageal adenocarcinoma | |
BR112020006912A2 (pt) | Marcadores de metilação para diagnóstico de câncer | |
Sun et al. | An integrated epigenomic-transcriptomic landscape of lung cancer reveals novel methylation driver genes of diagnostic and therapeutic relevance | |
AU2021291586B2 (en) | Multimodal analysis of circulating tumor nucleic acid molecules | |
JP2023526252A (ja) | 相同組換え修復欠損の検出 | |
US20240182983A1 (en) | Cell-free dna methylation test | |
Isidori | Addressing tumor heterogeneity in esophageal adenocarcinoma through different molecular approaches | |
Burgener | Multimodal Profiling of Cell-Free DNA for Detection and Characterization of Circulating Tumour DNA in Low Tumour Burden Settings | |
WO2024211717A1 (en) | Detecting the presence of a tumor based on methylation status of cell-free nucleic acid molecules | |
WO2023197004A1 (en) | Detecting the presence of a tumor based on methylation status of cell-free nucleic acid molecules | |
WO2024112946A1 (en) | Cell-free dna methylation test for breast cancer | |
CA3229981A1 (en) | Next generation sequencing and artificial intelligence-based approaches for improved cancer diagnostics and therapeutic treatment selection | |
Robbe | Addressing challenges of molecular precision diagnostics for cancer patients in the genomics era | |
Cho | Sparsity and scarcity: Multiomic studies in a low resource setting (A study in archival FFPE cancer tissue) | |
Alsolami | Characterisation of the mutational landscape of chronic lymphocytic leukaemia using genome-wide approaches | |
Taskesen | Computational Biology in Acute Myeloid Leukemia with CEBPA Abnormalities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240528 |