CN111836907A - 基因组位点处核小体修饰和突变的定量方法及其临床应用 - Google Patents
基因组位点处核小体修饰和突变的定量方法及其临床应用 Download PDFInfo
- Publication number
- CN111836907A CN111836907A CN201980018514.0A CN201980018514A CN111836907A CN 111836907 A CN111836907 A CN 111836907A CN 201980018514 A CN201980018514 A CN 201980018514A CN 111836907 A CN111836907 A CN 111836907A
- Authority
- CN
- China
- Prior art keywords
- standard
- epitope
- histone
- nucleosomes
- nucleosome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035772 mutation Effects 0.000 title claims abstract description 182
- 230000004048 modification Effects 0.000 title claims abstract description 60
- 238000012986 modification Methods 0.000 title claims abstract description 60
- 108010047956 Nucleosomes Proteins 0.000 title claims description 422
- 210000001623 nucleosome Anatomy 0.000 title claims description 422
- 238000004445 quantitative analysis Methods 0.000 title description 3
- 108010033040 Histones Proteins 0.000 claims abstract description 358
- 238000000034 method Methods 0.000 claims abstract description 218
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 157
- 230000001973 epigenetic effect Effects 0.000 claims abstract description 132
- 108010077544 Chromatin Proteins 0.000 claims abstract description 104
- 210000003483 chromatin Anatomy 0.000 claims abstract description 104
- 102000006947 Histones Human genes 0.000 claims abstract description 100
- 201000010099 disease Diseases 0.000 claims abstract description 92
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 33
- 238000012544 monitoring process Methods 0.000 claims abstract description 33
- 238000004393 prognosis Methods 0.000 claims abstract description 20
- 238000002560 therapeutic procedure Methods 0.000 claims abstract description 17
- 239000000090 biomarker Substances 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 9
- 108020004414 DNA Proteins 0.000 claims description 304
- 230000027455 binding Effects 0.000 claims description 169
- 239000012472 biological sample Substances 0.000 claims description 157
- 239000003153 chemical reaction reagent Substances 0.000 claims description 142
- 210000004027 cell Anatomy 0.000 claims description 140
- 210000001519 tissue Anatomy 0.000 claims description 109
- 101710163270 Nuclease Proteins 0.000 claims description 106
- 102000008579 Transposases Human genes 0.000 claims description 106
- 108010020764 Transposases Proteins 0.000 claims description 106
- 210000004940 nucleus Anatomy 0.000 claims description 98
- 210000003463 organelle Anatomy 0.000 claims description 96
- 102000040430 polynucleotide Human genes 0.000 claims description 93
- 108091033319 polynucleotide Proteins 0.000 claims description 93
- 239000002157 polynucleotide Substances 0.000 claims description 93
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 82
- 108090000623 proteins and genes Proteins 0.000 claims description 74
- 239000012634 fragment Substances 0.000 claims description 73
- 235000018102 proteins Nutrition 0.000 claims description 70
- 102000004169 proteins and genes Human genes 0.000 claims description 70
- 208000035475 disorder Diseases 0.000 claims description 65
- 230000004049 epigenetic modification Effects 0.000 claims description 63
- 230000004481 post-translational protein modification Effects 0.000 claims description 61
- 230000004807 localization Effects 0.000 claims description 58
- 102000053602 DNA Human genes 0.000 claims description 54
- 239000007787 solid Substances 0.000 claims description 48
- 125000003729 nucleotide group Chemical group 0.000 claims description 46
- 239000002773 nucleotide Substances 0.000 claims description 45
- 239000004472 Lysine Substances 0.000 claims description 39
- 239000000126 substance Substances 0.000 claims description 28
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 26
- 108050005231 Histone H2A Proteins 0.000 claims description 24
- 102000017286 Histone H2A Human genes 0.000 claims description 24
- 101710103773 Histone H2B Proteins 0.000 claims description 24
- 102100021639 Histone H2B type 1-K Human genes 0.000 claims description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 24
- 206010028980 Neoplasm Diseases 0.000 claims description 24
- 238000012421 spiking Methods 0.000 claims description 24
- 239000000523 sample Substances 0.000 claims description 22
- 150000007523 nucleic acids Chemical group 0.000 claims description 18
- 201000011510 cancer Diseases 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 15
- 238000007069 methylation reaction Methods 0.000 claims description 14
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 12
- 230000000869 mutational effect Effects 0.000 claims description 12
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 11
- 239000004475 Arginine Substances 0.000 claims description 11
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 11
- 235000009697 arginine Nutrition 0.000 claims description 11
- 210000000056 organ Anatomy 0.000 claims description 11
- 238000007481 next generation sequencing Methods 0.000 claims description 10
- 238000010798 ubiquitination Methods 0.000 claims description 10
- 230000034512 ubiquitination Effects 0.000 claims description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 9
- 239000004473 Threonine Substances 0.000 claims description 9
- 102100039869 Histone H2B type F-S Human genes 0.000 claims description 7
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 claims description 7
- 210000003169 central nervous system Anatomy 0.000 claims description 7
- 230000008836 DNA modification Effects 0.000 claims description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 6
- 238000006640 acetylation reaction Methods 0.000 claims description 6
- 239000007850 fluorescent dye Substances 0.000 claims description 6
- 230000026731 phosphorylation Effects 0.000 claims description 6
- 238000006366 phosphorylation reaction Methods 0.000 claims description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 6
- 230000005730 ADP ribosylation Effects 0.000 claims description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 5
- 235000004279 alanine Nutrition 0.000 claims description 5
- 235000003704 aspartic acid Nutrition 0.000 claims description 5
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 5
- 238000001574 biopsy Methods 0.000 claims description 5
- 230000006329 citrullination Effects 0.000 claims description 5
- 235000013922 glutamic acid Nutrition 0.000 claims description 5
- 239000004220 glutamic acid Substances 0.000 claims description 5
- 231100000590 oncogenic Toxicity 0.000 claims description 5
- 230000002246 oncogenic effect Effects 0.000 claims description 5
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 4
- 230000004075 alteration Effects 0.000 claims description 4
- 238000000376 autoradiography Methods 0.000 claims description 4
- 208000015181 infectious disease Diseases 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- 208000023275 Autoimmune disease Diseases 0.000 claims description 3
- 208000035473 Communicable disease Diseases 0.000 claims description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 3
- 238000010614 crotonylation reaction Methods 0.000 claims description 3
- 238000001215 fluorescent labelling Methods 0.000 claims description 3
- 238000009396 hybridization Methods 0.000 claims description 3
- 208000027866 inflammatory disease Diseases 0.000 claims description 3
- 238000009830 intercalation Methods 0.000 claims description 3
- 238000003757 reverse transcription PCR Methods 0.000 claims description 3
- 230000006181 N-acylation Effects 0.000 claims description 2
- 210000000601 blood cell Anatomy 0.000 claims description 2
- 210000004880 lymph fluid Anatomy 0.000 claims description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 claims description 2
- 210000002381 plasma Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 150000001484 arginines Chemical class 0.000 claims 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 abstract description 28
- 238000003556 assay Methods 0.000 abstract description 15
- 102000004190 Enzymes Human genes 0.000 abstract description 9
- 108090000790 Enzymes Proteins 0.000 abstract description 9
- 238000013507 mapping Methods 0.000 abstract description 8
- 238000003776 cleavage reaction Methods 0.000 abstract description 4
- 230000007017 scission Effects 0.000 abstract description 4
- 238000001114 immunoprecipitation Methods 0.000 description 50
- 108090000765 processed proteins & peptides Proteins 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 24
- 102000004196 processed proteins & peptides Human genes 0.000 description 21
- 208000011580 syndromic disease Diseases 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 19
- 241000894007 species Species 0.000 description 17
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 241000700605 Viruses Species 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 10
- 230000001124 posttranscriptional effect Effects 0.000 description 10
- 230000008685 targeting Effects 0.000 description 9
- 239000000427 antigen Substances 0.000 description 8
- 108091007433 antigens Proteins 0.000 description 8
- 102000036639 antigens Human genes 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 238000009162 epigenetic therapy Methods 0.000 description 7
- 230000001363 autoimmune Effects 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 5
- 206010060862 Prostate cancer Diseases 0.000 description 5
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 5
- 208000028017 Psychotic disease Diseases 0.000 description 5
- 206010039491 Sarcoma Diseases 0.000 description 5
- -1 acetylation Chemical class 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 125000003091 canonical deoxyribonucleoside group Chemical group 0.000 description 5
- 230000001684 chronic effect Effects 0.000 description 5
- 230000011987 methylation Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- 206010009944 Colon cancer Diseases 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 4
- NTNWOCRCBQPEKQ-YFKPBYRVSA-N N(omega)-methyl-L-arginine Chemical compound CN=C(N)NCCC[C@H](N)C(O)=O NTNWOCRCBQPEKQ-YFKPBYRVSA-N 0.000 description 4
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 206010047115 Vasculitis Diseases 0.000 description 4
- 238000005917 acylation reaction Methods 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 229950006137 dexfosfoserine Drugs 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 208000032839 leukemia Diseases 0.000 description 4
- 230000003211 malignant effect Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 201000001441 melanoma Diseases 0.000 description 4
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 201000009030 Carcinoma Diseases 0.000 description 3
- 102100033636 Histone H3.2 Human genes 0.000 description 3
- 101001067844 Homo sapiens Histone H3.1 Proteins 0.000 description 3
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 208000019022 Mood disease Diseases 0.000 description 3
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 3
- PQNASZJZHFPQLE-LURJTMIESA-N N(6)-methyl-L-lysine Chemical compound CNCCCC[C@H](N)C(O)=O PQNASZJZHFPQLE-LURJTMIESA-N 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 208000008589 Obesity Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 230000021736 acetylation Effects 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 3
- 230000010933 acylation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 238000009509 drug development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 208000005017 glioblastoma Diseases 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 244000000010 microbial pathogen Species 0.000 description 3
- 235000020824 obesity Nutrition 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000026447 protein localization Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- 208000017194 Affective disease Diseases 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 201000001320 Atherosclerosis Diseases 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 238000001353 Chip-sequencing Methods 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 2
- 102100030507 Coiled-coil domain-containing protein 181 Human genes 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 241000711573 Coronaviridae Species 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 2
- 101100477411 Dictyostelium discoideum set1 gene Proteins 0.000 description 2
- 241000710188 Encephalomyocarditis virus Species 0.000 description 2
- 241000709661 Enterovirus Species 0.000 description 2
- 206010064212 Eosinophilic oesophagitis Diseases 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 101150112014 Gapdh gene Proteins 0.000 description 2
- 102100030943 Glutathione S-transferase P Human genes 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 208000009329 Graft vs Host Disease Diseases 0.000 description 2
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 2
- 241000590002 Helicobacter pylori Species 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- RPTUSVTUFVMDQK-UHFFFAOYSA-N Hidralazin Chemical compound C1=CC=C2C(NN)=NN=CC2=C1 RPTUSVTUFVMDQK-UHFFFAOYSA-N 0.000 description 2
- 101710195172 Histone H2B 2 Proteins 0.000 description 2
- 102100034535 Histone H3.1 Human genes 0.000 description 2
- 101000772632 Homo sapiens Coiled-coil domain-containing protein 181 Proteins 0.000 description 2
- 101001010139 Homo sapiens Glutathione S-transferase P Proteins 0.000 description 2
- 101000702560 Homo sapiens Probable global transcription activator SNF2L1 Proteins 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 206010048643 Hypereosinophilic syndrome Diseases 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 208000005615 Interstitial Cystitis Diseases 0.000 description 2
- 206010059176 Juvenile idiopathic arthritis Diseases 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 208000005777 Lupus Nephritis Diseases 0.000 description 2
- 208000016604 Lyme disease Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 2
- 206010026749 Mania Diseases 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- MXNRLFUSFKVQSK-QMMMGPOBSA-O N(6),N(6),N(6)-trimethyl-L-lysine Chemical compound C[N+](C)(C)CCCC[C@H]([NH3+])C([O-])=O MXNRLFUSFKVQSK-QMMMGPOBSA-O 0.000 description 2
- XXEWFEBMSGLYBY-ZETCQYMHSA-N N(6),N(6)-dimethyl-L-lysine Chemical compound CN(C)CCCC[C@H](N)C(O)=O XXEWFEBMSGLYBY-ZETCQYMHSA-N 0.000 description 2
- GNMSLDIYJOSUSW-LURJTMIESA-N N-acetyl-L-proline Chemical compound CC(=O)N1CCC[C@H]1C(O)=O GNMSLDIYJOSUSW-LURJTMIESA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 206010034277 Pemphigoid Diseases 0.000 description 2
- 241000709664 Picornaviridae Species 0.000 description 2
- 208000004347 Postpericardiotomy Syndrome Diseases 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 201000000582 Retinoblastoma Diseases 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000021386 Sjogren Syndrome Diseases 0.000 description 2
- 208000027520 Somatoform disease Diseases 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 206010042276 Subacute endocarditis Diseases 0.000 description 2
- 201000009594 Systemic Scleroderma Diseases 0.000 description 2
- 206010042953 Systemic sclerosis Diseases 0.000 description 2
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 2
- 101710120037 Toxin CcdB Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000024780 Urticaria Diseases 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- NIJJYAXOARWZEE-UHFFFAOYSA-N Valproic acid Chemical compound CCCC(C(O)=O)CCC NIJJYAXOARWZEE-UHFFFAOYSA-N 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 150000001483 arginine derivatives Chemical class 0.000 description 2
- 230000006217 arginine-methylation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 238000007413 biotinylation Methods 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 108091006090 chromatin-associated proteins Proteins 0.000 description 2
- 238000007697 cis-trans-isomerization reaction Methods 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- VFLDPWHFBUODDF-FCXRPNKRSA-N curcumin Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)CC(=O)\C=C\C=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-FCXRPNKRSA-N 0.000 description 2
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003968 dna methyltransferase inhibitor Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- INVTYAOGFAGBOE-UHFFFAOYSA-N entinostat Chemical compound NC1=CC=CC=C1NC(=O)C(C=C1)=CC=C1CNC(=O)OCC1=CC=CN=C1 INVTYAOGFAGBOE-UHFFFAOYSA-N 0.000 description 2
- 201000000708 eosinophilic esophagitis Diseases 0.000 description 2
- XMOCLSLCDHWDHP-IUODEOHRSA-N epi-Gallocatechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@H]2O)=CC(O)=C(O)C(O)=C1 XMOCLSLCDHWDHP-IUODEOHRSA-N 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 208000024908 graft versus host disease Diseases 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229940121372 histone deacetylase inhibitor Drugs 0.000 description 2
- 239000003276 histone deacetylase inhibitor Substances 0.000 description 2
- 230000006607 hypermethylation Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000006216 lysine-methylation Effects 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 201000006417 multiple sclerosis Diseases 0.000 description 2
- 206010028417 myasthenia gravis Diseases 0.000 description 2
- 201000005962 mycosis fungoides Diseases 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 238000012910 preclinical development Methods 0.000 description 2
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 208000020016 psychiatric disease Diseases 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 208000008467 subacute bacterial endocarditis Diseases 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 229960000237 vorinostat Drugs 0.000 description 2
- WAEXFXRVDQXREF-UHFFFAOYSA-N vorinostat Chemical compound ONC(=O)CCCCCCC(=O)NC1=CC=CC=C1 WAEXFXRVDQXREF-UHFFFAOYSA-N 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 2
- WMBWREPUVVBILR-WIYYLYMNSA-N (-)-Epigallocatechin-3-o-gallate Chemical compound O([C@@H]1CC2=C(O)C=C(C=C2O[C@@H]1C=1C=C(O)C(O)=C(O)C=1)O)C(=O)C1=CC(O)=C(O)C(O)=C1 WMBWREPUVVBILR-WIYYLYMNSA-N 0.000 description 1
- 229930014124 (-)-epigallocatechin gallate Natural products 0.000 description 1
- DTTONLKLWRTCAB-UDFURZHRSA-N (1s,3e,5r,7r)-3-[(3,4-dihydroxyphenyl)-hydroxymethylidene]-6,6-dimethyl-5,7-bis(3-methylbut-2-enyl)-1-[(2s)-5-methyl-2-prop-1-en-2-ylhex-4-enyl]bicyclo[3.3.1]nonane-2,4,9-trione Chemical compound O=C([C@@]1(C(C)(C)[C@H](CC=C(C)C)C[C@](C2=O)(C1=O)C[C@H](CC=C(C)C)C(C)=C)CC=C(C)C)\C2=C(\O)C1=CC=C(O)C(O)=C1 DTTONLKLWRTCAB-UDFURZHRSA-N 0.000 description 1
- HPTXLHAHLXOAKV-INIZCTEOSA-N (2S)-2-(1,3-dioxo-2-isoindolyl)-3-(1H-indol-3-yl)propanoic acid Chemical compound O=C1C2=CC=CC=C2C(=O)N1[C@H](C(=O)O)CC1=CNC2=CC=CC=C12 HPTXLHAHLXOAKV-INIZCTEOSA-N 0.000 description 1
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 1
- BWDQBBCUWLSASG-MDZDMXLPSA-N (e)-n-hydroxy-3-[4-[[2-hydroxyethyl-[2-(1h-indol-3-yl)ethyl]amino]methyl]phenyl]prop-2-enamide Chemical compound C=1NC2=CC=CC=C2C=1CCN(CCO)CC1=CC=C(\C=C\C(=O)NO)C=C1 BWDQBBCUWLSASG-MDZDMXLPSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- 101150025032 13 gene Proteins 0.000 description 1
- WBHQYBZRTAEHRR-UHFFFAOYSA-N 2-[2-(4-heptylphenyl)ethyl]-6-hydroxybenzoic acid Chemical compound C1=CC(CCCCCCC)=CC=C1CCC1=CC=CC(O)=C1C(O)=O WBHQYBZRTAEHRR-UHFFFAOYSA-N 0.000 description 1
- LTPSRQRIPCVMKQ-UHFFFAOYSA-N 2-amino-5-methylbenzenesulfonic acid Chemical compound CC1=CC=C(N)C(S(O)(=O)=O)=C1 LTPSRQRIPCVMKQ-UHFFFAOYSA-N 0.000 description 1
- CWVRJTMFETXNAD-FWCWNIRPSA-N 3-O-Caffeoylquinic acid Natural products O[C@H]1[C@@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-FWCWNIRPSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- UCINOBZMLCREGM-RNNUGBGQSA-N 4-n-[(1r,2s)-2-phenylcyclopropyl]cyclohexane-1,4-diamine;dihydrochloride Chemical compound Cl.Cl.C1CC(N)CCC1N[C@H]1[C@H](C=2C=CC=CC=2)C1 UCINOBZMLCREGM-RNNUGBGQSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- 206010056508 Acquired epidermolysis bullosa Diseases 0.000 description 1
- 102100030891 Actin-associated protein FAM107A Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 101150095323 Adcy10 gene Proteins 0.000 description 1
- 208000026872 Addison Disease Diseases 0.000 description 1
- 241000701242 Adenoviridae Species 0.000 description 1
- 102100032157 Adenylate cyclase type 10 Human genes 0.000 description 1
- 102100032153 Adenylate cyclase type 8 Human genes 0.000 description 1
- 102100036826 Aldehyde oxidase Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102100024075 Alpha-internexin Human genes 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 201000002434 Alpha-thalassemia-X-linked intellectual disability syndrome Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 241000606646 Anaplasma Species 0.000 description 1
- 208000009575 Angelman syndrome Diseases 0.000 description 1
- 208000028185 Angioedema Diseases 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 208000000103 Anorexia Nervosa Diseases 0.000 description 1
- 208000008958 Anti-N-Methyl-D-Aspartate Receptor Encephalitis Diseases 0.000 description 1
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 description 1
- 208000001839 Antisynthetase syndrome Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 208000032467 Aplastic anaemia Diseases 0.000 description 1
- 108010082340 Arginine deiminase Proteins 0.000 description 1
- 206010003267 Arthritis reactive Diseases 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 206010003827 Autoimmune hepatitis Diseases 0.000 description 1
- 208000000659 Autoimmune lymphoproliferative syndrome Diseases 0.000 description 1
- 206010055128 Autoimmune neutropenia Diseases 0.000 description 1
- 206010069002 Autoimmune pancreatitis Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 208000023328 Basedow disease Diseases 0.000 description 1
- 208000009299 Benign Mucous Membrane Pemphigoid Diseases 0.000 description 1
- 241000219495 Betulaceae Species 0.000 description 1
- 208000017306 Bickerstaff brainstem encephalitis Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 208000033222 Biliary cirrhosis primary Diseases 0.000 description 1
- 208000020925 Bipolar disease Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 241000588779 Bordetella bronchiseptica Species 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000589968 Borrelia Species 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 206010006550 Bulimia nervosa Diseases 0.000 description 1
- 102100033611 CB1 cannabinoid receptor-interacting protein 1 Human genes 0.000 description 1
- 201000002829 CREST Syndrome Diseases 0.000 description 1
- 206010006895 Cachexia Diseases 0.000 description 1
- PZIRUHCJZBGLDY-UHFFFAOYSA-N Caffeoylquinic acid Natural products CC(CCC(=O)C(C)C1C(=O)CC2C3CC(O)C4CC(O)CCC4(C)C3CCC12C)C(=O)O PZIRUHCJZBGLDY-UHFFFAOYSA-N 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- 241000712083 Canine morbillivirus Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000700664 Capripoxvirus Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010007572 Cardiac hypertrophy Diseases 0.000 description 1
- 208000006029 Cardiomegaly Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010076303 Centromere Protein A Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241001647372 Chlamydia pneumoniae Species 0.000 description 1
- 241000606153 Chlamydia trachomatis Species 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 206010008748 Chorea Diseases 0.000 description 1
- 208000006332 Choriocarcinoma Diseases 0.000 description 1
- 206010008909 Chronic Hepatitis Diseases 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 208000030939 Chronic inflammatory demyelinating polyneuropathy Diseases 0.000 description 1
- 241001533384 Circovirus Species 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 206010010252 Concentric sclerosis Diseases 0.000 description 1
- 206010010741 Conjunctivitis Diseases 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 208000019707 Cryoglobulinemic vasculitis Diseases 0.000 description 1
- 241000223935 Cryptosporidium Species 0.000 description 1
- 102100027309 Cyclic AMP-responsive element-binding protein 5 Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 229940126190 DNA methyltransferase inhibitor Drugs 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 238000000219 DamID Methods 0.000 description 1
- 206010012239 Delusion Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000016192 Demyelinating disease Diseases 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 206010012438 Dermatitis atopic Diseases 0.000 description 1
- 206010012468 Dermatitis herpetiformis Diseases 0.000 description 1
- 206010012689 Diabetic retinopathy Diseases 0.000 description 1
- 201000003066 Diffuse Scleroderma Diseases 0.000 description 1
- 208000006926 Discoid Lupus Erythematosus Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 208000021866 Dressler syndrome Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 241000605314 Ehrlichia Species 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 206010015226 Erythema nodosum Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000032027 Essential Thrombocythemia Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102100039254 Exophilin-5 Human genes 0.000 description 1
- 241000714201 Feline calicivirus Species 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102100031509 Fibrillin-1 Human genes 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 241000711950 Filoviridae Species 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- WMBWREPUVVBILR-UHFFFAOYSA-N GCG Natural products C=1C(O)=C(O)C(O)=CC=1C1OC2=CC(O)=CC(O)=C2CC1OC(=O)C1=CC(O)=C(O)C(O)=C1 WMBWREPUVVBILR-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- QDKLRKZQSOQWJQ-JGWHSXGBSA-N Garcinol Natural products O=C([C@@]1(C(C)(C)[C@@H](CC=C(C)C)C[C@](C=2O)(C1=O)C[C@H](CC=C(C)C)C(C)=C)CC=C(C)C)C=2C(=O)C1=CC=C(O)C(O)=C1 QDKLRKZQSOQWJQ-JGWHSXGBSA-N 0.000 description 1
- 241000885593 Geisha Species 0.000 description 1
- 208000007465 Giant cell arteritis Diseases 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 206010018364 Glomerulonephritis Diseases 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 101710112368 Glutathione S-transferase P 1 Proteins 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 206010018691 Granuloma Diseases 0.000 description 1
- 208000003084 Graves Ophthalmopathy Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 208000035895 Guillain-Barré syndrome Diseases 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 208000004547 Hallucinations Diseases 0.000 description 1
- 208000001204 Hashimoto Disease Diseases 0.000 description 1
- 208000016905 Hashimoto encephalopathy Diseases 0.000 description 1
- 206010019196 Head injury Diseases 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- 208000037319 Hepatitis infectious Diseases 0.000 description 1
- 241000700586 Herpesviridae Species 0.000 description 1
- 101710195171 Histone H2B 3 Proteins 0.000 description 1
- 102100024501 Histone H3-like centromeric protein A Human genes 0.000 description 1
- 102100034536 Histone H3.1t Human genes 0.000 description 1
- 101710158967 Histone H3.1t Proteins 0.000 description 1
- 229940122597 Histone acetyltransferase inhibitor Drugs 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 102100027893 Homeobox protein Nkx-2.1 Human genes 0.000 description 1
- 101001063917 Homo sapiens Actin-associated protein FAM107A Proteins 0.000 description 1
- 101000959328 Homo sapiens Adenylate cyclase type 3 Proteins 0.000 description 1
- 101000775481 Homo sapiens Adenylate cyclase type 8 Proteins 0.000 description 1
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 1
- 101000833549 Homo sapiens Alpha-internexin Proteins 0.000 description 1
- 101000834898 Homo sapiens Alpha-synuclein Proteins 0.000 description 1
- 101000945426 Homo sapiens CB1 cannabinoid receptor-interacting protein 1 Proteins 0.000 description 1
- 101000726193 Homo sapiens Cyclic AMP-responsive element-binding protein 5 Proteins 0.000 description 1
- 101000813263 Homo sapiens Exophilin-5 Proteins 0.000 description 1
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 description 1
- 101100451399 Homo sapiens HAPLN3 gene Proteins 0.000 description 1
- 101001067880 Homo sapiens Histone H4 Proteins 0.000 description 1
- 101000632178 Homo sapiens Homeobox protein Nkx-2.1 Proteins 0.000 description 1
- 101000760817 Homo sapiens Macrophage-capping protein Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000782074 Homo sapiens Palmitoyltransferase ZDHHC1 Proteins 0.000 description 1
- 101001120056 Homo sapiens Phosphatidylinositol 3-kinase regulatory subunit alpha Proteins 0.000 description 1
- 101000595669 Homo sapiens Pituitary homeobox 2 Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000997280 Homo sapiens Potassium voltage-gated channel subfamily C member 2 Proteins 0.000 description 1
- 101000757232 Homo sapiens Protein arginine N-methyltransferase 2 Proteins 0.000 description 1
- 101001100767 Homo sapiens Protein quaking Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101000702544 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Proteins 0.000 description 1
- 101000701575 Homo sapiens Spartin Proteins 0.000 description 1
- 101000713590 Homo sapiens T-box transcription factor TBX1 Proteins 0.000 description 1
- 101000915601 Homo sapiens Zinc finger protein 775 Proteins 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 241000342334 Human metapneumovirus Species 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- 241001559187 Human rubulavirus 2 Species 0.000 description 1
- 102100025260 Hyaluronan and proteoglycan link protein 3 Human genes 0.000 description 1
- 208000037147 Hypercalcaemia Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 102000044753 ISWI Human genes 0.000 description 1
- 208000031814 IgA Vasculitis Diseases 0.000 description 1
- 208000014919 IgG4-related retroperitoneal fibrosis Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 208000004187 Immunoglobulin G4-Related Disease Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 206010022557 Intermediate uveitis Diseases 0.000 description 1
- 208000000209 Isaacs syndrome Diseases 0.000 description 1
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 description 1
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 description 1
- 208000003456 Juvenile Arthritis Diseases 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 208000011200 Kawasaki disease Diseases 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- XMOCLSLCDHWDHP-UHFFFAOYSA-N L-Epigallocatechin Natural products OC1CC2=C(O)C=C(O)C=C2OC1C1=CC(O)=C(O)C(O)=C1 XMOCLSLCDHWDHP-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- 206010069698 Langerhans' cell histiocytosis Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 241000712902 Lassa mammarenavirus Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 206010024305 Leukaemia monocytic Diseases 0.000 description 1
- 208000012309 Linear IgA disease Diseases 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010058143 Lupus vasculitis Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 102000000717 Lysine methyltransferases Human genes 0.000 description 1
- 108050008120 Lysine methyltransferases Proteins 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 102100024573 Macrophage-capping protein Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 208000007054 Medullary Carcinoma Diseases 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 208000027530 Meniere disease Diseases 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 206010049567 Miller Fisher syndrome Diseases 0.000 description 1
- 208000003250 Mixed connective tissue disease Diseases 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 208000012192 Mucous membrane pemphigoid Diseases 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 101100284239 Mus musculus H2ax gene Proteins 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 208000002033 Myoclonus Diseases 0.000 description 1
- 201000002481 Myositis Diseases 0.000 description 1
- HRNLUBSXIHFDHP-UHFFFAOYSA-N N-(2-aminophenyl)-4-[[[4-(3-pyridinyl)-2-pyrimidinyl]amino]methyl]benzamide Chemical compound NC1=CC=CC=C1NC(=O)C(C=C1)=CC=C1CNC1=NC=CC(C=2C=NC=CC=2)=N1 HRNLUBSXIHFDHP-UHFFFAOYSA-N 0.000 description 1
- YALNUENQHAQXEA-UHFFFAOYSA-N N-[4-[(hydroxyamino)-oxomethyl]phenyl]carbamic acid [6-(diethylaminomethyl)-2-naphthalenyl]methyl ester Chemical compound C1=CC2=CC(CN(CC)CC)=CC=C2C=C1COC(=O)NC1=CC=C(C(=O)NO)C=C1 YALNUENQHAQXEA-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- CWVRJTMFETXNAD-KLZCAUPSSA-N Neochlorogenin-saeure Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O CWVRJTMFETXNAD-KLZCAUPSSA-N 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 206010072359 Neuromyotonia Diseases 0.000 description 1
- 208000021384 Obsessive-Compulsive disease Diseases 0.000 description 1
- 208000022873 Ocular disease Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 208000003435 Optic Neuritis Diseases 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241000712464 Orthomyxoviridae Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 102100036609 Palmitoyltransferase ZDHHC1 Human genes 0.000 description 1
- 241000711504 Paramyxoviridae Species 0.000 description 1
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 1
- 206010033864 Paranoia Diseases 0.000 description 1
- 208000027099 Paranoid disease Diseases 0.000 description 1
- 102100027370 Parathymosin Human genes 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 201000011152 Pemphigus Diseases 0.000 description 1
- 208000008469 Peptic Ulcer Diseases 0.000 description 1
- 241000150350 Peribunyaviridae Species 0.000 description 1
- 208000031845 Pernicious anaemia Diseases 0.000 description 1
- 102100026169 Phosphatidylinositol 3-kinase regulatory subunit alpha Human genes 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000007641 Pinealoma Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 102100036090 Pituitary homeobox 2 Human genes 0.000 description 1
- 241000101040 Pityriasis Species 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 206010065159 Polychondritis Diseases 0.000 description 1
- 208000007048 Polymyalgia Rheumatica Diseases 0.000 description 1
- 201000009916 Postpartum depression Diseases 0.000 description 1
- 102100034307 Potassium voltage-gated channel subfamily C member 2 Human genes 0.000 description 1
- 241000700625 Poxviridae Species 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 208000031951 Primary immunodeficiency Diseases 0.000 description 1
- 208000032319 Primary lateral sclerosis Diseases 0.000 description 1
- 102100031031 Probable global transcription activator SNF2L1 Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 101710188306 Protein Y Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 201000001263 Psoriatic Arthritis Diseases 0.000 description 1
- 208000036824 Psoriatic arthropathy Diseases 0.000 description 1
- 208000006262 Psychological Sexual Dysfunctions Diseases 0.000 description 1
- 208000003670 Pure Red-Cell Aplasia Diseases 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000005587 Refsum Disease Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 241000702247 Reoviridae Species 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 208000005793 Restless legs syndrome Diseases 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 206010038979 Retroperitoneal fibrosis Diseases 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 241000711931 Rhabdoviridae Species 0.000 description 1
- 206010039085 Rhinitis allergic Diseases 0.000 description 1
- 206010051497 Rhinotracheitis Diseases 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 208000020186 Schizophreniform disease Diseases 0.000 description 1
- 206010039705 Scleritis Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 201000010208 Seminoma Diseases 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000607762 Shigella flexneri Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 208000001203 Smallpox Diseases 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 206010072148 Stiff-Person syndrome Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241001312524 Streptococcus viridans Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 208000002286 Susac Syndrome Diseases 0.000 description 1
- 206010042742 Sympathetic ophthalmia Diseases 0.000 description 1
- 102100036771 T-box transcription factor TBX1 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 241000710924 Togaviridae Species 0.000 description 1
- 102100032120 Toll/interleukin-1 receptor domain-containing adapter protein Human genes 0.000 description 1
- 206010051526 Tolosa-Hunt syndrome Diseases 0.000 description 1
- 208000000323 Tourette Syndrome Diseases 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- RTKIYFITIVXBLE-UHFFFAOYSA-N Trichostatin A Natural products ONC(=O)C=CC(C)=CC(C)C(=O)C1=CC=C(N(C)C)C=C1 RTKIYFITIVXBLE-UHFFFAOYSA-N 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 206010064996 Ulcerative keratitis Diseases 0.000 description 1
- 208000025851 Undifferentiated connective tissue disease Diseases 0.000 description 1
- 208000017379 Undifferentiated connective tissue syndrome Diseases 0.000 description 1
- 206010046298 Upper motor neurone lesion Diseases 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 206010046851 Uveitis Diseases 0.000 description 1
- 241000870995 Variola Species 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 201000004810 Vascular dementia Diseases 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 208000014070 Vestibular schwannoma Diseases 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 206010047642 Vitiligo Diseases 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- 102100028579 Zinc finger protein 775 Human genes 0.000 description 1
- MULKOGJHUZTANI-ADMBKAPUSA-N [(3s,4r)-3-amino-4-hydroxypiperidin-1-yl]-[2-[1-(cyclopropylmethyl)indol-2-yl]-7-methoxy-1-methylbenzimidazol-5-yl]methanone;hydrochloride Chemical compound Cl.CN1C=2C(OC)=CC(C(=O)N3C[C@H](N)[C@H](O)CC3)=CC=2N=C1C1=CC2=CC=CC=C2N1CC1CC1 MULKOGJHUZTANI-ADMBKAPUSA-N 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 208000004064 acoustic neuroma Diseases 0.000 description 1
- 208000017733 acquired polycythemia vera Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 208000002552 acute disseminated encephalomyelitis Diseases 0.000 description 1
- 208000027137 acute motor axonal neuropathy Diseases 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 201000001256 adenosarcoma Diseases 0.000 description 1
- 108700010877 adenoviridae proteins Proteins 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 201000005188 adrenal gland cancer Diseases 0.000 description 1
- 208000024447 adrenal gland neoplasm Diseases 0.000 description 1
- 208000030597 adult Refsum disease Diseases 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 208000037884 allergic airway inflammation Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 201000010105 allergic rhinitis Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 208000004631 alopecia areata Diseases 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- KAOMOVYHGLSFHQ-UTOQUPLUSA-N anacardic acid Chemical compound CCC\C=C/C\C=C/CCCCCCCC1=CC=CC(O)=C1C(O)=O KAOMOVYHGLSFHQ-UTOQUPLUSA-N 0.000 description 1
- 235000014398 anacardic acid Nutrition 0.000 description 1
- ADFWQBGTDJIESE-UHFFFAOYSA-N anacardic acid 15:0 Natural products CCCCCCCCCCCCCCCC1=CC=CC(O)=C1C(O)=O ADFWQBGTDJIESE-UHFFFAOYSA-N 0.000 description 1
- 206010002224 anaplastic astrocytoma Diseases 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 201000008937 atopic dermatitis Diseases 0.000 description 1
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 1
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 1
- 208000027625 autoimmune inner ear disease Diseases 0.000 description 1
- 208000006424 autoimmune oophoritis Diseases 0.000 description 1
- 206010071572 autoimmune progesterone dermatitis Diseases 0.000 description 1
- 206010071578 autoimmune retinopathy Diseases 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 201000004982 autoimmune uveitis Diseases 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 229960002756 azacitidine Drugs 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- NCNRHFGMJRPRSK-MDZDMXLPSA-N belinostat Chemical compound ONC(=O)\C=C\C1=CC=CC(S(=O)(=O)NC=2C=CC=CC=2)=C1 NCNRHFGMJRPRSK-MDZDMXLPSA-N 0.000 description 1
- 229960003094 belinostat Drugs 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 208000000594 bullous pemphigoid Diseases 0.000 description 1
- 230000006242 butyrylation Effects 0.000 description 1
- 238000010514 butyrylation reaction Methods 0.000 description 1
- 235000004883 caffeic acid Nutrition 0.000 description 1
- 229940074360 caffeic acid Drugs 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 201000007455 central nervous system cancer Diseases 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008118 cerebral infarction Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 229940038705 chlamydia trachomatis Drugs 0.000 description 1
- 229940074393 chlorogenic acid Drugs 0.000 description 1
- 235000001368 chlorogenic acid Nutrition 0.000 description 1
- CWVRJTMFETXNAD-JUHZACGLSA-N chlorogenic acid Chemical compound O[C@@H]1[C@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-JUHZACGLSA-N 0.000 description 1
- FFQSDFBBSXGVKF-KHSQJDLVSA-N chlorogenic acid Natural products O[C@@H]1C[C@](O)(C[C@@H](CC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O FFQSDFBBSXGVKF-KHSQJDLVSA-N 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000012601 choreatic disease Diseases 0.000 description 1
- 102000022628 chromatin binding proteins Human genes 0.000 description 1
- 108091013410 chromatin binding proteins Proteins 0.000 description 1
- 201000005795 chronic inflammatory demyelinating polyneuritis Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000025302 chronic primary adrenal insufficiency Diseases 0.000 description 1
- 201000010002 cicatricial pemphigoid Diseases 0.000 description 1
- BMRSEYFENKXDIS-KLZCAUPSSA-N cis-3-O-p-coumaroylquinic acid Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)cc2)[C@@H]1O)C(=O)O BMRSEYFENKXDIS-KLZCAUPSSA-N 0.000 description 1
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 1
- 208000029664 classic familial adenomatous polyposis Diseases 0.000 description 1
- 238000012398 clinical drug development Methods 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 201000007717 corneal ulcer Diseases 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 201000003278 cryoglobulinemia Diseases 0.000 description 1
- 229940109262 curcumin Drugs 0.000 description 1
- 235000012754 curcumin Nutrition 0.000 description 1
- 239000004148 curcumin Substances 0.000 description 1
- 208000004921 cutaneous lupus erythematosus Diseases 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- YYTHPXHGWSAKIZ-UHFFFAOYSA-N cyclopentylidene-[4-(4-chlorophenyl)thiazol-2-yl]hydrazone Chemical compound C1=CC(Cl)=CC=C1C1=CSC(NN=C2CCCC2)=N1 YYTHPXHGWSAKIZ-UHFFFAOYSA-N 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000032459 dedifferentiation Effects 0.000 description 1
- 231100000868 delusion Toxicity 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 201000001981 dermatomyositis Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- VFLDPWHFBUODDF-UHFFFAOYSA-N diferuloylmethane Natural products C1=C(O)C(OC)=CC(C=CC(=O)CC(=O)C=CC=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-UHFFFAOYSA-N 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000018459 dissociative disease Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 208000007784 diverticulitis Diseases 0.000 description 1
- 201000004997 drug-induced lupus erythematosus Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 230000002616 endonucleolytic effect Effects 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 229940032049 enterococcus faecalis Drugs 0.000 description 1
- 229950005837 entinostat Drugs 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000002327 eosinophilic effect Effects 0.000 description 1
- 208000003401 eosinophilic granuloma Diseases 0.000 description 1
- 201000009580 eosinophilic pneumonia Diseases 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 201000011114 epidermolysis bullosa acquisita Diseases 0.000 description 1
- DZYNKLUGCOSVKS-UHFFFAOYSA-N epigallocatechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3cc(O)c(O)c(O)c3 DZYNKLUGCOSVKS-UHFFFAOYSA-N 0.000 description 1
- 230000007608 epigenetic mechanism Effects 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 238000011124 ex vivo culture Methods 0.000 description 1
- 231100000573 exposure to toxins Toxicity 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- LMFLOMBYUXRHIL-UHFFFAOYSA-N garcifuran-A Natural products COC1=C(O)C(OC)=CC(C=2C(=C3C=COC3=CC=2)O)=C1 LMFLOMBYUXRHIL-UHFFFAOYSA-N 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 208000002409 gliosarcoma Diseases 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 238000003875 gradient-accelerated spectroscopy Methods 0.000 description 1
- GRBCIRZXESZBGJ-UHFFFAOYSA-N guttiferone F Natural products CC(=CCCC(C(=C)C)C12CC(CC=C(C)C)C(C)(C)C(CC=C(C)C)(C(=O)C(=C1O)C(=O)c3ccc(O)c(O)c3)C2=O)C GRBCIRZXESZBGJ-UHFFFAOYSA-N 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 201000002222 hemangioblastoma Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 208000013057 hereditary mucoepithelial dysplasia Diseases 0.000 description 1
- 208000002557 hidradenitis Diseases 0.000 description 1
- 201000007162 hidradenitis suppurativa Diseases 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 102000046485 human PRMT2 Human genes 0.000 description 1
- 229960002474 hydralazine Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 230000000148 hypercalcaemia Effects 0.000 description 1
- 208000030915 hypercalcemia disease Diseases 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 208000015446 immunoglobulin a vasculitis Diseases 0.000 description 1
- 208000035231 inattentive type attention deficit hyperactivity disease Diseases 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 208000002551 irritable bowel syndrome Diseases 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000002215 juvenile rheumatoid arthritis Diseases 0.000 description 1
- 208000022013 kidney Wilms tumor Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 201000010901 lateral sclerosis Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 201000011486 lichen planus Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 210000005073 lymphatic endothelial cell Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 201000000564 macroglobulinemia Diseases 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 201000006512 mast cell neoplasm Diseases 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 206010027191 meningioma Diseases 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010065059 methylaspartate ammonia-lyase Proteins 0.000 description 1
- LSDPWZHWYPCBBB-UHFFFAOYSA-O methylsulfide anion Chemical compound [SH2+]C LSDPWZHWYPCBBB-UHFFFAOYSA-O 0.000 description 1
- 208000008275 microscopic colitis Diseases 0.000 description 1
- 206010063344 microscopic polyangiitis Diseases 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 208000008588 molluscum contagiosum Diseases 0.000 description 1
- 208000005871 monkeypox Diseases 0.000 description 1
- 201000006894 monocytic leukemia Diseases 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 208000005264 motor neuron disease Diseases 0.000 description 1
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 208000009091 myxoma Diseases 0.000 description 1
- 208000001611 myxosarcoma Diseases 0.000 description 1
- ZJZCTCNQTXBBFZ-PLMZOXRSSA-N n-[(4-amino-2-methylpyrimidin-5-yl)methyl]-n-[(z)-5-hydroxy-3-[3-(4-methylphenyl)-3-oxopropyl]sulfanylpent-2-en-2-yl]formamide;hydrochloride Chemical compound Cl.C=1C=C(C)C=CC=1C(=O)CCSC(/CCO)=C(/C)N(C=O)CC1=CN=C(C)N=C1N ZJZCTCNQTXBBFZ-PLMZOXRSSA-N 0.000 description 1
- HPODOLXTMDHLLC-QGZVFWFLSA-N n-[(4-methoxy-6-methyl-2-oxo-1h-pyridin-3-yl)methyl]-2-methyl-1-[(1r)-1-[1-(2,2,2-trifluoroethyl)piperidin-4-yl]ethyl]indole-3-carboxamide Chemical compound C1=C(C)NC(=O)C(CNC(=O)C=2C3=CC=CC=C3N([C@H](C)C3CCN(CC(F)(F)F)CC3)C=2C)=C1OC HPODOLXTMDHLLC-QGZVFWFLSA-N 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- OYKBQNOPCSXWBL-SNAWJCMRSA-N n-hydroxy-3-[(e)-3-(hydroxyamino)-3-oxoprop-1-enyl]benzamide Chemical compound ONC(=O)\C=C\C1=CC=CC(C(=O)NO)=C1 OYKBQNOPCSXWBL-SNAWJCMRSA-N 0.000 description 1
- 230000002956 necrotizing effect Effects 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 208000008795 neuromyelitis optica Diseases 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 201000005737 orchitis Diseases 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 208000021255 pancreatic insulinoma Diseases 0.000 description 1
- 229960005184 panobinostat Drugs 0.000 description 1
- FWZRWHZDXBDTFK-ZHACJKMWSA-N panobinostat Chemical compound CC1=NC2=CC=C[CH]C2=C1CCNCC1=CC=C(\C=C\C(=O)NO)C=C1 FWZRWHZDXBDTFK-ZHACJKMWSA-N 0.000 description 1
- 230000005298 paramagnetic effect Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 201000004986 pemphigus gestationis Diseases 0.000 description 1
- 201000001976 pemphigus vulgaris Diseases 0.000 description 1
- 201000001245 periodontitis Diseases 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- 208000024724 pineal body neoplasm Diseases 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 201000006292 polyarteritis nodosa Diseases 0.000 description 1
- 208000037244 polycythemia vera Diseases 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- REQCZEXYDRLIBE-UHFFFAOYSA-N procainamide Chemical compound CCN(CC)CCNC(=O)C1=CC=C(N)C=C1 REQCZEXYDRLIBE-UHFFFAOYSA-N 0.000 description 1
- 229960000244 procainamide Drugs 0.000 description 1
- MFDFERRIHVXMIY-UHFFFAOYSA-N procaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 MFDFERRIHVXMIY-UHFFFAOYSA-N 0.000 description 1
- 229960004919 procaine Drugs 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 201000008752 progressive muscular atrophy Diseases 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 210000004908 prostatic fluid Anatomy 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000010379 pull-down assay Methods 0.000 description 1
- 201000009732 pulmonary eosinophilia Diseases 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011155 quantitative monitoring Methods 0.000 description 1
- 208000002574 reactive arthritis Diseases 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 208000009169 relapsing polychondritis Diseases 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 201000003068 rheumatic fever Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 206010048628 rheumatoid vasculitis Diseases 0.000 description 1
- OHRURASPPZQGQM-GCCNXGTGSA-N romidepsin Chemical compound O1C(=O)[C@H](C(C)C)NC(=O)C(=C/C)/NC(=O)[C@H]2CSSCC\C=C\[C@@H]1CC(=O)N[C@H](C(C)C)C(=O)N2 OHRURASPPZQGQM-GCCNXGTGSA-N 0.000 description 1
- 229960003452 romidepsin Drugs 0.000 description 1
- OHRURASPPZQGQM-UHFFFAOYSA-N romidepsin Natural products O1C(=O)C(C(C)C)NC(=O)C(=CC)NC(=O)C2CSSCCC=CC1CC(=O)NC(C(C)C)C(=O)N2 OHRURASPPZQGQM-UHFFFAOYSA-N 0.000 description 1
- 108010091666 romidepsin Proteins 0.000 description 1
- 201000000306 sarcoidosis Diseases 0.000 description 1
- 208000022610 schizoaffective disease Diseases 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 210000001732 sebaceous gland Anatomy 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 201000009890 sinusitis Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- MFBOGIVSZKQAPD-UHFFFAOYSA-M sodium butyrate Chemical compound [Na+].CCCC([O-])=O MFBOGIVSZKQAPD-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 208000020431 spinal cord injury Diseases 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 201000006152 substance dependence Diseases 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 201000010965 sweat gland carcinoma Diseases 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 206010043207 temporal arteritis Diseases 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 206010043778 thyroiditis Diseases 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 208000009174 transverse myelitis Diseases 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- RTKIYFITIVXBLE-QEQCGCAPSA-N trichostatin A Chemical compound ONC(=O)/C=C/C(/C)=C/[C@@H](C)C(=O)C1=CC=C(N(C)C)C=C1 RTKIYFITIVXBLE-QEQCGCAPSA-N 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 229960000604 valproic acid Drugs 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
Abstract
本发明涉及定量染色质映射分析的临床应用,例如,染色质免疫沉淀分析和采用束缚酶的分析(例如,染色质免疫切割(ChIC)和核酸酶靶向切割和释放(CUT&
Description
优先权声明
本申请要求2018年1月10日提交的序列号为62/615,770的美国临时申请的权益,通过引用,该临时申请通过引用全文纳入本申请中。
技术领域
本发明涉及定量染色质映射分析的临床应用,例如,染色质免疫沉淀分析和采用束缚酶的分析(例如,染色质免疫切割(ChIC)和核酸酶靶向切割和释放)。所述方法可以用于检测和定量生物样品中核小体(组蛋白和/或DNA)上的表观遗传修饰和突变的存在,监测这些修饰和突变状态的变化,监测表观遗传和突变治疗的效果,选择合适的疾病治疗方法,确定受试者的预后,鉴定疾病的生物标记,及筛选修饰表观遗传或突变状态的试剂。本发明进一步涉及本发明方法中使用的试剂盒。
背景技术
调节蛋白、组蛋白翻译后修饰(PTM)和染色质结构之间的合作功能代表了一种复杂的系统级信号传导网络。许多染色质调控因子与多种人类病理学有关,包括白血病(Yooet al.,Int.J.Biol.Sci.8(1):59(2012))、结直肠癌(Ashktorab et al.,Dig.Dis.Sci.54(10):2109(2009);Benard et al.,BMC Cancer 14:531(2014))、阿尔茨海默病(Hendrickxet al.,PLoS One 9(6):e99467(2014))和亨廷顿病(Moumne et al.,Front.Neurol.4:127(2013))。因此,这些酶(即组蛋白PTM)的催化靶正作为有用的疾病指标(Khan et al.,World J.Biol.Chem.6(4):333(2015);Chervona et al.,Am.J.Cancer Res.2(5):589(2012))而不断出现。到目前为止,市场上有几种FDA-批准的治疗癌症的表观遗传靶向药,许多靶向染色质调控的治疗方法正在进入临床前开发和I/II期临床试验(Jones et al.,Nat.Rev.Genet.17(10):630(2016))。
无法对患者的响应直接检测和定量仍然是继续阻碍表观遗传药物开发的巨大技术障碍。定义患者独特的表观遗传背景,然后对这种背景如何因响应治疗而发生改变进行监测,对于根据患者独特的遗传学和表观遗传学特征,对患者的响应进行选择、分类和评价非常具有价值。但是,目前使用的组蛋白PTM定量工具的临床研究不够可靠(即定量性、鲁棒性等)。ChIP采用抗体来富集包含特异性组蛋白PTM的核小体;然后,分离相关DNA,并分别采用qPCR或新一代测序(NGS)法映射到特异性基因组位点,提供所研究PTM的局部或全基因组-范围的情况。但是,ChIP-seq方法最多只能算半-定量方法(Park et al.,Nat.Rev.Genet.10(10):669(2009))。或者,可以采用ELISA,但是,这种方法仅限于定量总体PTM变化(即并非选择的基因组位点处的变化),因此,对于鉴定/测定癌症-特异性生物标记缺少分辨率和灵敏度。因此,只是常规间接监测疾病进程和患者对表观遗传靶向治疗的任何反应(例如,通过测定下游代谢物、基因表达等的变化)。因此,临床前/临床药物开发流程中目前缺少患者-特定的表观遗传背景和对治疗反应的任何直接量化方法。
值得注意的是,人们已经开发了新的染色质映射方法,将酶束缚到基因组区域,从而引起靶材料释放、富集,并在之后开展分析(例如,DamID、ChIC、ChEC和方法)。CUT&RUN(核酸酶靶向切割和释放)方法(PCT/US2018/052707)开发了使用固相载体的完整细胞稳健方案,扩展了以前的染色质免疫切割方法(ChIC;美国专利No.7,790,379)。和ChIC采用因子-特异性抗体将蛋白A的融合蛋白和微球菌核酸酶(pA-MN)束缚到完整细胞的基因组结合位点,然后,加入钙激活,从而切割DNA。pA-MN提供了将抗体束缚到目标PTM、转录因子或染色质蛋白质的切割束缚系统。CUT&RUN分析采用很少的100个细胞和300万次读数,即可获得高质量、可重现的全基因组PTM映射数据。虽然染色质映射技术(与传统ChIP相比)取得了这些显著的进步,但是,样品的易变性及无法监测抗体性能仍然是巨大的技术障碍。
最近,开发了一种新的ChIP定量方法,称为ICeChIP(内标校准的ChIP(Grzybowskiet al.,Mol.Cell,2015.58(5):886(2015))和美国公开No.2016/0341743。此方法已经以CAP-(校准和抗体谱分析)及SNAP-(样品归一化和抗体谱分析)的名称商业化。这种技术采用携带特异性组蛋白PTM的DNA条形码化设计者核小体(dNucs)作为内部对照标准物,用于样品归一化和校准。将条形码化的dNucs掺入到各种浓度(其条形码序列中编码的相对数量)的片段染色质样品中,然后,采用磁珠固定抗体(对目标PTM具有特异性)捕获此库中(细胞衍生的和dNuc)的核小体。在免疫沉淀后,开展NGS(或qPCR)数据分析,了解检测的读数,用于:1)每个条形码;及2)输入库和IP-捕获库内的样品DNA。然后,将IP读数归一化为每个条形码dNuc的输入浓度,得到一条标准曲线,用于样品DNA读数直接定量。条形码dNucs作为直接校准物,因为他们在ChIP处理期间会经历与样品染色质同样的易变性来源的影响,并且代表内源性抗体靶,修饰的单核小体。
本领域需要一种用于临床应用和药物开发的定量生物样品中组蛋白PTM的可靠且稳健的方法。
发明内容
本发明涉及条形码化重组设计者核小体作为定量染色质映射分析(如ChIP,ChIC或CUT&RUN)的掺入对照的临床应用,所述定量染色质映射分析监测靶向表观遗传治疗和其它治疗之前和之后患者样品中的组蛋白PTM、染色质相关蛋白(例如,转录因子、染色质结合蛋白、染色质重塑剂等),和/或突变。直接定量染色质修饰和调节蛋白全基因组的能力提供了表观遗传治疗效果强大的读数功能及能够开发出用于疾病治疗的伴随诊断方法。因此,本方法用于药物开发和临床应用。
本发明中使用的染色质分析可以是本领域熟悉的产生定量结果的任何染色质分析。实例包括但不限于CUT&RUN分析(PCT/US2018/052707)、ChIC分析(美国专利No.7,790,379)和ICeChIP分析(WO 2015/117145)。这些参考文献全文纳入本申请中。
在一些实施例中,定量染色质分析是染色质免疫沉淀分析。因此,本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;从而,检测和定量表位的表观遗传修饰或突变。
本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;从而测定和定量基因组位点表观遗传或突变的状态。
本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)重复步骤a)至g)至少一次;及
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)在表观遗传治疗或突变治疗开始后重复步骤a)至g)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,选择合适的治疗。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,确定受试者的预后。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明试剂修饰基因组位点的表观遗传或突变状态。
在一些实施例中,定量染色质分析是采用束缚酶的染色质映射分析。因此,本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心元件表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量。
本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
从而测定和定量基因组位点表观遗传或突变的状态。
本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)重复步骤a)至j)至少一次;
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)重复步骤a)至j)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)根据核心元件表位的表观遗传或突变状态,选择合适的治疗。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)根据核心元件表位的表观遗传或突变状态,确定受试者的预后。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明试剂修饰基因组位点的表观遗传或突变状态。
本发明的另一方面涉及试剂盒,包括一组设计者核小体,每个核小体包括一种或多种疾病-相关表观遗传修饰或组蛋白突变。
本发明的这些方面和其它方面在下面本发明的具体实施方式中进行更详细的说明。
具体实施方式
下面对本发明进行更详细的说明。这些说明并非是本发明可以实施的所有不同方式或本发明可以加入的所有特征的详细目录。例如,一个实施例中谈到的特征可以在其它实施例中采纳,特定实施例中阐明的特征也可以从该实施例中删除。此外,根据本发明,对于此处建议的各种实施例的许多变化和添加,对于本领域技术人员将是显而易见的,其并不背离本发明。因此,以下说明旨在阐明本发明的一些特定实施例,而不是穷举地指定其所有排列、组合和变形。
除非上下文另外声明,应该特别指出的是,此处描述的本发明的各种特征可以以任何组合形式使用。此外,本发明还设想在本发明的一些实施例中,可以排除或省略此处提出的任何特征或特征组合。例如,如果说明书声明一种复合物包含组分A、B和C,应该特别指出的是,A、B或C组分中的任一种组分,或它们的组合,都可以单独或在任何组合中省略和放弃。
除非特别规定,本发明使用的所有术语(包括技术名词和科学术语)的意义与本发明所属领域技术人员通常理解的相同。本发明说明中使用的术语仅仅是为了描述特定实施例,并不是用于限制本发明。
除非特别说明,此处核苷酸序列仅以从左至右5'至3'方向的单链显示。此处核苷酸和氨基酸按照IUPAC-IUB生化命名委员会推荐的方式表示,或(氨基酸)按照37CFR§1.822和惯用法以单字母代码或三字母代码表示。
除非另有说明,否则本领域技术人员熟悉的标准方法可用于制备重组和合成的多肽、抗体或其抗原结合片段,操作核酸序列,产生转化细胞,构建核小体及瞬时转染和稳定转染的细胞。这些技术是本领域技术人员熟悉的。参见,例如,SAMBROOK et al.,MOLECULARCLONING:A LABORATORY MANUAL 2nd Ed.(Cold Spring Harbor,NY,1989);F.M.AUSUBELet al.CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(Green Publishing Associates,Inc.and John Wiley&Sons,Inc.,New York)。
此处提到的所有出版物、专利、核苷酸序列、氨基酸序列和其它参考文献都通过引用而整体纳入本申请中。
在本发明中,除非上下文中清楚表明,否则,单数形式“一”、“这个”也包括复数形式。
此处所述“和/或”指的是和包括一个或多个相关列出项目的任何和所有可能组合,及缺少替代(“或”)中阐明的组合。
此外,本发明还设想在本发明的一些实施例中,可以排除或省略此处提出的任何特征或特征组合。
此外,提到可测量值,如本发明化合物或试剂的数量、剂量、时间、温度等时使用的词语“大约”指的是包括规定数值±10%、±5%、±1%、±0.5%或甚至±0.1%的变化范围。
此处所述与核酸或蛋白质有关的词语“基本上由……组成”是指核酸或蛋白质除所列举的要素以外不包含任何显著改变(例如,大于约1%、5%或10%)目标核酸或蛋白质功能的要素。
词语“多肽”、“肽”和“蛋白质”此处互换使用,指的是氨基酸残基聚合物。也就是说,针对多肽的描述同样适用于肽的描述和蛋白质的描述,反之亦然。这些词语适用于天然氨基酸聚合物以及其中一个或多个氨基酸残基为非天然氨基酸的氨基酸聚合物。正如此处所使用的那样,这些词语涵盖任何长度的氨基酸链,包括全长蛋白质,其中氨基酸残基通过共价肽和/或假肽键连接。
“核酸”或“核苷酸序列”是核苷酸碱基序列,可能是RNA、DNA或DNA-RNA混合序列(包括天然和非天然核苷酸),但是优选是单链或双链DNA序列。
此处所述“分离”核酸或核苷酸序列(例如,“分离DNA”或“分离RNA”)指的是分离的核酸或核苷酸或基本上不含天然生物或病毒的至少一些其它组分,例如,通常发现的与核酸或核苷酸序列有关的细胞或病毒结构组分或其它多肽或核酸。
同样,“分离”多肽指的是与天然生物或病毒至少其它一些组分(例如,通常发现与多肽有关的细胞或病毒结构组分或其它多肽或核酸)分离的多肽或基本上不含天然生物或病毒至少其它一些组分的多肽。
“基本上保留”一种性质指的是保留所述性质(例如,活性或其它可测量的特性)的至少大约75%、85%、90%、95%、97%、98%、99%或100%。
词语“表位”指的是生物分子上能引起亲和试剂结合的任何位点。亲和试剂可以识别生物分子或生物分子片段的线性序列、生物分子或生物分子片段的形状、生物分子或生物分子片段的化学物理性质或它们的组合。
此处所述“氨基酸”可以采用其众所周知的三个字母符号或采用IUPAC-IUB生化命名委员会推荐的一个字母符号来表示。蛋白质或肽中的氨基酸残基缩写如下:苯丙氨酸为Phe或F;亮氨酸是Leu或L;异亮氨酸是Ile或I;蛋氨酸是Met或M;缬氨酸是Val或V;丝氨酸是Ser或S;脯氨酸是Pro或P;苏氨酸是Thr或T;丙氨酸是Ala或A;酪氨酸是Tyr或Y;组氨酸是His或H;谷氨酰胺是Gln或Q;天冬酰胺是Asn或N;赖氨酸是Lys或K;天冬氨酸是Asp或D;谷氨酸是Glu或E;半胱氨酸是Cys或C;色氨酸是Trp或W;精氨酸是Arg或R;甘氨酸是Gly或G。
词语“氨基酸”指的是天然的和非天然的氨基酸,以及功能与天然氨基酸类似的氨基酸类似物和氨基酸模拟物。天然编码的氨基酸是20种常见氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)和吡咯赖氨酸和硒代半胱氨酸。氨基酸类似物指的是基本化学结构与天然氨基酸相同的化合物,即与氢,羧基,氨基和R基结合的碳,例如高丝氨酸、正亮氨酸、蛋氨酸亚砜和蛋氨酸甲基锍。所述类似物具有修饰的R基团(例如正亮氨酸)或修饰的肽主链,但是保留了与天然氨基酸相同的基本化学结构。
关于氨基酸序列,本领域技术人员将认识到,核酸、肽、多肽或蛋白质序列的单个替换、删除或添加,改变、添加或删除编码序列中的单个氨基酸或小百分比的氨基酸,是“保守修饰变体”,其中的改变导致氨基酸被化学上相似的氨基酸取代。列出功能相似氨基酸的保守替换表是本领域技术人员熟悉的。所述保守修饰变体是此处所述试剂的多态变体、种间同系物/直系同源物和等位基因的补充,并且不排除这些。
此处所述“抗原”可以是被抗体识别或可以产生识别抗体的任何结构。在某些实施例中,抗原可以包含单个氨基酸残基或2个或更多个残基的氨基酸片段。在某些实施例中,抗原可以包含氨基酸的修饰,例如乙酰化,甲基化(例如单-、双-、三-)、磷酸化、泛素化(例如单-、双-、三-、多-)、类泛素化、ADP-核糖基化、瓜氨酸化、生物素化和顺反异构化。在某些实施例中,抗原可以包含核苷酸修饰,例如5-甲基胞嘧啶。在其他实施例中,抗原可以包含特异性突变,例如点突变。在其他实施例中,抗原可以包含野生型氨基酸序列或核苷酸序列。
词语“翻译后修饰”是指天然或非天然氨基酸在体内或体外被掺入到多肽链后发生或将要发生的任何修饰。这样的修饰包括但不限于酰化(例如,乙酰基-、丁酰基-、巴豆酰基-)、甲基化(例如,单-、二-、三-)、磷酸化、泛素化(例如,单-、二-、三-、多-)、类泛素化、ADP-核糖基化、瓜氨酸化、生物素化和顺反异构化。这样的修饰可以在多肽合成过程中通过合成方法,例如化学方法引入,或者在多肽合成或多肽纯化之后通过酶引入。
词语“翻译后修饰”是指天然或非天然核苷酸在体内或体外被掺入到多核苷酸链后发生或将要发生的任何修饰。所述修饰包括但不限于5-甲基胞嘧啶、5-羟甲基胞嘧啶、5,6-二氢尿嘧啶、7-甲基鸟苷、黄苷和肌苷。
词语“免疫沉淀(IP)富集”是指免疫沉淀样品的内标读数除以输入样品的内标读数。
词语“不对称”是指其中组蛋白二聚体中的一个组蛋白包含翻译后修饰的核小体。例如,三甲基修饰存在于一个组蛋白H3的第9位赖氨酸上,而在二聚体中的第二个H3上不存在。
词语“对称”是指其中组蛋白二聚体中的两个组蛋白都包含翻译后修饰的核小体。例如,在两个组蛋白H3的第9位赖氨酸上都发现了三甲基修饰。
本发明涉及CAP-ChIP和SNAP-ChIP在靶向表观遗传治疗和其他治疗之前和之后定量监测患者样品中组蛋白PTM和突变的临床应用。直接定量HMD全基因组的能力提供了表观遗传治疗效果强大的读数功能及能够开发出用于疾病治疗的伴随诊断方法。因此,本方法用于药物开发和临床应用。
因此,本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
从而,检测和定量表位处的表观遗传修饰或突变。所述方法的步骤不限于叙述它们的顺序。例如,添加标准物的步骤(c)可以在步骤(b)之前或之后进行,例如,标准物可以在执行步骤(b)之前添加到生物样品中,或者可以在执行步骤(b)之后添加到文库中。
所述分析方法的一般描述如下。将具有定义浓度(由每个唯一的DNA条形码编码)的修饰或突变组蛋白(例如,4位赖氨酸N6,N6,N6-三甲基化的H3)的半合成核小体梯带(ladder)标准物掺入到从人细胞核分离并通过例如微球菌核酸酶的核内消化而释放的天然核小体文库中。然后,例如通过下一代测序,对梯带(ladder)-掺杂文库的样品进行免疫沉淀(IP)、DNA纯化和DNA表征。保留梯带(ladder)-掺杂文库的另一个样本作为输入样品,并且不进行免疫沉淀。在此,免疫沉淀(IP)或“拉下(pull-down)”是指用于纯化染色质、核小体,DNA-蛋白质复合物或包含一个或多个目标表位的蛋白质的方法或技术,其中将所述表位与对表位具有特异性的亲和试剂接触,并与该文库的其他组分分离。亲和试剂可以是与表位特异性结合并且适合用于沉淀分析的任何试剂。亲和试剂可以是抗体或其片段或衍生物。亲和试剂可以是非抗体试剂,例如适体或蛋白质-蛋白质相互作用域。词语“免疫沉淀”在本文中采用广义,以涵盖非抗体亲和试剂。
免疫沉淀的样品和输入样品均采用能够读出和定量DNA序列的方法进行分析。将回收的DNA片段根据参考基因组映射到相对基因组位置,并针对从IP(使用亲和试剂通过免疫沉淀得到的样品)中回收的DNA及输入(未进行免疫沉淀的样品)对基因组的每个碱基对测量这些片段的丰度。对于用于制备半合成核小体的独特核苷酸序列,从测序数据中进行相同的读数计数。IP和输入中半合成核小体的丰度比用于测定IP效率,IP和输入中任何基因组位点DNA片段的丰度比用于测定相对富集。所添加的半合成核小体的标记数构成了一条校准曲线,可用于推导全基因组天然核小体的组蛋白修饰或突变密度。带有100%修饰的半合成核小体梯带的平均IP富集率用作带有相同表位的天然染色质的标量校准,以比率的比率计算所需基因组间隔内的修饰量。随后将IP效率应用于相对富集,以碱基对分辨率测量整个基因组范围的组蛋白翻译后修饰或突变的组蛋白修饰密度。在一些实施例中,具有天然样的亲和力、特异性和亲合力的蛋白表位包括蛋白亚型和/或具有翻译后修饰的蛋白。例如,表位可以是在测定中对其密度进行测量的组蛋白修饰或具有相似结合特性的表位。在一个实施例中,DNA-蛋白质复合物的蛋白质部分是包含核心组蛋白H2A、H2B、H3和H4的核心组蛋白八聚体复合物。这些序列在专利申请No:US2013/044537中进行了说明,通过引用,其内容并入本发明中。为了重现天然样的亲和力,任何上述核心组蛋白的蛋白质表位的特异性和亲合力可以用包括表1(a)-1(f)中所列的任何组蛋白变体来表示。在本发明的一个实施例中,蛋白质表位可以是组蛋白的片段。
在本发明的另一方面,蛋白质-DNA复合物包含标准多核苷酸,其包括但不限于定位序列和唯一的条形码标识符序列。包含蛋白质定位序列允许通过与蛋白质的特异性天然样相互作用来形成DNA-蛋白质复合物。在一个实施例中,蛋白质定位序列是核小体定位序列。在一个实施例中,定位序列包括至少146个碱基对的天然或合成双链DNA序列。在一个实施例中,蛋白质定位序列是“601-Widom”序列-通过选择对核小体表现出亲和力的序列制备的合成核小体结合序列。尽管我们在这里提到了“601-Widom”序列作为核小体定位序列,但是本实施例涵盖了使用对核小体表现出亲和力的其他此类合成和天然序列。在一些实施例中,标准多核苷酸不包含定位序列。只要标准多核苷酸能够与组蛋白或组蛋白片段形成稳定的蛋白质-DNA结合,就可以将其用于本发明的方法中。
单一序列允许在天然DNA-蛋白质复合物的文库或库中特异性鉴定DNA-蛋白质复合物,即条形码。在一些实施例中,单一序列可以采用另一种特异性识别方式取代,例如多肽、荧光团、发色团、RNA序列、锁核酸序列、亲和标签等。一方面,单一序列可以通过任何熟悉的核苷酸分析技术开展分析,例如,下一代测序,PCR、qPCR、RT-PCR、ddPCR、杂交、放射自显影、荧光标记、光密度和使用嵌入荧光探针。单一序列和定位序列可以是相同序列,并且具有作为识别分子的双重功能。单一序列可以位于定位序列的5'-末端、定位序列的3'-末端、定位序列的两端和/或定位序列的内部。
在一些实施例中,单一序列是具有最小长度的双链DNA序列,与正在研究的生物体的基因组序列及样品中可能发现的所有其他序列之间的汉明距离至少保持为1。在一个实施例中,为了确保在天然基因组序列环境中对条形码进行有力的区分,每个条形码均由人和小鼠基因组中不存在的两个11个碱基对(bp)序列组成(Herold et al.,BMCBioinformatics 9:167(2008)),其中11个bp序列是确保人类和小鼠基因组的汉明距离至少为1的最短序列。在另一个实施例中,条形码序列是细胞基因组中不存在的序列。在另一个实施例中,条形码序列是自然界中不存在的序列。虽然这里提到11个bp可能是人类和小鼠的汉明距离至少为1的最短序列,但汉明距离至少为1的数量不受限的较长序列也可以成功作为上述单一序列。此外,对于其他生物的基因组,汉明距离至少为1的单一序列的最短序列可能短于11个bp,因此,对于这些生物,可以成功使用短于11个bp的序列。条形码是一种分子,在一个实施例中是DNA,其可以通过人们熟悉的DNA分析技术进行分析,包括但不限于下一代测序和PCR。条形码序列编码给定内标核小体的浓度和/或一致性。
在一些实施例中,单一核苷酸序列指示给定内标的浓度和一致性。在本发明的一方面,单一序列包括长度至少或至多10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90或100个碱基对长度。在另一个实施例中,定位序列和单一序列的总长度具有至少100个碱基对长度。一方面,单一序列是微球菌核酸酶抗性的。在本发明的一个实施例中,包括但不限于定位序列和单一序列或条形码的标准物分子包括,基本上由或由SEQ ID NO:1;SEQ ID NO:2;SEQ ID NO:3;SEQ ID NO:4;SEQ ID NO:5;SEQ ID NO:6;SEQID NO:7;SEQ ID NO:8;SEQ ID NO:9;SEQ ID NO:10;SEQ ID NO:11;SEQ ID NO:12;SEQ IDNO:13;SEQ ID NO:14;或SEQ ID NO:15组成。在一个实施例中,包含但不限于定位序列和独特序列或条形码的标准分子包括,基本上由或由SEQ ID NO:16;SEQ ID NO:17;SEQ ID NO:18;SEQ ID NO:19;SEQ ID NO:20;SEQ ID NO:21;SEQ ID NO:22;SEQ ID NO:23;SEQ IDNO:24;SEQ ID NO:25;SEQ ID NO:26;SEQ ID NO:27;SEQ ID NO:28;SEQ ID NO:29;SEQ IDNO:30;SEQ ID NO:31;SEQ ID NO:32;SEQ ID NO:33;SEQ ID NO:34;SEQ ID NO:35;SEQ IDNO:36;SEQ ID NO:37;SEQ ID NO:38;SEQ ID NO:39;SEQ ID NO:40;SEQ ID NO:41;SEQ IDNO:42;SEQ ID NO:43;SEQ ID NO:44;SEQ ID NO:45;SEQ ID NO:46;SEQ ID NO:47;SEQ IDNO:48;SEQ ID NO:49;SEQ ID NO:50;SEQ ID NO:51;SEQ ID NO:52;SEQ ID NO:53;SEQ IDNO:54;SEQ ID NO:55;SEQ ID NO:56;SEQ ID NO:57;SEQ ID NO:58;SEQ ID NO:59;SEQ IDNO:60;SEQ ID NO:61;SEQ ID NO:62;SEQ ID NO:63;SEQ ID NO:64;SEQ ID NO:65;SEQ IDNO:66;SEQ ID NO:67;SEQ ID NO:68;SEQ ID NO:69;SEQ ID NO:70;SEQ ID NO:71;SEQ IDNO:72;SEQ ID NO:73;SEQ ID NO:74;SEQ ID NO:75;SEQ ID NO:76;SEQ ID NO:77;SEQ IDNO:78;SEQ ID NO:79;SEQ ID NO:80;SEQ ID NO:81;SEQ ID NO:82;SEQ ID NO:83;SEQ IDNO:84;SEQ ID NO:85;SEQ ID NO:86;SEQ ID NO:87;SEQ ID NO:88;SEQ ID NO:89;SEQ IDNO:90;SEQ ID NO:91;SEQ ID NO:92;SEQ ID NO:93;SEQ ID NO:94;SEQ ID NO:95;SEQ IDNO:96;SEQ ID NO:97;SEQ ID NO:98;SEQ ID NO:99;SEQ ID NO:100;SEQ ID NO:101;SEQID NO:102;SEQ ID NO:103;SEQ ID NO:104;SEQ ID NO:105;SEQ ID NO:106SEQ ID NO:107;SEQ ID NO:108;SEQ ID NO:109;SEQ ID NO:110;SEQ ID NO:111;SEQ ID NO:112;SEQID NO:113;SEQ ID NO:114;或SEQ ID NO:115组成。
在此处所述表位密度测定方法的一个实施例中,将一组具有标准多核苷酸的上述半合成核小体掺入天然核小体集合中。该组可以包括其中标准多核苷酸带有一个以上表位,但包含至少一个目标表位的半合成核小体。例如,一组半合成核小体可以具有翻译后修饰,例如H3K9me3,以及保守的或不变的表位,例如组蛋白的多肽序列。或者,一组半合成的核小体可以具有多个翻译后修饰。另一方面,该组标准物包括至少一个半合成的、重组的或含有变体的DNA结合蛋白,其具有与目标表位不同的假阳性表位的天然样亲和力、特异性和亲合力。在一个实施例中,一组包含半合成或变体的核小体,包括至少一个具有真阳性表位的天然样亲和力、特异性和亲合力的核小体和至少一个具有假阳性表位的天然样亲和力、特异性和亲合力的核小体。
为了从许多蛋白质-DNA复合物中提纯出一群天然或半合成核小体,可以采用一种亲和捕获步骤,其中亲和试剂识别核小体的不变片段,例如组蛋白。本发明方法中采用的亲和试剂可以是识别并特异性结合目标表位的任何合适分子。一方面,与目标表位接触的亲和试剂包括抗体或其片段、单体(monobody)、scFv、适体、Fab或结合肽。纯化一群核小体的方法可能仅适用于半合成核小体,仅适用于天然核小体或适用于掺有半合成核小体的天然核小体。
在一个实施例中,为了执行本发明的方法,将一组可以与ChIP读出进行比较的前述内标掺入到天然DNA-蛋白质复合物的集合中。下文描述了如何使用这些标准物来计算标准IP效率,而标准IP效率又可以用于计算蛋白质或表位密度(PD)、蛋白质变体密度(PVD)或蛋白质修饰密度(PMD),这取决于所研究的表位是否是不变的蛋白质片段、蛋白质亚型、蛋白质翻译后修饰或多核苷酸转录后修饰。采用具有天然的亲和力、特异性和亲合力且基于半合成或含变体的核小体的标准物,,可以通过对组蛋白修饰密度(HMD)或组蛋白变体密度(HVD)进行绝对定量,从而改善染色质的免疫沉淀。
组蛋白修饰密度是一个标准化的标度,定义为在给定基因组位置上,携带特异性表位的核小体占所有核小体的表观百分数。组蛋白修饰密度以模拟标度表示,范围为0%(表示不存在)至100%(表示表位饱和)。例如,GAPDH基因的核小体+1(转录起始位点下游的第一个核小体)的90H3K4me3组蛋白修饰密度应解释为,在GAPDH基因启动子上构成核小体+1的所有组蛋白H3分子群体中,90%具有组蛋白H3第%4位赖氨酸的N6,N6,N6-三甲基化(H3K4me3)翻译后修饰,并且它们中的10%应没有H3K4me3。虽然该实例给出了跨越单个核小体的基因组区域,该区域大约为147个bp,但是,可以将其应用于从单个碱基对到整个基因组的任何基因组范围。
为了计算蛋白质或表位密度,需要了解四件事:基因组位点大小、表位丰度、一般蛋白质丰度和免疫沉淀效率(“IP效率”)。基因组位点大小由用户定义,可以从单个碱基对到整个基因组。表位丰度定义为在基因组位点范围内表位的丰度。丰度通常是通过量化与DNA-蛋白质复合物结合的DNA的量来推断,因为它对蛋白质而言是符合化学计量的,并且DNA易于通过多种方法进行定量,例如PCR、RT-PCR、ddPCR、下一代测序、杂交、放射自显影、荧光标记、光密度、插入式荧光探针等。但是,也可以通过光密度、荧光、放射自显影、质谱、比色法、多肽总分解等方法测量蛋白质浓度来直接测量丰度。
在特异性亲和试剂识别表位的亲和捕获步骤后,测量表位的丰度,在此步骤后,将表位-亲和试剂复合物与DNA-蛋白质复合物中未结合的部分分离。最常见的是,通过将表位-亲和试剂复合物固定在表面上并洗去未结合的DNA-蛋白质复合物部分,将表位-亲和试剂复合物与未结合的核小体分离。一般蛋白质丰度定义为在给定基因组位点范围内,形成DNA复合物的给定种类所有蛋白质的丰度。一般蛋白质丰度的测定方法与表位丰度相同。
为了从其它蛋白质-DNA复合物中提纯出一群核小体,可以采用一种亲和捕获步骤,其中亲和试剂识别核小体的不变片段,例如组蛋白。但是,如果涉及蛋白质-DNA复合物制备的给定不变片段与考虑的基因组位点大小相比占主导地位,则在假设其他蛋白质-DNA复合物群体微不足道的条件下,可以跳过一般蛋白质群体的亲和捕获步骤。表位丰度与一般蛋白质丰度之比得到每种蛋白质的表位密度。然而,很少有亲和力捕获步骤效率为100%的情况,并且如果使用两个或多个亲和力捕获步骤时,它们的捕获效率几乎不会彼此相等。为了解决这个问题,需要了解表位丰度与一般蛋白质丰度测量之间的相对IP效率。
“IP效率”是指一个或多个拉下(pull-downs)实验之间表位的相对回收率。了解标准物的IP效率,可以通过校准一个或多个拉下实验之间的回收率差异来执行绝对量化。在一个实施例中,通过使用一组与天然表位具有相同的亲和力、特异性和亲合力并且易于在复杂混合物中测量其丰度的上述标准物来测量上述IP效率。将这些半合成标准物掺入到天然DNA-蛋白质复合物库中,对其样品进行亲和捕获。在此步骤之后,针对上述半合成标准物和天然DNA-蛋白质复合物库,使用上述丰度测量方法中的其中一种方法,对表位丰度和一般蛋白质密度进行上述测量。在一个实施例中,一组标准物包括以不同浓度添加的标准物。此处添加的浓度由条形码唯一标识。
在一个实施例中,对标准DNA-蛋白质复合物和天然DNA-蛋白质复合物来说,表位丰度可通过定量与DNA-蛋白质复合物结合的DNA来测定。在一个实施例中,IP中给定标准物条形码的表位与半合成核小体的输入材料的表位之比等于标准物IP效率。或者,该标准物IP效率可以以表位特异性IP中的条形码丰度与一般蛋白质丰度(对于组蛋白H3来说,例如抗H3普通IP的条形码计数)之比计算。一旦计算出IP效率,就可以将该标准物IP效率应用于任何基因组位点的IP/输入DNA或IP表位/IP一般蛋白质之比。这是通过将基因组IP效率-IP中表位丰度(亲和步骤中捕获的给定基因组间隔的DNA量)和输入中相同间隔的DNA量之比,除以标准物IP效率计算得出。或者,这可以以IP中给定基因组DNA片段的比率除以上述任何基因组位点的一般表位丰度IP中相同种类的数量,然后除以标准物IP效率计算得出。得到的数值为蛋白质或表位密度(PD),也称为蛋白质变体密度(PVD)或蛋白质修饰密度(PMD)。
拉下实验面临的另一个问题挑战分析是拉下实验中所用亲和试剂的脱靶特异性导致预测精度低。术语“假阳性”和“脱靶”是同义词,是指与亲和试剂混杂或非特异性接触的表位或错误的结果。术语“真阳性”和“上靶”是同义词,是指目标表位或正确的结果。
假阳性表位信号的发生率在各拉下实验之间有所不同,并取决于亲和试剂的质量(其对期望表位的固有结合亲和力vs对其他相关表位的亲和力),天然染色质中上靶vs脱靶表位的丰度,拉下实验中亲和试剂的能力与DNA-蛋白质复合物负载水平的比值以及开展拉下实验的其他条件。对于不同的亲和试剂,虽然在常规ChIP的给定实验中,上靶结合和脱靶结合两者中任一来源对表观ChIP信号的作用尚不清楚,但是,它们两者都不同程度地影响表观ChIP信号。在不了解脱靶结合的丰度的情况下,人们无法决定观察到的表位丰度是否显着,这反过来使得在医学诊断和研究中使用拉下实验是不切实际的。本发明人发现了一种在拉下实验中就地定量假阳性和真阳性表位的IP效率的方法,由于很容易计算出阳性预测值(PPV),因此提高了数据解释的精度。PPV允许将某个置信水平的最小表位丰度估算值视为真阳性。
使用上述计算IP效率和标准物IP效率的方法,可以计算阳性预测值(PPV),也称为精度。了解PPV简化了任何数据分析,因为它可以估计蛋白质密度的任何差异是否显着,而这是当前可用的方法和技术无法实现的。
ηTP是真阳性表位的IP效率,α是真阳性表位的给定重量,ηFP是假阳性表位(也称为脱靶表位)的IP效率,β是假阳性表位的重量。在没有事先了解重量分布的情况下,α=β=1。该式存在其他变化形式,并且在其他应用中可以利用对假阳性和真阳性表位发生率的了解。
有两种替代方法可以校准ChIP:使用外标进行总体组蛋白修饰密度校准和直接进行内标校准。像本工作中主要采用的相对内标方法一样,这两种方法都可以得到以“组蛋白修饰密度”单位表示的结果,这些结果等于所探测表位与给定基因组位点中所有其他表位的表观比率。
总体组蛋白修饰密度校准依赖于相对于组蛋白数量的修饰总比率的测定,例如,了解到所有H3的百分比都是K4三甲基化的。然后,可以将质谱或定量免疫印迹法测定得到的总体组蛋白修饰密度,针对任何给定基因组位点的输入深度进行校准,在所有IP峰中重新进行分配。除了总丰度测量时存在巨大的误差(例如,MS准确度及可能无法观察到所有可能的修饰形式的不确定性)之外,这种方法的缺点是此类通过正交法进行的外部测量采用的核小体样品必须与ChIP中采用的是同一样品,而且这两种技术中的样品处理损失都是造成误差的重要原因。特别是,IP效率永远不会达到100%(实际上可能会大大降低),因此,效率偏离理论最大值的程度将反映在表观HMD的相当虚增值上。
直接内标校准通过ChIP方法测定加标条形码核小体标准物的标签计数,了解输入中每个内标梯带成员的精确摩尔浓度,从而推断出原始样品中所探测表位的绝对摩尔丰度。这种校准受微球菌核酸酶消化的细胞核数量的计数准确性的限制,并且从这种很好定量的数量到彻底破碎的染色质分离物的过程中,存在损失偏差。由于在高度优化的消化和分离条件下,我们从消化细胞核中回收的总核酸几乎不超过80%,因此,由于基因组回收偏差而存在一些系统误差(Henikoff et al,Nat.Rev.Genet.9:15(2009))。
该实施例的另一个优点是能够通过解以下矩阵方程,从假阳性表位信号反卷积真阳性表位信号的能力,在此以组蛋白修饰密度为例进行介绍:A*x=b。对于指定的数据集,通过解以下矩阵方程,对CAP-ChIP和SNAP-ChIP-seq轨迹进行了非特异性校准:A*x=b。
本发明的另一个实施例描述了一种通过解以下矩阵方程,从假阳性表位信号反卷积真阳性表位信号的方法,在此以组蛋白修饰密度为例进行介绍:A*x=b。
式中,x是校准HMD分数矩阵,A是校准因子矩阵,b是未校准HMD分数矩阵,其中t是免疫沉淀中对来自‘a’到‘z’组蛋白标记(下标)集的组蛋白标记的特异性校准因子,其中在所述免疫沉淀中,采用抗来自‘a’到‘z’组蛋白标记集(上标)的组蛋白标记的抗体;HMD是从第1个到第n个基因组位点给定组蛋白标记(‘a’至‘z’)的组蛋白修饰密度;HMD(Cor)是从第1个到第n个基因组位点的给定组蛋白标记的校准组蛋白修饰密度。
式中,t是免疫沉淀中对来自‘a’到‘z’组蛋白标记(下标)集的组蛋白标记的特异性校准因子,其中在所述免疫沉淀中,采用抗来自‘a’到‘z’组蛋白标记集(上标)的组蛋白标记的抗体;HMD是从第1个到第n个基因组位点给定组蛋白标记(‘a’至‘z’)的组蛋白修饰密度;HMD(Cor)是从第1个到第n个基因组位点的给定组蛋白标记的校准组蛋白修饰密度。
其中,Σ1 NIP和Σ1 N输入是指IP或输入中给定条形码的丰度,上标是指产生抗体的组蛋白标记,而下标是指被拉下的半合成核小体上的标记。
常规ChIP测定法未在临床中采用的主要原因是,由于微妙的处理差异和易变的抗体特异性,它们通常无法重现,从而使IP富集的百分含量随实验而变化很大,并且使无偏差对比存在问题且不可靠。由于采用的内标经历对变化敏感的ChIP步骤,CAP-ChIP和SNAP-ChIP在结果重复性和可靠性方面要稳健很多,并且因为通过与定义明确的内标直接进行原位比较,HMD是通用的,具有生物学上相关的量度,因此,这些数值很容易进行比较。
组蛋白修饰和其他表观遗传机制对于调节基因活性和细胞过程至关重要。不同的组蛋白修饰调节不同的过程,例如转录、DNA复制和DNA修复。这些修饰中任何一种修饰失调都会改变基因表达的平衡,从而导致异常的表观遗传模式和细胞异常。例如,在各种癌症中都检测到了组蛋白翻译后修饰和变体的变化,并且在某些情况下,异常修饰模式是导致疾病的驱动因素(Daigle et al.,Cancer Cell 20:53(2011);Chi et al.,Nat.Rev.Cancer10:457(2010))。
本发明可用于与组蛋白翻译后修饰、转录后修饰和突变的变化有关的任何疾病(包括患者,例如人类患者的癌症)的诊断、预后、分类、疾病风险的预测、复发的检测、治疗选择以及治疗效果的评估。此类分析与患者细胞或诱导多能干细胞的离体培养一起用于评估给定去分化方案用于生产真正的多能干细胞的适用性,或用于评估将干细胞分化为特异性细胞类型的方案的适用性。
在根据特定组蛋白PTM或突变的存在、不存在或HMD进行诊断、预后、风险评估、分类、复发检测或治疗选择时,可以将PTM或突变的数量与阈值进行比较,将一种诊断、预后、风险评估、分类等与另一种进行区分。例如,阈值可以代表组蛋白甲基化的程度,其以期望的敏感性和特异性水平满意地区分癌症样品和正常活检样品。使用ICe-ChIP时,阈值不会根据所用抗体或处理条件而变化。阈值或范围可通过以下方法确定:使用ICe-ChIP测量病变样品和正常样品中特定的目标组蛋白PTM,然后确定能够将至少大部分癌症样品与大多数非癌症样品区分开的数值。
本发明方法中使用的生物样品可以是任何合适的样品。生物样品可以是,例如血液、血清、血浆、尿液、唾液、精液、前列腺液、乳头吸取液、泪液、汗液、粪便、面颊拭子、脑脊髓液、细胞裂解液样品、羊水、胃肠道液、活检组织、淋巴液或脑脊髓液。
在一些实施例中,生物学样品包括细胞,并且从细胞中分离出染色质。在某些实施例中,细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞,例如病变细胞。在某些实施例中,细胞是来自受与组蛋白突变有关的疾病或病症影响的组织或器官的细胞,例如病变细胞。可以通过本领域熟悉的任何方式从病变器官或组织获得细胞,包括但不限于活检、抽吸和手术。
在其他实施例中,细胞不是来自受与组蛋白翻译后修饰或DNA修饰变化有关或与组蛋白的突变有关的疾病或病症影响的组织或器官的细胞。细胞可以是,例如充当病变细胞代理的细胞。细胞可以是比病变细胞更容易获取的细胞,例如,不需要复杂或痛苦的过程(例如活检)即可获得的细胞。合适细胞的实例包括但不限于外周血单核细胞。
在一些实施例中,生物学样品包括循环核小体,例如已经从垂死细胞释放的核小体。在某些实施例中,循环核小体可以来自血细胞。在某些实施例中,循环核小体可以来自受与组蛋白翻译后修饰或DNA修饰变化有关或与组蛋白的突变有关的疾病或病症影响的组织或器官的细胞。
受试者可以是需要本发明方法的任何受试者。在一些实施例中,受试者是哺乳动物,例如人。在一些实施例中,受试者是实验动物,例如小鼠、大鼠、狗或猴子,例如疾病的动物模型。在某些实施例中,受试者可以是已经被诊断患有或怀疑患有疾病或病症的受试者。在一些实施例中,受试者可以是例如由于遗传学、家族史、暴露于毒素等而有疾病或病症罹患风险的受试者。
在某些实施例中,将多个标准物添加到文库中。在一些实施例中,将多个标准物添加到文库中,每个标准物包括重组的核小体,其包括(i)具有表位的标准组蛋白或组蛋白片段,和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸,其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数,并且其中将具有相当浓度的标准物添加到文库中。在一些实施例中,每个PTM或突变由两个或更多个(例如,2、3、4、5、6、7、8、9或10个)浓度相同或相似的标准物代表。任选每个重复的标准物具有不同的条形码标识符序列,例如,用作内部标准物。
在一些实施例中,将多个标准物添加到文库中,每个标准物包括重组的核小体,其包括(i)具有表位的标准组蛋白或组蛋白片段,和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸,其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数,并且其中将至少两个不同浓度的标准物添加到文库中。在一些实施例中,添加2、3、4、5、6、7、8、9或10或更多个不同浓度的标准物。任选每个浓度重复的标准物具有不同的条形码标识符序列,例如,用作内部标准物。
在某些实施例中,多个标准物可以进一步包括包含重组核小体的标准物,所述核小体包含(i)一个或多个脱靶表位和(ii)编码脱靶表位一致性的标准分子条形码和指示脱靶表位的浓度参数。
在一些实施例中,该方法进一步包括根据脱靶表位的一种或多种捕获效率来确定亲和试剂的脱靶捕获特异性,并根据脱靶捕获特异性来校准基因组位点核心组蛋白的表位密度。
表位可以是核心组蛋白上需要定量和/或监测的任何表位。在一些实施例中,表位是翻译后修饰或蛋白质亚型。在一些实施例中,核心组蛋白的表位包含至少一种翻译后氨基酸修饰,例如选自丝氨酸和丙氨酸的N-乙酰化;丝氨酸、苏氨酸和酪氨酸的磷酸化;赖氨酸的N-酰化(例如巴豆酰化或丁酰化);赖氨酸的N6-甲基化、N6,N6-二甲基化、N6,N6,N6-三甲基化;精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化;精氨酸的瓜氨酸化;赖氨酸的泛素化;赖氨酸的类泛素化;丝氨酸和苏氨酸的O-甲基化;丝氨酸、苏氨酸或酪氨酸的磷酸化;精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化,及它们的任意组合。修饰可以是表1(a)-1(f)中所列的任何修饰,可以是单独的或它们的任何组合。
在一些实施例中,表位是核心组蛋白的突变,例如与疾病或病症相关的突变。在一些实施例中,所述突变是致癌突变,例如包括但不限于H3K4M、H3K9M、H3K27M、H3G34R、H3G34V、H3G34W、H3K36M及其任何组合的突变。H3突变体可以基于H3的任何变体主链,例如,H3.1、H3.2或H3.3。
在某些实施例中,本发明的方法可以进一步包括:
确定掺杂文库中基因组位点核心组蛋白的数量;和
确定掺杂文库中标准物的数量。
在一些实施例中,确定掺杂文库中基因组位点核心组蛋白的数量的步骤可以包括:
向掺杂文库中添加第二亲和试剂,回收一定数量的包括第二表位的核小体,其中第二表位是位于核心组蛋白上的不变表位,和
确定回收的包括第二表位的核小体中多核苷酸的数量。
在一些实施例中,确定掺杂文库中标准物的数量的步骤可以包括:
回收一定数量的重组核小体;其中重组核小体包括第二表位,和
确定回收的包括第二表位的核小体中标准物的数量。
在这些实施例中,亲和试剂可以是靶向表位的抗体或其片段或其变体或非抗体试剂,而第二亲和试剂可以是靶向第二表位的抗体或其片段或其变体或非抗体试剂。
本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;从而测定和定量基因组位点表观遗传或突变的状态。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)重复步骤a)至g)至少一次;及
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
该方法的步骤可以根据需要重复多次,以监测表观遗传修饰或突变状态的变化,例如重复2、3、4、5、6、7、8、9、10、25、50或100或更多次。该方法可以定期(例如每天、每周、每月、每年)或根据需要重复进行。该方法可以例如在受试者的治疗之前、期间和/或之后重复;在诊断出受试者的疾病或病症之后重复;作为确定受试者疾病或病症的诊断的一部分;在确定受试者存在患病或出现病症的风险之后重复,或在需要监测表观遗传修饰或突变的可能变化的任何其他情况时重复。
本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)在表观遗传治疗或突变治疗开始后重复步骤a)至g)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
表观遗传治疗是旨在改变蛋白质(例如,组蛋白)或DNA的表观遗传状态的疗法。表观遗传治疗的一个实例包括赖氨酸脱乙酰基酶抑制剂(以前称为组蛋白脱乙酰基酶抑制剂)(例如,伏立诺他(辛二酰苯胺异羟肟酸)、CI-994(泰克地那林(tacedinaline))、MS-275(恩提诺特(entinostat))、BMP-210、M344、NVP-LAQ824、LBH-529(帕比司他)、MGCD0103(莫塞替诺特)、PXD101(贝利司他)、CBHA、PCI-24781、ITF2357、丙戊酸、曲古抑菌素A和丁酸钠),用于治疗皮肤T细胞淋巴瘤(CTCL)或在临床试验中用于治疗血液和实体瘤,包括肺癌、乳腺癌、胰腺癌、肾癌和膀胱癌、黑素瘤、成胶质细胞瘤、白血病、淋巴瘤和多发性骨髓瘤。表观遗传治疗的另一个实例是组蛋白乙酰转移酶抑制剂(例如,表没食子儿茶素-3-没食子酸酯、山竹醇、鸡腰果酸、CPTH2、姜黄素、MB-3、MG149,C646和罗米地辛)。表观遗传治疗的另一个实例是DNA甲基转移酶抑制剂(例如氮杂胞苷,地西他滨、泽布拉林(zebularine)、咖啡酸、绿原酸、表没食子儿茶素、肼苯哒嗪、普鲁卡因酰胺、普鲁卡因和RG108),它们已被批准用于治疗急性髓细胞性白血病、骨髓增生异常综合症和慢性粒细胞性单核细胞白血病以及用于治疗实体瘤的临床试验。其他表观遗传治疗包括但不限于赖氨酸甲基转移酶(例如,pinometostat(匹美司他),他泽司他(tazometostat)、CPI-1205);赖氨酸脱甲基酶(例如ORY1001);精氨酸甲基转移酶(例如,EPZ020411);精氨酸脱亚氨酶(例如,GSK484);和异柠檬酸脱氢酶(例如恩西地平、艾伏尼布)。参见Fischle et al.,ACS Chem.Biol.11:689(2016);DeWoskin et al.,Nature Rev.12:661(2013);Campbell et al.,J.Clin.Invest.124:64(2014);and Brown et al.,Future Med.Chem.7:1901(2015);通过引用,这些文献全文纳入本申请中。
突变疗法包括旨在改变基因的核苷酸序列(例如,编码组蛋白)的疗法。实例包括但不限于基因疗法。
该方法的步骤可以根据需要重复多次,以监测治疗的变化,例如重复2、3、4、5、6、7、8、9、10、25、50或100或更多次。该方法可以定期(例如每天、每周、每月、每年)或根据需要重复进行,例如,直到治疗结束。该方法可以例如在对受试者进行治疗之前、期间和/或之后,例如在每次给予治疗之后重复。在一些实施例中,治疗一直持续到本发明的方法显示治疗有效为止。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,选择合适的治疗。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
该方法可以例如应用于已经被诊断或怀疑患有与表观遗传修饰或突变相关的疾病或病症的受试者。对表位的表观遗传状态或突变状态的确定可以指示表位的状态已经被修饰,并且应当向受试者施用表观遗传疗法或突变疗法以纠正该修饰。相反,确定表位的状态没有被修饰将表明表观遗传疗法或突变疗法预期无效,应避免采用这些疗法。例如,确定特定基因组位点已被脱乙酰化,可能表明采用组蛋白脱乙酰基酶抑制剂进行治疗将是适当的。类似地,确定特定基因组位点已被超甲基化,可能表明采用DNA甲基转移酶抑制剂进行治疗将是适当的。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,确定受试者的预后。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
在一些情况下,表位的表观遗传状态或突变状态指示与表观遗传修饰或突变相关的疾病或病症的预后。因此,确定已经诊断出或怀疑患有与表观遗传修饰或突变相关的疾病或病症的受试者的表位的表观遗传状态或突变状态可能对确定受试者的预后有用。许多这样的例子是本领域熟悉的。一个实例是前列腺癌和谷胱甘肽S转移酶P1(GSTP1)基因启动子、腺瘤性结肠息肉病(APC)基因、PITX2、C1orf114和GABRE~miR-452~miR-224基因,及三基因标记组合AOX1/C1orf114/HAPLN3和13基因标记组合GSTP1、GRASP、TMP4、KCNC2、TBX1、ZDHHC1、CAPG、RARRES2、SAC3D1、NKX2-1、FAM107A、SLC13A3、FILIP1L的超甲基化。另一个实例是前列腺癌和组蛋白PTMS,包括但不限于H3K18乙酰化和H3K4二甲基化增加与前列腺癌复发风险显著升高有关,H4K12乙酰化和H4R3二甲基化和与肿瘤分期相关,H3K9二甲基化与和与低级前列腺癌患者肿瘤复发风险有关。另一个实例是乳腺癌患者的总生存率与CREB5、EXPH5、ZNF775、ADCY3和ADMA8基因中CpG甲基化状态之间的联系。另一个实例是成胶质细胞瘤和EGFR、PTEN、NF1、PIK3R1、RB1、PDGFRA和QKI等基因的内含子区域超甲基化有关。另一个实例是结肠癌的预后较差和CNRIP1、FBN1、INA、MAL、SNCA和SPG20基因启动子的甲基化状态有关。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
h)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
在此方法中,病变组织的生物学样品可以从患有疾病或病症并且确定一个或多个表位的表观遗传或突变状态的许多患者中获取。然后,可以采用本领域众所周知的分析技术来鉴定表位状态与发生、分期、亚型、预后等之间的相关性。
在本发明的任何方法中,与表观遗传修饰或突变相关的疾病或病症可以是癌症、中枢神经系统(CNS)疾病、自身免疫性疾病、炎症性疾病或感染性疾病。
癌症可以是细胞的任何良性或恶性异常生长,包括但不限于听神经瘤、急性粒细胞性白血病、急性淋巴细胞性白血病、急性骨髓性白血病、腺癌、肾上腺癌、肾上腺皮质癌、肛门癌、间变性星形细胞瘤、血管肉瘤、基底细胞癌、胆管癌、膀胱癌、脑癌、乳腺癌、支气管癌、子宫颈癌、宫颈增生、脊索瘤、绒毛膜癌、慢性粒细胞性白血病、慢性淋巴细胞性白血病、慢性粒细胞性白血病、结肠癌、结肠直肠癌、颅咽管瘤、囊腺肉瘤、胚胎癌、子宫内膜癌、内皮细胞肉瘤、室管膜瘤、上皮癌、食道癌、原发性血小板增多症、尤文氏瘤、纤维肉瘤、泌尿生殖系癌、胶质母细胞瘤、胶质瘤、胶质肉瘤、毛细胞性白血病、头颈癌、成血管细胞瘤、肝癌、霍奇金病、卡波济氏肉瘤、平滑肌肉瘤、白血病、脂肪肉瘤、肺癌、淋巴管内皮细胞肉瘤、淋巴管肉瘤、淋巴瘤、恶性类癌、恶性高钙血症、恶性黑色素瘤、恶性胰腺胰岛素瘤、肥大细胞瘤、髓样癌、成神经管细胞瘤、黑色素瘤、脑膜瘤、间皮瘤、多发性骨髓瘤、阿利贝尔氏病、骨髓瘤、粘液瘤、粘液肉瘤、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、间胶质瘤、成骨肉瘤、卵巢癌、胰腺癌、乳头状腺肉瘤、乳头状肉瘤、松果体瘤、真性红细胞增多症、原发性脑癌、原发性巨球蛋白血症、前列腺癌、直肠癌、肾细胞癌、视网膜母细胞瘤、横纹肌肉瘤,皮脂腺肉瘤、精原细胞瘤、皮肤癌、小细胞肺癌、软组织肉瘤、鳞状细胞癌、胃癌、汗腺癌、滑膜瘤、睾丸癌、喉癌、甲状腺癌和肾母细胞瘤。
中枢神经系统(CNS)疾病包括遗传疾病、神经退行性疾病、精神病和肿瘤。CNS示例性疾病包括但不限于阿尔茨海默病、帕金森氏病、亨廷顿氏舞蹈病、海绵状脑白质营养不良症、雷氏病、雷夫叙姆病、妥瑞症、原发性脊髓侧索硬化、肌萎缩性侧索硬化、进行性肌萎缩、皮克氏病、肌肉萎缩症、多发性硬化、重症肌无力、皮质下动脉硬化性脑病、脊髓或头部损伤引起的创伤、泰-萨克斯病、莱施-尼汉病、癫痫、脑梗死、精神疾病(包括情感障碍(例如,抑郁症、双相情感障碍、持续性情感障碍、继发性情感障碍、噪狂症、躁狂性精神病)、精神分裂症、分裂情感性障碍、分裂样精神病、赖药症(例如,酒精和其它物质依赖症)、神经症(例如,焦虑、强迫症、躯体形式障碍、分离性障碍、悲伤、产后忧郁症)、精神病(例如,幻觉和妄想,未指定的精神病(Psychosis NOS))、痴呆、衰老、偏执狂、注意力缺失症、性心理障碍、睡眠障碍、疼痛障碍、饮食或体重失调(例如,肥胖症、恶病质、神经性厌食症和易饿症),涉及视网膜、后束和视神经的眼睛疾病(例如,色素性视网膜炎、糖尿病视网膜病、和其它视网膜退行性疾病、葡萄膜炎、老年性黄斑变性、青光眼)及CNS癌症和肿瘤(例如,垂体瘤)。
自身免疫性疾病和炎症性疾病和病症包括但不限于心肌炎、心肌梗塞后综合征、心包切开术后综合征、亚急性细菌性心内膜炎、抗肾小球基底膜肾炎、间质性膀胱炎、狼疮性肾炎、自身免疫性肝炎、原发性胆汁性肝硬化、原发性硬化性胆管炎综合征、抗合成酶综合征、鼻窦炎、牙周炎、动脉粥样硬化、皮炎、过敏、过敏性鼻炎,过敏性气道炎症、慢性阻塞性肺病、嗜酸细胞性肺炎、嗜酸细胞性食管炎、嗜酸性白细胞性增多综合征、移植物抗宿主病、特应性皮炎、肺结核、哮喘、慢性消化性溃疡、斑秃、自身免疫性血管性水肿、自身免疫性孕酮性皮炎、自身免疫性荨麻疹、大疱性类天疱疮、瘢痕性类天疱疮、疱疹样皮炎、盘状红斑狼疮、后天性大疱性表皮松解、结节性红斑、妊娠性天疱疮、化脓性汗腺炎、扁平苔藓、萎缩性硬化性苔藓、线性IgA病、硬斑病、寻常性天疱疮、急性痘疮样苔藓样糠疹、穆-哈二氏病、牛皮癣、系统性硬皮病、白斑病、艾迪生氏病、自身免疫性多内分泌腺病综合征Ⅰ型、自身免疫性多内分泌腺病综合征II型、自身免疫性多内分泌腺病综合征III型、自身免疫性胰腺炎、糖尿病I型、自身免疫性甲状腺炎、奥德甲状腺炎、格雷夫斯病、自身免疫性卵巢炎、子宫内膜异位症、自身免疫性睾丸炎、干燥综合征、自身免疫性肠病、乳糜泻、克罗恩病、肠易激综合症、憩室炎,显微镜下结肠炎、溃疡性结肠炎、抗磷脂综合征、再生障碍性贫血、自身免疫性溶血性贫血、自身免疫性淋巴细胞增生综合征、自身免疫性嗜中性白血球减少症、自身免疫性血小板减少性紫癜、冷凝集病、特发性混合性冷球蛋白血症、伊文氏综合征、恶性贫血、纯红细胞再生障碍、血小板减少症、痛性肥胖症、成人斯蒂尔病、强直性脊柱炎、CREST综合征、药物诱发狼疮、与附着点炎症相关的关节炎、嗜酸性筋膜炎、费尔蒂综合征、IgG4相关疾病、青少年关节炎、莱姆病(慢性)、混合性结缔组织病、汉-罗二氏综合征、帕罗综合征、神经痛性肌萎缩、银屑病关节炎、反应性关节炎、复发性多软骨炎、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施尼茨勒综合征、系统性红斑狼疮、未分化的结缔组织病、皮肌炎、纤维肌痛、肌炎、重症肌无力、神经性肌强直、副肿瘤性小脑神经变性、多发性肌炎、急性播散性脑脊髓炎、急性运动轴索性神经病、抗N-甲基-D-天冬氨酸受体脑炎、巴洛同心性硬化症、Bickerstaff脑干脑炎、慢性炎性脱髓鞘性多发性神经病、格林-巴雷综合征、桥本脑病、特发性炎性脱髓鞘性疾病、兰伯特-伊顿肌无力综合征、多发性硬化症、奥舒兰综合征、与链球菌相关的儿童自身免疫性神经精神疾病(PANDAS)、进行性炎症性神经病、躁动性腿综合征、僵人综合征、小舞蹈病、横贯性脊髓炎、自身免疫性视网膜病、自身免疫性葡萄膜炎、科根综合症、甲状腺眼病、中间葡萄膜炎、木样结膜炎、蚕蚀性角膜溃疡、视神经脊髓炎、眼球阵挛肌阵挛综合征、视神经炎、巩膜炎、Susac综合征、交感性眼炎、Tolosa-Hunt综合征、自身免疫性内耳病、梅尼埃病、病、嗜酸性肉芽肿伴多血管炎、巨细胞动脉炎、肉芽肿伴多发性脉管炎、IgA血管炎、川崎病、白细胞增生性血管炎、狼疮性血管炎、类风湿性血管炎、显微镜下多血管炎、结节性多动脉炎、风湿性多肌痛、荨麻疹性血管炎、血管炎和原发性免疫缺陷。
此处所述术语“感染性疾病”是指与感染剂感染有关的任何疾病。感染剂的实例包括但不限于病毒和微生物(例如细菌、寄生虫、原生动物、隐孢子虫)。病毒包括但不限于肝炎病毒科,包括甲型、乙型、丙型、丁型、戊型、庚型肝炎等;黄病毒科,包括丙型肝炎病毒(HCV)、黄热病病毒和登革热病毒;逆转录病毒科,包括人类免疫缺陷病毒(HIV)和人类T淋巴细胞病毒(HTLV1和HTLV2);疱疹病毒科,包括单纯疱疹病毒(HSV-1和HSV-2)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒、水痘-带状疱疹病毒(VZV)、人类疱疹病毒6(HHV-6)、人类疱疹病毒8(HHV-8)和疱疹B病毒;乳多空病毒科,包括人乳头状瘤病毒;弹状病毒科,包括狂犬病病毒;副粘病毒科,包括呼吸道合胞病毒;呼肠孤病毒科,包括轮状病毒;布尼亚病毒科,包括汉坦病毒;丝状病毒科,包括埃博拉病毒;腺病毒科;细小病毒科,包括细小病毒B-19;沙眼病毒科,包括拉沙病毒;正粘病毒科,包括流感病毒;痘病毒科,包括羊痘病毒、传染性软疣病毒、天花病毒和猴痘病毒;披膜病毒科,包括委内瑞拉马脑炎病毒;冠状病毒科,包括冠状病毒,例如严重急性呼吸系统综合症(SARS)病毒;和微小核糖核酸病毒科,包括脊髓灰质炎病毒;鼻病毒;环状病毒;微小核糖核酸病毒;脑心肌炎病毒(EMV);副流感病毒、腺病毒、柯萨奇病毒、埃科病毒、麻疹病毒、风疹病毒、人乳头瘤病毒、犬瘟热病毒、犬传染性肝炎病毒、猫杯状病毒、猫鼻气管炎病毒、TGE病毒(猪)、口蹄疫病毒、猿猴病毒5型、人副流感病毒2型、人偏肺病毒、肠病毒和任何其他已知或以后鉴定的病原性病毒(参见,例如,Fundamental Virology,Fields et al.,Eds.,3rd ed.,Lippincott-Raven,New York,1996,通过引用,其全部内容并入本申请中,用于病原性病毒的教导)。
病原微生物包括但不限于立克次氏体、衣原体、嗜衣原体、分枝杆菌、梭状芽胞杆菌、棒状杆菌、支原体、脲原体、军团菌、志贺氏菌、沙门氏菌、致病性大肠杆菌、博代氏菌、奈瑟氏菌、密螺旋体、芽孢杆菌、嗜血杆菌、莫拉氏菌、弧菌、葡萄球菌属、链球菌属、弯曲杆菌属、疏螺旋体属、钩端螺旋体属、埃利希体属、克雷伯菌属、假单胞菌属、幽门螺杆菌,以及现在已知或以后鉴定的其他任何病原微生物(参见,例如,Microbiology,Davis et al,Eds.,4thed.,Lippincott,New York,1990,通过引用,其全部内容并入本申请中,用于病原微生物的教导)。微生物的具体实例包括但不限于幽门螺杆菌、肺炎衣原体、沙眼衣原体、解脲支原体、肺炎支原体、金黄色葡萄球菌、化脓性链球菌、肺炎链球菌、绿色链球菌、粪肠球菌、脑膜炎奈瑟菌、淋病奈瑟菌,梅毒螺旋体、炭疽杆菌、伤寒沙门氏菌、霍乱弧菌、鼠疫巴氏杆菌(鼠疫耶尔森菌)、铜绿假单胞菌、空肠弯曲菌、艰难梭菌、肉毒杆菌、结核分枝杆菌、伯氏疏螺旋体、杜克雷嗜血杆菌、白喉棒状杆菌、百日咳杆菌,副百日咳博德特菌、支气管败血症博德特菌、流感嗜血杆菌、单核细胞增生性李斯特菌、福氏志贺氏菌、嗜吞噬细胞无形体、肠毒性大肠杆菌和埃及血吸虫。
在一些实施例中,所述疾病或病症包括但不限于肥胖症、糖尿病、心脏病、自闭症、脆性X综合征、ATR-X综合征、快乐木偶综合征、普拉德-威利综合征、伯-韦综合征、解救综合征、鲁宾斯坦-泰比综合征、锥形指和鸡胸综合征、免疫缺陷、着丝粒不稳定面部异常综合征、α-地中海贫血、白血病、德朗热综合征、歌舞伎综合征、进行性系统性硬化和心脏肥大。
本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列。
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,包括核小体定位序列和条形码标识序列,其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点核心组蛋白表位的密度;
其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明所述试剂修饰基因组位点的表观遗传或突变状态。
上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。
筛选方法可用于鉴定增加或减少表观遗传修饰或突变的试剂。在一些实施例中,检测到的增加或减少在统计学上是显著的,例如至少p<0.05,例如p<0.01、0.005或0.001。在其他实施例中,检测到的增加或减少是至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
可以根据本发明筛选任何目标化合物。合适的试验化合物包括有机和无机分子。合适的有机分子可包括但不限于小分子(小于大约1000道尔顿的化合物)、多肽(包括酶、抗体和抗体片段)、碳水化合物、脂质、辅酶和核酸分子(包括DNA、RNA和嵌合体及其类似物)以及核苷酸和核苷酸类似物。
此外,本发明的方法可以实践用于筛选化合物文库,例如小分子文库、组合化学化合物文库、多肽文库、cDNA文库、反义核酸文库等,或化合物的阵列集合,例如多肽和核酸阵列。
可以使用任何合适的筛选测定形式,例如高通量筛选。
该方法还可用于表征已被鉴定为修饰染色质中特异性基因组位点的表观遗传或突变状态的试剂。表征,例如临床前表征,可包括例如确定有效浓度,确定有效剂量方案,以及测量药代动力学和药效学。
在一些实施例中,定量染色质分析是采用束缚酶的染色质映射分析。因此,本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心元件表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量。
本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
从而测定和定量基因组位点表观遗传或突变的状态。
本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)重复步骤a)至j)至少一次;
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;k)重复步骤a)至j)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)根据核心元件表位的表观遗传或突变状态,选择合适的治疗。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)根据核心元件表位的表观遗传或突变状态,确定受试者的预后。
本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明所述试剂修饰基因组位点的表观遗传或突变状态。
对于这些束缚酶方法中的每一种方法,都适用以上关于染色质免疫沉淀测定的描述。
在一些实施例中,DNA分子在核小体定位序列和结合成员之间包含长度为大约10至大约80个核苷酸,例如大约15至大约40个核苷酸或大约15至大约30个核苷酸的接头,其中该接头包括核酸酶或转座酶识别序列。
此处所述“核心元件”是与核小体共价或非共价结合或作为其一部分的任何蛋白质或核酸,包括但不限于组蛋白、核酸、转录因子、染色质阅读器和染色质重塑剂(例如,写入器、擦除器),例如组蛋白乙酰基转移酶、组蛋白脱乙酰基酶、SWI/SNF、ISWI。
核小体标准物将包括与生物样品中检测到的靶表位相同的靶表位。核小体标准物可包括一个或一个以上的靶表位。核小体标准物可以以一系列浓度存在。
在一些实施例中,核酸酶或转座酶识别序列被内脱氧核糖核酸酶识别,例如被微球菌核酸酶、S1核酸酶、绿豆核酸酶、胰腺DNase I、酵母HO内切核酸酶、限制性内切核酸酶或归巢内切核酸酶识别。在一些实施例中,识别序列可以是被核酸酶或转座酶结合的特异性序列。在一些实施例中,识别序列可以是基于特异性序列未被核酸酶或转座酶识别的序列,但是具有使该序列优先被核酸酶或转座酶结合的特征。在一个实施例中,识别序列是富-A/T区域。
在一些实施例中,核酸酶或转座酶识别序列被转座酶识别,例如被Tn5,Mu,IS5,IS91,Tn552,Ty1,Tn7,Tn/O,Mariner,P Element,Tn3,Tn10或Tn903识别。
在一些实施例中,结合成员及其结合伴侣配对,例如生物素与抗生物素蛋白或抗生蛋白链菌素,纳米标签与抗生蛋白链菌素,谷胱甘肽与谷胱甘肽转移酶,抗原/表位与抗体,多组氨酸与镍,多核苷酸与互补的多核苷酸,适体与其特异性靶分子,或Si-标签和二氧化硅。
在一些实施例中,结合成员连接至DNA分子的5'和/或3'末端。
在一些实施例中,DNA条形码具有大约6至大约50个碱基对的长度,例如大约7至大约30个碱基对或大约8至大约20个碱基对。
在一些实施例中,核小体中的每个组蛋白独立地是完全合成的、半合成的或重组的。
在一些实施例中,组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰选自翻译后修饰,包括但不限于丝氨酸和丙氨酸的N-乙酰化;丝氨酸、苏氨酸和酪氨酸的磷酸化;N-巴豆酰化、赖氨酸的N-酰化;赖氨酸的N6-甲基化、N6,N6-二甲基化、N6,N6,N6-三甲基化;精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化;精氨酸的瓜氨酸化;赖氨酸的泛素化;赖氨酸的类泛素化;丝氨酸和苏氨酸的O-甲基化;精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化;致癌突变(例如H3K4M,H3K9M,H3K27M,H3G34R,H3G34V,H3G34W或H3K36M);转录后修饰包括但不限于5-甲基胞嘧啶、5-羟甲基胞嘧啶、5-甲酰基胞嘧啶、5-羧基胞嘧啶和3-甲基胞嘧啶;和组蛋白变体(例如,H3.3、H2A.Bbd、H2A.Z.1、H2A.Z.2、H2A.X、mH2A1.1、mH2A1.2、mH2A2和TH2B)。
在一些实施例中,核小体可以是一个组合的一部分,其中所述组合包括至少两个包括不同组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰的核小体。在某些实施例中,组合中的每个核小体包括不同的组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰,它们在组合中的浓度相同。在某些实施例中,组合中的每个核小体包括不同的组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰,它们在组合中以多种浓度存在,每个核小体的DNA条形码表明组合中存在的核小体的浓度。在一些实施例中,该组合进一步包括不包含翻译后修饰、突变或组蛋白变体和/或DNA转录后修饰的合成核小体。
在一些实施例中,核小体是例如包含2-10个核小体的多核小体的一部分。在一些实施例中,多核小体是阵列的一部分。在一些实施例中,所述阵列是阵列库的一部分,其中每个阵列包含独特的组蛋白翻译后修饰、突变或组蛋白变体和/或DNA转录后修饰。
在一些实施例中,步骤(f)的核酸酶或转座酶是无活性的,并且步骤(g)包括例如通过添加活化离子(例如钙)来活化核酸酶或转座酶。
在一些实施例中,鉴定切割的DNA包括对切割的DNA进行扩增和/或测序,例如qPCR,下一代测序或纳米串。
在一些实施例中,该方法进一步包括基于切割DNA中的DNA条形码序列,确定核小体、组合、多核小体、阵列或库的身份。
在上述方法中,固相载体可以是,例如珠子(例如,磁珠)或孔。
本发明的另一方面提供了包含执行此处所述方法之一的试剂及包含所述试剂的试剂盒。试剂可以包含在合适的包装或容器中。试剂盒可包括一种或多种含有本文所述标准物的试剂,用于例如在拉下实验、染色质免疫沉淀测定或染色质束缚酶测定中对真阳性和假阳性表位进行绝对定量。试剂盒还可包含至少一种此处所述的亲和试剂,例如抗体或其片段或变体。试剂盒还可以包括用于对条形码标识符序列进行测序的试剂(例如引物、探针)。这些标准物对于真阳性表位可能具有类似天然的亲和力、特异性和亲合力。试剂盒还可包括至少一种对假阳性表位具有类似天然的表位亲和力、特异性和亲合力的标准物。
在一些实施例中,标准物包括DNA-蛋白质复合物,其包括用组蛋白、组蛋白亚型、组蛋白翻译后修饰或组蛋白突变制备的半合成核小体,具有类似天然的亲和力、特异性和亲合力及条形码标识符序列。在各种实施例中,本领域熟悉的核心组蛋白序列的任何变体,或翻译后修饰,包括表1(a)-1(f)中定义的那些,可以安装在包括组蛋白八聚体的组蛋白上,假设维持了类似天然的表位亲和力、特异性和亲合力的话。在一个实施例中,一组标准物包括至少一个DNA-复合物标准物,其对真阳性表位具有类似天然的表位亲和力、特异性和亲合力,以及多个DNA-复合物标准物,它们对天然的DNA-蛋白质复合物库中可能存在的一系列脱靶表位(假阳性表位)具有类似天然的表位亲和力、特异性和亲合力。
在其他实施例中,试剂盒可在包装或容器中包括一种或多种洗涤缓冲液(例如,磷酸盐缓冲盐水)和/或其他缓冲液。在其他实施例中,试剂盒可包括分离捕获试剂必需的试剂,例如固相捕获试剂,其包括,例如与第二抗体或蛋白-A连接的顺磁性颗粒。试剂盒还可以包括用于测量捕获的标准物或样品数量所需的试剂。
供应试剂盒时,可以将不同的组分包装在单独的容器中,并在使用前立即混合。各组分的这种单独包装允许长期储存而不会丧失活性组分的功能。试剂盒还可以随附说明性材料。说明可以印刷在纸或其他基材上,和/或可以作为电子可读介质提供。
在一些实施例中,试剂盒可包括一组标准物,这些标准物代表特定类别的PTM的某些或全部不同可能性,例如单个组蛋白或多个组蛋白的,例如赖氨酸甲基化、赖氨酸酰化或精氨酸甲基化。该组标准物可以包括被认为与一种或多种疾病有关的一些或全部修饰。在一些实施例中,试剂盒可包括一组标准物,这些标准物代表组蛋白突变的大多数或全部不同可能性,例如单个组蛋白或多个组蛋白的,例如致癌性组蛋白突变。该组标准物可用于评估亲和试剂的特异性,监测技术变化性并归一化实验。量化标准物的回收率也可以用作继续进行其余测定(例如,下一代测序)的停止/继续决策点。
在一些实施例中,组中的每个种类可以多次包括。在一些实施例中,每个种类可以以相同的浓度多次表示,该种类的每次迭代具有作为内部对照的不同的条形码标识符序列。在一些实施例中,每个种类可以以不同的浓度多次表示,该种类的每次迭代具有代表标准物浓度的唯一的条形码标识符序列。这样的浓度系列可以用于绘制测定用标准曲线。每种浓度可以多次表示,该种类的每次迭代具有作为内部对照的不同的条形码标识符序列。
标准物的赖氨酸甲基化组的一个实例包括选自H3K4,H3K9,H3K27,H3K36和H4K20的部分或全部PTM,在该组中每个标准物可能代表有0、1、2或3个甲基。在一个实施例中,该组可以具有16个种类(5个赖氨酸残基中的每一个具有1、2或3个甲基基团以及未修饰的标准物)。在一些实施例中,该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此,该组可包括多达32个不同的种类。在一些实施例中,高达16种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示,每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如,每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在,每种浓度具有不同的条形码标识符序列。因此,一组可以具有唯一标准物,其具有8或16的倍数,例如总计16、24、32、40、48、56、64、72、80、96、104、112、120、128、136、144、152或160个种类。
标准物的精氨酸甲基化组的一个实例包括选自以下的一些或全部PTM:H2AR2me1、H2AR2me2a、H2AR2me2s、H3R2me1、H3R2me2a、H3R2me2s、H3R8me1、H3R8me2a、H3R8me2s、H3R17me1、H3R17me2a、H4R3me1、H4R3me2a和H4R3me2s,其中a是不对称的,而s是对称的。在一个实施例中,该组可以具有15个种类(14个PTM中的每一种以及未修饰的标准物)。在一些实施例中,该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此,该组可包括多达30个不同的种类。在一些实施例中,高达15种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示,每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如,每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在,每种浓度具有不同的条形码标识符序列。因此,一组可以具有唯一标准物,其具有15的倍数,例如总计30、45、60、75、90、105、120、135、或150个种类。
标准物的赖氨酸酰化组的一个实例包括选自以下的部分或全部PTM:ptmH2AtetraAc、H3K4ac、H3K9ac、H3K9bu、H3K9cr、H3K14ac、H3K18ac、H3K18bu、H3K18cr、H3tetraAc(K4-9-14-18ac)、H3K23ac、H3K27ac、H3K27bu、H3K27cr、H3K36ac、H3K56ac、H4K5ac、H4K8ac、H4K12ac、H4K16ac、H4tetraAc(K5-8-12-16ac)和H4K20ac。在一个实施例中,该组可以具有23个种类(22个PTM中的每一种以及未修饰的标准物)。在一些实施例中,该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此,该组可包括多达46个不同的种类。在一些实施例中,高达23种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示,每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如,每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在,每种浓度具有不同的条形码标识符序列。因此,一组可以具有唯一标准物,其具有23的倍数,例如总计46、69、92、115、138、161、184、207、或230个种类。
标准物的致癌突变组的一个实例包括部分或全部突变,包括但不限于H3K4M、H3K9M、H3K27M、H3G34R、H3G34V、H3G34W、H3K36M及其任何组合。该组还可以包括野生型H3。H3突变体可以基于H3的任何变体主链,例如,H3.1、H3.2或H3.3。因此,该组可包括多达8个不同的种类,每个种类具有唯一的条形码标识符序列。在一些实施例中,该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此,该组可包括多达16个不同的种类。在一些实施例中,高达8种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示,每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如,每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在,每种浓度具有不同的条形码标识符序列。因此,一组可以具有唯一标准物,其具有8或16的倍数,例如总计16、24、32、40、48、56、64、72、80、96、104、112、120、128、136、144、152或160个种类。
在一些实施例中,试剂盒适合采用束缚酶的染色质分析。在一些实施例中,试剂盒包括本发明的核小体、组、多核体、阵列、库或珠。在一些实施例中,试剂盒还包括抗体、适体或其它亲和试剂,它们与组蛋白翻译后修饰、突变或组蛋白变体或DNA转录后修饰特异性结合。在一些实施例中,试剂盒还包括与抗体结合蛋白(例如蛋白质A、蛋白质G、蛋白质A与蛋白质G之间的融合、蛋白质L或蛋白质Y等)、或与结合识别剂的实体(例如蛋白质)连接的核酸酶或转座酶。在一些实施中,试剂盒还包括珠粒,其包括结合元件的结合伴侣,例如磁珠。
上述说明是为了阐明本发明,不应视为限制本发明。本发明由下述权利要求定义,与所述权利要求相当的内容也包括在本发明中。
表1(a)人类组蛋白H2A 1/2/3类、H2A.X、H2A.Z和H2A.V的1/2/3/4/5亚型的翻译后修饰
表1(b)人类组蛋白H2A.J和H2B 1类的翻译后修饰
表1(c)人类组蛋白H2B 2/3/F-S类的翻译后修饰
位置 | 修饰类型说明 |
1 | N-乙酰脯氨酸 |
5 | N6-乙酰赖氨酸 |
5 | N6-巴豆酰-L-赖氨酸 |
11 | N6-乙酰赖氨酸 |
11 | N6-巴豆酰-L-赖氨酸 |
12 | N6-乙酰赖氨酸 |
12 | N6-巴豆酰-L-赖氨酸 |
14 | 磷酸丝氨酸 |
15 | N6-乙酰赖氨酸 |
15 | N6-巴豆酰-L-赖氨酸 |
16 | N6-乙酰赖氨酸 |
16 | N6-巴豆酰-L-赖氨酸 |
20 | N6-乙酰赖氨酸 |
20 | N6-巴豆酰-L-赖氨酸 |
23 | N6-乙酰赖氨酸 |
23 | N6-巴豆酰-L-赖氨酸 |
34 | N6-巴豆酰-L-赖氨酸 |
36 | 磷酸丝氨酸 |
46 | N6-甲基赖氨酸 |
57 | N6,N6-二甲基赖氨酸 |
79 | 二甲基化精氨酸 |
85 | N6,N6,N6-三甲基赖氨酸 |
85 | N6-乙酰赖氨酸 |
86 | ω-N-甲基精氨酸 |
92 | ω-N-甲基精氨酸 |
108 | N6-甲基赖氨酸 |
115 | 磷酸苏氨酸 |
116 | N6-甲基化赖氨酸 |
112 | O-连接的(GlcNAc) |
34 | 甘氨酰赖氨酸异肽(Lys-Gly)(泛素中的G-Cter链间) |
121 | 甘氨酰赖氨酸异肽(Lys-Gly)(泛素中的G-Cter链间) |
表1(d)人类推定组蛋白H2B 2-D/2-C类的翻译后修饰
位置 | 修饰类型说明 |
1 | N-乙酰脯氨酸 |
5 | N6-乙酰赖氨酸 |
5 | N6-巴豆酰-L-赖氨酸 |
11 | N6-乙酰赖氨酸 |
11 | N6-巴豆酰-L-赖氨酸 |
12 | N6-乙酰赖氨酸 |
12 | N6-巴豆酰-L-赖氨酸 |
14 | 磷酸丝氨酸 |
15 | N6-乙酰赖氨酸 |
15 | N6-巴豆酰-L-赖氨酸 |
16 | N6-乙酰赖氨酸 |
16 | N6-巴豆酰-L-赖氨酸 |
20 | N6-乙酰赖氨酸 |
20 | N6-巴豆酰-L-赖氨酸 |
23 | N6-乙酰赖氨酸 |
23 | N6-巴豆酰-L-赖氨酸 |
34 | N6-巴豆酰-L-赖氨酸 |
36 | 磷酸丝氨酸 |
46 | N6-甲基赖氨酸 |
57 | N6,N6-二甲基赖氨酸 |
79 | 二甲基化精氨酸 |
85 | N6,N6,N6-三甲基赖氨酸 |
85 | N6-乙酰赖氨酸 |
86 | ω-N-甲基精氨酸 |
92 | ω-N-甲基精氨酸 |
表1(e)人类组蛋白H3.1/H3.1t/H3.2/H3.3/H3.3C的翻译后修饰
表1(f)人类组蛋白H3-样着丝粒蛋白A和人类组蛋白H4的翻译后修饰
序列表
<110> 埃皮赛佛尔有限公司
M·W·考雷司
迈克尔-克里斯托弗·基奥
<120> 基因组位点处核小体修饰和突变的定量方法及其临床应用
<130> 1426-11WO
<150> US 62/615,770
<151> 2018-01-10
<160> 115
<170> SIPOSequenceListing 1.0
<210> 1
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ggcggccgac gcgatacacc gttcgtcgct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgtt 180
cgacggtacg tcgagcggcc gcc 203
<210> 2
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggcggcgtat cgcgtcgcgc gtaatcgact ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgcg 180
acgttacgct cgacgtagcc gcc 203
<210> 3
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ggcggcaccg atacgcgcgc ggtacgatct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttaatc 180
gacgcgatat cgcgcgtgcc gcc 203
<210> 4
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggcggcatat cgcgcgtcgt atcgcggtct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttcgta 180
tcgcgccgcg tattcgggcc gcc 203
<210> 5
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ggcggcccgc gcgatattac gcgcgaatct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtacgaa 180
cgtcgatcgt cgattcggcc gcc 203
<210> 6
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggcggccgac gaacggttcg tacgcgagct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttcgcg 180
tacgaatcgc gtaatcggcc gcc 203
<210> 7
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggcggccgcg taatacgccg cgatacgact ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtaacgc 180
gtatcgcgcg taacgcggcc gcc 203
<210> 8
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggcggccgta cgacgctcgc gatatccgct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgacg 180
ttaacgcgtt acgcgtcgcc gcc 203
<210> 9
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggcggcgcgt tcgacgggtc gcgaactact ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgtcgc 180
gaactacgtc gttcgacgcc gcc 203
<210> 10
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ggcggctacg ctcggactcg cgcgatgact ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgatc 180
gtcgcatcgg tacgctagcc gcc 203
<210> 11
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggcggctatt atgcgcgacc cgcgtacgct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgtac 180
cgcgatccga cgatcgagcc gcc 203
<210> 12
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ggcggctcgc gaccgtacga atttcgcgct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgcgt 180
caatcgcgat tacgcgagcc gcc 203
<210> 13
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ggcggctcgt acgaccgcgc gtatcgggct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgat 180
cgtacgcgcg acgttaagcc gcc 203
<210> 14
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ggcggcccgc gcgatattac gcgcgaatct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgacg 180
ttaacgcgtt acgcgtcgcc gcc 203
<210> 15
<211> 203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ggcggccgta cgacgctcgc gatatccgct ggagaatccc ggtgccgagg ccgctcaatt 60
ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120
cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtacgaa 180
cgtcgatcgt cgattcggcc gcc 203
<210> 16
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctattatg cgcgcgatac gcgtttc 147
<210> 17
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgcat aataatcgcg cgatttc 147
<210> 18
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcatatcgc gcgttcgacg ttcgttc 147
<210> 19
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcacgcgcg atattatcgc gtcgttc 147
<210> 20
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgtcga cgatcgtcga atcgttc 147
<210> 21
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgtcga ttcgacgcga atcgttc 147
<210> 22
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctacgcga ttcgtcgttt cgcgttc 147
<210> 23
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctatacgc gtcgacgatt cgcgttc 147
<210> 24
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgta atcgtttcga cgcgttc 147
<210> 25
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcttaacgt cgcgcgttcg aacgttc 147
<210> 26
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtatta cgcgaatcgc gcgattc 147
<210> 27
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgatta cgcgtcgcgc gtaattc 147
<210> 28
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtttcg tacgcgcgac gtaattc 147
<210> 29
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgta tacgtacgcg cgaattc 147
<210> 30
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtaa tacgcgcgaa attcgtc 147
<210> 31
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgatagtc gacgttatcg cgtcgtc 147
<210> 32
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtacga aacgcgttaa cgtcgtc 147
<210> 33
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtcgac tatctcgtcg tatcgtc 147
<210> 34
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcttacgcg taccaacgcg tatcgtc 147
<210> 35
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgaatcg cgtattacgc gatcgtc 147
<210> 36
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcggtac gctatcgtac gatcgtc 147
<210> 37
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgcg tatacgaatt tcgcgtc 147
<210> 38
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgacgc gataattacg tcgcgtc 147
<210> 39
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgcg aatattcgta tcgcgtc 147
<210> 40
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctatcgcg tcgagtgata tcgcgtc 147
<210> 41
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtaa tcgatacgtt acgcgtc 147
<210> 42
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcttacgtc gcgataatcg acgcgtc 147
<210> 43
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctattcgc gcgatcgcga ttacgtc 147
<210> 44
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgattac gcgaacgatt cgacgtc 147
<210> 45
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtatac gcgattaacg cgacgtc 147
<210> 46
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctagcgta ccgacgacgt taacgtc 147
<210> 47
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcatcgtcg acgaacgttc gaacgtc 147
<210> 48
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgaatcg acgatagttc gcgactc 147
<210> 49
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgacg ttaacgcgat atcactc 147
<210> 50
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcggtacgc gtaacgcgtc gattatc 147
<210> 51
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgac gtaaattcgc gcgtatc 147
<210> 52
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtat cggtcgcgta acgtatc 147
<210> 53
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgaa cggtgtcgcg aactatc 147
<210> 54
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgaacgg tcgtttcgcg cgatatc 147
<210> 55
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgacga tcgtacgacg cgatatc 147
<210> 56
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgta ccgtttacgc gtcgatc 147
<210> 57
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtacga cgctacgaac gtcgatc 147
<210> 58
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgcgcg atattttcgt cgcgatc 147
<210> 59
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgcg acatcgtaat cgcgatc 147
<210> 60
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgcga tatgattacg cgcgatc 147
<210> 61
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtat tcggttcgta cgcgatc 147
<210> 62
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgatcg tcggcgatcg tacgatc 147
<210> 63
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcacgatcg tcggtcgttc gacgatc 147
<210> 64
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgta tcggcgatac gacgatc 147
<210> 65
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcatatcgc gcggtcgtcg aacgatc 147
<210> 66
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgta acggacgcga aacgatc 147
<210> 67
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcacgaccg ttcgcgtcgc gttaatc 147
<210> 68
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtatcg gtcgcgatcg cgtaatc 147
<210> 69
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcctcgttc gtcgttcgcg cgtaatc 147
<210> 70
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcaccgttc gtcgtcgacg cgtaatc 147
<210> 71
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctacgtcc gtcgcgacgc gataatc 147
<210> 72
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgttac gtcgtatcgc gcgaatc 147
<210> 73
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcacggtac gtcgttacgc gcgaatc 147
<210> 74
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgatac gtcgtcgcgt acgaatc 147
<210> 75
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcacg atcgcgcgat acgaatc 147
<210> 76
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgccga atcgacgcgt cgaaatc 147
<210> 77
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctatgcgt cgcgtcgcga cgaaatc 147
<210> 78
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccatatcg cgcgcgtatc gcggttc 147
<210> 79
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtatag cgcgccgtac gtcgttc 147
<210> 80
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcaccgata cgcgtagcga cgcgttc 147
<210> 81
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgaata cgcgtcgacg accgttc 147
<210> 82
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgtacg accgcggtcg aacgttc 147
<210> 83
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcagcgtcg tacgtcgcga cgagttc 147
<210> 84
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgcta tacgcgtacc gcgattc 147
<210> 85
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgaccga tacgcgcggt acgattc 147
<210> 86
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcttcgagc gacgcggcgt acgattc 147
<210> 87
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgtcgaac gacgcggtcg acgattc 147
<210> 88
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgacgcgt aacgccgcgc gtaattc 147
<210> 89
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgacgc gtagcgcgac gcaattc 147
<210> 90
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgaa cgagtcgtat cgcggtc 147
<210> 91
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgttacg cgtcttatcg cgcggtc 147
<210> 92
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctaacgtc gcgcattacg cgcggtc 147
<210> 93
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctacgctc ggactatacg cgcggtc 147
<210> 94
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtcgtt cgacacgacg tacggtc 147
<210> 95
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgcgcgac gttacgattc gacggtc 147
<210> 96
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctgtcgcg cgtatacgct cgtcgtc 147
<210> 97
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgtccgag cgtagtatcg cgtcgtc 147
<210> 98
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcgcgac cgtagttacg cgtcgtc 147
<210> 99
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgacgga cgtacgtatc cgtcgtc 147
<210> 100
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgacg catagcgtta cgtcgtc 147
<210> 101
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcctacgcg tcgacgcgtt agtcgtc 147
<210> 102
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgacga tcgatcggcg tatcgtc 147
<210> 103
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgatcgt gcgacgcgac tatcgtc 147
<210> 104
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgattcg gcgatgcgac gatcgtc 147
<210> 105
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctacggtc gcgaccgtcg aatcgtc 147
<210> 106
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcatgtcgc gcgacgcgtc aatcgtc 147
<210> 107
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccggtcgt acgacgcgat atgcgtc 147
<210> 108
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctacgcgc gacacgtaat cggcgtc 147
<210> 109
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgtcgct cgaatatcgg tcgcgtc 147
<210> 110
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgcgttcg acggattgcg tcgcgtc 147
<210> 111
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtta cgcgcgatag tcgcgtc 147
<210> 112
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggccgcgtaa cgcggtcgta tcgcgtc 147
<210> 113
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggctcggtac gcgccggata tcgcgtc 147
<210> 114
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcccgtcga acgccgcata tcgcgtc 147
<210> 115
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60
acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120
ggcgcgcgta ccgataccga tcgcgtc 147
Claims (55)
1.一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;从而,检测和定量表位处的表观遗传修饰或突变。
2.一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;从而测定和定量基因组位点表观遗传或突变的状态。
3.一种监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
h)重复步骤a)至g)至少一次;及
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
4.一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
h)在表观遗传治疗或突变治疗开始后重复步骤a)至g)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
5.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,选择合适的治疗。
6.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量和与天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
h)根据核心组蛋白表位的表观遗传或突变状态,确定受试者的预后。
7.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
h)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
8.一种筛选修饰受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)从所述生物样品的染色质制备天然核小体文库,其中所述文库包括核小体,所述核小体包括具有表位的核心组蛋白及多核苷酸,所述多核苷酸包括指示基因组位点的核苷酸序列;
c)向文库中加入标准物,建立掺杂文库;其中所述标准物包括重组核小体,其包括:(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸,其包括核小体定位序列和条形码标识序列,其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合;
d)向掺杂文库中加入亲和试剂,捕获一定数量的天然核小体和包含表位的标准物;
e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较,确定表位的相对基因组丰度;
f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较,确定表位的标准物捕获效率;
g)将相对基因组丰度与标准物捕获效率进行比较,确定基因组位点处核心组蛋白表位的密度;
其中在存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明所述试剂修饰基因组位点的表观遗传或突变状态。
9.根据权利要求1-8任一项所述的方法,其中所述生物样品包括细胞,所述染色质是从所述细胞分离得到的。
10.根据权利要求9所述的方法,其中所述细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。
11.根据权利要求9所述的方法,其中所述细胞是来自受与组蛋白突变有关的疾病或病症影响的组织或器官的细胞。
12.根据权利要求1-11任一项所述的方法,其中所述生物样品是活检样品。
13.根据权利要求9所述的方法,其中所述细胞不是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。
14.根据权利要求9所述的方法,其中所述细胞不是来自受与突变有关的疾病或病症影响的组织或器官的细胞。
15.根据权利要求1-14任一项所述的方法,其中所述生物样品包括外周血单核细胞。
16.根据权利要求1-8任一项所述的方法,其中所述生物样品包括循环核小体。
17.根据权利要求16所述的方法,其中所述循环核小体来自血细胞。
18.根据权利要求16所述的方法,其中所述细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。
19.根据权利要求16所述的方法,其中所述循环核小体来自受与突变有关的疾病或病症影响的组织或器官的细胞。
20.根据权利要求16所述的方法,其中所述生物样品是血浆、尿液、唾液、粪便、淋巴液或脑脊髓液。
21.根据权利要求1-20任一项所述的方法,其中所述受试者是人类。
22.根据权利要求1-21任一项所述的方法,其中所述确定标准物捕获效率包括将条形码标识符序列的捕获数量与重组核小体的输入数量之比进行比较。
23.根据权利要求1-22任一项所述的方法,其中所述确定相对基因组丰度包括将天然核小体核苷酸序列的捕获数量与天然核小体核苷酸序列的输入数量之比进行比较。
24.根据权利要求1-23任一项所述的方法,其中所述亲和试剂是靶向表位的抗体。
25.根据权利要求1-24任一项所述的方法,其中将多个标准物添加到文库中,每个标准物包括重组的核小体,其包括(i)具有表位的标准组蛋白或组蛋白片段,和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸,其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数,并且其中将相当浓度的标准物添加到文库中。
26.根据权利要求1-24任一项所述的方法,其中将多个标准物添加到文库中,每个标准物包括重组的核小体,其包括(i)具有表位的标准组蛋白或组蛋白片段,和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸,其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数,并且其中将至少两个不同浓度的标准物添加到文库中。
27.根据权利要求26所述的方法,其中将至少六个不同浓度的标准物添加到文库中。
28.根据权利要求25-27任一项所述的方法,其中所述多个标准物可以进一步包括包含重组核小体的标准物,所述核小体包含(i)一个或多个脱靶表位和(ii)编码脱靶表位一致性的标准分子条形码和指示脱靶表位的浓度参数。
29.根据权利要求25-27任一项所述的方法,进一步包括根据脱靶表位的一种或多种捕获效率来确定亲和试剂的脱靶捕获特异性,并根据脱靶捕获特异性来校准基因组位点核心组蛋白的表位密度。
30.根据权利要求1-29任一项所述的方法,其中所述表位是翻译后修饰或蛋白质亚型。
31.根据权利要求1-30任一项所述的方法,其中所述条形码序列是细胞基因组中不存在的序列。
32.根据权利要求1-31任一项所述的方法,其中至少一种包括指示基因组位点的核苷酸序列的多核苷酸和标准多核苷酸的丰度采用选自PCR、RT-PCR、ddPCR、下一代测序、杂交、放射自显影、荧光标记、光密度和插入式荧光探针方法测定。
33.根据权利要求1-32任一项所述的方法,其中所述核心组蛋白的表位包含至少一种翻译后氨基酸修饰,所述修饰选自丝氨酸和丙氨酸的N-乙酰化;丝氨酸、苏氨酸和酪氨酸的磷酸化;赖氨酸的N-巴豆酰化、N-酰化;赖氨酸的N6-甲基化、N6,N6-二甲基化、N6,N6,N6-三甲基化;精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化;精氨酸的瓜氨酸化;赖氨酸的泛素化;赖氨酸的类泛素化;丝氨酸和苏氨酸的O-甲基化;精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化。
34.根据权利要求1-32任一项所述的方法,其中所述核心组蛋白的表位包括至少一种选自H3K4M、H3K9M、H3K27M和H3K36M的致癌突变。
35.根据权利要求1-34任一项所述的方法,其中所述标准多核苷酸是双链多核苷酸。
36.根据权利要求35所述的方法,其中所述双链多核苷酸包括选自SEQ ID NOS:1-115的核苷酸序列。
37.根据权利要求1-36任一项所述的方法,其中所述条形码标识符序列包括选自核苷酸条形码序列分子、锁核酸序列和DNA序列的分子。
38.根据权利要求1-37任一项所述的方法,其中所述与表观遗传修饰或突变相关的疾病或病症可以是癌症、中枢神经系统(CNS)疾病、自身免疫性疾病、炎症性疾病或感染性疾病。
39.根据权利要求1-38任一项所述的方法,其中所述天然核小体文库包括核小体,所述每个核小体包括核心组蛋白及多核苷酸,所述多核苷酸包括指示其原基因组位点的核苷酸序列,所述方法包括:
确定掺杂文库中基因组位点核心组蛋白的数量;和
确定掺杂文库中标准物的数量。
40.根据权利要求39所述的方法,其中确定掺杂文库中基因组位点处核心组蛋白的数量包括:
向掺杂文库中添加第二亲和试剂,回收一定数量的包括第二表位的核小体,其中第二表位是位于核心组蛋白上的不变表位,和
确定回收的包括第二表位的核小体中多核苷酸的数量。
41.根据权利要求39所述的方法,其中确定掺杂文库中标准物的数量包括:
回收一定数量的重组核小体;其中重组核小体包括第二表位,和
确定回收的包括第二表位的重组核小体中标准物分子的数量。
42.根据权利要求41所述的方法,其中所述亲和试剂是靶向表位的抗体,其中所述第二亲和试剂是靶向第二表位的抗体。
43.一种检测和定量受试者生物样品染色质内特异性基因组位点核心元件表位处表观遗传修饰或突变的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量。
44.一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将其丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
从而测定和定量基因组位点表观遗传或突变的状态。
45.一种监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)重复步骤a)至j)至少一次;
从而监测基因组位点处表观遗传或突变状态随时间的变化情况。
46.一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法,所述方法包括监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的情况,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)重复步骤a)至j)至少一次;
从而监测受试者表观遗传治疗或突变治疗的有效性。
47.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
k)根据核心元件表位的表观遗传或突变状态,选择合适的治疗。
48.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,选择患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)根据核心元件表位的表观遗传或突变状态,确定受试者的预后。
49.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况,鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法,所述方法包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;及
k)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联;
从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。
50.一种筛选修饰受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的试剂的方法,所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态;
其中所述测定基因组位点的表观遗传或突变状态包括:
a)从受试者分离生物样品;
b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合;
c)透化处理细胞、细胞核、细胞器或组织;
d)将固相载体与包括带表位核心元件的重组核小体标准物结合,所述核小体标准物包括:
a.蛋白八聚体,包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝,及任选包含连接组蛋白H1;
b.DNA分子,包括:
i.核小体定位序列,
ii.DNA条形码;
iii.核酸酶或转座酶识别序列;及
c.与DNA分子连接的结合成员,其中所述结合成员与结合伴侣特异性结合;
e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触;
f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂;
g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列;
h)分离切割的DNA;及
i)鉴定切割的DNA;及
j)通过将相对基因组丰度与核小体标准物进行比较,对基因组位点的表位进行检测和定量;
其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化,则表明所述试剂修饰基因组位点的表观遗传或突变状态。
51.一种试剂盒,包括一组核小体标准物,所述组包括两个或多个核小体,所述核小体包括表观遗传修饰或疾病-相关组蛋白突变。
52.根据权利要求51所述的试剂盒,其中所述组包括核小体,所述核小体包括两个或多个不同的甲基化赖氨酸修饰。
53.根据权利要求51所述的试剂盒,其中所述组包括核小体,所述核小体包括两个或多个不同的酰化赖氨酸修饰。
54.根据权利要求51所述的试剂盒,其中所述组包括核小体,所述核小体包括两个或多个不同的甲基化精氨酸修饰。
55.根据权利要求51所述的试剂盒,其中所述组包括核小体,所述核小体包括两个或多个不同的选自H3K4M、H3K9M、H3K27M、H3K34R、H3K34V、H3K34W、H3K36M及它们的任何组合的疾病-相关组蛋白突变。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862615770P | 2018-01-10 | 2018-01-10 | |
US62/615,770 | 2018-01-10 | ||
PCT/US2019/013036 WO2019140082A1 (en) | 2018-01-10 | 2019-01-10 | Methods for quantification of nucleosome modifications and mutations at genomic loci and clinical applications thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111836907A true CN111836907A (zh) | 2020-10-27 |
Family
ID=67218755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980018514.0A Pending CN111836907A (zh) | 2018-01-10 | 2019-01-10 | 基因组位点处核小体修饰和突变的定量方法及其临床应用 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20200332370A1 (zh) |
EP (1) | EP3737772A4 (zh) |
JP (2) | JP2021510306A (zh) |
CN (1) | CN111836907A (zh) |
AU (1) | AU2019206547A1 (zh) |
CA (1) | CA3088077A1 (zh) |
WO (1) | WO2019140082A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112904006A (zh) * | 2021-01-28 | 2021-06-04 | 中山大学 | 一种乳腺癌预后预测分子标志物及其应用 |
CN113539361A (zh) * | 2021-07-08 | 2021-10-22 | 谱天(天津)生物科技有限公司 | 一种基于基因突变丰度的肿瘤靶向药物选择方法 |
CN114561434A (zh) * | 2022-03-30 | 2022-05-31 | 南京师范大学 | 裂殖壶菌发酵生产epa和dha的方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021097153A1 (en) * | 2019-11-15 | 2021-05-20 | The University Of Toledo | Methods and kits using internal standards to control for complexity of next generation sequencing (ngs) libraries |
WO2024081782A1 (en) * | 2022-10-12 | 2024-04-18 | Epicypher, Inc. | High efficiency antibodies for chromatin targets |
WO2024178273A1 (en) * | 2023-02-24 | 2024-08-29 | The Regents Of The University Of California | Methods for epigenetic analysis |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070160989A1 (en) * | 2003-08-18 | 2007-07-12 | Bawden Lindsay J | Detection of histone modification in cell-free nucleosomes |
WO2013184930A2 (en) * | 2012-06-06 | 2013-12-12 | Trustees Of Princeton University | Dna barcoding of designer mononucleosome and chromatin array libraries for the profiling of chromatin readers, writers, erasers, and modulators thereof |
CN107002289A (zh) * | 2014-02-03 | 2017-08-01 | 芝加哥大学 | 用于定量评价dna‑蛋白质复合物密度的组合物和方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7790379B2 (en) | 2005-05-19 | 2010-09-07 | Universite De Geneve | Mapping of proteins along chromatin by chromatin cleavage |
JP5756760B2 (ja) | 2010-01-13 | 2015-07-29 | 株式会社日立製作所 | 磁気メモリ、磁気メモリの製造方法、及び、磁気メモリの駆動方法 |
GB201303575D0 (en) * | 2013-02-28 | 2013-04-10 | Singapore Volition Pte Ltd | Method for detecting histone modifications in nucleosomes |
WO2015138870A2 (en) * | 2014-03-13 | 2015-09-17 | The Trustees Of The University Of Pennsylvania | Compositions and methods for targeted epigenetic modification |
EP3688157B1 (en) * | 2017-09-25 | 2022-04-27 | Fred Hutchinson Cancer Research Center | High efficiency targeted in situ genome-wide profiling |
-
2019
- 2019-01-10 JP JP2020538986A patent/JP2021510306A/ja active Pending
- 2019-01-10 EP EP19738539.6A patent/EP3737772A4/en active Pending
- 2019-01-10 US US16/960,640 patent/US20200332370A1/en not_active Abandoned
- 2019-01-10 CN CN201980018514.0A patent/CN111836907A/zh active Pending
- 2019-01-10 CA CA3088077A patent/CA3088077A1/en active Pending
- 2019-01-10 AU AU2019206547A patent/AU2019206547A1/en active Pending
- 2019-01-10 WO PCT/US2019/013036 patent/WO2019140082A1/en unknown
-
2023
- 2023-04-11 US US18/298,777 patent/US20230407406A1/en active Pending
- 2023-09-27 JP JP2023164206A patent/JP2023182657A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070160989A1 (en) * | 2003-08-18 | 2007-07-12 | Bawden Lindsay J | Detection of histone modification in cell-free nucleosomes |
WO2013184930A2 (en) * | 2012-06-06 | 2013-12-12 | Trustees Of Princeton University | Dna barcoding of designer mononucleosome and chromatin array libraries for the profiling of chromatin readers, writers, erasers, and modulators thereof |
CN107002289A (zh) * | 2014-02-03 | 2017-08-01 | 芝加哥大学 | 用于定量评价dna‑蛋白质复合物密度的组合物和方法 |
Non-Patent Citations (2)
Title |
---|
PETER J SKENE AND STEVEN HENIKOFF: "An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites", ELIFE, no. 6, pages 1 - 35 * |
PETER MCANENA ET AL.: "Circulating Nucleosomes and Nucleosome Modifications as Biomarkers in Cancer", CANCERS (BASEL), vol. 9, no. 1, pages 1 - 11 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112904006A (zh) * | 2021-01-28 | 2021-06-04 | 中山大学 | 一种乳腺癌预后预测分子标志物及其应用 |
CN113539361A (zh) * | 2021-07-08 | 2021-10-22 | 谱天(天津)生物科技有限公司 | 一种基于基因突变丰度的肿瘤靶向药物选择方法 |
CN113539361B (zh) * | 2021-07-08 | 2023-02-24 | 谱天(天津)生物科技有限公司 | 一种肿瘤靶向治疗药物敏感性和耐药性评估方法 |
CN114561434A (zh) * | 2022-03-30 | 2022-05-31 | 南京师范大学 | 裂殖壶菌发酵生产epa和dha的方法 |
CN114561434B (zh) * | 2022-03-30 | 2024-03-26 | 南京师范大学 | 裂殖壶菌发酵生产epa和dha的方法 |
Also Published As
Publication number | Publication date |
---|---|
US20230407406A1 (en) | 2023-12-21 |
WO2019140082A1 (en) | 2019-07-18 |
AU2019206547A1 (en) | 2020-07-30 |
EP3737772A1 (en) | 2020-11-18 |
CA3088077A1 (en) | 2019-07-18 |
JP2023182657A (ja) | 2023-12-26 |
EP3737772A4 (en) | 2021-09-22 |
US20200332370A1 (en) | 2020-10-22 |
JP2021510306A (ja) | 2021-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111836907A (zh) | 基因组位点处核小体修饰和突变的定量方法及其临床应用 | |
EP3759249B1 (en) | Quantification of nucleosome modifications using chemically-defined recombinant nucleosomes | |
US11965890B2 (en) | Compositions and methods for quantitative assessment of DNA-protein complex density | |
US20220042074A1 (en) | Dna-barcoded nucleosomes for chromatin mapping assays | |
JPWO2019169263A5 (zh) | ||
US20220049311A1 (en) | Chromatin mapping assays and kits using long-read sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |