CN114585741A - 转录中继系统 - Google Patents
转录中继系统 Download PDFInfo
- Publication number
- CN114585741A CN114585741A CN202080054299.2A CN202080054299A CN114585741A CN 114585741 A CN114585741 A CN 114585741A CN 202080054299 A CN202080054299 A CN 202080054299A CN 114585741 A CN114585741 A CN 114585741A
- Authority
- CN
- China
- Prior art keywords
- transcription factor
- transcription
- certain embodiments
- nucleotide sequence
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013518 transcription Methods 0.000 title claims abstract description 97
- 230000035897 transcription Effects 0.000 title claims abstract description 97
- 108091023040 Transcription factor Proteins 0.000 claims abstract description 264
- 102000040945 Transcription factor Human genes 0.000 claims abstract description 264
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 146
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 131
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 131
- 210000004027 cell Anatomy 0.000 claims description 215
- 239000002773 nucleotide Substances 0.000 claims description 186
- 125000003729 nucleotide group Chemical group 0.000 claims description 186
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 159
- 108091027981 Response element Proteins 0.000 claims description 97
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 72
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 72
- 229920001184 polypeptide Polymers 0.000 claims description 70
- 230000001105 regulatory effect Effects 0.000 claims description 69
- 230000004913 activation Effects 0.000 claims description 51
- 230000000694 effects Effects 0.000 claims description 45
- 230000004568 DNA-binding Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 27
- 108060001084 Luciferase Proteins 0.000 claims description 21
- 239000000126 substance Substances 0.000 claims description 16
- 230000002103 transcriptional effect Effects 0.000 claims description 15
- 108010001515 Galectin 4 Proteins 0.000 claims description 13
- 102100039556 Galectin-4 Human genes 0.000 claims description 13
- 102100024321 Alkaline phosphatase, placental type Human genes 0.000 claims description 10
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 claims description 10
- 108010060309 Glucuronidase Proteins 0.000 claims description 10
- 102000053187 Glucuronidase Human genes 0.000 claims description 10
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 10
- 102000005936 beta-Galactosidase Human genes 0.000 claims description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 10
- 108091006047 fluorescent proteins Proteins 0.000 claims description 10
- 102000034287 fluorescent proteins Human genes 0.000 claims description 10
- 210000004962 mammalian cell Anatomy 0.000 claims description 10
- 108010031345 placental alkaline phosphatase Proteins 0.000 claims description 10
- 108020004999 messenger RNA Proteins 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 9
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 8
- 108700025832 Serum Response Element Proteins 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 6
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 5
- 241000607479 Yersinia pestis Species 0.000 claims description 4
- 150000003384 small molecules Chemical group 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 abstract description 38
- 230000014509 gene expression Effects 0.000 abstract description 22
- 238000003556 assay Methods 0.000 abstract description 19
- 102000004169 proteins and genes Human genes 0.000 abstract description 11
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 38
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 38
- 239000013598 vector Substances 0.000 description 34
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 29
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 description 22
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 20
- 239000005089 Luciferase Substances 0.000 description 14
- 230000010354 integration Effects 0.000 description 14
- 238000001890 transfection Methods 0.000 description 14
- 108700008625 Reporter Genes Proteins 0.000 description 13
- 238000012163 sequencing technique Methods 0.000 description 13
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 12
- 239000002609 medium Substances 0.000 description 11
- 210000003734 kidney Anatomy 0.000 description 10
- 235000018102 proteins Nutrition 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 9
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 230000005754 cellular signaling Effects 0.000 description 8
- 108020003175 receptors Proteins 0.000 description 8
- 102000005962 receptors Human genes 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 206010029260 Neuroblastoma Diseases 0.000 description 5
- 208000029742 colonic neoplasm Diseases 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000012289 standard assay Methods 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000282552 Chlorocebus aethiops Species 0.000 description 4
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 4
- 108091006027 G proteins Proteins 0.000 description 4
- 102000030782 GTP binding Human genes 0.000 description 4
- 108091000058 GTP-Binding Proteins 0.000 description 4
- 101000951234 Homo sapiens Solute carrier family 49 member 4 Proteins 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 102100037945 Solute carrier family 49 member 4 Human genes 0.000 description 4
- 238000002869 basic local alignment search tool Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000001605 fetal effect Effects 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108091006107 transcriptional repressors Proteins 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 102100025169 Max-binding protein MNT Human genes 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 3
- 238000002123 RNA extraction Methods 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 201000010897 colon adenocarcinoma Diseases 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 210000002540 macrophage Anatomy 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 201000008968 osteosarcoma Diseases 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 102000034285 signal transducing proteins Human genes 0.000 description 3
- 108091006024 signal transducing proteins Proteins 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 2
- 102220476710 39S ribosomal protein L18, mitochondrial_K18A_mutation Human genes 0.000 description 2
- 108010052412 Apelin Proteins 0.000 description 2
- 206010003571 Astrocytoma Diseases 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 102220485710 Cell death activator CIDE-B_K23A_mutation Human genes 0.000 description 2
- 102000009410 Chemokine receptor Human genes 0.000 description 2
- 102220605470 Coilin_R15A_mutation Human genes 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- 101100533189 Danio rerio selenof gene Proteins 0.000 description 2
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 201000008808 Fibrosarcoma Diseases 0.000 description 2
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 108010067218 Guanine Nucleotide Exchange Factors Proteins 0.000 description 2
- 102000016285 Guanine Nucleotide Exchange Factors Human genes 0.000 description 2
- 108010012048 Kisspeptins Proteins 0.000 description 2
- 102000013599 Kisspeptins Human genes 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 102000028517 Neuropeptide receptor Human genes 0.000 description 2
- 108070000018 Neuropeptide receptor Proteins 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- YHIPILPTUVMWQT-UHFFFAOYSA-N Oplophorus luciferin Chemical compound C1=CC(O)=CC=C1CC(C(N1C=C(N2)C=3C=CC(O)=CC=3)=O)=NC1=C2CC1=CC=CC=C1 YHIPILPTUVMWQT-UHFFFAOYSA-N 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 102220595928 Protein RCC2_K23T_mutation Human genes 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 102220346271 c.69A>C Human genes 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- AIXAANGOTKPUOY-UHFFFAOYSA-N carbachol Chemical compound [Cl-].C[N+](C)(C)CCOC(N)=O AIXAANGOTKPUOY-UHFFFAOYSA-N 0.000 description 2
- 229960004484 carbachol Drugs 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 201000003908 endometrial adenocarcinoma Diseases 0.000 description 2
- 208000029382 endometrium adenocarcinoma Diseases 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 208000005017 glioblastoma Diseases 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- KAHDONZOCXSKII-NJVVDGNHSA-N kisspeptin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)O)C1=CN=CN1 KAHDONZOCXSKII-NJVVDGNHSA-N 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 102200074788 rs111033567 Human genes 0.000 description 2
- 102200062505 rs121909226 Human genes 0.000 description 2
- 102200057424 rs138789658 Human genes 0.000 description 2
- 102200006349 rs2066828 Human genes 0.000 description 2
- 102220258691 rs373410109 Human genes 0.000 description 2
- 102220219140 rs398123324 Human genes 0.000 description 2
- 102200111183 rs74315487 Human genes 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 210000003606 umbilical vein Anatomy 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- HWYCFZUSOBOBIN-AQJXLSMYSA-N (2s)-2-[[(2s)-1-[(2s)-5-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-n-[(2s)-1-[[(2s)-1-amino-1-oxo-3-phenylpropan-2-yl]amino]-5-(diaminome Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)C1=CC=CC=C1 HWYCFZUSOBOBIN-AQJXLSMYSA-N 0.000 description 1
- HBZBAMXERPYTFS-SECBINFHSA-N (4S)-2-(6,7-dihydro-5H-pyrrolo[3,2-f][1,3]benzothiazol-2-yl)-4,5-dihydro-1,3-thiazole-4-carboxylic acid Chemical compound OC(=O)[C@H]1CSC(=N1)c1nc2cc3CCNc3cc2s1 HBZBAMXERPYTFS-SECBINFHSA-N 0.000 description 1
- HGUFODBRKLSHSI-UHFFFAOYSA-N 2,3,7,8-tetrachloro-dibenzo-p-dioxin Chemical compound O1C2=CC(Cl)=C(Cl)C=C2OC2=C1C=C(Cl)C(Cl)=C2 HGUFODBRKLSHSI-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 description 1
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 description 1
- 108010004276 A18Famide Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 208000036832 Adenocarcinoma of ovary Diseases 0.000 description 1
- 102000009346 Adenosine receptors Human genes 0.000 description 1
- 108050000203 Adenosine receptors Proteins 0.000 description 1
- 108060003345 Adrenergic Receptor Proteins 0.000 description 1
- 102000017910 Adrenergic receptor Human genes 0.000 description 1
- 102000008873 Angiotensin II receptor Human genes 0.000 description 1
- 108050000824 Angiotensin II receptor Proteins 0.000 description 1
- 108700032225 Antioxidant Response Elements Proteins 0.000 description 1
- 102000018746 Apelin Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 108070000005 Bile acid receptors Proteins 0.000 description 1
- 102000017002 Bile acid receptors Human genes 0.000 description 1
- 108010073466 Bombesin Receptors Proteins 0.000 description 1
- 241000710780 Bovine viral diarrhea virus 1 Species 0.000 description 1
- 102000010183 Bradykinin receptor Human genes 0.000 description 1
- 108050001736 Bradykinin receptor Proteins 0.000 description 1
- 208000003170 Bronchiolo-Alveolar Adenocarcinoma Diseases 0.000 description 1
- 206010058354 Bronchioloalveolar carcinoma Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 108010001789 Calcitonin Receptors Proteins 0.000 description 1
- 102100038520 Calcitonin receptor Human genes 0.000 description 1
- 102000018208 Cannabinoid Receptor Human genes 0.000 description 1
- 108050007331 Cannabinoid receptor Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 102000034573 Channels Human genes 0.000 description 1
- 108050000299 Chemokine receptor Proteins 0.000 description 1
- 102000004859 Cholecystokinin Receptors Human genes 0.000 description 1
- 108090001085 Cholecystokinin Receptors Proteins 0.000 description 1
- 108010009685 Cholinergic Receptors Proteins 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 108010056643 Corticotropin-Releasing Hormone Receptors Proteins 0.000 description 1
- 102100038018 Corticotropin-releasing factor receptor 1 Human genes 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 108010043648 Discoidin Domain Receptors Proteins 0.000 description 1
- 102000002706 Discoidin Domain Receptors Human genes 0.000 description 1
- 101000922140 Drosophila melanogaster Peripheral plasma membrane protein CASK Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 206010014958 Eosinophilic leukaemia Diseases 0.000 description 1
- 108091008815 Eph receptors Proteins 0.000 description 1
- 208000031637 Erythroblastic Acute Leukemia Diseases 0.000 description 1
- 208000036566 Erythroleukaemia Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 108091008794 FGF receptors Proteins 0.000 description 1
- 108070000009 Free fatty acid receptors Proteins 0.000 description 1
- 102000005698 Frizzled receptors Human genes 0.000 description 1
- 108010045438 Frizzled receptors Proteins 0.000 description 1
- 102100033061 G-protein coupled receptor 55 Human genes 0.000 description 1
- -1 GABABReceptors Proteins 0.000 description 1
- 102000011392 Galanin receptor Human genes 0.000 description 1
- 108050001605 Galanin receptor Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010016122 Ghrelin Receptors Proteins 0.000 description 1
- 108091006101 Gi proteins Proteins 0.000 description 1
- 102000034354 Gi proteins Human genes 0.000 description 1
- 108010063919 Glucagon Receptors Proteins 0.000 description 1
- 102100040890 Glucagon receptor Human genes 0.000 description 1
- 102100033839 Glucose-dependent insulinotropic receptor Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102000017357 Glycoprotein hormone receptor Human genes 0.000 description 1
- 108050005395 Glycoprotein hormone receptor Proteins 0.000 description 1
- 108091006068 Gq proteins Proteins 0.000 description 1
- 102000052606 Gq-G11 GTP-Binding Protein alpha Subunits Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100039256 Growth hormone secretagogue receptor type 1 Human genes 0.000 description 1
- 108091006065 Gs proteins Proteins 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108091008603 HGF receptors Proteins 0.000 description 1
- 102000027430 HGF receptors Human genes 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000000543 Histamine Receptors Human genes 0.000 description 1
- 108010002059 Histamine Receptors Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000871151 Homo sapiens G-protein coupled receptor 55 Proteins 0.000 description 1
- 101000996752 Homo sapiens Glucose-dependent insulinotropic receptor Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 101000829761 Homo sapiens N-arachidonyl glycine receptor Proteins 0.000 description 1
- 101000986779 Homo sapiens Orexigenic neuropeptide QRFP Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 108091006343 Hydroxycarboxylic acid receptors Proteins 0.000 description 1
- 206010048643 Hypereosinophilic syndrome Diseases 0.000 description 1
- 102000003746 Insulin Receptor Human genes 0.000 description 1
- 108010001127 Insulin Receptor Proteins 0.000 description 1
- 102000001702 Intracellular Signaling Peptides and Proteins Human genes 0.000 description 1
- 108010068964 Intracellular Signaling Peptides and Proteins Proteins 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 102000008238 LHRH Receptors Human genes 0.000 description 1
- 108010021290 LHRH Receptors Proteins 0.000 description 1
- 108091008693 LMR receptors Proteins 0.000 description 1
- 108091008555 LTK receptors Proteins 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- MJURCEOLOMHLAX-ZRDIBKRKSA-N Latia Luciferin Natural products O=CO\C=C(/C)CCC1=C(C)CCCC1(C)C MJURCEOLOMHLAX-ZRDIBKRKSA-N 0.000 description 1
- MJURCEOLOMHLAX-UHFFFAOYSA-N Latia luciferin Chemical compound O=COC=C(C)CCC1=C(C)CCCC1(C)C MJURCEOLOMHLAX-UHFFFAOYSA-N 0.000 description 1
- 206010024305 Leukaemia monocytic Diseases 0.000 description 1
- 206010024380 Leukoderma Diseases 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000004378 Melanocortin Receptors Human genes 0.000 description 1
- 108090000950 Melanocortin Receptors Proteins 0.000 description 1
- 102000001419 Melatonin receptor Human genes 0.000 description 1
- 108050009605 Melatonin receptor Proteins 0.000 description 1
- 241000699673 Mesocricetus auratus Species 0.000 description 1
- 102000016193 Metabotropic glutamate receptors Human genes 0.000 description 1
- 108010010914 Metabotropic glutamate receptors Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000057413 Motilin receptors Human genes 0.000 description 1
- 108700040483 Motilin receptors Proteins 0.000 description 1
- 108091008553 MuSK receptors Proteins 0.000 description 1
- 101100043689 Mus musculus Stim1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 102100023414 N-arachidonyl glycine receptor Human genes 0.000 description 1
- 108091008604 NGF receptors Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000030937 Neuromedin U receptor Human genes 0.000 description 1
- 108010002741 Neuromedin U receptor Proteins 0.000 description 1
- 102400001090 Neuropeptide AF Human genes 0.000 description 1
- 102100038842 Neuropeptide B Human genes 0.000 description 1
- 102400001095 Neuropeptide FF Human genes 0.000 description 1
- 108050002826 Neuropeptide Y Receptor Proteins 0.000 description 1
- 102000012301 Neuropeptide Y receptor Human genes 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 206010061534 Oesophageal squamous cell carcinoma Diseases 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000010175 Opsin Human genes 0.000 description 1
- 108050001704 Opsin Proteins 0.000 description 1
- 102100028142 Orexigenic neuropeptide QRFP Human genes 0.000 description 1
- 108070000031 Orphan receptors Proteins 0.000 description 1
- 102000016978 Orphan receptors Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010061328 Ovarian epithelial cancer Diseases 0.000 description 1
- 206010073260 Ovarian granulosa cell tumour Diseases 0.000 description 1
- 102000004279 Oxytocin receptors Human genes 0.000 description 1
- 108090000876 Oxytocin receptors Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091008606 PDGF receptors Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 108010058828 Parathyroid Hormone Receptors Proteins 0.000 description 1
- 102000006461 Parathyroid Hormone Receptors Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 101100352419 Pithecopus hypochondrialis psn1 gene Proteins 0.000 description 1
- 108010064032 Pituitary Adenylate Cyclase-Activating Polypeptide Receptors Proteins 0.000 description 1
- 102000014743 Pituitary Adenylate Cyclase-Activating Polypeptide Receptors Human genes 0.000 description 1
- 102000011653 Platelet-Derived Growth Factor Receptors Human genes 0.000 description 1
- 108700023400 Platelet-activating factor receptors Proteins 0.000 description 1
- 108010002519 Prolactin Receptors Proteins 0.000 description 1
- 102100029000 Prolactin receptor Human genes 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 102000002298 Purinergic P2Y Receptors Human genes 0.000 description 1
- 108010000818 Purinergic P2Y Receptors Proteins 0.000 description 1
- 108091008551 RET receptors Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108091008554 ROR receptors Proteins 0.000 description 1
- 108091008556 ROS receptors Proteins 0.000 description 1
- 108091008552 RYK receptors Proteins 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 102100033914 Retinoic acid receptor responder protein 2 Human genes 0.000 description 1
- 101710170513 Retinoic acid receptor responder protein 2 Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 102220497176 Small vasohibin-binding protein_T47D_mutation Human genes 0.000 description 1
- 108050001286 Somatostatin Receptor Proteins 0.000 description 1
- 102000011096 Somatostatin receptor Human genes 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 102000011011 Sphingosine 1-phosphate receptors Human genes 0.000 description 1
- 108050001083 Sphingosine 1-phosphate receptors Proteins 0.000 description 1
- 208000036765 Squamous cell carcinoma of the esophagus Diseases 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 208000000389 T-cell leukemia Diseases 0.000 description 1
- 208000028530 T-cell lymphoblastic leukemia/lymphoma Diseases 0.000 description 1
- 102000005450 TIE receptors Human genes 0.000 description 1
- 108010006830 TIE receptors Proteins 0.000 description 1
- 102000007124 Tachykinin Receptors Human genes 0.000 description 1
- 108010072901 Tachykinin Receptors Proteins 0.000 description 1
- 102220500149 Target of EGR1 protein 1_Q9A_mutation Human genes 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 102000011829 Trace amine associated receptor Human genes 0.000 description 1
- 108050002178 Trace amine associated receptor Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 102100037236 Tyrosine-protein kinase receptor UFO Human genes 0.000 description 1
- 101150056450 UTS2R gene Proteins 0.000 description 1
- 108091008605 VEGF receptors Proteins 0.000 description 1
- 102000012088 Vasoactive Intestinal Peptide Receptors Human genes 0.000 description 1
- 108010075974 Vasoactive Intestinal Peptide Receptors Proteins 0.000 description 1
- 102000004136 Vasopressin Receptors Human genes 0.000 description 1
- 108700042354 Vitamin D Response Element Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000034337 acetylcholine receptors Human genes 0.000 description 1
- 208000021841 acute erythroid leukemia Diseases 0.000 description 1
- 201000003352 adrenal gland pheochromocytoma Diseases 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 230000001270 agonistic effect Effects 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- BWVPHIKGXQBZPV-QKFDDRBGSA-N apelin Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N1[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=2NC=NC=2)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=2NC=NC=2)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CCSC)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(O)=O)CCC1 BWVPHIKGXQBZPV-QKFDDRBGSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 description 1
- 208000030224 brain astrocytoma Diseases 0.000 description 1
- 210000000424 bronchial epithelial cell Anatomy 0.000 description 1
- PPBOKXIGFIBOGK-BDTUAEFFSA-N bvdv Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)C(C)C)[C@@H](C)CC)C1=CN=CN1 PPBOKXIGFIBOGK-BDTUAEFFSA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000021668 chronic eosinophilic leukemia Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- QUHVVVWAQMRCSJ-IXXPHHLHSA-N dinoflagellate luciferin Chemical compound N1C(CC2=C(C=3C(=O)CC(/C=3N2)=C/2[C@H]([C@H](C)[C@H](N\2)C(O)=O)CCC(O)=O)C)=C(CC)C(C)=C1CC1NC(=O)C(C)=C1C=C QUHVVVWAQMRCSJ-IXXPHHLHSA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 201000005619 esophageal carcinoma Diseases 0.000 description 1
- 208000007276 esophageal squamous cell carcinoma Diseases 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 210000000185 follicular epithelial cell Anatomy 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 108091005708 gustatory receptors Proteins 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 102000003835 leukotriene receptors Human genes 0.000 description 1
- 108090000146 leukotriene receptors Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 208000016992 lung adenocarcinoma in situ Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 201000009546 lung large cell carcinoma Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 201000006894 monocytic leukemia Diseases 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- ZRCUKBVXFDZBKP-XJEBPGRNSA-N neuropepetide s Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@H](C(=O)NCC(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O)[C@@H](C)O)C(C)C)NC(=O)[C@@H](N)CO)C1=CC=CC=C1 ZRCUKBVXFDZBKP-XJEBPGRNSA-N 0.000 description 1
- 108010085094 neuropeptide B Proteins 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 208000013371 ovarian adenocarcinoma Diseases 0.000 description 1
- 208000029749 ovarian granulosa cell tumor Diseases 0.000 description 1
- 201000006588 ovary adenocarcinoma Diseases 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 208000012110 pancreatic exocrine neoplasm Diseases 0.000 description 1
- 102000014187 peptide receptors Human genes 0.000 description 1
- 108010011903 peptide receptors Proteins 0.000 description 1
- 239000003614 peroxisome proliferator Substances 0.000 description 1
- 108010055752 phenylalanyl-leucyl-phenylalanyl-glutaminyl-prolyl-glutaminyl-arginyl-phenylalaninamide Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 102000030769 platelet activating factor receptor Human genes 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000017953 prostanoid receptors Human genes 0.000 description 1
- 108050007059 prostanoid receptors Proteins 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000028617 response to DNA damage stimulus Effects 0.000 description 1
- 201000006845 reticulosarcoma Diseases 0.000 description 1
- 208000029922 reticulum cell sarcoma Diseases 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 102200132946 rs16991652 Human genes 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000009450 sialylation Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 208000001608 teratocarcinoma Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000002676 xenobiotic agent Substances 0.000 description 1
- 230000002034 xenobiotic effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/005—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB
Abstract
本文描述的是用于在蛋白表达测定和报道测定中降低背景信号的转录中继系统。这些系统利用核酸系统,其中启动子序列控制激活报道分子转录的合成转录因子的表达。
Description
交叉引用
本申请要求于2019年5月28日提交的第62/853,637号美国临时申请的权益,该申请通过引用方式以全文并入于此。
发明内容
本文描述了用于探测细胞信号传导通路响应、筛选细胞信号传导通路的拮抗剂或激动剂或发现新的细胞信号传导通路的核酸、系统和方法。本领域中先前已知的方法是利用编码报道分子的核酸近端的内源性应答元件调控的启动子。由于细胞中内源性应答元件结合启动子的“泄露”性质,因此这些方法受到报道分子高强度背景信号的困扰。此外,这些方法还存在高变异系数的问题。最后,此类方法还受到报道子激活的低绝对值的影响,导致低信噪比。本公开的核酸和系统通过使用对合成转录因子结合位点具有高度选择性的非内源性合成转录因子,来降低生物变异水平,提高报道信号的信噪比,并减少背景信号。因此,该报道分子的转录不是由内源性转录因子启动的,这有助于降低背景信号并提高报道子的信噪比。这些核酸和系统可用于筛选信号传导通路的小分子或生物激动剂或拮抗剂,如G蛋白偶联受体、受体酪氨酸激酶、离子通道和核受体。在一个广泛的方面,该系统包含编码以下的核酸:a)位于合成转录因子阅读框5’端的近端的应答元件调控的启动子;和b)能够被该合成转录因子结合的启动子元件,所述启动子元件位于报道基因阅读框5’端的近端。在此系统中,报道基因可以包含独特分子标识符(UMI),以允许报道测定的多重化。
一方面,本文描述的是一种转录中继系统,其包括:转录因子核酸,该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧;和报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列,其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧,并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中,所述合成转录因子包含来自第一转录因子的DNA结合域和来自第二转录因子的转录激活域。在某些实施方案中,所述DNA结合域来自Gal4、PPR1、Lac9或LexA。在某些实施方案中,所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约90%同一性的氨基酸序列。在某些实施方案中,所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约95%同一性的氨基酸序列。在某些实施方案中,所述DNA结合域包含SEQ ID NO:1所示的氨基酸序列。在某些实施方案中,所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。在某些实施方案中,所述转录激活域包含VP64、p65和Rta。在某些实施方案中,所述转录激活域包含与SEQID NO:14所示的序列具有至少约90%同一性的氨基酸序列。在某些实施方案中,所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约95%同一性的氨基酸序列。在某些实施方案中,所述转录激活域包含SEQ ID NO:14所示的氨基酸序列。在某些实施方案中,所述转录激活域包含SEQ ID NO:14的氨基酸序列变体,其中所述序列变体增加或减少转录激活。在某些实施方案中,所述合成转录因子包含SEQ ID NO:10所示的氨基酸序列变体。在某些实施方案中,所述合成转录因子包含使所述合成转录因子去稳定化的多肽序列。在某些实施方案中,使所述合成转录因子去稳定化的所述多肽序列包含PEST或CL1多肽序列。在某些实施方案中,所述合成转录因子启动子核苷酸序列包含能够被Gal4、PPR1、Lac9或LexA结合的核苷酸序列。在某些实施方案中,报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或独特分子标识符。在某些实施方案中,所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶,和UMI。在某些实施方案中,所述独特分子标识符对于测试多肽是特有的,其中所述测试多肽由所述报道核酸编码。在某些实施方案中,所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列,所述核苷酸序列可以被转录阻遏子结合。在某些实施方案中,所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列,所述核苷酸序列延伸由编码合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中,其中由编码合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。在某些实施方案中,所述转录因子核酸和所述报道核酸是单一核酸的组分。在某些实施方案中,如本文所述的是包含所述中继系统的细胞。在某些实施方案中,所述细胞包括真核细胞。在某些实施方案中,所述细胞包括哺乳动物细胞。在某些实施方案中,转录因子核酸、报道核酸或转录因子核酸和报道核酸二者作为单一拷贝整合到细胞基因组中。在某些实施方案中,如本文所述的是包含所述中继系统的细胞群。在某些实施方案中,所述细胞群包括真核细胞群。在某些实施方案中,所述细胞群包括哺乳动物细胞群。在某些实施方案中,细胞或细胞群包含高基础报道活性。在某些实施方案中,细胞或细胞群包括其中高基础报道活性比背景高至少约30倍,其中背景是针对不包含该报道子的亲本细胞或细胞系所观察到的报道活性水平。在某些实施方案中,细胞或细胞群包含报道活性的低生物变异系数。在某些实施方案中,细胞或细胞群包括其中报道活性的低生物变异系数低于约0.5。
在某些实施方案中,如本文所述的是一种用于检测测试试剂对应答元件调控的启动子的活性的影响的方法,其包括使细胞或细胞群与所述测试物质接触。在某些实施方案中,所述测试试剂是化学品。
附图说明
图1A描绘了转录中继系统的示意图,其示出了转录因子核酸(左)和报道核酸(右)。
图1B描绘了编码报道子的核酸序列,其中所述报道子包含独特RNA序列。
图2示出了携带单一整合的CRE-萤光素酶的细胞(灰色)和携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞(黑色)的报道输出。
图3示出了图2中描绘的每个样品的变异系数,这是三次重复操作的结果。
图4示出了Gal4-VPR启动子核苷酸序列上的去稳定化序列标签(降解决定子(degron)标签)对转录中继系统的倍数诱导的影响。
图5示出了从NFAT中继等克隆(isoclonal)细胞系产生的细胞文库。用阳性对照化合物对细胞系进行筛选,以确定其检测Gq偶联GPCR的NFAT中继报道活性的能力。产生错误发现率(FDR)低于0.001或最大Q值高于3的信号的受体-化合物组合被视为显著命中(significant hit)。在本次筛选中,文库cb29和cb37产生了最多的显著命中。
图6示出了用于产生细胞文库的等克隆细胞系的变异与基础活性。
具体实施方式
一方面,本文描述的是一种转录中继系统,其包括:(a)转录因子核酸,该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧;和(b)报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列,其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧,并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。
另一方面,本文描述的是一种测定测试物质对应答元件调控的启动子的活性的影响的方法,其包括:(a)使细胞与测试物质接触,所述细胞包含(i)转录因子核酸,该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧;和(ii)报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列,其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧,并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合;和(b)进行至少一次测定,该测定测量所述报道子的转录。
在以下描述中,阐述了某些特定细节以提供对各种实施方案的透彻理解。然而,本领域技术人员将理解,可以在没有这些细节的情况下实践所提供的实施方案。除非上下文另有要求,否则在整个说明书和随后的权利要求书中,词语“包含”及其变体,诸如“包括”应被解释为开放、包容性的,即“包括但不限于”。除非上下文另有明确规定,否则如在本说明书和所附权利要求书中所用的,单数形式“一”、“一个”和“该”包括复数指代。还应注意,除非上下文另有明确规定,否则术语“或”通常采用其包括“和/或”的含义。此外,本文提供的标题仅为方便起见,并不解释要求保护的实施方案的范围或含义。
如本文所用的,术语“约”是指与所陈述的量相差10%以内的量。
术语“多肽”和“蛋白质”可互换使用以指氨基酸残基的聚合物并且不限最小长度。多肽(包括所提供的多肽链和其他肽,诸如接头和结合肽)可以包括氨基酸残基,包括天然和/或非天然氨基酸残基。该术语还包括多肽的表达后修饰,例如糖基化、唾液酸化、乙酰化、磷酸化等。在一些方面,只要蛋白质保持期望的活性,多肽可以含有对于原生或天然序列的修饰。这些修饰可以是有意的(如通过定点诱变),也可以是偶然的(诸如通过产生蛋白质的宿主的突变或由于PCR扩增而产生的错误)。
相对于参考多肽序列的序列同一性百分比(%)是在比对序列并引入空位(如果必要)以达到最大的序列同一性百分比之后,并且在不将任何保守性置换认定为序列同一性的一部分的情况下,候选序列中的氨基酸残基与参考多肽序列中的氨基酸残基相同的百分比。可以通过各种已知的方式实现用于确定氨基酸序列同一性百分比的目的的比对,例如使用公开可用的计算机软件,诸如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。可以确定用于比对序列的适当参数,包括在被比较序列的全长上实现最大比对所需的算法。然而,出于本文的目的,使用序列比较计算机程序ALIGN-2产生氨基酸序列同一性值%。ALIGN-2序列比较计算机程序由Genentech,Inc.编写,并且源代码已与用户文档一起提交至美国版权局(Washington D.C.,20559)以美国版权注册号TXU510087注册。ALIGN-2程序可从Genentech,Inc.(South San Francisco,Calif.)公开获得,或者可以从源代码编译。应当编译ALIGN-2程序以在UNIX操作系统(包括数字UNIX V4.0D)上使用。所有序列比较参数均由ALIGN-2程序设置并且不改变。
在采用ALIGN-2进行氨基酸序列比较的情况下,给定氨基酸序列A对/与/相对于给定氨基酸序列B的氨基酸序列同一性%(或者,也可以表述为给定氨基酸序列A与/对/相对于给定氨基酸序列B具有/包含一定的氨基酸序列同一性%)计算如下:100乘以分数X/Y,其中X是序列比对程序ALIGN-2在该程序的A和B比对中评分为相同匹配的氨基酸残基数目,并且其中Y是B中氨基酸残基的总数。应当理解,当氨基酸序列A的长度不等于氨基酸序列B的长度时,A对B的氨基酸序列同一性%将不等于B对A的氨基酸序列同一性%。除非另外特别说明,否则本文所用的所有氨基酸序列同一性%值均如前一段所述使用ALIGN-2计算机程序获得。
在本文中用于描述相对于参照序列的核酸序列时,术语“同一性”、“相同的”或“同一性百分比”,可以使用Karlin和Altschul描述的公式来确定(Proc.Natl.Acad.Sci.USA87:2264-2268,1990,Proc.Natl.Acad.Sci.USA 90:5873-5877,1993中有改进)。这样的公式被并入Altschul等人(J.Mol.Biol.215:403-410,1990)的基本局部比对搜索工具(BLAST)程序中。截止到本申请的申请日,序列的同一性百分比可以使用最新版本的BLAST来确定。
本文所述系统的多肽可由核酸编码。核酸是一种包含两个或更多个核苷酸碱基的多核苷酸。在某些实施方案中,核酸是可用于将编码多肽的多核苷酸转运到细胞中的载体的组分。如本文所用的,术语“载体”是指能够转运与其连接的另一核酸的核酸分子。一种类型的载体是基因组整合载体或“整合载体”,其可以整合到宿主细胞的染色体DNA中。另一种类型的载体是“附加型”载体,例如,能够进行染色体外复制的核酸。能够指导与其可操作地连接的基因的表达的载体在本文中称为“表达载体”。合适的载体包括质粒、细菌人工染色体、酵母人工染色体、病毒载体等。在表达载体中,用于控制转录的启动子、增强子、聚腺苷酸化信号等调控元件可以衍生自哺乳动物、微生物、病毒或昆虫的基因。附加地,可以并入在宿主中复制的能力(通常由复制起点赋予)以及促进转化体识别的选择基因。可以采用衍生自诸如慢病毒、逆转录病毒、腺病毒、腺相关病毒等病毒的载体。可将质粒载体线性化以用于整合到染色体位置。载体可以包含指导向基因组中的位点特异性整合限定的位置或受限位点组的序列(例如,AttP-AttB重组)。附加地,载体可以包含衍生自用于整合的转座元件的序列。
如本文所用的术语“转染”或“转染的”是指通过实验室常用的方法有意地将外源核酸引入细胞的方法。转染可以通过例如脂质转染、磷酸钙沉淀、病毒转导或电穿孔实现。转染可以是瞬时的或稳定的。
如本文所用的术语“转染效率”是指细胞群并入外源核酸的范围或程度。转染效率可以测量为与系统中细胞总数相比,给定群体中并入外源核酸的细胞百分比(%)。可以在瞬时和稳定转染的细胞中测量转染效率。
如本文所用的,术语“生物激活多肽”是指由调节基因表达的细胞表达的多肽。通过经由一个或多个中间分子或多肽对刺激作出响应的信号传导,或通过任何其他机制,生物激活多肽可以直接调节基因表达。生物激活多肽可以是跨膜多肽(如,受体或通道蛋白)、胞内多肽(如,信号转导中间体)、胞外多肽或分泌型多肽。
如本文所用的,“报道活性”是指报道子的实验性读数。例如,当与合适的底物一起温育时,萤光素酶报道子将具有发光读数。其他报道子如荧光蛋白可能不需要底物,而是可以通过例如显微镜或荧光读板仪进行测量。
系统概述
本文描述的系统、核酸和方法可用于筛选应答元件结合启动子的存在和/或激活水平。本文描述的核酸、系统和方法允许以比传统报道系统更低水平的背景信号激活转录。在某些实施方案中,应答元件结合启动子在细胞信号传导级联的末端被激活。在某些实施方案中,可以在外部刺激例如物理或化学刺激之前和之后测量应答元件结合启动子的存在,或者将应答元件结合启动子的存在与平行操作的对照条件进行比较。化学刺激可以是激动性或拮抗性小分子或生物分子。在某些实施方案中,该系统可用于药物发现目的的筛选。该系统至少包含核酸,该核酸包含应答元件调控的启动子、合成转录因子启动子、合成转录因子和报道子。应答元件调控的启动子位于合成转录因子的5’侧,并且当应答元件结合启动子存在时,激活合成转录因子的转录。翻译后,合成转录因子可以随后与合成转录因子启动子结合,该启动子位于编码报道子的核酸序列的5’侧。当结合时,合成转录因子启动子激活编码报道子的核酸序列的转录。在某些实施方案中,报道子是多肽。在某些实施方案中,报道子是UMI。该系统的其他任选特征包括位于应答元件调控的启动子核苷酸序列近端的核苷酸序列,该核苷酸序列可以被转录阻遏子结合。在某些实施方案中,位于应答元件调控的启动子核苷酸序列近端的该核苷酸序列延伸由编码合成转录因子的核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中,由编码合成转录因子的核苷酸序列编码的mRNA的5’非翻译区具有一个或多个减少合成转录因子翻译的序列。
图1A中示出了本发明的一个非限制性实施方案。左图显示的是转录因子核酸100。转录因子核酸100上存在应答元件调控的启动子核酸102,其位于编码合成转录因子104的核苷酸序列的5’位置。右图是报道核酸110,它包含位于编码报道子114的核苷酸序列的5’侧的合成转录因子启动子核苷酸序列112。在某些实施方案中,转录因子核酸和报道核酸存在于不同的核酸分子上,例如不同的质粒或病毒载体上。在某些实施方案中,转录因子核酸和报道核酸是线性的。在某些实施方案中,转录因子核酸和报道核酸存在于同一核酸上,该核酸可以是质粒、病毒载体、线性或任何其他构型。
图1B中示出了编码报道子的核苷酸序列的一个非限制性实施方案。编码报道子114的核苷酸序列包含编码报道多肽122的核酸序列以及编码UMI 124的核酸序列。序列124也被称为独特分子标识符(UMI)。UMI可以标识特定的生物激活多肽,该生物激活多肽导致102处的应答元件调控的启动子核酸的激活。作为非限制性示例,该生物激活多肽可以包含特定的G蛋白偶联受体,其中已知的有数百种。因此,UMI元件允许以多重化形式对多种不同生物激活多肽的信号传导进行简易和快捷的探测。此外,所提供的中继系统通过应答元件调控的启动子降低背景信号传导。在针对可激活生物激活多肽的化合物的任何多重化筛选中,这可以使定量更加准确,并减少假阳性测试化合物的数量。在某些实施方案中,编码报道多肽的核酸序列不存在。在某些实施方案中,编码UMI的核酸序列不存在。在某些实施方案中,编码UMI的核酸序列位于编码报道多肽的核酸序列的5’侧。在某些实施方案中,编码报道多肽的核酸序列位于编码UMI的核酸序列的5’侧。
在某些实施方案中,编码报道子的核酸编码报道多肽。在某些实施方案中,所述报道多肽能够被直接检测。在某些实施方案中,基于蛋白质对底物的酶活性,所述报道多肽产生可检测信号。在某些实施方案中,报道多肽的检测可以定量完成。在某些实施方案中,所述报道多肽包含萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或其组合。在某些实施方案中,其中所述报道多肽是萤光素酶蛋白,底物的非限制性示例包括萤火虫萤光素、肩棘螺萤光素(latia luciferin)、细菌萤光素、腔肠素、甲藻萤光素(dinoflagellate luciferin)、海萤荧光素(vargulin)和3-羟基牛奶树碱(3-hydroxy hispidin)。
在某些实施方案中,编码报道子的核酸编码UMI。所述UMI包含核酸特有的短核苷酸序列。所述UMI的长度可以是8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。所述UMI能够以允许确定所述UMI序列的任何合适的方式进行检测,例如通过下一代测序方法。检测所述UMI的方法可以是定量的,并且包括下一代测序方法。
在某些实施方案中,本文描述了部署用于药物发现的系统的方法,该系统包含编码转录因子核酸和报道核酸的核酸。在某些实施方案中,该方法包括在足以使核酸被细胞内化和表达(例如,转染)的条件下使核酸与细胞或细胞群接触;使细胞与物理或化学刺激接触;以及通过一个或多个测定确定报道元件的激活。在某些实施方案中,该方法包括接触包含编码转录因子核酸和报道核酸的核酸的细胞或细胞群;以及通过一个或多个测定确定报道元件的激活。
应答元件调控的启动子
应答元件是基因启动子区域内的短DNA序列,能够结合特定转录因子并调节基因转录。某些应答元件对某些启动子是特异性的。一些应答元件能够被内源性转录因子结合。同一应答元件的多个拷贝可以位于核苷酸序列的不同部分,对相同刺激作出响应而激活不同的基因。可以并入本文所述系统的应答元件的非限制性示例包括cAMP应答元件(CRE)、B识别元件、AhR-、二噁英或生物异源物质应答元件、HIF应答元件、激素应答元件、血清应答元件、视黄酸应答元件、过氧化物酶体增殖物激素应答元件、金属应答元件、DNA损伤应答元件、IFN刺激应答元件、ROR应答元件、糖皮质激素应答元件、钙应答元件CaRE1、抗氧化应答元件、p53应答元件、甲状腺激素应答元件、生长激素应答元件、固醇应答元件、多梳蛋白(polycomb)应答元件和维生素D应答元件。
应答元件调控的启动子核苷酸序列是含有一个或多个应答元件的核酸区域,这些应答元件有助于募集启动子和其他分子来调节基因的转录。细胞含有许多应答元件调控的核苷酸序列,这些序列利用内源性蛋白质来调节基因的转录。在内源性应答元件调控的启动子核苷酸序列直接调节报道子转录的情况下,由于内源性启动子的存在,因此存在高水平的背景信号。与使用内源性转录因子调节报道子转录的系统相比,使用非内源性的转录因子来调节报道子转录的系统(该非内源性是相对于含有所述系统的细胞)具有优势。这种系统的一个优势是所述报道子产生的背景少。
在某些实施方案中,本发明的转录中继系统包含转录因子核酸,其包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。所述应答元件调控的启动子核苷酸序列用于控制由所述合成转录因子核苷酸序列编码的合成转录因子的表达。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列、血清应答元件核苷酸序列或其组合。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含NFAT转录因子应答元件核苷酸序列。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含FOS启动子核苷酸序列。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包含血清应答元件核苷酸序列。在某些实施方案中,所述应答元件调控的启动子核苷酸序列包括cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列和/或血清应答元件核苷酸序列的任意组合。
在某些实施方案中,所述应答元件调控的启动子能够被转录因子结合。常见转录因子的非限制性示例包括LexA、Gal4、VP16(来自单纯疱疹病毒)、热休克因子(HSF)、NFAT、CREB或其组合。本文所述的系统与报道测定中通常或潜在可用的任何转录因子或其任何组合相容。
在某些实施方案中,所述应答元件调控的启动子被内源性转录因子结合。内源性转录因子是生物体、组织或细胞中天然存在的转录因子。内源性转录因子的存在将取决于其中存在所述转录中继的系统。在某些实施方案中,所述内源性转录因子以背景速率促进合成转录因子的转录。
在某些实施方案中,所述转录因子核酸包含位于所述应答元件调控的启动子核酸序列近端的核苷酸序列,所述核苷酸序列可以被转录阻遏子结合。转录阻遏子抑制远端核苷酸序列的转录。常见转录阻遏子的非限制性示例包括TetR、lac阻遏子、KRAB阻遏子及其组合。本文所述的系统与报道测定中通常或潜在可用的任何阻遏子或其组合相容。
在某些实施方案中,所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列,所述核苷酸序列延伸由编码合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中,由编码合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。在某些实施方案中,减少所述合成转录因子的翻译的所述一个或多个序列包含减少所述合成转录因子的翻译的二级结构。在某些实施方案中,减少所述合成转录因子的翻译的所述一个或多个序列包含影响RNA结合蛋白的结合的序列。在某些实施方案中,减少所述合成转录因子的翻译的所述一个或多个序列包含上游开放阅读框。
测定方法
可以使用多种方法有效地利用上述系统。该系统可用于在稳态下以及响应于物理或化学刺激下探测细胞信号传导通路的活性的方法。当报道元件包含与特定报道元件配对的UMI序列时,可将该系统部署在多重测定中。
在一个非限制性的说明性示例中,将多个细胞在多孔板的一个孔中温育。用包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列的报道子核酸转染多个细胞。细胞可以已经包含转录因子核酸,该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,或者可以用所述转录因子核酸转染细胞。然后,使转染的细胞与化学刺激接触。在允许报道基因表达的足够时间后,收获细胞裂解物并对所述报道基因的激活进行定量。在本示例中,存在增加的报道基因表明化学刺激导致结合所述应答元件调控的启动子的转录因子的活性增强。在某些实施方案中,在细胞信号传导级联反应后,与所述应答元件调控的启动子结合的所述转录因子的活性增强。
在其中所述报道基因包含在与底物相互作用时产生可检测信号的酶的实施方案中,可以利用本领域中已知的标准测定法来定量所述报道基因的激活。在其中所述报道基因包含荧光分子的实施方案中,所述报道基因的激活可以通过荧光显微术或荧光读板仪来测量,并且可能不需要细胞裂解。所述荧光分子可用于测量活细胞中的报道子激活。在其中所述报道基因包含UMI的实施方案中,对mRNA进行反转录,并通过下一代测序技术对UMI进行测序。
在某些实施方案中,测定以多孔格式诸如6、12、24、48、96或384孔格式进行。在某些实施方案中,向每个孔提供不同的测试化学品,或者测试化学品以一式两孔、三孔或四孔提供。测定还可以包括一个或多个阳性或阴性对照孔。
合成转录因子
合成转录因子是能够靶向和调节基因表达的人工蛋白质。一些合成转录因子是包含来自多个不同基因的域的嵌合蛋白。在某些实施方案中,合成转录因子包含来自一个基因的DNA结合域和来自另一个基因的转录调控域。
在本文所述的方法、核酸和系统中,转录激活多肽是在转录因子核酸上编码的。在某些实施方案中,所述转录激活多肽是合成转录因子。在某些实施方案中,所述合成转录因子是嵌合蛋白。在某些实施方案中,所述合成转录因子包含来自第一转录因子的DNA结合域。在某些实施方案中,所述合成转录因子包含来自第二转录因子的转录激活域。在某些实施方案中,所述第一转录因子不同于所述第二转录因子。
在某些实施方案中,与任何内源性转录因子相比,所述合成转录因子对于合成转录因子启动子核苷酸序列具有更高的特异性。在某些实施方案中,所述合成转录因子与不能被内源启动子结合的合成转录因子启动子核苷酸序列结合。在某些实施方案中,与使用内源性转录因子相比,所述合成转录因子导致报道子的背景产生更少。
在某些实施方案中,所述DNA结合域对于含有本发明的转录中继系统的细胞是非内源的。在某些实施方案中,来自第一转录因子的所述DNA结合域来自Gal 4、PPR1、LexA、Lac9或其组合。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MKLLSSIEQACDICRLKKLKCSKEKPKCAKCLKNNWECRYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS,SEQ ID NO:1。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MKKKNSKKSNRTDSKRGDSNGSKSRTACKRCRKKKCDSCKRCAKVCVSDATGKDVRSYVDRAVMMRVKYGVDTKRGNATSDDDKKYSSVSS,SEQ ID NO:2。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MKSRTACKRCRLKKIKCDQEFPSCKRCAKLEVPCYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS,SEQ ID NO:3。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MKSRTACKRCRLKKIKCDQEFPSCKRCAKLEVPCVSSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS,SEQ ID NO:4。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MNKKSSEVMHQACDACRKKKWKCSKTVPTCTNCLKYNLDCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV,SEQ ID NO:5。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MNKKSSEVMHQACVECRQQKSKCDAHERAPEPCTKCAKKNVPCIVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV,SEQ ID NO:6。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MNKKSSEVMHQACKRCRLKKIKCDQEFPSCKRCLKYNLDCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV,SEQ ID NO:7。在某些实施方案中,所述DNA结合域包含如下所示的氨基酸序列:
MNKKSSEVMHQACKRCRLKKIKCDQEFPSCKRCAKLEVPCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV,SEQ ID NO:8。
在某些实施方案中,所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是R15W、K23P、K23T、K23W、K23M、K23N、F68R、F68Q、L69P、L70P、Q9E、Q9A、Q9N、R15K、R15A、R15M、K18R、K18A、K18M、K23R、K23A、K23M或其组合。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是R15W。在某些实施方案中,SEQ IDNO:1的氨基酸序列变体是K23P。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K23T。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K23W。在某些实施方案中,SEQID NO:1的氨基酸序列变体是K23M。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K23N。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是F68R。在某些实施方案中,SEQID NO:1的氨基酸序列变体是F68Q。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是L69P。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是L70P。在某些实施方案中,SEQID NO:1的氨基酸序列变体是Q9E。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是Q9A。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是Q9N。在某些实施方案中,SEQ IDNO:1的氨基酸序列变体是R15K。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是R15A。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是R15M。在某些实施方案中,SEQID NO:1的氨基酸序列变体是K18R。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K18A。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K18M。在某些实施方案中,SEQID NO:1的氨基酸序列变体是K23R。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K23A。在某些实施方案中,SEQ ID NO:1的氨基酸序列变体是K23M。
在一些实施方案中,来自第二转录因子的所述转录激活域来自VP64、p65和Rta及其组合。在某些实施方案中,所述转录激活域包含如下所示的氨基酸序列:
RAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKVGSQYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISSGSGSGSRDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF,SEQ ID NO:14。
在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少90%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少95%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少97%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少98%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少99%同一性。在某些实施方案中,本文所述的核酸编码具有VPR氨基酸序列的转录因子,该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有100%同一性。
在某些实施方案中,合成转录因子上的转录激活域包含增加或减少转录激活的氨基酸序列变体。在某些实施方案中,包含增加或减少转录激活的氨基酸序列变体的所述转录激活域是SEQ ID NO:14的序列变体。
在某些实施方案中,由转录因子核酸的核酸序列编码的合成转录因子包含使所述合成转录因子去稳定化的多肽序列,也称为“降解决定子”。在某些实施方案中,使所述转录因子去稳定化的所述多肽序列包括PEST多肽序列。PEST多肽序列是含有多个氨基酸的多肽序列,其中所述多肽序列富含脯氨酸、谷氨酸、丝氨酸和/或苏氨酸。在某些实施方案中,使所述转录因子去稳定化的所述多肽序列包括CL1多肽序列。CL1多肽序列可充当降解信号,导致所产生的合成转录因子的半衰期缩短。在某些实施方案中,使所述合成转录因子去稳定化的所述多肽序列有助于降低报道子的背景信号。
在某些实施方案中,所述合成转录因子包括GAL4-VP16嵌合转录因子。在某些实施方案中,转录因子包括GAL4-VPR嵌合转录因子。Gal4-VPR嵌合转录因子的序列由以下所示的序列给出:
MKLLSSIEQACDICRLKKLKCSKEKPKCAKCLKNNWECRYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVSASGSGRAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKVGSQYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISSGSGSGSRDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF,SEQ ID NO:10。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少90%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少95%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少97%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少98%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少99%同一性的转录因子。在某些实施方案中,本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有100%同一性的转录因子。
在某些实施方案中,所述合成转录因子包含由SEQ ID NO:1中列出的氨基酸序列给出的Gal4 DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ IDNO:1所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少90%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少95%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少97%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少98%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少99%同一性的DNA结合域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有100%同一性的DNA结合域。
在某些实施方案中,所述合成转录因子包含来自VP64的转录激活域,由以下列出的氨基酸序列给出:
RAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKV,SEQ ID NO:11。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ IDNO:11所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少90%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少95%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少97%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQID NO:11所示的氨基酸序列具有至少98%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少99%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有100%同一性的转录激活域。
在某些实施方案中,所述合成转录因子包含来自p65的转录激活域,由以下列出的氨基酸序列给出:
QYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS,SEQ ID NO:12。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少90%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少95%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少97%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少98%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少99%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有100%同一性的转录激活域。
在某些实施方案中,所述合成转录因子包含来自Rta的转录激活域,由以下列出的氨基酸序列给出:
RDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF,SEQ ID NO:13。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少90%、95%、97%、98%、99%或100%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少90%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少95%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少97%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少98%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少99%同一性的转录激活域。在某些实施方案中,所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有100%同一性的转录激活域。
合成转录因子启动子核苷酸序列
合成转录因子启动子核苷酸序列是能够被合成转录因子结合的核酸序列。在某些实施方案中,所述合成转录因子核苷酸序列不被内源性转录因子结合。所述合成转录因子启动子核苷酸序列有助于募集所述合成转录因子,以便激活报道分子的转录。所述报道分子在位于所述合成转录因子启动子核苷酸序列3’侧的核酸上编码。
在本文描述的方法、核酸和系统中,合成转录因子启动子核苷酸序列是在报道核酸上编码的。所述合成转录因子启动子核苷酸序列能够被在转录因子核酸上编码的合成转录因子结合。所述合成转录因子启动子核苷酸序列位于编码报道子的核苷酸序列的5’侧。在某些实施方案中,所述合成转录因子启动子核苷酸序列不被内源性转录因子结合。在某些实施方案中,所述合成转录因子对所述合成转录因子启动子核苷酸序列具有高度特异性。
在某些实施方案中,所述合成转录因子启动子核苷酸序列能够被Gal4、PPR1、Lac9或LexA结合。在某些实施方案中,所述合成转录因子能够被包含SEQ ID NO:1所示氨基酸序列的多肽结合。
在某些实施方案中,所述合成转录因子启动子核苷酸序列能够被Gal4、PPR1、Lac9或LexA的氨基酸序列变体结合。在某些实施方案中,所述合成转录因子启动子核苷酸序列能够被SEQ ID NO:1的氨基酸序列变体结合。
报道元件
报道核酸至少包含能够被合成转录因子结合的调控元件和编码报道子的核苷酸序列。编码报道子的所述核苷酸序列位于能够被所述合成转录因子结合的所述调控元件的下游。所述合成转录因子调节所述报道子的表达。
在某些实施方案中,编码报道子的核苷酸序列包含报道基因。在某些实施方案中,所述报道基因编码报道子,该报道子选自荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶和分泌型胎盘碱性磷酸酶。可以测定这些报道蛋白的特定酶活性,或者在荧光报道子的情况下,可以测定荧光发射。在某些实施方案中,荧光蛋白包括绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白(YFP)或青色荧光蛋白(CFP)。
在某些实施方案中,编码报道基因的核苷酸序列包含编码独特序列标识符(UMI)的核苷酸序列。在某些实施方案中,所述UMI对于测试多肽是特有的,其中所述测试多肽由所述报道核酸编码。一般来说,所述UMI的长度介于8和20个核苷酸之间,但也可能更长。在某些实施方案中,所述UMI的长度为8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在某些实施方案中,所述UMI的长度为8个核苷酸。在某些实施方案中,所述UMI的长度为9个核苷酸。在某些实施方案中,所述UMI的长度为10个核苷酸。在某些实施方案中,所述UMI的长度为11个核苷酸。在某些实施方案中,所述UMI的长度为12个核苷酸。在某些实施方案中,所述UMI的长度为13个核苷酸。在某些实施方案中,所述UMI的长度为14个核苷酸。在某些实施方案中,所述UMI的长度为15个核苷酸。在某些实施方案中,所述UMI的长度为16个核苷酸。在某些实施方案中,所述UMI的长度为17个核苷酸。在某些实施方案中,所述UMI的长度为18个核苷酸。在某些实施方案中,所述UMI的长度为19个核苷酸。在某些实施方案中,所述UMI的长度为20个核苷酸。在某些实施方案中,所述UMI的长度为超过20个核苷酸。
本文描述的系统可以利用许多不同的调控序列,这些序列通过合成转录因子结合而控制报道基因的激活。调控序列是可被合成转录因子多肽结合的序列。通常,将配置使得调控序列在UMI、报道基因或两者的5’侧。在某些实施方案中,调控序列包含Gal4、PPR1-或LexA-UAS,其能够被合成转录因子结合。
在某些实施方案中,报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶,和UMI。在某些实施方案中,所述UMI在荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶的5’侧的报道核酸上编码。在某些实施方案中,编码荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶的核苷酸序列位于所述UMI的5’侧。
UMI允许在同一测定中对不同的转录中继系统进行多重化,因为UMI的转录将表明特定的中继系统与报道子的关联。UMI可以是允许充分多样性的任何长度,以允许在同一测定中对不同转录中继系统进行多重化测定。所述长度应当足以区分至少100、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000个转录中继靶标。在某些实施方案中,所述不同转录中继系统会存在于不同的细胞中。在某些实施方案中,所述不同转录中继系统会存在于同一细胞中。
报道元件还可以包含5’UTR、3’UTR或二者。UTR可能与报道元件异源。
报道子激活
使用标准测定法检测萤光素酶蛋白、β-半乳糖苷酶蛋白、β-葡糖醛酸糖苷酶蛋白、氯霉素乙酰转移酶蛋白、分泌型胎盘碱性磷酸酶蛋白,可以确定报道分子的激活。通常,这些是酶测定,其中基于蛋白质对底物的酶活性产生可检测信号。例如,萤光素酶表达可以在萤光素酶底物的存在下通过光度计测量。荧光报道子不需要底物,并且可以通过荧光显微术或荧光读板仪测量信号。荧光报道子尤其可用于测量活细胞中的报道子激活。
在其中报道分子包含独特RNA序列的实施方案中,报道子的激活可以用任何合适的方式来测量,只要该方式允许对独特RNA序列进行序列测定,优选允许以多重化方式进行序列测定的方法。此类方法包括高通量测序方法,其可以在24小时内产生至少约100,000、1,000,000、10,000,000或100,000,000个DNA或RNA碱基上的信息。在某些实施方案中,使用下一代测序技术来确定独特RNA序列的序列。下一代测序包括许多种测序,诸如焦磷酸测序、合成测序、单分子测序、第二代测序、纳米孔测序、连接测序或杂交测序。下一代测序平台包括可从Illumina(RNA-Seq)和Helicos(数字基因表达或“DGE”)商购获得的平台。下一代测序方法包括但不限于由以下公司商业化的方法:1)454/Roche Lifesciences,包括但不限于在Margulies等人,Nature(2005)437:376-380(2005);以及美国专利号7,244,559;7,335,762;7,211,390;7,244,567;7,264,929;7,323,305中描述的方法和装置;2)HelicosBiosciences Corporation(Cambridge,MA),如在美国申请序列号11/167046和美国专利号7501245;7491498;7,276,720;以及在美国专利申请公开号US20090061439;US20080087826;US20060286566;US2006002471 1;US20060024678;US20080213770;和US20080103058中描述的;3)Applied Biosystems(例如,SOLiD测序);4)Dover Systems(例如,Polonator G.007测序);5)Illumina,Inc.,如在美国专利号5,750,341;6,306,597;和5,969,119中描述的;以及6)Pacific Biosciences,如在美国专利号7,462,452;7,476,504;7,405,281;7,170,050;7,462,468;7,476,503;7,315,019;7,302,146;7,313,308;和美国申请公开号US20090029385;US20090068655;US20090024331;和US20080206764中描述的。这样的方法和装置在此通过示例的方式提供并且不旨在进行限制。
标志物
在某些实施方案中,本文所述的核酸还包含编码选择多肽或标记多肽的一个或多个附加基因。在某些实施方案中,本文所述的核酸还包含编码赋予转染细胞以抗生素抗性的多肽的一个或多个附加基因。例如,核酸可以包含选择性标志物,诸如赋予新霉素/G418抗性、嘌呤霉素抗性、博来霉素抗性或杀稻瘟素抗性的抗生素抗性基因。在某些实施方案中,本文所述的核酸还包含编码多肽的一个或多个附加基因,该多肽包括在细胞表面上表达的表位标签。这使得能够进行亲和纯化或细胞分选以收集已用所述核酸转染的细胞。在某些实施方案中,表位标签包括c-Myc标签、血凝素(HA)标签、组氨酸标签、V5标签或FLAG标签。在某些实施方案中,本文所述的核酸还包含编码荧光多肽的一个或多个附加的无启动子基因。当转染旨在引起整合并靶向特定位置或着陆区(landing pad)时,这样的基因是有用的。在这些情况下,细胞基因组中的“着陆区”包含启动子,该启动子可以补充无启动子基因中启动子的缺失,并且只有在被整合到预期的基因组位置时才导致无启动子基因的表达。可以通过流式细胞术和细胞分选来选择具有正确整合的细胞。这种类型的标志物还可以确保预期核酸的仅单个拷贝被整合到基因组中,并有助于避免异位过表达。在某些实施方案中,编码诱饵多肽的核酸包含:编码赋予转染细胞以抗生素抗性的多肽的基因;编码包括在细胞表面上表达的表位标签的多肽的基因;或编码荧光多肽的无启动子基因。
细胞
可用于本文所述的方法的细胞通常是能够容易地用编码合成转录因子和报道元件的外源核酸使其变得转基因的细胞。可以使用本领域已知的方法将编码合成转录因子和报道元件的系统核酸转染或转导到合适的细胞系中,诸如磷酸钙转染、脂质体介导转染(例如,或HD)、电穿孔或病毒转导。细胞也可以是在合适的组织培养容器中生长至汇合或接近汇合的相同类型的细胞群。
在某些实施方案中,所用细胞包含编码合成转录因子的核酸、包含报道元件的核酸或两者的稳定整合。可以使用线性化质粒的随机整合、病毒或转座子定向整合或定向整合(例如使用AttP和AttB位点之间的位点特异性重组)来制备稳定的细胞系。在某些实施方案中,这两种核酸中的任一种在安全着陆位点(safe landing site)例如AAVS1位点处编码。
在某些实施方案中,在系统中使用的细胞或细胞群是真核细胞。在某些实施方案中,细胞或细胞群是哺乳动物细胞。在某些实施方案中,细胞或细胞群是人类细胞。在某些实施方案中,细胞或细胞群是SH-SY5Y,人神经母细胞瘤;Hep G2,白种人肝细胞癌;293(也称为HEK 293),人胚肾;RAW 264.7,小鼠单核巨噬细胞;HeLa,人宫颈上皮样癌;MRC-5(PD19),人胎肺;A2780,人卵巢癌;CACO-2,白种人结肠腺癌;THP 1,人单核细胞白血病;A549,白种人肺癌;MRC-5(PD 30),人胎肺;MCF7,白种人乳腺癌;SNL 76/7,小鼠SIM品系胚胎成纤维细胞;C2C12,小鼠C3H肌肉成肌细胞;Jurkat E6.1,人白血病T细胞淋巴母细胞;U937,白种人组织细胞淋巴瘤;L929,小鼠C3H/An结缔组织;3T3 L1,小鼠胚胎;HL60,白种人早幼粒细胞白血病;PC-12,大鼠肾上腺嗜铬细胞瘤;HT29,白种人结肠腺癌;OE33,白种人食管癌;OE19,白种人食管癌;NIH 3T3,Swiss鼠NIH胚胎;MDA-MB-231,白种人乳腺癌;K562,白种人慢性粒细胞白血病;U-87MG,人胶质母细胞瘤星形细胞瘤;MRC-5(PD 25),人胎肺;A2780cis,人卵巢癌;B9,小鼠B细胞杂交瘤;CHO-K1,中国仓鼠卵巢;MDCK,可卡犬肾;1321N1,人脑星形细胞瘤;A431,人鳞癌;ATDC5,小鼠129畸胎癌AT805衍生;RCC4 PLUSVECTOR ALONE,用赋予新霉素抗性的空表达载体pcDNA3稳定转染的肾细胞癌细胞系RCC4;HUVEC(S200-05n),人预筛选的脐静脉内皮细胞(HUVEC);新生儿;Vero,非洲绿猴肾;RCC4PLUS VHL,用pcDNA3-VHL稳定转染的肾细胞癌细胞系RCC4;Fao,大鼠肝癌;J774A.1,小鼠BALB/c单核巨噬细胞;MC3T3-E1,小鼠C57BL/6颅盖;J774.2,小鼠BALB/c单核巨噬细胞;PNT1A,人正常青春期后前列腺,用SV40永生化;U-2OS,人骨肉瘤;HCT 116,人结肠癌;MA104,非洲绿猴肾;BEAS-2B,人正常支气管上皮细胞;NB2-11,大鼠淋巴瘤;BHK 21(克隆13),叙利亚仓鼠肾;NS0,小鼠骨髓瘤;Neuro 2a,小鼠白化神经母细胞瘤;SP2/0-Ag14,小鼠x小鼠骨髓瘤,非生产性;T47D,人乳腺肿瘤;1301,人T细胞白血病;MDCK-II,可卡犬肾;PNT2,人正常前列腺,用SV40永生化;PC-3,白种人前列腺癌;TF1,人红白血病;COS-7,非洲绿猴肾,SV40转化;MDCK,可卡犬肾;HUVEC(200-05n),人脐静脉内皮细胞(HUVEC);新生儿;NCI-H322,白种人细支气管肺泡癌;SK.N.SH,白种人神经母细胞瘤;LNCaP.FGC,白种人前列腺癌;OE21,白种人食管鳞状细胞癌;PSN1,人胰腺癌;ISHIKAWA,亚洲人子宫内膜腺癌;MFE-280,白种人子宫内膜腺癌;MG-63,人骨肉瘤;RK 13,兔肾,BVDV阴性;EoL-1细胞,人嗜酸性粒细胞白血病;VCaP,人前列腺癌转移;tsA201,人胚肾,SV40转化;CHO,中国仓鼠卵巢;HT1080,人纤维肉瘤;PANC-1,白种人胰腺;Saos-2,人原发性成骨性肉瘤;成纤维细胞生长培养基(116K-500),成纤维细胞生长培养基试剂盒;ND7/23,小鼠神经母细胞瘤x大鼠神经元杂合体;SK-OV-3,白种人卵巢腺癌;COV434,人卵巢颗粒细胞瘤;Hep 3B,人肝细胞癌;Vero(WHO),非洲绿猴肾;Nthy-ori 3-1,人甲状腺滤泡上皮细胞;U373 MG(Uppsala),人胶质母细胞瘤星形细胞瘤;A375,人恶性黑色素瘤;AGS,白种人胃腺癌;CAKI 2,白种人肾癌;COLO205,白种人结肠腺癌;COR-L23,白种人肺大细胞癌;IMR 32,白种人神经母细胞瘤;QT 35,日本鹌鹑纤维肉瘤;WI 38,白种人胎肺;HMVII,人阴道恶性黑色素瘤;HT55,人结肠癌;TK6,人淋巴母细胞,胸苷激酶杂合子;SP2/0-AG14(AC-FREE),小鼠x小鼠杂交瘤不分泌、无血清、无动物成分(AC);AR42J,或大鼠胰腺外分泌肿瘤,或其任何组合。
本文描述的是包含转录因子核酸的细胞和细胞系,该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。在某些实施方案中,细胞系是哺乳动物细胞系。在某些实施方案中,应答元件调控的启动子是cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中,应答元件调控的启动子是NFAT应答元件调控的启动子。在某些实施方案中,细胞系包含报道核酸,所述报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列,其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧,并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。
在某些实施方案中,细胞系包含高基础报道活性。在某些实施方案中,高基础报道活性比背景高至少约5%、10%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%,其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。对于此类比较,通常用作参比物的细胞或细胞系会是包含报道子的细胞系的亲本(例如,包含报道子的HEK293对比不含报道子的HEK293)。
在某些实施方案中,细胞系包含高基础报道活性。在某些实施方案中,高基础报道活性比背景高至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、32倍、50倍、75倍、100倍、200倍、500倍、750倍、1,000倍、2,000倍、5,000倍、10,000倍或20,000倍,其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。在某些实施方案中,细胞系包含高基础报道活性。在某些实施方案中,高基础报道活性比背景高至少约30倍,其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。在某些实施方案中,高基础报道活性比背景高至少约32倍,其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。对于此类比较,通常用作参比物的细胞或细胞系会是包含报道子的细胞系的亲本(例如,包含报道子的HEK293对比不含报道子的HEK293)。
在某些实施方案中,细胞系包含基础报道活性的低变异性。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.6。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.5。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.4。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.3。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.2。在某些实施方案中,基础报道活性的低变异性是指生物变异系数小于约0.1。
在不受理论束缚的情况下,通过选择包括至少2、3、4、5或更多个包含转录因子核酸的拷贝的克隆细胞系,可以获得变异性的降低和高水平的基础活性,所述转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。在某些实施方案中,应答元件调控的启动子是cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中,应答元件调控的启动子是NFAT应答元件调控的启动子。在某些实施方案中,细胞系仅包含1个拷贝的报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列。在某些实施方案中,细胞系仅包含2个拷贝的报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列。在某些实施方案中,细胞系包含报道核酸,该报道核酸包含合成转录因子启动子核苷酸序列和编码保持未整合或附加体状态的报道子的核苷酸序列。在某些实施方案中,细胞系还包含编码细胞信号传导蛋白的cDNA或其他无内含子形式的核酸。在某些实施方案中,细胞信号传导蛋白是GPCR或GPCR亚基。
在某些实施方案中,细胞包含编码G蛋白偶联受体家族成员的核酸。G蛋白偶联受体(GPCR),也称为七(穿)跨膜域受体,是配体结合细胞表面信号传导蛋白。当配体与GPCR结合时,它会导致GPCR的构象变化,从而使其充当鸟嘌呤核苷酸交换因子(GEF)。然后GPCR可以通过将与G蛋白结合的GDP交换为GTP来激活相关的G蛋白。然后,与结合的GTP一起,G蛋白的α亚基可以与β和γ亚基解离,以进一步影响直接依赖于α亚基类型的细胞内信号传导蛋白或靶向功能蛋白(Gαs、Gαi/o、Gαq/11、Gα12/13)。人类基因组中编码有至少约800种GPCR,大致分为A、B和C类,它们都可与本文中的系统一起使用。在某些实施方案中,可以将编码G蛋白偶联受体家族成员的核酸整合到基因组中。在某些实施方案中,可以将编码G蛋白偶联受体家族成员的核酸保持附加体状态。
在某些实施方案中,细胞包含编码受体酪氨酸激酶家族成员的核酸。受体酪氨酸激酶(RTK)是对于许多多肽生长因子、细胞因子和激素具有高亲和力的细胞表面受体。受体酪氨酸激酶已被证明不仅是正常细胞过程的关键调控物,而且在许多类型癌症的发展和进展中也具有关键作用。存在许多种类的RTK,其中任何成员都可以在本文所述系统中使用。在某些实施方案中,RTK包含I类RTK(EGF受体家族)(ErbB家族);II类RTK(胰岛素受体家族);III类RTK(PDGF受体家族);IV类RTK(VEGF受体家族);V类RTK(FGF受体家族);VI类RTK(CCK受体家族);VII类RTK(NGF受体家族);VIII类RTK(HGF受体家族);IX类RTK(Eph受体家族);X类RTK(AXL受体家族);XI类RTK(TIE受体家族);XII类RTK(RYK受体家族);XIII类RTK(DDR受体家族);XIV类RTK(RET受体家族);XV类RTK(ROS受体家族);XVI类RTK(LTK受体家族);XVII类RTK(ROR受体家族);XVIII类RTK(MuSK受体家族);XIX类RTK(LMR受体);或XX类RTK(未确定)的成员。在某些实施方案中,可以将编码RTK家族成员的核酸整合到基因组中。在某些实施方案中,可以将编码RTK家族成员的核酸保持附加体状态。
本文还描述了包含NFAT应答元件的哺乳动物细胞系。在某些实施方案中,包含NFAT应答元件的哺乳动物细胞系包括cb29。
本文还描述了包含NFAT应答元件的哺乳动物细胞系。在某些实施方案中,包含NFAT应答元件的哺乳动物细胞系包括cb37。
使用系统的方法
本发明的多核苷酸序列可以在转染到细胞中时使用。转染可以通过多种转染剂来完成,包括但不限于脂转染、磷酸钙沉淀、病毒转导或电穿孔。转染可以是瞬时的或稳定的。在转染稳定的实施方案中,可以将稳定转染的细胞冷冻或储存起来供以后使用。
在某些实施方案中,将单一核酸中继系统转染到细胞群中。在某些实施方案中,将1、2、3、4、5、10、100或更多种核酸中继系统转染到细胞群中。在某些实施方案中,将2种核酸中继系统转染到细胞群中。在某些实施方案中,将3种核酸中继系统转染到细胞群中。在某些实施方案中,将4种核酸中继系统转染到细胞群中。在某些实施方案中,将5种核酸中继系统转染到细胞群中。在用多种核酸中继系统转染细胞群的某些实施方案中,所述多种核酸中继系统包含不同的应答元件调控的启动子。在其中所述多种核酸中继系统包含不同的应答元件调控的启动子的某些实施方案中,所述多种核酸中继系统包含不同的报道子。在某些实施方案中,所述不同的报道子包含UMI。
用本发明的核酸转染的细胞群可以是任何容量。在某些实施方案中,细胞群包含1,000、10,000、100,000、1,000,000、10,000,000或更多个细胞。在某些实施方案中,用一种或多种转录中继系统转染至少约1,000或更多个细胞。在某些实施方案中,用一种或多种转录中继系统转染至少约10,000或更多个细胞。在某些实施方案中,用一种或多种转录中继系统转染至少约100,000或更多个细胞。在某些实施方案中,用一种或多种转录中继系统转染至少约1,000,000或更多个细胞。在某些实施方案中,用一种或多种转录中继系统转染至少约10,000,000或更多个细胞。
在某些实施方案中,可以将本发明的核酸系统用于多孔板实验中。与本发明的核酸中继系统相容的多孔板的非限制性示例包括6、12、24、48、96、384或1,536孔板。在某些实施方案中,多孔板的每个孔包含用单一转录中继系统转染的细胞群。在某些实施方案中,多孔板的每个孔包含用多种转录中继系统转染的细胞群。在某些实施方案中,每个孔包含多个细胞群,每个细胞群用单一核酸中继系统转染。在某些实施方案中,每个孔包含多个细胞群,每个细胞群用多种核酸中继系统转染。
在某些实施方案中,将测试试剂应用于用本发明的转录中继系统转染的细胞。在某些实施方案中,在使所述测试试剂与所述细胞接触之后,测量报道分子转录的激活水平。在某些实施方案中,所述测试试剂是化学品、小分子、生物分子、多肽、多核苷酸、适配体或其任意组合。在某些实施方案中,将单一测试试剂应用于细胞群。在某些实施方案中,将多种测试试剂应用于细胞群。
在某些实施方案中,本发明的转录中继系统适用于测量GPCR对测试试剂的响应。本发明的核酸系统可适用于与任何GPCR受体一起使用。在某些实施方案中,通过利用cAMP应答元件调控的启动子,所述转录中继系统适用于与GPCR受体一起使用。GPCR的非限制性示例包括5-羟色胺受体、乙酰胆碱受体、腺苷受体、肾上腺素受体、血管紧张素受体、爱帕琳肽(apelin)受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素(chemerin)受体、趋化因子受体、胆囊收缩素受体、多巴胺受体、内皮素受体、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、胃饥饿素受体、糖蛋白激素受体、促性腺激素释放激素受体、GPR18、GPR55、GPR119、G蛋白偶联的雌激素受体、组胺受体、羟基羧酸受体、吻素(kisspeptin)受体、白三烯受体、LPA受体、S1P受体、黑色素聚集激素受体、黑皮质素受体、褪黑素受体、胃动素受体、神经介肽U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片样物质受体、视蛋白受体、食欲肽受体、酮戊二酸受体、P2Y受体、血小板活化因子受体、前动力蛋白受体、催乳素释放肽受体、前列腺素类激素受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、痕量胺受体、硬骨鱼紧张肽受体、血管升压素和催产素受体、降钙素受体、促肾上腺皮质激素释放因子受体、胰高血糖素受体家族、甲状旁腺激素受体、VIP和PACAP受体、钙敏感受体、GABAB受体、代谢型谷氨酸受体、味觉受体第一家族、卷曲类受体、粘附类GPCR、孤儿受体,以及它们的任意组合。
本发明的核酸与本领域中常见的许多载体相容。载体的非限制性示例包括基因组整合载体、附加型载体、质粒、病毒载体、粘粒、细菌人工染色体和酵母人工染色体。与本发明的核酸相容的病毒载体的非限制性示例包括来源于慢病毒、逆转录病毒、腺病毒和腺相关病毒的载体。在某些实施方案中,本发明的核酸存在于载体上,该载体包含引导位点特异性整合到基因组中的固定位置或一组限定位点的序列(例如AttP-AttB重组)。
在某些实施方案中,将本文所述的转录中继系统并入单一载体中。在某些实施方案中,将所述单一载体瞬时转染到细胞中。在某些实施方案中,将所述单一载体稳定转染到细胞中。
在某些实施方案中,将所述转录中继系统划分入两个载体。在某些实施方案中,将包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列的转录因子核酸并入第一载体,并将包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列的报道核酸并入第二载体。在某些实施方案中,将所述第一载体和所述第二载体瞬时转染到细胞中。在某些实施方案中,将所述第一载体和所述第二载体稳定转染到细胞中。在某些实施方案中,将所述第一载体稳定转染到细胞中,并将所述第二载体瞬时转染到细胞中。在某些实施方案中,将所述第一载体瞬时转染到细胞中,并将所述第二载体稳定转染到细胞中。
可以使用许多众所周知的分子生物学技术来构建包含本文所述的转录中继系统或其部分的载体。许多此类程序的详细方案(包括扩增、克隆、诱变、转化等)描述于例如Ausubel等人,Current Protocols in Molecular Biology(supplemented through 2012)John Wiley&Sons,New York 10(“Ausubel”);Sambrook等人,Molecular Cloning–ALaboratory Manual(4th Ed.),Vol.1-3,Cold Spring Harbor Laboratory,Cold SpringHarbor,New York,2012(“Sambrook”);和Abelson等人,Guide to Molecular CloningTechniques(Methods in Enzymology)volume 152Academic Press,Inc.,San Diego,CA(“Abelson”)中。
实施例
以下说明性实施例代表本文所述的组合物和方法的实施方案并且不意味着以任何方式进行限制。
实施例1-针对CRE激活的示例GPCR受体筛选
在本实施例中,如图1A和1B所配置,包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例,图1A的核酸包括cAMP应答元件(CRE)激活,其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子,这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞包含编码图1A和1B的系统的稳定整合核酸,以及给定的GPCR。每个UMI都与给定的GPCR相关联,从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。
在第1天,在DMEM中以35,000个细胞/孔将细胞铺在96孔测定板内。在第2天,将培养基换成0.5%FBS+DMEM。在第3天,移除培养基,并以所需浓度加入在25uL Opti-mem中的测试化合物。约4小时后,移除培养基并替换为裂解缓冲液用于进行RNA提取。使用标准方法或试剂盒提取RNA,并随后通过标准测定法进行定量。测序文库制备后,在Illumina MiSeq上进行RNAseq。
实施例2-针对NFAT激活的示例GPCR受体筛选
在本实施例中,如图1A和1B所配置,包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例,图1A的核酸包括活化T细胞核因子应答元件(NFAT)激活,其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子,这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞包含编码图1A和1B的系统的稳定整合核酸,以及给定的GPCR。每个UMI都与给定的GPCR相关联,从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。
在第1天,在DMEM中以35,000个细胞/孔将细胞铺在96孔测定板内。在第2天,将培养基换成0.5%FBS+DMEM。在第3天,移除培养基,并以所需浓度加入在25uL Opti-mem中的测试化合物。约4小时后,移除培养基并替换为裂解缓冲液用于进行RNA提取。使用标准方法或试剂盒提取RNA,并随后通过标准测定法进行定量。测序文库制备后,在Illumina MiSeq上进行RNAseq。
实施例3-针对多种GPCR的CRE激活的示例GPCR受体筛选
在本实施例中,将各自如图1A和1B所配置的100种或更多种包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例,图1A的每种核酸包括cAMP应答元件(CRE)激活,其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的每种核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子,这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞群各自包含编码图1A和1B的系统的稳定整合核酸,以及给定的单一GPCR。将多个100种或更多种细胞群混合在一起以形成混合细胞群,每个细胞群编码单一独特GPCR。每个UMI都与给定的GPCR相关联,从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。
在第1天,在DMEM中以35,000个细胞/孔将所述混合细胞群铺在96孔测定板内。在第2天,将培养基换成0.5%FBS+DMEM。在第3天,移除培养基,并以所需浓度加入在25uLOpti-mem中的测试化合物。约4小时后,移除培养基并替换为裂解缓冲液用于进行RNA提取。使用标准方法或试剂盒提取RNA,并随后通过标准测定法进行定量。测序文库制备后,在Illumina MiSeq上进行RNAseq。
实施例4-使用转录中继放大报道输出
本实施例中的实验表明,与没有转录中继的系统相比,当使用转录中继系统时,萤光素酶信号增加,且萤光素酶信号的变异系数降低。以30,000个细胞/孔,将携带单一整合的CRE-萤光素酶的HEK293来源的细胞或携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞铺在白壁多聚-L-赖氨酸包被的96孔板中的100μL DMEM+10%FBS内。在细胞顶部加入50μL含有45ng多西环素的Opti-mem。24小时后,加入DMSO。在指定的时间段内,用DMSO处理细胞。在指定的温育时间后,吸出培养基并替换为35μLDMEM,然后按照制造商的说明书,使用Bright-Glo萤光素酶测定试剂盒[Promega]对细胞进行测定。图2示出了携带单一整合的CRE-萤光素酶的细胞(灰色)和携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞(黑色)由此表达的萤光素酶活性。实验按照在技术上重复3次来进行,并且每个样品的变异系数计算如图3所示。
实施例5-使用Gal4-VPR上的降解决定子标签增强转录中继的倍数诱导
本实施例中的实验表明,当转录中继系统中的Gal4-VPR上包含降解决定子标签时,萤光素酶信号的倍数诱导增加。以30,000个细胞/孔,将携带单一整合的TRE-CHRM3::UAS-萤光素酶双基因盒和多个半随机整合的FOS-Gal4-VPR-CP(降解决定子)或FOS-Gal4-VPR(无降解决定子)的HEK293来源的细胞铺在白壁多聚-L-赖氨酸包被的96孔板中的100μLDMEM+10%FBS内。在细胞顶部加入50μL含有45ng多西环素的Opti-mem。24小时后,用DMSO或1M卡巴胆碱处理细胞8小时。在指定的温育时间后,吸出培养基并替换为35μLDMEM,然后按照制造商的说明书,使用Bright-Glo萤光素酶测定试剂盒[Promega]对细胞进行测定。由此产生的卡巴胆碱中的萤光素酶活性与DMSO中的萤光素酶活性的比值绘制在图4中。
实施例6-包含NFAT应答元件的细胞系
本实施例中描述的细胞系具有NFAT应答元件转录中继(驱动合成转录因子转录的NFAT启动子)的整合拷贝。就拷贝数和整合位点而言,这些细胞系是作为遗传异源池而产生的。从该池中分离出单细胞克隆,并进行扩增。将这些细胞系进一步用于整合GPCR和UAS-萤光素酶-条形码报道子,以测试它们在多重化中检测NFAT信号传导的能力。从这10个细胞文库中,鉴定出两个能够检测到针对对照激动剂的最高数值的不同GPCR命中的细胞文库:cb29(由克隆c713构建)和cb37(由克隆c708构建),如图5所示。
重要的是,我们发现产生这两个细胞文库的等克隆细胞系具有两个共同的特性。首先,这些细胞系在未受刺激状态下显示出最高量的报道表达(见图6,“基础活性-反向转染”)。其次,两个相应的细胞文库可能以依赖性的方式显示出最低水平的变异(见图6,“BCV”)。
虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅通过示例的方式提供。在不脱离本发明的情况下,本领域技术人员现在将想到许多变体、变化和替换。应当理解,本文所述本发明实施方案的各种替代方案可用于实施本发明。
本说明书中提及的所有出版物、专利申请、授权专利和其他文件均通过引用并入本文,如同明确和单独地指出每个单独的出版物、专利申请、授权专利或其他文件均通过引用以其整体并入。通过引用并入的文本中包含的定义在与本公开内容中的定义相矛盾时则被排除在外。
Claims (40)
1.一种转录中继系统,其包括:
a)转录因子核酸,所述转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列,其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧;和
b)报道核酸,所述报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列,其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧,并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。
2.根据权利要求1所述的转录中继系统,其中所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。
3.根据权利要求1或2所述的转录中继系统,其中所述合成转录因子包含来自第一转录因子的DNA结合域和来自第二转录因子的转录激活域。
4.根据权利要求3所述的转录中继系统,其中所述DNA结合域来自Gal4、PPR1、Lac9或LexA。
5.根据权利要求4所述的转录中继系统,其中所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约90%同一性的氨基酸序列。
6.根据权利要求4所述的转录中继系统,其中所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约95%同一性的氨基酸序列。
7.根据权利要求4所述的转录中继系统,其中所述DNA结合域包含与SEQ ID NO:1所示的序列相同的氨基酸序列。
8.根据权利要求5所述的转录中继系统,其中所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。
9.根据权利要求3所述的转录中继系统,其中所述转录激活域包含VP64、p65和Rta。
10.根据权利要求9所述的转录中继系统,其中所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约90%同一性的氨基酸序列。
11.根据权利要求9所述的转录中继系统,其中所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约95%同一性的氨基酸序列。
12.根据权利要求9所述的转录中继系统,其中所述转录激活域包含与SEQ ID NO:14所示的序列相同的氨基酸序列。
13.根据权利要求10所述的转录中继系统,其中所述转录激活域包含SEQ ID NO:14的氨基酸序列变体,其中所述序列变体增加或减少转录激活。
14.根据权利要求1至13中任一项所述的转录中继系统,其中所述合成转录因子包含与SEQ ID NO:10所示的序列具有至少约90%同一性的氨基酸序列。
15.根据权利要求1至13中任一项所述的转录中继系统,其中所述合成转录因子包含与SEQ ID NO:10所示的序列具有至少约95%同一性的氨基酸序列。
16.根据权利要求1至13中任一项所述的转录中继系统,其中所述合成转录因子包含与SEQ ID NO:10所示的序列相同的氨基酸序列。
17.根据权利要求1至16中任一项所述的转录中继系统,其中所述合成转录因子包含使所述合成转录因子去稳定化的多肽序列。
18.根据权利要求17所述的转录中继系统,其中使所述合成转录因子去稳定化的所述多肽序列包含PEST或CL1多肽序列。
19.根据权利要求1至18中任一项所述的转录中继系统,其中所述合成转录因子启动子核苷酸序列包含能够被Gal4、PPR1、Lac9或LexA结合的核苷酸序列。
20.根据权利要求1至19中任一项所述的转录中继系统,其中所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或独特分子标识符。
21.根据权利要求20所述的转录中继系统,其中所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶,和独特分子标识符。
22.根据权利要求20或21所述的转录中继系统,其中所述独特分子标识符对于测试多肽是特有的,其中所述测试多肽由所述报道核酸编码。
23.根据权利要求1至22中任一项所述的转录中继系统,其中所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列,所述核苷酸序列可以被转录阻遏子结合。
24.根据权利要求23所述的转录中继系统,其中所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列,所述核苷酸序列延伸由编码所述合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。
25.根据权利要求24所述的转录中继系统,其中由编码所述合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。
26.根据权利要求1至25中任一项所述的转录中继系统,其中所述转录因子核酸和所述报道核酸是单一核酸的组分。
27.一种包含权利要求1至26中任一项的所述中继系统的细胞。
28.根据权利要求27所述的细胞,其中所述细胞包括真核细胞。
29.根据权利要求27所述的细胞,其中所述细胞包括哺乳动物细胞。
30.根据权利要求27至29中任一项所述的细胞,其中所述转录因子核酸、所述报道核酸或所述转录因子核酸和所述报道核酸二者作为单一拷贝整合到所述细胞的基因组中。
31.一种包含权利要求1至26中任一项的所述中继系统的细胞群。
32.根据权利要求30所述的细胞群,其中所述细胞群包括真核细胞群。
33.根据权利要求30所述的细胞群,其中所述细胞群包括哺乳动物细胞群。
34.根据权利要求32或33所述的细胞群,其中所述转录因子核酸、所述报道核酸或所述转录因子核酸和所述报道核酸二者作为单一拷贝整合到所述细胞群的基因组中。
35.根据权利要求27至34中任一项所述的细胞或细胞群,其中所述细胞或细胞群包含高基础报道活性。
36.根据权利要求27至34中任一项所述的细胞或细胞群,其中所述高基础报道活性比背景高至少约30倍,其中背景是针对不包含所述报道子的亲本细胞或细胞系所观察到的报道活性水平。
37.根据权利要求27至34中任一项所述的细胞或细胞群,其中所述细胞或细胞群包含报道活性的低生物变异系数。
38.根据权利要求27至34中任一项所述的细胞或细胞群,其中所述报道活性的低生物变异系数低于约0.5。
39.一种用于检测测试试剂对应答元件调控的启动子的活性的影响的方法,其包括使根据权利要求27-38中任一项所述的细胞或细胞群与测试物质接触。
40.根据权利要求39所述的方法,其中所述测试试剂是小分子化学品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962853637P | 2019-05-28 | 2019-05-28 | |
US62/853,637 | 2019-05-28 | ||
PCT/US2020/034685 WO2020243164A1 (en) | 2019-05-28 | 2020-05-27 | Transcriptional relay system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114585741A true CN114585741A (zh) | 2022-06-03 |
Family
ID=71094844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080054299.2A Pending CN114585741A (zh) | 2019-05-28 | 2020-05-27 | 转录中继系统 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220177897A1 (zh) |
EP (1) | EP3976795A1 (zh) |
JP (1) | JP2022536257A (zh) |
KR (1) | KR20220015443A (zh) |
CN (1) | CN114585741A (zh) |
AU (1) | AU2020283935A1 (zh) |
CA (1) | CA3140902A1 (zh) |
MA (1) | MA56037A (zh) |
WO (1) | WO2020243164A1 (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030166555A1 (en) * | 2001-04-02 | 2003-09-04 | Alberini Cristina M. | Methods and compositions for regulating memory consolidation |
CN101743329A (zh) * | 2007-05-11 | 2010-06-16 | 平移基因组学研究所 | 测定外部刺激对活细胞中生物通路影响的方法 |
CN102643852A (zh) * | 2011-02-28 | 2012-08-22 | 华东理工大学 | 光可控的基因表达系统 |
CN107760707A (zh) * | 2017-05-25 | 2018-03-06 | 西北农林科技大学 | 一种增强基因表达的自激活Gal4/UAS系统表达盒的建立 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
US7211390B2 (en) | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7329728B1 (en) * | 1999-10-25 | 2008-02-12 | The Scripps Research Institute | Ligand activated transcriptional regulator proteins |
US6936702B2 (en) | 2000-06-07 | 2005-08-30 | Li-Cor, Inc. | Charge-switch nucleotides |
DE602004024034D1 (de) | 2003-01-29 | 2009-12-24 | 454 Corp | Nukleinsäureamplifikation auf basis von kügelchenemulsion |
US7745116B2 (en) | 2003-04-08 | 2010-06-29 | Pacific Biosciences Of California, Inc. | Composition and method for nucleic acid sequencing |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
US7462452B2 (en) | 2004-04-30 | 2008-12-09 | Pacific Biosciences Of California, Inc. | Field-switch sequencing |
US20060024711A1 (en) | 2004-07-02 | 2006-02-02 | Helicos Biosciences Corporation | Methods for nucleic acid amplification and sequence determination |
US7276720B2 (en) | 2004-07-19 | 2007-10-02 | Helicos Biosciences Corporation | Apparatus and methods for analyzing samples |
US20060024678A1 (en) | 2004-07-28 | 2006-02-02 | Helicos Biosciences Corporation | Use of single-stranded nucleic acid binding proteins in sequencing |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
JP2008513782A (ja) | 2004-09-17 | 2008-05-01 | パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド | 分子解析のための装置及び方法 |
EP1817572A2 (en) | 2004-11-16 | 2007-08-15 | Helicos Biosciences Corporation | An optical train and method for tirf single molecule detection and analysis |
US7462468B1 (en) | 2005-01-28 | 2008-12-09 | Pacific Biosciences Of California, Inc. | DNA intercalating agents and methods of use |
AU2006211150A1 (en) | 2005-01-31 | 2006-08-10 | Pacific Biosciences Of California, Inc. | Use of reversible extension terminator in nucleic acid sequencing |
US20060286566A1 (en) | 2005-02-03 | 2006-12-21 | Helicos Biosciences Corporation | Detecting apparent mutations in nucleic acid sequences |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
US20080269476A1 (en) | 2006-04-26 | 2008-10-30 | Helicos Biosciences Corporation | Molecules and methods for nucleic acid sequencing |
US7767805B2 (en) | 2007-05-03 | 2010-08-03 | Helicos Biosciences Corporation | Methods and compositions for sequencing a nucleic acid |
CA2689626C (en) | 2007-06-06 | 2016-10-25 | Pacific Biosciences Of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
CN101802220B (zh) | 2007-07-26 | 2013-07-31 | 加利福尼亚太平洋生物科学股份有限公司 | 分子冗余测序法 |
MY196175A (en) * | 2016-01-11 | 2023-03-20 | Univ Leland Stanford Junior | Chimeric Proteins And Methods Of Regulating Gene Expression |
EP3342868B1 (en) * | 2016-12-30 | 2019-12-25 | Systasy Bioscience GmbH | Constructs and screening methods |
-
2020
- 2020-05-27 MA MA056037A patent/MA56037A/fr unknown
- 2020-05-27 CA CA3140902A patent/CA3140902A1/en active Pending
- 2020-05-27 JP JP2021570521A patent/JP2022536257A/ja active Pending
- 2020-05-27 WO PCT/US2020/034685 patent/WO2020243164A1/en unknown
- 2020-05-27 EP EP20733121.6A patent/EP3976795A1/en active Pending
- 2020-05-27 AU AU2020283935A patent/AU2020283935A1/en active Pending
- 2020-05-27 KR KR1020217042717A patent/KR20220015443A/ko unknown
- 2020-05-27 CN CN202080054299.2A patent/CN114585741A/zh active Pending
-
2021
- 2021-11-22 US US17/532,791 patent/US20220177897A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030166555A1 (en) * | 2001-04-02 | 2003-09-04 | Alberini Cristina M. | Methods and compositions for regulating memory consolidation |
CN101743329A (zh) * | 2007-05-11 | 2010-06-16 | 平移基因组学研究所 | 测定外部刺激对活细胞中生物通路影响的方法 |
CN102643852A (zh) * | 2011-02-28 | 2012-08-22 | 华东理工大学 | 光可控的基因表达系统 |
CN107760707A (zh) * | 2017-05-25 | 2018-03-06 | 西北农林科技大学 | 一种增强基因表达的自激活Gal4/UAS系统表达盒的建立 |
Also Published As
Publication number | Publication date |
---|---|
CA3140902A1 (en) | 2020-12-03 |
US20220177897A1 (en) | 2022-06-09 |
AU2020283935A1 (en) | 2021-12-23 |
EP3976795A1 (en) | 2022-04-06 |
MA56037A (fr) | 2022-04-06 |
KR20220015443A (ko) | 2022-02-08 |
WO2020243164A1 (en) | 2020-12-03 |
JP2022536257A (ja) | 2022-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113454217A (zh) | 用于蛋白质-蛋白质相互作用筛选的系统 | |
US7001733B1 (en) | Methods and compositions for screening for modulations of IgE synthesis, secretion and switch rearrangement | |
JP2002510051A (ja) | リガンド依存性核内受容体とコアクチベーターの相互作用を検出するための組成物および方法 | |
WO2003027634A2 (en) | Identification of modulatory molecules using inducible promoters | |
US6114111A (en) | Mammalian protein interaction cloning system | |
US6479289B2 (en) | Mammalian two-hybrid system | |
EP2985347B1 (en) | Method for detecting protein stability and uses thereof | |
CN114585741A (zh) | 转录中继系统 | |
Nakashima et al. | Cell-based assay of nongenomic actions of progestins revealed inhibitory G protein coupling to membrane progestin receptor α (mPRα) | |
EP1261705B1 (en) | Methods and compositions for screening using diphtheria toxin constructs | |
US7566685B2 (en) | Methods and compositions for screening using diphtheria toxin constructs | |
KR20090040809A (ko) | RhoB 프로모터의 리포터 시스템을 이용한 아폽토시스유도 항암 물질 스크리닝 방법 | |
Ejeskär et al. | Method for efficient transfection of in vitro-transcribed mRNA into SK-N-AS and HEK293 cells: Difference in the toxicity of nuclear EGFP compared to cytoplasmic EGFP | |
Allera-Moreau et al. | The use of IRES-based bicistronic vectors allows the stable expression of recombinant G-protein coupled receptors such as NPY5 and histamine 4 | |
US20220244253A1 (en) | Systems and methods for measuring cell signaling protein activity | |
Han et al. | Intrinsic HER4/4ICD transcriptional activation domains are required for STAT5A activated gene expression | |
US20240132934A1 (en) | Systems and methods for measuring cell signaling protein activity | |
US20190359937A1 (en) | Chimeric receptors, biosensor host cells and methods/uses thereof | |
JP2008228627A (ja) | アリルハイドロカーボン受容体キメラタンパク質、それをコードする遺伝子、発現ベクター、形質転換細胞、および被験物質の毒性検出方法 | |
US20030211523A1 (en) | Two-hybrid double screening system and method | |
Sheridan | Jumping green genes: Development and applications of an in vitro method to randomly generate libraries of functional, fluorescent fusion proteins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |