KR20240004433A - Ert2 돌연변이체 및 이의 용도 - Google Patents
Ert2 돌연변이체 및 이의 용도 Download PDFInfo
- Publication number
- KR20240004433A KR20240004433A KR1020237037724A KR20237037724A KR20240004433A KR 20240004433 A KR20240004433 A KR 20240004433A KR 1020237037724 A KR1020237037724 A KR 1020237037724A KR 20237037724 A KR20237037724 A KR 20237037724A KR 20240004433 A KR20240004433 A KR 20240004433A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- amino acid
- acid substitution
- optionally
- positions
- Prior art date
Links
- 108700027649 Mitogen-Activated Protein Kinase 3 Proteins 0.000 title description 96
- 102100024192 Mitogen-activated protein kinase 3 Human genes 0.000 title description 96
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 125
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims abstract description 108
- 238000013518 transcription Methods 0.000 claims abstract description 60
- 230000035897 transcription Effects 0.000 claims abstract description 59
- 102100038595 Estrogen receptor Human genes 0.000 claims abstract description 43
- 230000001105 regulatory effect Effects 0.000 claims abstract description 32
- 108020001756 ligand binding domains Proteins 0.000 claims abstract description 14
- 230000004807 localization Effects 0.000 claims abstract description 10
- 108010007005 Estrogen Receptor alpha Proteins 0.000 claims abstract description 7
- 230000001276 controlling effect Effects 0.000 claims abstract description 7
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 849
- 238000006467 substitution reaction Methods 0.000 claims description 831
- 102000040430 polynucleotide Human genes 0.000 claims description 126
- 108091033319 polynucleotide Proteins 0.000 claims description 126
- 239000002157 polynucleotide Substances 0.000 claims description 126
- 239000006274 endogenous ligand Substances 0.000 claims description 123
- 230000027455 binding Effects 0.000 claims description 114
- 108090000623 proteins and genes Proteins 0.000 claims description 103
- 230000014509 gene expression Effects 0.000 claims description 90
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 75
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 68
- 229920001184 polypeptide Polymers 0.000 claims description 66
- MHJBZVSGOZTKRH-IZHYLOQSSA-N 4-Hydroxy-N-desmethyltamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCNC)=CC=1)/C1=CC=C(O)C=C1 MHJBZVSGOZTKRH-IZHYLOQSSA-N 0.000 claims description 58
- 230000004913 activation Effects 0.000 claims description 56
- 102000040945 Transcription factor Human genes 0.000 claims description 51
- 108091023040 Transcription factor Proteins 0.000 claims description 51
- 239000003446 ligand Substances 0.000 claims description 40
- 230000035945 sensitivity Effects 0.000 claims description 37
- 108010038795 estrogen receptors Proteins 0.000 claims description 36
- 239000002773 nucleotide Substances 0.000 claims description 35
- 125000003729 nucleotide group Chemical group 0.000 claims description 35
- 230000001939 inductive effect Effects 0.000 claims description 29
- 102100035100 Transcription factor p65 Human genes 0.000 claims description 26
- 241000282414 Homo sapiens Species 0.000 claims description 23
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 22
- 239000011701 zinc Substances 0.000 claims description 22
- 229910052725 zinc Inorganic materials 0.000 claims description 22
- 108091007494 Nucleic acid- binding domains Proteins 0.000 claims description 21
- 230000002103 transcriptional effect Effects 0.000 claims description 20
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 claims description 19
- 239000013612 plasmid Substances 0.000 claims description 19
- 108091006106 transcriptional activators Proteins 0.000 claims description 18
- NYDCDZSEEAUOHN-IZHYLOQSSA-N N-Desmethyltamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCNC)=CC=1)/C1=CC=CC=C1 NYDCDZSEEAUOHN-IZHYLOQSSA-N 0.000 claims description 17
- 230000002068 genetic effect Effects 0.000 claims description 17
- YAASNACECBQAFW-QPLCGJKRSA-N tamoxifen N-oxide Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)(C)=O)=CC=1)/C1=CC=CC=C1 YAASNACECBQAFW-QPLCGJKRSA-N 0.000 claims description 17
- 108010065805 Interleukin-12 Proteins 0.000 claims description 15
- 102000013462 Interleukin-12 Human genes 0.000 claims description 15
- -1 antibodies Proteins 0.000 claims description 14
- 239000012190 activator Substances 0.000 claims description 13
- 102000004169 proteins and genes Human genes 0.000 claims description 13
- 241001465754 Metazoa Species 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 12
- 230000030648 nucleus localization Effects 0.000 claims description 12
- 150000001413 amino acids Chemical class 0.000 claims description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 102000004127 Cytokines Human genes 0.000 claims description 10
- 108090000695 Cytokines Proteins 0.000 claims description 10
- 101710122931 Replication and transcription activator Proteins 0.000 claims description 10
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 claims description 9
- 206010028980 Neoplasm Diseases 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 8
- 108090000246 Histone acetyltransferases Proteins 0.000 claims description 7
- 102000003893 Histone acetyltransferases Human genes 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 7
- 102000005962 receptors Human genes 0.000 claims description 7
- 108020003175 receptors Proteins 0.000 claims description 7
- 102100023050 Nuclear factor NF-kappa-B p105 subunit Human genes 0.000 claims description 6
- 230000000144 pharmacologic effect Effects 0.000 claims description 6
- 101900009012 Epstein-Barr virus Replication and transcription activator Proteins 0.000 claims description 5
- 102100032606 Heat shock factor protein 1 Human genes 0.000 claims description 5
- 101710155878 Histone acetyltransferase p300 Proteins 0.000 claims description 5
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 claims description 5
- 101000979342 Homo sapiens Nuclear factor NF-kappa-B p105 subunit Proteins 0.000 claims description 5
- 101710149136 Protein Vpr Proteins 0.000 claims description 5
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 claims description 4
- 102000019034 Chemokines Human genes 0.000 claims description 4
- 108010012236 Chemokines Proteins 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 101000998146 Homo sapiens Interleukin-17A Proteins 0.000 claims description 4
- 101001010626 Homo sapiens Interleukin-22 Proteins 0.000 claims description 4
- 108010074328 Interferon-gamma Proteins 0.000 claims description 4
- 102000008070 Interferon-gamma Human genes 0.000 claims description 4
- 108090000174 Interleukin-10 Proteins 0.000 claims description 4
- 108090000172 Interleukin-15 Proteins 0.000 claims description 4
- 102000003812 Interleukin-15 Human genes 0.000 claims description 4
- 102100033461 Interleukin-17A Human genes 0.000 claims description 4
- 102000003810 Interleukin-18 Human genes 0.000 claims description 4
- 108090000171 Interleukin-18 Proteins 0.000 claims description 4
- 102100030704 Interleukin-21 Human genes 0.000 claims description 4
- 102100030703 Interleukin-22 Human genes 0.000 claims description 4
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 4
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 claims description 4
- 239000003102 growth factor Substances 0.000 claims description 4
- 229960003130 interferon gamma Drugs 0.000 claims description 4
- 108010074108 interleukin-21 Proteins 0.000 claims description 4
- 230000006907 apoptotic process Effects 0.000 claims description 3
- 108010014726 Interferon Type I Proteins 0.000 claims description 2
- 102000002227 Interferon Type I Human genes 0.000 claims description 2
- 102000003814 Interleukin-10 Human genes 0.000 claims 1
- 241001529453 unidentified herpesvirus Species 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 291
- 230000035772 mutation Effects 0.000 description 107
- 150000007523 nucleic acids Chemical group 0.000 description 95
- 102000039446 nucleic acids Human genes 0.000 description 85
- 108020004707 nucleic acids Proteins 0.000 description 85
- 238000012384 transportation and delivery Methods 0.000 description 64
- 108020004414 DNA Proteins 0.000 description 54
- 150000002632 lipids Chemical class 0.000 description 52
- 239000013598 vector Substances 0.000 description 41
- 239000013603 viral vector Substances 0.000 description 33
- 239000002502 liposome Substances 0.000 description 30
- 230000001976 improved effect Effects 0.000 description 29
- 230000003612 virological effect Effects 0.000 description 28
- 229960005309 estradiol Drugs 0.000 description 27
- 229930182833 estradiol Natural products 0.000 description 27
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 26
- 241000700605 Viruses Species 0.000 description 26
- 238000001890 transfection Methods 0.000 description 26
- 230000000174 oncolytic effect Effects 0.000 description 25
- 239000000203 mixture Substances 0.000 description 24
- 238000012216 screening Methods 0.000 description 24
- 230000006801 homologous recombination Effects 0.000 description 23
- 238000002744 homologous recombination Methods 0.000 description 23
- 238000001727 in vivo Methods 0.000 description 21
- 101710163270 Nuclease Proteins 0.000 description 20
- 238000000338 in vitro Methods 0.000 description 20
- 238000010361 transduction Methods 0.000 description 19
- 230000026683 transduction Effects 0.000 description 19
- 238000003776 cleavage reaction Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 18
- 238000010362 genome editing Methods 0.000 description 18
- 108010025306 histidylleucine Proteins 0.000 description 18
- 230000007017 scission Effects 0.000 description 18
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 17
- 230000001404 mediated effect Effects 0.000 description 17
- 108010071207 serylmethionine Proteins 0.000 description 17
- 210000004881 tumor cell Anatomy 0.000 description 17
- 108091027981 Response element Proteins 0.000 description 16
- 102000004389 Ribonucleoproteins Human genes 0.000 description 15
- 108010081734 Ribonucleoproteins Proteins 0.000 description 15
- 108010005233 alanylglutamic acid Proteins 0.000 description 15
- 238000004520 electroporation Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 108091033409 CRISPR Proteins 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 238000000126 in silico method Methods 0.000 description 13
- 210000000822 natural killer cell Anatomy 0.000 description 13
- 108020001580 protein domains Proteins 0.000 description 13
- 241000713666 Lentivirus Species 0.000 description 12
- 210000001808 exosome Anatomy 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 241000701161 unidentified adenovirus Species 0.000 description 12
- 230000004568 DNA-binding Effects 0.000 description 11
- 108010060035 arginylproline Proteins 0.000 description 11
- 210000000170 cell membrane Anatomy 0.000 description 11
- 239000003814 drug Substances 0.000 description 11
- 239000012528 membrane Substances 0.000 description 11
- 241000880493 Leptailurus serval Species 0.000 description 10
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 10
- 230000006872 improvement Effects 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 9
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 9
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 9
- IPPFAOCLQSGHJV-WFBYXXMGSA-N Asn-Trp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O IPPFAOCLQSGHJV-WFBYXXMGSA-N 0.000 description 9
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 9
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 9
- OJQJUQUBJGTCRY-WFBYXXMGSA-N Cys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N OJQJUQUBJGTCRY-WFBYXXMGSA-N 0.000 description 9
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 9
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 9
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 9
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 9
- HJUPAYWVVVRYFQ-PYJNHQTQSA-N His-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N HJUPAYWVVVRYFQ-PYJNHQTQSA-N 0.000 description 9
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 9
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 9
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 9
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 9
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 9
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 9
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 9
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 9
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 9
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 9
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 9
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 9
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 9
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 9
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 229940079593 drug Drugs 0.000 description 9
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 9
- 230000002401 inhibitory effect Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 9
- 238000004088 simulation Methods 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 8
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 8
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 8
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 8
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 8
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 8
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 8
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 8
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 8
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 8
- UQTKYYNHMVAOAA-HJPIBITLSA-N His-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N UQTKYYNHMVAOAA-HJPIBITLSA-N 0.000 description 8
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 8
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 8
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 8
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 8
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 8
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 8
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 8
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 8
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 8
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 8
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 8
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 8
- 108010066427 N-valyltryptophan Proteins 0.000 description 8
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 8
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 8
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 8
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 8
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 8
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 8
- 241000713880 Spleen focus-forming virus Species 0.000 description 8
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 8
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 8
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 8
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 8
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 108010054813 diprotin B Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108010085203 methionylmethionine Proteins 0.000 description 8
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 7
- GFMWTFHOZGLTLC-AVGNSLFASA-N Arg-His-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O GFMWTFHOZGLTLC-AVGNSLFASA-N 0.000 description 7
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 7
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 7
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 7
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 7
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 7
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 7
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 7
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 7
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 7
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 7
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 7
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 7
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 7
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 7
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 7
- OPTCSTACHGNULU-DCAQKATOSA-N Lys-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN OPTCSTACHGNULU-DCAQKATOSA-N 0.000 description 7
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 7
- RATXDYWHIYNZLE-DCAQKATOSA-N Met-Lys-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N RATXDYWHIYNZLE-DCAQKATOSA-N 0.000 description 7
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 7
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 7
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 7
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 7
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 7
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 7
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 7
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 7
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 7
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 7
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 7
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 7
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 7
- 108010070944 alanylhistidine Proteins 0.000 description 7
- 239000005557 antagonist Substances 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 238000003032 molecular docking Methods 0.000 description 7
- 239000002105 nanoparticle Substances 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 229960001603 tamoxifen Drugs 0.000 description 7
- 108091079001 CRISPR RNA Proteins 0.000 description 6
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 6
- 241000700584 Simplexvirus Species 0.000 description 6
- 239000000556 agonist Substances 0.000 description 6
- 210000001671 embryonic stem cell Anatomy 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 239000002086 nanomaterial Substances 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 5
- PQPMMGQTRQFSDA-SRVKXCTJSA-N Met-Glu-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O PQPMMGQTRQFSDA-SRVKXCTJSA-N 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 238000010459 TALEN Methods 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 5
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000002207 metabolite Substances 0.000 description 5
- 239000000693 micelle Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 244000309459 oncolytic virus Species 0.000 description 5
- 150000003904 phospholipids Chemical class 0.000 description 5
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 4
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 4
- 102000014150 Interferons Human genes 0.000 description 4
- 108010050904 Interferons Proteins 0.000 description 4
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 4
- 239000000232 Lipid Bilayer Substances 0.000 description 4
- 102100025169 Max-binding protein MNT Human genes 0.000 description 4
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 4
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 4
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 4
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 4
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 4
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 102100037935 Polyubiquitin-C Human genes 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- 108010056354 Ubiquitin C Proteins 0.000 description 4
- 230000000735 allogeneic effect Effects 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 125000002091 cationic group Chemical group 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 230000001124 posttranscriptional effect Effects 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 238000000527 sonication Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229960002180 tetracycline Drugs 0.000 description 4
- 229930101283 tetracycline Natural products 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 108091006107 transcriptional repressors Proteins 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 4
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 3
- YVMBAUWDIGJRNY-BESUKNQGSA-N 4o8o7q7iu4 Chemical compound C1C(=O)C[C@H](O)\C=C(/C)\C=C\CNC(=O)\C=C\[C@@H](C)[C@@H](C(C)C)OC(=O)C2=CCCN2C(=O)C2=COC1=N2.N([C@@H]1C(=O)N[C@@H](C(N2CCC[C@H]2C(=O)N(C)[C@@H](CC=2C=CC(=CC=2)N(C)C)C(=O)N2CCC(=O)C[C@H]2C(=O)N[C@H](C(=O)O[C@@H]1C)C=1C=CC=CC=1)=O)CC)C(=O)C1=NC=CC=C1O YVMBAUWDIGJRNY-BESUKNQGSA-N 0.000 description 3
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 3
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 3
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241000702421 Dependoparvovirus Species 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 102000026659 IL10 Human genes 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 3
- RLNUPSVMIYRZSM-UHFFFAOYSA-N Pristinamycin Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC(=CC=2)N(C)C)CCN(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O RLNUPSVMIYRZSM-UHFFFAOYSA-N 0.000 description 3
- 108010079780 Pristinamycin Proteins 0.000 description 3
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 3
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 3
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 3
- 108010087302 Viral Structural Proteins Proteins 0.000 description 3
- 101710185494 Zinc finger protein Proteins 0.000 description 3
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000034303 cell budding Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- BFPSDSIWYFKGBC-UHFFFAOYSA-N chlorotrianisene Chemical compound C1=CC(OC)=CC=C1C(Cl)=C(C=1C=CC(OC)=CC=1)C1=CC=C(OC)C=C1 BFPSDSIWYFKGBC-UHFFFAOYSA-N 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 238000002716 delivery method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 210000001163 endosome Anatomy 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 229940079322 interferon Drugs 0.000 description 3
- 239000010410 layer Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 229960003961 pristinamycin Drugs 0.000 description 3
- DAIKHDNSXMZDCU-OUDXUNEISA-N pristinamycin-IIA Natural products CC(C)[C@H]1OC(=O)C2=CCCN2C(=O)c3coc(CC(=O)C[C@H](O)C=C(C)C=CCNC(=O)C=C[C@@H]1C)n3 DAIKHDNSXMZDCU-OUDXUNEISA-N 0.000 description 3
- JOOMGSFOCRDAHL-XKCHLWDXSA-N pristinamycin-IIB Natural products CC(C)[C@@H]1OC(=O)[C@H]2CCCN2C(=O)c3coc(CC(=O)C[C@@H](O)C=C(C)C=CCNC(=O)C=C[C@H]1C)n3 JOOMGSFOCRDAHL-XKCHLWDXSA-N 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 230000037426 transcriptional repression Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 2
- ATRCOGLZUCICIV-UHFFFAOYSA-N 6-hydroxynicotine Chemical compound CN1CCCC1C1=CC=C(O)N=C1 ATRCOGLZUCICIV-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 2
- 101100519161 Arabidopsis thaliana PCR5 gene Proteins 0.000 description 2
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 2
- 241000711404 Avian avulavirus 1 Species 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 108090000565 Capsid Proteins Proteins 0.000 description 2
- 102100023321 Ceruloplasmin Human genes 0.000 description 2
- 241001502567 Chikungunya virus Species 0.000 description 2
- 108700014420 Chromobox Protein Homolog 5 Proteins 0.000 description 2
- 102100032918 Chromobox protein homolog 5 Human genes 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000725619 Dengue virus Species 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000991587 Enterovirus C Species 0.000 description 2
- 101710091045 Envelope protein Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 2
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 2
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 2
- SRGRINJFBHKHAC-NAKRPEOUSA-N Ile-Cys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N SRGRINJFBHKHAC-NAKRPEOUSA-N 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 2
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 2
- 210000004322 M2 macrophage Anatomy 0.000 description 2
- 241001372913 Maraba virus Species 0.000 description 2
- 241000712079 Measles morbillivirus Species 0.000 description 2
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 2
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 2
- 241000712045 Morbillivirus Species 0.000 description 2
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 2
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000700562 Myxoma virus Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010010677 Phosphodiesterase I Proteins 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 241000711798 Rabies lyssavirus Species 0.000 description 2
- 241000702263 Reovirus sp. Species 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- 241000702670 Rotavirus Species 0.000 description 2
- 241000710799 Rubella virus Species 0.000 description 2
- XRKZVXDFKCVICZ-IJLUTSLNSA-N SCB1 Chemical compound CC(C)CCCC[C@@H](O)[C@H]1[C@H](CO)COC1=O XRKZVXDFKCVICZ-IJLUTSLNSA-N 0.000 description 2
- 101100439280 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLB1 gene Proteins 0.000 description 2
- 241000837158 Senecavirus A Species 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 239000012670 alkaline solution Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 210000001130 astrocyte Anatomy 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 210000003651 basophil Anatomy 0.000 description 2
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000001772 blood platelet Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 210000004413 cardiac myocyte Anatomy 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000020411 cell activation Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000003690 classically activated macrophage Anatomy 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003979 eosinophil Anatomy 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- CLQUUOKNEOQBSW-KEGKUKQHSA-N erythromycin D Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@H]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)C)CC)[C@H]1C[C@@](C)(O)[C@@H](O)[C@H](C)O1 CLQUUOKNEOQBSW-KEGKUKQHSA-N 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 210000003630 histaminocyte Anatomy 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 210000004964 innate lymphoid cell Anatomy 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 210000000274 microglia Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000581 natural killer T-cell Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 210000004248 oligodendroglia Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- VGEREEWJJVICBM-UHFFFAOYSA-N phloretin Chemical compound C1=CC(O)=CC=C1CCC(=O)C1=C(O)C=C(O)C=C1O VGEREEWJJVICBM-UHFFFAOYSA-N 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- YQUVCSBJEUQKSH-UHFFFAOYSA-N protochatechuic acid Natural products OC(=O)C1=CC=C(O)C(O)=C1 YQUVCSBJEUQKSH-UHFFFAOYSA-N 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 210000004116 schwann cell Anatomy 0.000 description 2
- 235000021309 simple sugar Nutrition 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 150000003432 sterols Chemical class 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- 210000002536 stromal cell Anatomy 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- WKOLLVMJNQIZCI-UHFFFAOYSA-N vanillic acid Chemical compound COC1=CC(C(O)=O)=CC=C1O WKOLLVMJNQIZCI-UHFFFAOYSA-N 0.000 description 2
- TUUBOHWZSQXCSW-UHFFFAOYSA-N vanillic acid Natural products COC1=CC(O)=CC(C(O)=O)=C1 TUUBOHWZSQXCSW-UHFFFAOYSA-N 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- ZWTDXYUDJYDHJR-UHFFFAOYSA-N (E)-1-(2,4-dihydroxyphenyl)-3-(2,4-dihydroxyphenyl)-2-propen-1-one Natural products OC1=CC(O)=CC=C1C=CC(=O)C1=CC=C(O)C=C1O ZWTDXYUDJYDHJR-UHFFFAOYSA-N 0.000 description 1
- FDSYTWVNUJTPMA-UHFFFAOYSA-N 2-[3,9-bis(carboxymethyl)-3,6,9,15-tetrazabicyclo[9.3.1]pentadeca-1(15),11,13-trien-6-yl]acetic acid Chemical compound C1N(CC(O)=O)CCN(CC(=O)O)CCN(CC(O)=O)CC2=CC=CC1=N2 FDSYTWVNUJTPMA-UHFFFAOYSA-N 0.000 description 1
- FXCMGCFNLNFLSH-JTQLQIEISA-N 3-oxo-octanoic acid (2-oxo-tetrahydro-furan-3-yl)-amide Chemical compound CCCCCC(=O)CC(=O)N[C@H]1CCOC1=O FXCMGCFNLNFLSH-JTQLQIEISA-N 0.000 description 1
- TVEXGJYMHHTVKP-UHFFFAOYSA-N 6-oxabicyclo[3.2.1]oct-3-en-7-one Chemical compound C1C2C(=O)OC1C=CC2 TVEXGJYMHHTVKP-UHFFFAOYSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 241000649046 Adeno-associated virus 11 Species 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- RGDKRCPIFODMHK-HJWJTTGWSA-N Ala-Leu-Leu-His Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RGDKRCPIFODMHK-HJWJTTGWSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- QEHMMRSQJMOYNO-DCAQKATOSA-N Arg-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QEHMMRSQJMOYNO-DCAQKATOSA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 1
- BFDDUDQCPJWQRQ-IHRRRGAJSA-N Arg-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O BFDDUDQCPJWQRQ-IHRRRGAJSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- QGNXYDHVERJIAY-ACZMJKKPSA-N Asn-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGNXYDHVERJIAY-ACZMJKKPSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- WOKXEQLPBLLWHC-IHRRRGAJSA-N Asp-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 WOKXEQLPBLLWHC-IHRRRGAJSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 101100048079 Caenorhabditis elegans ubc-25 gene Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 1
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- XSQAWJCVYDEWPT-GUBZILKMSA-N Cys-Met-Arg Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XSQAWJCVYDEWPT-GUBZILKMSA-N 0.000 description 1
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101100408813 Drosophila melanogaster polo gene Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 101710196141 Estrogen receptor Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 208000000666 Fowlpox Diseases 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 1
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical group NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 206010019695 Hepatic neoplasm Diseases 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101001136592 Homo sapiens Prostate stem cell antigen Proteins 0.000 description 1
- 101000864780 Homo sapiens Pulmonary surfactant-associated protein A1 Proteins 0.000 description 1
- 101000651017 Homo sapiens Pulmonary surfactant-associated protein A2 Proteins 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- 241001481495 Indiana vesiculovirus Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000325689 Marava Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- CRVSHEPROQHVQT-AVGNSLFASA-N Met-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N CRVSHEPROQHVQT-AVGNSLFASA-N 0.000 description 1
- KYJHWKAMFISDJE-RCWTZXSCSA-N Met-Thr-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCSC KYJHWKAMFISDJE-RCWTZXSCSA-N 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- YQHMWTPYORBCMF-UHFFFAOYSA-N Naringenin chalcone Natural products C1=CC(O)=CC=C1C=CC(=O)C1=C(O)C=C(O)C=C1O YQHMWTPYORBCMF-UHFFFAOYSA-N 0.000 description 1
- 206010029098 Neoplasm skin Diseases 0.000 description 1
- FXCMGCFNLNFLSH-UHFFFAOYSA-N OOHL Natural products CCCCCC(=O)CC(=O)NC1CCOC1=O FXCMGCFNLNFLSH-UHFFFAOYSA-N 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 206010034038 Parotitis Diseases 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 102100036735 Prostate stem cell antigen Human genes 0.000 description 1
- 102100027773 Pulmonary surfactant-associated protein A2 Human genes 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-KBPBESRZSA-N Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- CUJRVFIICFDLGR-UHFFFAOYSA-N acetylacetonate Chemical compound CC(=O)[CH-]C(C)=O CUJRVFIICFDLGR-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000031016 anaphase Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 239000003012 bilayer membrane Substances 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 235000015111 chews Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002121 endocytic effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- SSQPWTVBQMWLSZ-AAQCHOMXSA-N ethyl (5Z,8Z,11Z,14Z,17Z)-icosapentaenoate Chemical compound CCOC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC SSQPWTVBQMWLSZ-AAQCHOMXSA-N 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 125000005456 glyceride group Chemical group 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 101150118163 h gene Proteins 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000013546 insoluble monolayer Substances 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000013554 lipid monolayer Substances 0.000 description 1
- 150000002634 lipophilic molecules Chemical class 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000037841 lung tumor Diseases 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 208000025402 neoplasm of esophagus Diseases 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000005937 nuclear translocation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 230000036470 plasma concentration Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 208000023958 prostate neoplasm Diseases 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 208000002079 spinocerebellar ataxia with epilepsy Diseases 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 208000013076 thyroid tumor Diseases 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 208000025421 tumor of uterus Diseases 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940054541 urex Drugs 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000024719 uterine cervix neoplasm Diseases 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 229940023147 viral vector vaccine Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
- C07K14/721—Steroid/thyroid hormone superfamily, e.g. GR, EcR, androgen receptor, oestrogen receptor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/715—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
- C07K14/7155—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for interleukins [IL]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Endocrinology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
에스트로겐 수용체 알파 리간드 결합 도메인(ER-LBD)의 돌연변이체, 및 이러한 돌연변이체 ER-LBD를 포함하는 키메라 단백질이 본원에 제공된다. 또한, 이러한 키메라 단백질의 전사를 조절하고 국소화를 조절하는 방법이 제공된다.
Description
관련 출원에 대한 상호 참조
본 출원은 2021년 4월 6일에 출원된 미국 가출원 제63/171,227호의 이익을 주장하고, 이들은 사실상 그 전체가 참조로서 본원에 포함된다.
서열 목록
본 출원은 EFS-Web을 통해 제출된 서열 목록을 함유하며 그 전체가 본원에 참조로 포함된다. 2022년 4월 4일에 생성된 상기 ASCII 사본의 명칭은 STB-028WO_SL.txt이고, 크기는 212,560 바이트이다.
에스트로겐 수용체(ER)는 에스트로겐 및 에스트라디올과 같은 내인성 호르몬 리간드에 결합하는 리간드 의존성 전사 인자이다. ER에 결합하는 합성 리간드는 ER-양성 유방암과 같은 ER-양성 암을 치료하기 위해 개발되었다. 예를 들어, 약물 타목시펜의 활성 대사산물은 ER의 핵 전위를 유도하고 조직-선택적 방식으로 ER에 길항작용을 한다. 타목시펜 및 이의 활성 대사산물은 또한 연구 환경에서 핵 국소화를 제어하기 위한 도구로서 사용된다. 예를 들어, ERT2로 알려진 ER 리간드 결합 도메인 변이체는 동물 모델 시스템에서 Cre 재조합효소 기반 유전자 편집을 조절하기 위해 Cre 재조합효소와 융합 단백질로서 널리 사용되어 왔다. 합성 리간드를 사용하여 핵 국소화를 조작하는 능력은 또한 치료 유전자의 조절과 같은 치료 용도에 유용할 것이다. 따라서, 합성 리간드에 대한 민감도 및/또는 선택성이 개선된 ERT2 기반 시스템은 임상 환경에서 ERT2 기반 유전자 조절을 사용하는 데 유용할 것이다.
일부 구현예에서, 타목시펜 및 이의 대사산물과 같은 비-내인성 리간드에 대한 개선된 민감도 및/또는 선택성을 갖는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)이 본원에 제공된다. 또한, 일부 구현예에서, 본원에 기술된 바와 같은 변형된 ER-LBD를 포함하는 키메라 단백질, 유전자 스위치, 본원에 기술된 바와 같은 변형된 ER-LBD 및 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자, 본원에 기술된 폴리뉴클레오티드 분자를 암호화하거나 본원에 기술된 바와 같은 변형된 ER-LBD 및 키메라 단백질을 발현하는 세포, 및 본원에 기술된 바와 같은 변형된 ER-LBD, 키메라 단백질, 폴리뉴클레오티드 분자, 유전적 스위치, 또는 세포를 사용하는 방법이 본원에 제공된다.
본원에 기술된 변형된 ER-LBD 및 키메라 단백질은 ERT2에 비해 비-내인성 리간드(예를 들어, "4-OHT"로도 지칭되는 4-하이드록시타목시펜)에 대해 더 큰 민감도 및/또는 선택성을 갖는다. ERT2는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환을 포함하는 ER의 리간드 결합 도메인이다(서열번호 2 참조). ERT2는 또한 G400V/M543A/L544A 이외에, V595A 아미노산 치환을 포함할 수 있다(서열번호 3 참조). 타목시펜의 통상적인 임상 투여 후 평균 피크 혈장 농도는 나노몰 범위(예를 들어, 약 40 ng/mL)이다. 그러나, 타목시펜 대사산물(예를 들어, 엔독시펜 및 4-OHT)에 대한 야생형 ERT2의 민감도는 대사산물의 나노몰 농도에서 유전자 발현을 조절하는 데 사용하기에 너무 낮다. 또한, ERT2는 에스트라디올과 같은 내인성 리간드에 반응할 수 있다. 따라서, 변형된 ER-LBD 및 변형된 ER-LBD를 포함하는 키메라 단백질의 비-내인성 리간드에 대한 민감도 및/또는 선택성의 개선은 유전자 조절을 제어하기 위한 ER 기반 시스템의 사용을 허용한다.
서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)이 본원에 제공되며, 여기서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 또는 내인성 리간드와 비교했을 때 하나 이상의 추가 아미노산 치환의 결과로 비-내인성 리간드에 대해 더 큰 민감도 및/또는 선택성을 갖는다 일부 양태에서, 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함한다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재한다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함한다. 일부 양태에서, 서열번호 1의 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M343F, M343I, M343L, 및 M343V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함한다. 일부 양태에서, 서열번호 1의 위치 344에서의 아미노산 치환은 G344M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함한다. 일부 양태에서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함한다. 일부 양태에서, 서열번호 1의 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L346I, L346M, L346F, 및 L346V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함한다. 일부 양태에서, 서열번호 1의 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함한다. 일부 양태에서, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함한다. 일부 양태에서, 서열번호 1의 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L349I, L349M, L349F, 및 L349V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함한다. 일부 양태에서, 서열번호 1의 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: A350F, A350I, A350L, A350M 및 A350V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함한다. 일부 양태에서, 서열번호 1의 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함한다. 일부 양태에서, 서열번호 1의 위치 352에서의 아미노산 치환은 R352K이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L354I, L354M, L354F, 및 L354V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함한다. 일부 양태에서, 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L384I, L384M, L384F, 및 L384V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함한다. 일부 양태에서, 서열번호 1의 위치 386에서의 아미노산 치환은 I386V이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함한다. 일부 양태에서, 서열번호 1의 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L387I, L387M, L387F, 및 L387V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함한다. 일부 양태에서, 서열번호 1의 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M388I, M388L, 및 M388F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함한다. 일부 양태에서, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함한다. 일부 양태에서, 서열번호 1의 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L391I, L391M, L391F, 및 L391V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함한다. 일부 양태에서, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함한다. 일부 양태에서, 서열번호 1의 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: F404I, F404L, F404M, 및 F404V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함한다. 일부 양태에서, 서열번호 1의 위치 407에서의 아미노산 치환은 N407D이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함한다. 일부 양태에서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함한다. 일부 양태에서, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함한다. 일부 양태에서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함한다. 일부 양태에서, 서열번호 1의 위치 417에서의 아미노산 치환은 C417S이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함한다. 일부 양태에서, 서열번호 1의 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V418I, V418L, V418M, 및 V418F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함한다. 일부 양태에서, 서열번호 1의 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G420I, G420M, G420F, 및 G420V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함한다. 일부 양태에서, 서열번호 1의 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M421I, M421L, M421F, 및 M421V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함한다. 일부 양태에서, 서열번호 1의 위치 422에서의 아미노산 치환은 V422I이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함한다 1. 일부 양태에서, 서열번호 1의 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I424L, I424M, I424F, 및 I424V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함한다. 일부 양태에서, 서열번호 1의 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L428I, L428M, L428F, 및 L428V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함한다. 일부 양태에서, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함한다 1. 일부 양태에서, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함한다. 일부 양태에서, 서열번호 1의 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G521A, G521F, G521I, G521L, G521M, 및 G521V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함한다. 일부 양태에서, 서열번호 1의 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M522I, M522L, 및 M522V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함한다. 일부 양태에서, 서열번호 1의 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다. H524A, H524I, H524L, H524F, 및 H524V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함한다. 일부 양태에서, 서열번호 1의 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함한다. 일부 양태에서, 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함한다. 일부 양태에서, 서열번호 1의 위치 527에서의 아미노산 치환은 S527N이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함한다. 일부 양태에서, 서열번호 1의 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M528F, M528I, 및 M528V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함한다. 일부 양태에서, 서열번호 1의 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V533F 및 V533W.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함한다. 일부 양태에서, 서열번호 1의 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V534Q 및 V534R.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함한다. 일부 양태에서, 서열번호 1의 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L536F, 및 L536M, L536R, 및 L536Y.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함한다. 일부 양태에서, 서열번호 1의 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: Y537E 및 Y537S.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함한다. 일부 양태에서, 서열번호 1의 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D538G 및 D538K.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함한다. 일부 양태에서, 서열번호 1의 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L539A 및 L539R.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함한다. 일부 양태에서, 서열번호 1의 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L540A 및 L540F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함한다. 일부 양태에서, 서열번호 1의 위치 547에서의 아미노산 치환은 H547A이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환이다. 일부 양태에서, 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하고, 여기서 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하고, 여기서 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 387 및 391에 있고, 여기서 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 있고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 있고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.
일부 양태에서, 하나 이상의 아미노산 치환은 3개의 아미노산 치환이다. 일부 양태에서, 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하되, 여기서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하되, 여기서 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.
일부 양태에서, 하나 이상의 아미노산 치환은 4개의 아미노산 치환이다. 일부 양태에서, 4개의 아미노산 치환 각각은 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하되, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이며, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하되, 여기서 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이며, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이고, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이며, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하되, 여기서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하되, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하되, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환이다. 일부 양태에서, 5개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하되, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463 및 524에 존재하되, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.
일부 양태에서, 하나 이상의 아미노산 치환은 6개의 아미노산 치환이다. 일부 양태에서, 6개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환이다. 일부 양태에서, 7개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384 에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.
일부 양태에서, 하나 이상의 아미노산 치환은 8개의 아미노산 치환이다. 일부 양태에서, 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.
또한, 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질이 본원에 제공된다. 일부 양태에서, 관심 폴리펩티드는 핵산 결합 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거 도메인을 포함한다. 일부 양태에서, 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함한다. 일부 양태에서, 키메라 단백질은 키메라 전사 인자를 포함하고, 관심 폴리펩티드는 핵산 결합 도메인 및 전사 조절자 도메인을 포함한다. 일부 양태에서, 전사 조절자 도메인은 전사 활성인자이다. 일부 양태에서, 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된다. 일부 양태에서, 전사 조절인자 도메인은 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자이다.
또한, 본원에 기술된 바와 같은 변형된 ER-LBD를 암호화하거나 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자가 본원에 제공된다.
또한, 본원에 기술된 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물이 본원에 제공된다.
또한, 본원에 기술된 바와 같은 이종 작제물을 포함하는 플라스미드가 본원에 제공된다.
또한, 본원에 기술된 바와 같은 이종 작제물 또는 본원에 기술된 바와 같은 플라스미드를 포함하는 세포가 본원에 제공된다.
또한, (a) 본원에 기술된 바와 같은 키메라 단백질로서, 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는, 키메라 단백질; 및 (b) 비-내인성 리간드로서, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 비-내인성 리간드를 포함하는, 관심 유전자의 전사를 조절하기 위한 유전자 스위치가 본원에 제공된다.
일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
일부 양태에서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화한다.
일부 양태에서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화한다: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파; 및/또는
일부 양태에서, 관심 유전자는 아미노산 서열 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)를 포함하는 IL12p70 융합 단백질을 암호화한다.
또한, (i) 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하는, 관심 유전자의 전사를 조절하는 방법이 본원에 제공된다. 일부 양태에서, 방법은 키메라 단백질이 전사를 조절하도록 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함한다. 일부 양태에서, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화시키는 단계를 포함한다. 일부 양태에서, 표적 발현 카세트는 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되거나, 표적 발현 카세트는 제2 이종 작제물에 의해 암호화된다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
또한, 키메라 단백질의 국소화를 조절하는 방법이 본원에 제공되되, 방법은 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함한다. 일부 양태에서, 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함한다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
일부 양태에서, 형질전환된 세포는 인간 또는 동물에 존재하며, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함한다.
일부 양태에서, 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여된다.
서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열 및 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내의 하나 이상의 추가 아미노산 치환을 포함하는 변형된 ER-LBD가 본원에 제공된다. 일부 양태에서, 본원에 기술된 바와 같은 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환을 추가로 포함한다. 일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, L544A, 및 V595A 아미노산 치환을 추가로 포함한다.
일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A, 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함한다. 일부 양태에서, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다. 일부 양태에서, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.
일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, L544A 아미노산 치환, 및 V595A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함한다. 일부 양태에서, 변형된 ER-LBD는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다. 일부 양태에서, 변형된 ER-LBD는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.
일부 양태에서, 본 개시의 변형된 ER-LBD는 하나 이상의 추가 아미노산 치환의 결과로서 내인성 리간드와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다.
일부 양태에서, 본 개시의 변형된 ER-LBD는 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다.
일부 양태에서, 본 개시의 변형된 ER-LBD는 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재한다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함한다. 일부 양태에서, 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M343F, M343I, M343L, 및 M343V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함한다. 일부 양태에서, 위치 344에서의 아미노산 치환은 G344M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함한다. 일부 양태에서, 위치 345에서의 아미노산 치환은 L345S이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함한다. 일부 양태에서, 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L346I, L346M, L346F, 및 L346V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함한다. 일부 양태에서, 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함한다. 일부 양태에서, 위치 348에서의 아미노산 치환은 N348K이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함한다. 일부 양태에서, 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L349I, L349M, L349F, 및 L349V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함한다. 일부 양태에서, 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: A350F, A350I, A350L, A350M 및 A350V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함한다. 일부 양태에서, 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함한다. 일부 양태에서, 위치 352에서의 아미노산 치환은 R352K이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함한다. 일부 양태에서, 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L354I, L354M, L354F, 및 L354V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함한다. 일부 양태에서, 위치 380에서의 아미노산 치환은 E380Q이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함한다. 일부 양태에서, 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L384I, L384M, L384F, 및 L384V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함한다. 1. 일부 양태에서, 위치 386에서의 아미노산 치환은 I386V이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함한다. 일부 양태에서, 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L387I, L387M, L387F, 및 L387V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함한다. 일부 양태에서, 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M388I, M388L, 및 M388F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함한다. 일부 양태에서, 위치 389에서의 아미노산 치환은 I389M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함한다. 일부 양태에서, 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L391I, L391M, L391F, 및 L391V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함한다. 일부 양태에서, 위치 392에서의 아미노산 치환은 V392M이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함한다. 일부 양태에서, 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: F404I, F404L, F404M, 및 F404V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함한다. 일부 양태에서, 위치 407에서의 아미노산 치환은 N407D이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함한다. 일부 양태에서, 위치 409에서의 아미노산 치환은 L409V이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함한다. 일부 양태에서, 위치 413에서의 아미노산 치환은 N413D이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함한다. 일부 양태에서, 위치 414에서의 아미노산 치환은 Q414E이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함한다. 일부 양태에서, 위치 417에서의 아미노산 치환은 C417S이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함한다. 일부 양태에서, 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V418I, V418L, V418M, 및 V418F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함한다. 일부 양태에서, 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G420I, G420M, G420F, 및 G420V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함한다. 일부 양태에서, 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M421I, M421L, M421F, 및 M421V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함한다. 일부 양태에서, 위치 422에서의 아미노산 치환은 V422I이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함한다. 일부 양태에서, 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I424L, I424M, I424F, 및 I424V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함한다. 일부 양태에서, 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L428I, L428M, L428F, 및 L428V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함한다. 일부 양태에서, 위치 463에서의 아미노산 치환은 S463P이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함한다. 일부 양태에서, 위치 517에서의 아미노산 치환은 M517A이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함한다. 일부 양태에서, 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G521A, G521F, G521I, G521L, G521M, 및 G521V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함한다. 일부 양태에서, 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M522I, M522L, 및 M522V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함한다. 일부 양태에서, 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: H524A, H524I, H524L, H524F, 및 H524V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함한다. 일부 양태에서, 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함한다. 일부 양태에서, 위치 526에서의 아미노산 치환은 Y526L이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함한다. 일부 양태에서, 위치 527에서의 아미노산 치환은 S527N이다.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함한다. 일부 양태에서, 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M528F, M528I, 및 M528V.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함한다. 일부 양태에서, 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V533F 및 V533W.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함한다. 일부 양태에서, 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V534Q 및 V534R.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함한다. 일부 양태에서, 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L536F, 및 L536M, L536R, 및 L536Y.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함한다. 일부 양태에서, 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: Y537E 및 Y537S.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함한다. 일부 양태에서, 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D538G 및 D538K.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함한다. 일부 양태에서, 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L539A 및 L539R.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함한다. 일부 양태에서, 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L540A 및 L540F.
일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함한다. 일부 양태에서, 위치 547에서의 아미노산 치환은 H547A이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환을 포함한다. 일부 양태에서, 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재한다. 일부 양태에서, 위치 345에서의 아미노산 치환은 L345S이고 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재한다. 일부 양태에서, 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다.
일부 양태에서, 2개의 아미노산 치환은 위치 387 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다.
일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환을 포함한다. 일부 양태에서, 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 418, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다.
일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환을 포함한다.
일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이다.
일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재한다. 일부 양태에서, 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이며, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이다.
일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재한다. 일부 양태에서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이다.
일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
또한, 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질이 제공된다. 일부 양태에서, 관심 폴리펩티드는 핵산 결합 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거(ZF) 도메인을 포함한다. 일부 양태에서, 키메라 단백질은 전사 인자이고, 관심 폴리펩티드는 전사 조절인자 도메인을 포함한다.
또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드 분자가 제공된다.
또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물이 제공된다.
또한, 본원에 기술된 바와 같은 이종 작제물을 포함하는 플라스미드가 제공된다.
또한, 본원에 기술된 바와 같은 이종 작제물 또는 본원에 기술된 바와 같은 플라스미드를 포함하는 세포(예컨대 단리된 세포 또는 세포 집단)가 제공된다.
또한, 관심 유전자의 전사를 조절하기 위한 유전자 스위치가 제공된다. 일부 양태에서, 유전자 스위치는 본원에 기술된 바와 같은 변형된 ER-LBD 및 전사 조절인자를 포함하는 키메라 단백질 및 비-내인성 리간드를 포함하되, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도한다. 일부 양태에서, 유전자 스위치의 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
또한, 관심 유전자의 전사를 조절하는 방법이 본원에 제공된다. 일부 양태에서, 방법은 (a) (i) 변형된 ER-LBD 및 전사 조절인자 도메인을 포함하는 키메라 단백질을 암호화하는 이종 작제물, 및 (ii) 관심 유전자를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계; (b) 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및
(c) 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함한다.
일부 양태에서, 전사를 조절하는 방법은 전사를 활성화하는 방법이다.
일부 양태에서, 전사를 조절하는 방법은 전사를 억제하는 방법이다.
일부 양태에서, 표적 발현 카세트는 키메라를 암호화하는 이종 작제물에 의해 암호화된다.
일부 양태에서, 표적 발현 카세트는 키메라를 암호화하는 이종 작제물과 상이한 이종 작제물에 의해 암호화된다.
또한, 관심 폴로 펩티드의 국소화를 조절하는 방법이 제공된다. 일부 양태에서, 방법은 (a) 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계; (b) 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및 (c) 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함한다.
일부 양태에서, 본원에 기술된 방법 중 어느 하나의 형질전환된 세포는 인간 또는 동물에 존재한다. 일부 양태에서, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에게 투여하는 단계를 포함한다.
일부 양태에서, 이전에 기술된 방법의 단계 (c)의 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.
일부 양태에서, 비-내인성 리간드는 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여된다.
본 개시의 이들 및 다른 특징, 양태, 및 이점은 하기 설명, 및 첨부 도면과 관련하여 더 잘 이해될 것이다.
도 1a 및 도 1b는 인 실리코 분석된 제1 돌연변이 세트에 대한 결합 에너지 계산을 제공한다. 도 1a는 에스트라디올에 결합하기 위한 결합 에너지 계산을 제공하며, 도 1b는 4-OHT에 결합하기 위한 결합 에너지 계산을 제공한다.
도 2는 인 실리코 분석된 제2 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 3은 인 실리코 분석된 제3 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 4는 인 실리코 분석된 제4 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 5는 인 실리코 분석된 제5 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 6은 나선 12의 배향 및 도킹 부위에서 에스트라디올-결합 및 비-내인성 리간드-결합 형태 사이의 구조적 차이를 보여준다.
도 7은 인 실리코 분석된 제6 돌연변이 세트에 대한, 작용제-결합 대 길항제-결합 형태에 대한 결합 에너지 계산을 제공한다.
도 8a, 도 8b 및 도 8c는 제1 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 9a, 도 9b, 및 도 9c는 제2 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 10a, 도 10b 및 도 10c는 제3 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 11a 및 도 11b는 제1 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 12는 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 13은 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 14a 및 도 14b는 ERT2(SB04401) 및 OFF mCherry 리포터 작제물(SB01066)의 고 처리량 단백질 조작을 위한 백본을 보여준다.
도 15a 및 도 15b는 조합 라이브러리 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 16a, 도 16b, 도 16c, 및 도 16d는 검증 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜, 4-OHT, 및 에스트라디올에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. SB03422는 야생형 ER-LBD이며 성능의 벤치마크로서 포함된다.
도 17a 및 도 17b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. 화살표는 인간에서 추정된 약리학적으로 관련된 4-OHT 또는 엔독시펜 농도를 나타낸다.
도 18a 및 도 18b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜에 걸쳐 다양한 변형된 ER-LBD가 IL-12 발현에 미치는 효과를 보여준다.
도 1a 및 도 1b는 인 실리코 분석된 제1 돌연변이 세트에 대한 결합 에너지 계산을 제공한다. 도 1a는 에스트라디올에 결합하기 위한 결합 에너지 계산을 제공하며, 도 1b는 4-OHT에 결합하기 위한 결합 에너지 계산을 제공한다.
도 2는 인 실리코 분석된 제2 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 3은 인 실리코 분석된 제3 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 4는 인 실리코 분석된 제4 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 5는 인 실리코 분석된 제5 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 6은 나선 12의 배향 및 도킹 부위에서 에스트라디올-결합 및 비-내인성 리간드-결합 형태 사이의 구조적 차이를 보여준다.
도 7은 인 실리코 분석된 제6 돌연변이 세트에 대한, 작용제-결합 대 길항제-결합 형태에 대한 결합 에너지 계산을 제공한다.
도 8a, 도 8b 및 도 8c는 제1 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 9a, 도 9b, 및 도 9c는 제2 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 10a, 도 10b 및 도 10c는 제3 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 11a 및 도 11b는 제1 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 12는 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 13은 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 14a 및 도 14b는 ERT2(SB04401) 및 OFF mCherry 리포터 작제물(SB01066)의 고 처리량 단백질 조작을 위한 백본을 보여준다.
도 15a 및 도 15b는 조합 라이브러리 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 16a, 도 16b, 도 16c, 및 도 16d는 검증 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜, 4-OHT, 및 에스트라디올에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. SB03422는 야생형 ER-LBD이며 성능의 벤치마크로서 포함된다.
도 17a 및 도 17b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. 화살표는 인간에서 추정된 약리학적으로 관련된 4-OHT 또는 엔독시펜 농도를 나타낸다.
도 18a 및 도 18b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜에 걸쳐 다양한 변형된 ER-LBD가 IL-12 발현에 미치는 효과를 보여준다.
청구범위 및 명세서에 사용된 용어는 달리 명시되지 않는 한 다음과 같이 정의된다.
용어 "생체 내"는 살아있는 유기체에서 일어나는 과정을 지칭한다.
본원에서 사용되는 용어 "포유동물"은 인간 및 비인간 둘 모두를 포함하고 인간, 비인간 영장류, 개과, 고양이과, 쥣과, 소, 말, 및 돼지를 포함하지만 이에 제한되지는 않는다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서, 용어 백분율 "동일성"은 하기에 기술된 서열 비교 알고리즘(예를 들어, BLASTP 및 BLASTN 또는 당업자가 이용할 수 있는 기타 알고리즘) 중 하나를 사용하여 또는 육안 검사에 의해 측정된 바와 같이, 최대 일치를 위해 비교되고 정렬될 때 동일한 뉴클레오티드 또는 아미노산 잔기의 특정 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 적용에 따라, 백분율 "동일성"은 비교되는 서열의 영역에 걸쳐, 예를 들어, 기능적 도메인에 걸쳐 존재할 수 있거나, 대안적으로, 비교될 2개의 서열의 전체 길이에 걸쳐 존재할 수 있다.
서열 비교에 대해, 통상적으로 하나의 서열이 시험 서열이 비교되는 참조 서열 역할을 한다. 서열 비교 알고리즘을 사용하는 경우, 시험 서열과 참조 서열을 컴퓨터에 입력하고 필요에 따라 하위 서열 좌표를 지정하고, 서열 알고리즘 프로그램 매개변수를 지정한다. 그런 다음 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로 참조 서열에 대한 시험 서열(들)의 백분율 서열 동일성을 계산한다.
비교를 위한 서열의 최적 정렬은 예를 들어, Smith & Waterman의 문헌[Adv. Appl. Math. 2:482 (1981)]의 국소적 상동성 알고리즘에 의해, Needleman & Wunsch의 문헌[J. Mol. Biol. 48:443 (1970)]의 상동성 정렬 알고리즘에 의해, Pearson & Lipman의 문헌[Proc. Nat'l. Acad. Sci. USA 85:2444 (1988)]의 유사성 검색 방법에 의해, 이러한 알고리즘(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.의 GAP, BESTFIT, FASTA, 및 TFASTA)의 컴퓨터 구현에 의해, 또는 육안 검사에 의해(일반적으로 하기 Ausubel et al. 참조) 수행될 수 있다.
백분율 서열 동일성 및 서열 유사성을 결정하는데 적합한 알고리즘의 한 예는 BLAST 알고리즘이고, 이는 Altschul 등의 문헌[J. Mol. Biol. 215:403-410 (1990)]에 기재되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터를 통해 공개적으로 제공된다 (www.ncbi.nlm.nih.gov/).
용어 "충분한 양"은 원하는 효과를 생성하기에 충분한 양, 예를 들어 세포에서 단백질 응집을 조절하기에 충분한 양을 의미한다.
용어 "치료적 유효량"은 질환의 증상을 개선하는데 효과적인 양이다. 치료적 유효량은 예방이 요법으로 간주될 수 있기 때문에 "예방적 유효량"일 수 있다.
명세서 및 첨부된 청구범위에 사용된 바와 같이 단수형 "a", "an" 및 "the"는 문맥에서 명백하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다는 점에 유의해야 한다.
변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)
본 개시는 서열번호 1(인간 에스트로겐 수용체, UniProt ID 번호: P03372)의 아미노산 282~595에 상응하는 아미노산 서열을 포함하고, 아미노산 치환 G400V, M543A, 및 L544A 또는 아미노산 치환G400V, M543A, L544A, 및 V595A를 포함하고, 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로부터 선택된 서열번호 1의 영역 내 리간드 결합 잔기에 대해 하나 이상의 추가 아미노산 치환을 포함하는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)을 제공한다. 일부 양태에서, 하나 이상의 아미노산 치환은 다음을 초래한다: (a) 내인성 리간드와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, (b) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, 및/또는 (c) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 다음을 초래한다: (a) 내인성 리간드와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, (b) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, 및/또는 (c) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도를 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도를 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성을 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성을 초래한다.
"리간드 결합 잔기"는 에스트로겐 수용체(ER) 또는 ER-리간드 결합 도메인의 리간드 결합 포켓에 위치한 잔기를 지칭하며, 내인성 리간드(예를 들어, 에스트라디올)에 결합하기 위한 포켓 및 4-OHT와 같은 비-내인성 리간드에 결합하기 위한 포켓을 포함한다. 서열번호 1에 상응하는 위치 343~354, 위치 380~392 및 위치 404~463 내의 잔기는 내인성 및 비-내인성 리간드 둘 모두에 대한 결합에 관여한다. 서열번호 1에 상응하는 위치 517~547 내의 잔기(예를 들어, 잔기 517~40 및 잔기 547)는 나선 12로 지칭되는 나선 내에 위치하고 내인성 리간드 결합에 관여한다.
비-내인성 리간드에 대한 민감도에 비해 비-내인성 리간드에 대한 민감도가 더 높다는 것은 변형된 ER-LBD가 내인성 리간드(예를 들어, 에스트라디올)에 대한 결합의 친화도에 비해 더 높은 친화도로 비-내인성 리간드(예를 들어, 엔독시펜)에 결합한다는 것을 의미한다.
하나 이상의 아미노산 치환을 포함하지 않는 ER-LBD(예를 들어, 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD)의 민감도에 비해 비-내인성 리간드에 대한 민감도가 더 높다는 것은 변형된 ER-LBD가 하나 이상의 추가 아미노산 치환을 포함하지 않는 ER-LBD의 비-내인성 리간드에 대한 결합 친화도에 비해 더 높은 친화도로 비-내인성 리간드(예를 들어, 엔독시펜)에 결합한다는 것을 의미한다. 일부 구현예에서, 더 높은 민감도는 하나 이상의 추가 아미노산 치환을 포함하지 않는 ER-LBD의 결합과 비교했을 때, 비-내인성 리간드에 대한 결합 친화도가 적어도 1.5배, 적어도 2배, 적어도 3배, 적어도 4배, 또는 적어도 5배의 개선이다. 일부 구현예에서, 더 큰 민감도는 하나 이상의 추가 아미노산 치환이 결여된 ER-LBD를 포함하는 키메라 전사 인자와 비교하여, 변형된 ER-LBD를 포함하는 키메라 전사 인자의 더 큰 전사 조절(예를 들어, 더 큰 전사 활성화 또는 더 큰 전사 억제)에 의해 입증된다. 일부 구현예에서, 형질도입 검정의 형질감염에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자는 (리포터에 대해 양성인 세포의 %로 측정했을 때, 또는 기하학적 평균 형광 강도에 의해 측정했을 때) 비-내인성 리간드(예를 들어, 4-OHT)에 반응하여 키메라 전사 반응성 프로모터의 조절 하에 리포터의 발현을 동일한 조건 하에 하나 이상의 추가 아미노산 치환이 결여된 ER-LBD를 갖는 리포터의 발현과 비교하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35% 더 크게 유도할 수 있다.
비-내인성 리간드에 대한 더 큰 선택성은 내인성 리간드(예를 들어, 에스트라디올)에 비해 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)에 대한 우선적인 결합을 지칭한다. 선택성은, 기질(예를 들어, 변형된 ER-LBD)과의 복합체에서 다른 리간드(예를 들어, 내인성 리간드)의 하나의 리간드(예를 들어, 비-내인성 리간드)에 의한 치환 반응에 대한 평형 상수인 선택성 계수를 사용하여 측정될 수 있다. 선택성 계수가 클수록, 경쟁 리간드(예를 들어, 내인성 리간드)가 기질(예를 들어, 변형된 ER-LBD)과 형성된 복합체로부터 초기 리간드(예를 들어, 비-내인성 리간드)를 더 많이 치환할 것이다. 일부 구현예에서, 내인성 리간드의 존재 시의 전사 조절과 비교했을 때, 비-내인성 리간드의 존재 시 키메라 전사 인자의 전사 조절의 개선에 의해 더 큰 선택성이 입증된다. 일부 구현예에서, 형질도입 검정의 형질감염에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자는 (리포터에 대해 양성인 세포의 %로 측정했을 때, 또는 기하학적 평균 형광 강도에 의해 측정했을 때) 비-내인성 리간드(예를 들어, 4-OHT)에 반응하여 키메라 전사 인자 반응 프로모터의 조절 하에 리포터의 발현을 동일한 조건 하에 내인성 리간드에 대한 리포터의 발현과 비교하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35% 더 크게 유도할 수 있다.
일부 양태에서, 리간드 결합 잔기에 대한 하나 이상의 아미노산 치환은 나선 12 내에서 하나 이상의 아미노산 치환을 포함한다. ER-LBD의 나선 12는 서열번호 1의 잔기 위치 533~547을 포함한다. 일부 구현예에서, 나선 12 내의 하나 이상의 아미노산 치환은 538, 536, 539, 540, 547, 534, 533, 및 537로부터 선택된 하나 이상의 위치에 존재한다.
"비-내인성 리간드"는, 예를 들어, 에스트로겐 수용체를 발현하는 유기체에 의해 자연적으로 발현되지 않는 합성 에스트로겐 수용체 결합 리간드를 지칭할 수 있다. 비-내인성 에스트로겐 수용체 결합 리간드는 타목시펜 및 이의 대사산물, 예컨대 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜을 포함하지만, 이에 한정되지 않는다.
하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로부터 선택된 서열번호 1의 하나 이상의 위치에 존재한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 위에 열거된 위치 중 하나, 위에 열거된 위치 중 2개, 위에 열거된 위치 중 3개, 위에 열거된 위치 중 4개, 또는 위에 열거된 위치 중 5개에서의 치환을 포함한다.
일부 양태에서, 하나 이상의 추가 아미노산 치환은 하나 이상의 표 1에 열거된 치환으로부터 선택된다.
아미노산 치환 | |||||
M343I | L349I | L384M | N413D | L428F | L525S |
M343L | L349M | L384V | Q414E | M517A | Y526L |
M343V | L349V | L384F | C417S | G521A | S527N |
M343F | L349F | I386V | V418I | G521I | M528I |
G344M | A350L | L387I | V418L | G521L | M528V |
L345S | A350M | L387M | V418M | G521M | M528F |
L346I | A350V | L387V | V418F | G521V | V533F |
L346M | A350F | L387F | G420I | G521F | V533W |
L346V | A350I | M388I | G420M | M522I | V534R |
L346F | D351I | M388L | G420V | M522L | V534Q |
T347I | D351L | M388F | G420F | M522V | L536F |
T347L | D351M | I389M | M421I | H524A | L536M |
T347M | D351N | L391I | M421L | H524I | L536Y |
T347N | D351V | L391M | M421V | H524L | Y537E |
T347R | D351E | L391V | M421F | H524V | D538K |
T347V | D351F | L391F | V422I | H524F | L539R |
T347D | D351Q | V392M | I424L | L525I | L539A |
T347E | R352K | F404I | I424M | L525M | L540A |
T347F | L354I | F404L | I424V | L525N | L540F |
T347K | L354M | F404M | I424F | L525T | H547A |
T347Q | L354V | F404V | L428I | L525V | |
T347S | L354F | N407D | L428M | L525F | |
N348K | L384I | L409V | L428V | L525Q |
일부 양태에서, 하나 이상의 추가 돌연변이는 적어도 2개의 돌연변이, 적어도 3개의 돌연변이, 적어도 4개의 돌연변이, 적어도 5개의 돌연변이, 적어도 6개의 돌연변이, 적어도 7개의 돌연변이, 또는 적어도 8개의 돌연변이를 포함한다. 일부 양태에서, 하나 이상의 추가 돌연변이는 2개 내지 10개의 돌연변이, 2개 내지 9개의 돌연변이, 2개 내지 8개의 돌연변이, 2개 내지 7개의 돌연변이, 2개 내지 6개의 돌연변이, 2개 내지 5개의 돌연변이, 2개 내지 4개의 돌연변이, 2개 내지 3개의 돌연변이, 3개 내지 10개의 돌연변이, 3개 내지 9개의 돌연변이, 3개 내지 8개의 돌연변이, 3개 내지 7개의 돌연변이, 3개 내지 6개의 돌연변이, 3개 내지 5개의 돌연변이, 3개 내지 4개의 돌연변이, 4개 내지 10개의 돌연변이, 4개 내지 9개의 돌연변이, 4개 내지 8개의 돌연변이, 4개 내지 7개의 돌연변이, 4개 내지 6개의 돌연변이, 4개 내지 5개의 돌연변이, 5개 내지 10개의 돌연변이, 5개 내지 9개의 돌연변이, 5개 내지 8개의 돌연변이, 5개 내지 7개의 돌연변이, 5개 내지 6개의 돌연변이, 6개 내지 10개의 돌연변이, 6개 내지 9개의 돌연변이, 6개 내지 8개의 돌연변이, 6개 내지 7개의 돌연변이, 7개 내지 10개의 돌연변이, 7개 내지 9개의 돌연변이, 7개 내지 8개의 돌연변이, 8개 내지 10개의 돌연변이, 8개 내지 9개의 돌연변이, 또는 9 내지 10개의 돌연변이를 포함한다.
일부 양태에서, 하나 이상의 추가 돌연변이는 표 2에 열거된 돌연변이로부터 선택되는 적어도 2개의 돌연변이를 포함한다.
조합 아미노산 치환 | |
L345S_N348K | L384M_L391F |
L384M_I389M | L354I_L384M |
M421I_V392M | L354I_L384M_L391F |
L354I_L391F | L354I_L384M_L391F_V418I |
L354I_L387M | M343I_M388I_G521I_F404L |
L387M_L391F | H524V_T347R_D351Q_L525N |
L384M_L387M | L354I_L384M_L391F_V418I |
Q414E_S463P_H524L | L354I_L384M_L391V_S463P |
L384M_L391V_N413D_H524F | L384M_ L409V_N413D_S463P_H524L |
L391V_N413D_Q414E_S463P_H524F | L391V_Q414E_M421L_S463P_H524F |
L354I_L409V_N413D_M421L_H524L | L354I_L409V_M421L_S463P_H524L |
L384M_L391V_N413D_M421L_S463P_ H524L | L409V_N413D_Q414E_M421L_S463P_ H524L |
L354I_L391V_L409V_N413D_Q414E_ H524L | L354I_L384M_L409V_N413D_M421L_ S463P_H524F |
L354I_L391V_N413D_M421L_S463P_ M517A_H524L | L354I_L391V_N413D_Q414E_M421L_ M517A_H524F |
L384M_L391V_L409V_N413D_M421L_ S463P_M517A_H524F |
일부 구현예에서, 본원에 기술된 변형된 ER-LBD와 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 갖는 변형된 ER-LBD 변이체가 본원에 제공되되, 단, 변이체는G400V/MS43A/L544A 삼중 아미노산 치환 또는 G400V/M543A/L544A/V595A 사중 아미노산 치환을 포함하고, 비-내인성 리간드에 대해 더 큰 민감도 및/또는 더 큰 선택성을 부여하는 하나 이상의 추가 아미노산 치환을 가진다(예를 들어, 표 1 및 표 2에 도시된 아미노산 치환 중 하나 이상).
키메라 단백질
일부 양태에서, 본 개시는 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질을 제공한다. 변형된 ER-LBD는 비-내인성 리간드에 결합할 때 핵 국소화가 가능하다. 따라서, 변형된 ER-LBD를 관심 폴리펩티드에 융합하면 관심 폴리펩티드의 세포 국소화를 조절할 수 있다.
일부 구현예에서, 관심 폴리펩티드는 링커를 포함한다. 하나 이상의 링커는 키메라 단백질의 다양한 도메인 사이에, 예컨대 ER-LBD와 관심 폴리펩티드 사이에 사용될 수 있다. 예를 들어, 폴리펩티드 링커는 아미노산 서열, 예컨대, GGGGSGGGGSGGGGSVDGF(서열번호 4) 및 ASGGGGSAS(서열번호 5) 중 하나 이상의 아미노산 서열을 포함할 수 있다.
일부 구현예에서, 관심 폴리펩티드는 적어도 하나의 핵산 결합 도메인을 포함한다. 일부 구현예에서, 핵산 결합 도메인은 징크-핑거 도메인이다. 일부 구현예에서, 키메라 단백질은 전사 활성인자 또는 전사 억제인자와 같은 전사 조절인자를 포함한다. 핵산 결합 도메인을 포함하면 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)에 의해 유도 가능한, 키메라 단백질에 의한 표적화된 핵산 결합을 허용할 수 있다.
일부 양태에서, 핵산 결합 도메인은 DNA 결합 징크 핑거 단백질 도메인(ZF 단백질 도메인)을 포함한다. 일부 양태에서, ZF 단백질 도메인은 설계상 모듈식이며, 징크 핑거 어레이(ZFA)로 구성된다. 일부 양태에서, 전사 효과기 도메인은 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피로 이루어진 활성화 도메인, VP64 활성화 도메인; NFκB의 p65 활성화 도메인; 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 인간 E1A-연관 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인(p300 HAT 코어 활성화 도메인); 크루펠 연관 박스(KRAB) 억제 도메인; 억제 요소 침묵화 전사 인자(REST) 억제 도메인; 터럭 관련 염기성 나선-루프-나선 억제 단백질의 WRPW 모티프(서열번호 82), 모티프는 WRPW(서열번호 82) 억제 도메인으로 알려져 있음; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 억제 도메인; 및 HP1 알파 크로모섀도우 억제 도메인으로부터 선택된다.
일부 구현예에서, ZF 단백질 도메인은 설계 상 모듈식이고 징크 핑거 어레이 (ZFA)로 구성된다. 징크 핑거 어레이는 함께 연결된 다수의 징크 핑거 단백질 모티프를 포함한다. 각각의 징크 핑거 모티프는 상이한 핵산 모티프에 결합한다. 이는 임의의 원하는 핵산 서열에 특이성을 갖는 ZFA를 생성한다. ZF 모티프는 서로 직접 인접하거나, 유연한 링커 서열에 의해 분리될 수 있다. 일부 구현예에서, ZFA는 탠덤 배열된 ZF 모티프의 어레이, 스트링 또는 사슬이다. ZFA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,1 3, 14, 또는 15개의 징크 핑거 모티프를 가질 수 있다. ZFA는 1~10, 1~15, 1~2, 1~3, 1~4, 1~5, 1~6, 1~7, 1~8, 1~9, 2~3, 2~4, 2~5, 2~6, 2~7, 2~8, 2~9, 2~10, 3~4, 3~5 3~6, 3~7, 3~8, 3~9, 3~10, 4~5, 4~6, 4~7, 4~8, 4~9, 4~10, 5~6, 5~7, 5~8, 5~9, 5~10, 또는 5~15개의 징크 핑거 모티프를 가질 수 있다.
ZF 단백질 도메인은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 또는 그 이상의 ZFA를 가질 수 있다. ZF 도메인은 1~10, 1~15, 1~2, 1~3, 1~4, 1~5, 1~6, 1~7, 1~8, 1~9, 2~3, 2~4, 2~5, 2~6, 2~7, 2~8, 2~9, 2~10, 3~4, 3~5 3~6, 3~7, 3~8, 3~9, 3~10, 4~5, 4~6, 4~7, 4~8, 4~9, 4~10, 5~6, 5~7, 5~8, 5~9, 5~10, 또는 5~15개의 ZFA를 가질 수 있다. 일부 구현예에서, ZF 단백질 도메인은 1 내지 10개의 ZFA(들)를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 하나의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 2개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 3개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 4개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 5개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 10개의 ZFA를 포함한다.
예시적인 ZF 단백질 도메인은 서열 SRPGERPFQCRICMRNFSRRHGLDRHTRTHTGEKPFQCRICMRNFSDHSSLKRHLRTHTGSQKPFQCRICMRNFSVRHNLTRHLRTHTGEKPFQCRICMRNFSDHSNLSRHLKTHTGSQKPFQCRICMRNFSQRSSLVRHLRTHTGEKPFQCRICMRNFSESGHLKRHLRTHLRGS(서열번호 6)에 도시된다. 일부 구현예에서, ZF 단백질 도메인은 ZF5-7 DNA 결합 도메인이다. 예시적인 ZF5-7 DNA 결합 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)에 도시되어 있다.
일부 구현예에서, 키메라 단백질은 키메라 전사 인자이며, 변형된 ER-LBD 이외에, 핵산 결합 도메인 및 전사 조절인자 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인 및 전사 조절인자 도메인은 동일한 자연 발생 단백질의 일부이다. 일부 양태에서, 핵산 결합 도메인 및 전사 조절인자 도메인은 이종이고 자연적으로 동일한 단백질 내에 존재하지 않는다.
본원에서 사용되는 "전사 조절인자 도메인"은 (예를 들어, 관심 프로모터에 특이적으로 결합하는 핵산 결합 도메인에 의해) 유전자의 프로모터 영역에 표적화될 때 유전자의 전사를 조절할 수 있는 폴리펩티드 도메인을 지칭한다. 일부 양태에서, 전사 조절자 도메인은 전사 억제인자 도메인을 포함한다. 일부 양태에서, 전사 억제인자 도메인은 크루펠 연관 박스(KRAB) 억제 도메인; 억제 요소 침묵화 전사 인자(REST) 억제 도메인; 터럭 관련 염기성 나선-루프-나선 억제인자 단백질의 WRPW 모티프(서열번호 82), 모티프는 WRPW(서열번호 82) 억제 도메인으로 알려짐; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 억제 도메인; 및 HP1 알파 크로모새도우 억제 도메인으로부터 선택된다.
일부 양태에서, 전사 조절인자 도메인은 전사 활성인자 도메인을 포함한다. 일부 양태에서, 전사 활성인자 도메인은, 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(즉, p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된다. 일부 양태에서, 전사 조절인자 도메인은 p65 전사 활성인자 도메인을 포함한다. 일부 양태에서, p65 전사 활성인자는 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함한다.
유전자 스위치
또한, 전사를 조절하기 위한 유전자 스위치가 본원에 제공된다. 유전자 스위치는 (a) 변형된 ER-LBD를 포함하고 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성 프로모터(CTF-반응성 프로모터)에 결합할 수 있는 키메라 전사 인자, 및 (b) 키메라 단백질의 변형된 ER-LBD에 결합하는 비-내인성 리간드를 포함할 수 있다. 변형된 ER-LBD에 대한 비-내인성 리간드의 결합 시, 키메라 단백질은 관심 유전자의 전사를 조절할 수 있다.
일부 구현예에서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화한다. 일부 구현예에서, 관심 유전자는 사이토카인을 암호화한다. 일부 양태에서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화한다: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파. 일부 구현예에서, 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화한다.
일부 구현예에서, 비-내인성 리간드는 4-하이드록시-타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로부터 선택된다.
특정 구현예에서, 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT, 또한 아피목시펜으로 지칭됨)이다.
특정 구현예에서, 비-내인성 리간드는 엔독시펜이다.
단리된 폴리뉴클레오티드 분자 및 이종 작제물
또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드 분자 및 이종 작제물이 본원에 제공된다. 일부 양태에서, 본 개시는 본원에 기술된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자를 제공한다. 일부 양태에서, 본 개시는 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물을 제공한다.
일부 양태에서, 본 개시는 표적 유전자 발현 카세트를 포함하는 단리된 폴리뉴클레오티드 및/또는 이종 작제물을 추가로 제공한다.
"단리된" 핵산 분자 또는 폴리뉴클레오티드는 그의 고유 환경으로부터 제거된 DNA 또는 RNA와 같은 핵산 분자를 지칭한다. 예를 들어, 이종 작제물에 함유된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드는 단리된 것으로 간주된다. 단리된 폴리뉴클레오티드의 추가 예시는 이종 숙주 세포에서 유지되는 재조합 폴리뉴클레오티드 또는 용액 중 (부분적으로 또는 실질적으로) 정제된 폴리뉴클레오티드를 포함한다. 단리된 폴리뉴클레오티드는 또한 일반적으로 폴리뉴클레오티드 분자를 함유하는 세포에 함유된 폴리뉴클레오티드 분자를 포함하지만, 폴리뉴클레오티드 분자는 염색체외 또는 그의 자연적인 염색체 위치와 상이한 염색체 위치에 존재한다.
단리된 폴리뉴클레오티드 분자는 cDNA 폴리뉴클레오티드, RNA 폴리뉴클레오티드, RNAi 올리고뉴클레오티드(예를 들어, siRNA, miRNA, 안티센스 올리고뉴클레오티드, shRNA 등), mRNA 폴리뉴클레오티드, 원형 플라스미드, 선형 DNA 단편, 벡터, 미니서클, ssDNA, 박테리아 인공 염색체(BAC), 및 효모 인공 염색체(YAC), 및 올리고뉴클레오티드를 포함하지만, 이들로 한정되지는 않는다.
일부 구현예에서, 단리된 폴리뉴클레오티드는 DNA, cDNA, RNA, mRNA, 및 네이키드 플라스미드(선형 또는 환형)로부터 선택된다.
본 발명의 기준 뉴클레오티드 서열과 적어도, 예를 들어, 95% "동일한" 뉴클레오티드 서열을 갖는 핵산 또는 폴리뉴클레오티드는 폴리뉴클레오티드 서열이 기준 뉴클레오티드 서열의 각각의 100개 뉴클레오티드 당 최대 5개의 점 돌연변이를 포함할 수 있다는 점을 제외하고는 폴리뉴클레오티드의 뉴클레오티드 서열과 기준 서열이 동일하다는 것을 의도한다. 즉, 기준 뉴클레오티드 서열과 적어도 95% 동일한 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 수득하기 위해, 기준 서열 내의 뉴클레오티드의 최대 5%가 결실되거나 다른 뉴클레오티드로 치환될 수 있거나, 기준 서열 내의 총 뉴클레오티드의 최대 5%인 수의 뉴클레오티드가 기준 서열에 삽입될 수 있다. 기준 서열의 이러한 변경은 기준 뉴클레오티드 서열의 5' 또는 3' 말단 위치에서 또는 이들 말단 위치 사이의 어느 곳에서나 발생할 수 있으며, 이는 기준 서열 내의 잔기들 사이에 개별적으로 또는 기준 서열 내의 하나 이상의 연속된 그룹에 산재된다. 실제로, 임의의 특정 폴리뉴클레오티드 서열이 본 발명의 뉴클레오티드 서열과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한지 여부는 종래의 공지된 컴퓨터 프로그램을 사용하여 결정될 수 있다.
일부 양태에서, 폴리뉴클레오티드 분자에 의해 암호화된 키메라 단백질은 키메라 전사 인자이고, 폴리뉴클레오티드 분자는 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 작동 가능하게 연결된 관심 유전자를 포함하는 표적 발현 카세트를 추가로 포함한다. 일부 구현예에서, 표적 발현 카세트는 키메라 단백질과 동일한 이종 작제물에 존재한다. 일부 구현예에서, 키메라 단백질 및 표적 발현 카세트는 별도의 이종 작제물에 존재한다.
용어 "발현 카세트"는 표적 세포에서 특정 폴리뉴클레오티드의 전사를 허용하는 일련의 핵산 요소를 갖는 재조합적으로 또는 합성적으로 생성된 폴리뉴클레오티드를 지칭한다. 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소 DNA, 바이러스, 또는 핵산 단편에 혼입될 수 있다. 통상적으로, 발현 벡터의 발현 카세트 부분은, 다른 서열 중에서, 전사될 핵산 서열 및 프로모터를 포함한다. 일부 양태에서, 본 개시는 변형된 ER-LBD를 암호화하는 폴리뉴클레오티드 또는 변형된 ER-LBD를 포함하는 키메라 단백질을 포함하는 발현 카세트를 제공한다.
본원에 기술된 바와 같은 변형된 ER-LBD를 포함하는 단리된 폴리뉴클레오티드 분자 및 이종 작제물은 조작된 폴리뉴클레오티드 분자이다. "조작된 폴리뉴클레오티드"는 자연에서 발생하지 않는 폴리뉴클레오티드이다. 그러나, 조작된 폴리뉴클레오티드는 그 전체가 자연적으로 발생하지 않지만, 자연적으로 발생하는 뉴클레오티드 서열을 포함할 수 있음을 이해해야 한다. 일부 구현예에서, 조작된 폴리뉴클레오티드는 상이한 유기체(예를 들어, 상이한 종)로부터의 뉴클레오티드 서열을 포함한다. 예를 들어, 일부 구현예에서, 조작된 폴리뉴클레오티드는 쥣과 뉴클레오티드 서열, 박테리아 뉴클레오티드 서열, 인간 뉴클레오티드 서열 및/또는 바이러스 뉴클레오티드 서열을 포함한다. 용어 "조작된 폴리뉴클레오티드"는 재조합 핵산 및 합성 핵산을 포함한다. "재조합 폴리뉴클레오티드"는 뉴클레오티드 분자를 연결함으로써 구성되고, 일부 구현예에서, 살아있는 세포에서 복제될 수 있는 분자를 지칭한다. "합성 폴리뉴클레오티드"는 증폭되거나 화학적으로, 또는 다른 수단에 의해 합성된 분자를 지칭한다. 합성 폴리뉴클레오티드는 화학적으로 변형되거나 아니면 변형되지만 자연적으로 발생하는 뉴클레오티드 분자와 염기쌍을 이룰 수 있는 것들을 포함한다. 변형은 하나 이상의 변형된 뉴클레오티드 간 결합 및 비-자연 핵산을 포함하지만, 이에 한정되지 않는다. 변형은 미국 특허 제6,673,611호 및 미국 특허 출원 공개 제2004/0019001호에 더욱 상세히 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 통합된다. 변형된 뉴클레오티드간 결합은 포스포로디티오에이트 또는 포스포로티오에이트 결합일 수 있다. 비-천연 핵산은 잠금 핵산(LNA), 펩티드 핵산(PNA), 글리콜 핵산(GNA), 포스포로디아미데이트 모르폴리노 올리고머(PMO 또는 "모르폴리노"), 및 트레오스 핵산(TNA)일 수 있다. 비-천연 핵산은 국제 출원 WO 제1998/039352호, 미국 출원 공개 제2013/0156849호, 및 미국 특허 제6,670,461호; 제5,539,082호; 제5,185,444호에 더욱 상세히 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 포함된다. 재조합 폴리뉴클레오티드 및 합성 폴리뉴클레오티드는 또한 전술한 것 중 하나의 복제로부터 생성된 이들 분자를 포함한다. 본 개시의 조작된 폴리뉴클레오티드는 단일 분자(예를 들어, 동일한 플라스미드 또는 다른 벡터에 포함됨)에 의해 또는 다수의 상이한 분자(예를 들어, 다수의 상이한 독립적으로 복제하는 분자)에 의해 암호화될 수 있다.
본 개시의 조작된 폴리뉴클레오티드는 표준 분자 생물학 방법을 사용하여 제조될 수 있다(예를 들어, 문헌[Green and Sambrook, Molecular Cloning, A Laboratory Manual, 2012, Cold Spring Harbor Press] 참고). 일부 구현예에서, 조작된 핵산 작제물은 GIBSON ASSEMBLY® 클로닝(예를 들어, 각각이 참조로서 본원에 통합되는, Gibson, D.G.등의 문헌[Nature Methods, 343-345, 2009]; 및 Gibson, D.G.등의 문헌[Nature Methods, 901-903, 2010] 참고)을 사용하여 생산된다. GIBSON ASSEMBLY®는 통상적으로 단일-튜브 반응에서 다음의 3 가지 효소적 활성을 사용한다: 5' 엑소뉴클레아제, DNA 중합효소의 'Y 연장 활성 및 DNA 리가아제 활성. 5' 엑소뉴클레아제 활성은 5' 말단 서열을 다시 츄잉하고 어닐링을 위한 상보적 서열을 노출시킨다. 그런 다음, 중합효소 활성은 어닐링된 영역 상의 갭을 충진한다. 이어서, DNA 리가아제는 닉을 밀봉하고 DNA 단편을 함께 공유적으로 연결한다. 인접한 단편의 오버랩 서열은 골든게이트 어셈블리에 사용된 것보다 훨씬 길어, 더 높은 백분율로 올바른 조립을 생성한다. 일부 구현예에서, 조작된 핵산 작제물은 IN-FUSION® 클로닝(Clontech)을 사용하여 생산된다.
일부 구현예에서, 본원에 기술된 폴리뉴클레오티드 분자는 이종 작제물에 포함된다. 용어 "벡터" 또는 "발현 벡터"는 "이종 작제물"과 동의어이며, 표적 세포에서 작제물과 작동 가능하게 연관된 하나 이상의 유전자의 발현을 도입하고 유도하는 데 사용되는 폴리뉴클레오티드 분자를 지칭한다. 이러한 용어는 자가-복제 핵산 구조로서의 작제물뿐만 아니라 그것이 도입된 숙주 세포의 게놈에 혼입된 벡터를 포함한다. 본원에 기술된 바와 같은 이종 작제물은 발현 카세트를 포함한다. 일부 양태에서, 변형된 ER-LBD 또는 변형된 ER-LBD를 포함하는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함하는 이종 작제물이 본원에 제공된다.
본원에서 사용되는 바와 같이, "프로모터"는 나머지 핵산 서열의 전사의 개시 및 속도가 조절되는 핵산 서열의 조절 영역을 지칭한다. 프로모터는 또한 RNA 폴리머라제 및 다른 전사 인자와 같은 조절 단백질 및 분자가 결합할 수 있는 하위 영역을 포함할 수 있다. 프로모터는 구성적, 유도성, 억제성, 조직-특이적 또는 이들의 임의의 조합일 수 있다. 프로모터는 프로모터가 조절하는 핵산 서열의 발현을 유도하거나 전사를 유도한다. 여기에서, 프로모터는 그것이 그 서열의 전사 개시 및/또는 발현을 제어("구동")하기 위해 조절하는 핵산 서열에 대하여 정확한 기능적 위치 및 방향에 있을 때 "작동 가능하게 연결된" 것으로 간주된다.
프로모터는, 주어진 유전자 또는 서열의 코딩 분절의 상류에 위치한 5' 비코딩 서열을 단리함으로써 수득될 수 있는 바와 같은, 유전자 또는 서열과 자연적으로 연관된 것일 수 있다. 이러한 프로모터는 "내인성"으로 지칭될 수 있다. 일부 구현예에서, 코딩 핵산 서열은, 이것의 자연적인 환경에서 암호화된 서열과 일반적으로 연관되지 않은 프로모터를 지칭하는, 재조합 또는 이종 프로모터의 조절 하에 위치될 수 있다. 이러한 프로모터는 다른 유전자의 프로모터; 임의의 다른 세포로부터 단리된 프로모터; 및 예를 들어, 당업계에 공지된 유전 공학 방법을 통해 발현을 변경하는 상이한 전사 조절 영역 및/또는 돌연변이의 상이한 요소를 함유하는 것들과 같은 "자연 발생"이 아닌 합성 프로모터 또는 인핸서를 포함할 수 있다. 프로모터 및 인핸서의 핵산 서열을 합성적으로 생성하는 것 외에, 서열은 중합효소 연쇄 반응(PCR)을 포함하는 재조합 클로닝 및/또는 핵산 증폭 기술을 사용하여 생성될 수 있다(예를 들어, 미국 특허 제4,683,202호 및 미국 특허 제5,928,906호 참조).
본원에서 사용되는 바와 같이, "유도성 프로모터"는 신호의 존재 하에 또는 신호에 의해 영향을 받거나 신호와 접촉될 때 전사 활성을 조절(예를 들어, 개시 또는 활성화)하는 것을 특징으로 하는 프로모터를 지칭한다. 신호는 유도성 프로모터로부터 전사 활성을 조절하는 데에 있어 활성이 되는 방식으로 유도성 프로모터와 접촉하는 내인성 또는 보통 외인성 조건(예를 들어, 광), 화합물(예를 들어, 화학적 또는 비-화학적 화합물) 또는 단백질(예를 들어, 본원에 기재된 바와 같은 키메라 전사 인자)일 수 있다. 전사의 활성화는 전사를 구동하기 위해 프로모터에 직접적으로 작용하는 것 또는 프로모터가 전사를 구동하는 것을 방지하는 억제인자를 불활성화시킴으로써 프로모터에 간접적으로 작용하는 것을 포함할 수 있다. 반대로, 전사의 비활성화는 프로모터에 직접적으로 작용하여 전사를 방지하거나 후에 프로모터에 작용하는 억제인자를 활성화시킴으로써 프로모터에 간접적으로 작용하는 것을 포함할 수 있다.
본원에서 사용되는 바와 같이, 프로모터는 해당 상태 또는 신호의 존재 하에 프로모터로부터의 전사가 활성화, 비활성화, 증가 또는 감소되는 경우 국소 종양 상태(예를 들어, 염증 또는 저산소증) 또는 신호에 "반응성"이거나 "이에 의해 조절"된다. 일부 구현예에서, 프로모터는 반응 요소를 포함한다. "반응 요소"는 프로모터로부터 유전자 발현을 조정(조절)하는 특이적 분자(예를 들어, 전사 인자)에 결합하는 프로모터 영역 내의 짧은 DNA 서열이다. 본 개시에 따라 사용될 수 있는 반응 요소는, 비제한적으로, 플로레틴-조정가능한 조절 요소(PEACE), 징크-핑거 DNA 결합 도메인(DBD), 인터페론-감마-활성화 서열(GAS)(참조로서 본원에 통합된, Decker, T.등의 문헌[J Interferon Cytokine Res. 1997 Mar;17(3):121-34]), 인터페론-자극 반응 요소(ISRE)(참조로서 본원에 통합된, Han, K. J.등의 문헌[J Biol Chem. 2004 Apr 9;279(15):15652-61]), NF-카파B 반응 요소(참조로서 본원에 통합된, Wang, V.등의 문헌[Cell Reports. 2012; 2(4): 824-839]), 및 STAT3 반응 요소(참조로서 본원에 통합된, Zhang, D.등의 문헌[J of Biol Chem. 1996; 271: 9503-9509])를 포함한다. 다른 반응 요소가 본원에 포괄된다. 반응 요소는 또한 탠덤 반복체(예를 들어, 반응 요소를 암호화하는 동일한 뉴클레오티드 서열의 연속 반복체)를 함유하여 일반적으로 이의 동족 결합 분자에 대한 반응 요소의 민감도를 증가시킬 수 있다. 탠덤 반복체는 존재하는 반복의 수를 나타내기 위해 2X, 3X, 4X, 5X 등으로 표시될 수 있다.
반응성 프로모터("유도성 프로모터"라고도 함)(예를 들어, TGF-베타 반응성 프로모터)의 비제한적 예는 표 3에 나열되어 있고, 이는 프로모터 및 전사 인자의 설계 뿐만 아니라 전사 인자(TF) 및 이식유전자 전사(T)에 대한 유도 분자의 효과를 보여준다(B, 결합; D, 해리; n.d., 결정되지 않음)(A, 활성화; DA, 비활성화; DR, 탈억제)(Horner, M. & Weber, W.의 문헌[FEBS Letters 586 (2012) 20784-2096m], 및 문헌에 인용된 참고 문헌 참조). 유도성 프로모터의 구성요소의 비제한적인 예는 표 4에 나타낸 것을 포함한다.
시스템 | 프로모터 및 작동인자 | 전사 인자(TF) | 유도 분자 | 유도인자에 대한 반응 | |
TF | T | ||||
전사 활성인자-반응성 프로모터 | |||||
AIR | PAIR(OalcA-PhCMVmin) | AlcR | 아세트알데하이드 | n.d. | A |
ART | PART(OARG-PhCMVmin) | ArgR-VP16 | l-아르기닌 | B | A |
BIT | PBIT3(OBirA3-PhCMVmin) | BIT(BirA-VP16) | 비오틴 | B | A |
큐메이트 - 활성인자 | PCR5(OCuO6-PhCMVmin) | cTA(CymR-VP16) | 큐메이트 | D | DA |
큐메이트 - 역활성인자 | PCR5(OCuO6-PhCMVmin) | rcTA(rCymR-VP16) | 큐메이트 | B | A |
E-오프 | PETR(OETR-PhCMVmin) | ET(E-VP16) | 에리트로마이신 | D | DA |
NICE-오프 | PNIC(ONIC-PhCMVmin) | NT(HdnoR-VP16) | 6-하이드록시-니코틴 | D | DA |
PEACE | PTtgR1(OTtgR-PhCMVmin) | TtgA1(TtgR-VP16) | 플로레틴 | D | DA |
PIP-오프 | PPIR (OPIR-Phsp70min) | PIT(PIP-VP16) | 프리스티나마이신 I | D | DA |
QuoRex | PSCA(OscbR-PhCMVmin)PSPA (OpapRI-PhCMVmin) | SCA(ScbR-VP16) | SCB1 | D | DA |
Redox | PROP(OROP-PhCMVmin) | REDOX(REX-VP16) | NADH | D | DA |
TET-오프 | PhCMV*-1 (OtetO7-PhCMVmin) | tTA(TetR-VP16) | 테트라사이클린 | D | DA |
TET-온 | PhCMV*-1 (OtetO7-PhCMVmin) | rtTA(rTetR-VP16) | 독시사이클린 | B | A |
TIGR | PCTA(OrheO-PhCMVmin) | CTA(RheA-VP16) | 열 | D | DA |
TraR | O7x(tra box)-PhCMVmin | p65-TraR | 3-Oxo-C8-HSL | B | A |
VAC-오프 | P1VanO2(OVanO2-PhCMVmin) | VanA1(VanR-VP16) | 바닐산 | D | DA |
전사 억제 인자-반응성 프로모터 | |||||
큐메이트 - 억제 인자 | PCuO(PCMV5-OCuO) | CymR | 큐메이트 | D | DR |
E-온 | PETRON8(PSV40-OETR8) | E-KRAB | 에리트로마이신 | D | DR |
NICE-온 | PNIC(PSV40-ONIC8) | NS(HdnoR-KRAB) | 6-하이드록시-니코틴 | D | DR |
PIP-온 | PPIRON(PSV40-OPIR3) | PIT3(PIP-KRAB) | 프리스티나마이신 I | D | DR |
Q-온 | PSCAON8(PSV40-OscbR8) | SCS(ScbR-KRAB) | SCB1 | D | DR |
TET-온<컴마> 억제인자 기반 | OtetO-PHPRT | tTS-H4(TetR-HDAC4) | 독시사이클린 | D | DR |
T-REX | PTetO(PhCMV-OtetO2) | TetR | 테트라사이클린 | D | DR |
UREX | PUREX8(PSV40-OhucO8) | mUTS(KRAB-HucR) | 요산 | D | DR |
VAC-온 | PVanON8(PhCMV-OVanO8) | VanA4(VanR-KRAB) | 바닐산 | D | DR |
하이브리드 프로모터 | |||||
QuoRexPIP-온(IF 게이트 아님) | OscbR8-OPIR3-PhCMVmin | SCAPIT3 | SCB1프리스티나마이신 I | DD | DADR |
QuoRexE-온(IF 게이트 아님) | OscbR-OETR8-PhCMVmin | SCAE-KRAB | SCB1에리트로마이신 | DD | DADR |
TET-오프E-온(IF 게이트 아님) | OtetO7-OETR8-PhCMVmin | tTAE-KRAB | 테트라사이클린에리트로마이신 | DD | DADR |
TET-오프PIP-온E-온 | OtetO7-OPIR3-OETR8-PhCMVmin | tTAPIT3E-KRAB | 테트라사이클린프리스티나마이신 I에리트로마이신 | DDD | DADRDR |
명칭 | DNA 서열 | 공급원 |
최소 프로모터; minP | AGAGGGTATATAATGGAAGCTCGACTTCCAG (서열번호 7) | EU581860.1 (프로메가) |
NFkB 반응 요소 단백질 프로모터; 5x NFkB-RE | GGGAATTTCCGGGGACTTTCCGGGAATTTCCGGGGACTTTCCGGGAATTTCC(서열번호 8) | EU581860.1(프로메가) |
CREB 반응 요소 단백질 프로모터; 4x CRE | CACCAGACAGTGACGTCAGCTGCCAGATCCCATGGCCGTCATACTGTGACGTCTTTCAGACACCCCATTGACGTCAATGGGAGAA(서열번호 9) | DQ904461.1(프로메가) |
NFAT 반응 요소 단백질 프로모터; 3x NFAT 결합 부위 | GGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGT (서열번호 10) | DQ904462.1(프로메가) |
SRF 반응 요소 단백질 프로모터; 5x SRE | AGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCT (서열번호 11) | FJ773212.1(프로메가) |
SRF 반응 요소 단백질 프로모터 2; 5x SRF-RE | AGTATGTCCATATTAGGACATCTACCATGTCCATATTAGGACATCTACTATGTCCATATTAGGACATCTTGTATGTCCATATTAGGACATCTAAAATGTCCATATTAGGACATCT (서열번호 12) | FJ773213.1(프로메가) |
AP1 반응 요소 단백질 프로모터; 6x AP1-RE | TGAGTCAGTGACTCAGTGAGTCAGTGACTCAGTGAGTCAGTGACTCAG (서열번호 13) | JQ858516.1(프로메가) |
TCF-LEF 반응 요소 프로모터; 8x TCF-LEF-RE | AGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGTATAAGATCAAAGGGCCTAAGATCAAAGGGACTAAGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGCCTA (서열번호 14) | JX099537.1(프로메가) |
SBEx4 | GTCTAGACGTCTAGACGTCTAGACGTCTAGAC (서열번호 15) | Addgene 카탈로그 번호: 16495 |
SMAD2/3 - CAGACA x4 | CAGACACAGACACAGACACAGACA (서열번호 16) | Jonk 등 (J Biol Chem. 1998 Aug 14;273(33):21145-52. |
STAT3 결합 부위 | Ggatccggtactcgagatctgcgatctaagtaagcttggcattccggtactgttggtaaagccac (서열번호 17) | Addgene 시퀀싱 결과 #211335 |
프로모터의 다른 비제한적인 예는 사이토메갈로바이러스(CMV) 프로모터, 신장 인자 1-알파(EF1a) 프로모터, 신장 인자(EFS) 프로모터, MND 프로모터(골수증식성 육종 바이러스 인핸서가 있는 변형된 MoMuLV LTR의 U3 영역을 포함하는 합성 프로모터), 포스포글리세레이트 키나아제(PGK) 프로모터, 비장 초점 형성 바이러스(SFFV) 프로모터, 원숭이 바이러스 40(SV40) 프로모터, 및 유비퀴틴 C(UbC) 프로모터를 포함한다.
일부 양태에서, 본 개시는 본원에 기재된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물을 제공한다.
일부 구현예에서, 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터는 구성적 프로모터, 유도성 프로모터, 또는 합성 프로모터이다.
일부 구현예에서, 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터는 구성적 프로모터이다. 예시적인 구성적 프로모터는 표 5에 제시되어 있다. 일부 구현예에서, 구성적 프로모터는 다음으로부터 선택된다: CMV, EFS, SFFV, SV40, MND, PGK, UbC, hEF1aV1, hCAGG, hEF1aV2, hACTb, heIF4A1, hGAPDH, hGRP78, hGRP94, hHSP70, hKINb, 및 hUBIb.
명칭 | DNA 서열 |
CMV | GTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTC (SEQ ID NO: 18) |
EF1a | GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGCCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGACCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGTCCTCGCGCCGCCGTGTATCGCCCCGCCCCGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGTCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA (서열번호 19) |
EFS | GGATCTGCGATCGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGCTGAAGCTTCGAGGGGCTCGCATCTCTCCTTCACGCGCCCGCCGCCCTACCTGAGGCCGCCATCCACGCCGGTTGAGTCGCGTTCTGCCGCCTCCCGCCTGTGGTGCCTCCTGAACTGCGTCCGCCGTCTAGGTAAGTTTAAAGCTCAGGTCGAGACCGGGCCTTTGTCCGGCGCTCCCTTGGAGCCTACCTAGACTCAGCCGGCTCTCCACGCTTTGCCTGACCCTGCTTGCTCAACTCTACGTCTTTGTTTCGTTTTCTGTTCTGCGCCGTTACAGATCCAAGCTGTGACCGGCGCCTAC (서열번호 20) |
MND | TTTATTTAGTCTCCAGAAAAAGGGGGGAATGAAAGACCCCACCTGTAGGTTTGGCAAGCTAGGATCAAGGTTAGGAACAGAGAGACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGTTGGAACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGATGGTCCCCAGATGCGGTCCCGCCCTCAGCAGTTTCTAGAGAACCATCAGATGTTTCCAGGGTGCCCCAAGGACCTGAAATGACCCTGTGCCTTATTTGAACTAACCAATCAGTTCGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTCCCCGAGCTCAATAAAAGAGCCCA (서열번호 21) |
PGK | GGGGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCGGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAG (서열번호 22) |
SFFV | GTAACGCCATTTTGCAAGGCATGGAAAAATACCAAACCAAGAATAGAGAAGTTCAGATCAAGGGCGGGTACATGAAAATAGCTAACGTTGGGCCAAACAGGATATCTGCGGTGAGCAGTTTCGGCCCCGGCCCGGGGCCAAGAACAGATGGTCACCGCAGTTTCGGCCCCGGCCCGAGGCCAAGAACAGATGGTCCCCAGATATGGCCCAACCCTCAGCAGTTTCTTAAGACCCATCAGATGTTTCCAGGCTCCCCCAAGGACCTGAAATGACCCTGCGCCTTATTTGAATTAACCAATCAGCCTGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTTCCCGAGCTCTATAAAAGAGCTCACAACCCCTCACTCGGCGCGCCAGTCCTCCGACAGACTGAGTCGCCCGGG (서열번호 23) |
SV40 | CTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCT (서열번호 24) |
UbC | GCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGGAGCGTTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTTGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCACAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTAAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGGTTTGTCGTCTGGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAAGCTTCTGCAGGTCGACTCTAGAAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGAC (서열번호 25) |
hEF1aV1 | GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGTCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA (서열번호 26) |
hCAGG | ACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGGAGTCGCTGCGACGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTC (서열번호 27) |
hEF1aV2 | GGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAG (서열번호 28) |
hACTb | CCACTAGTTCCATGTCCTTATATGGACTCATCTTTGCCTATTGCGACACACACTCAATGAACACCTACTACGCGCTGCAAAGAGCCCCGCAGGCCTGAGGTGCCCCCACCTCACCACTCTTCCTATTTTTGTGTAAAAATCCAGCTTCTTGTCACCACCTCCAAGGAGGGGGAGGAGGAGGAAGGCAGGTTCCTCTAGGCTGAGCCGAATGCCCCTCTGTGGTCCCACGCCACTGATCGCTGCATGCCCACCACCTGGGTACACACAGTCTGTGATTCCCGGAGCAGAACGGACCCTGCCCACCCGGTCTTGTGTGCTACTCAGTGGACAGACCCAAGGCAAGAAAGGGTGACAAGGACAGGGTCTTCCCAGGCTGGCTTTGAGTTCCTAGCACCGCCCCGCCCCCAATCCTCTGTGGCACATGGAGTCTTGGTCCCCAGAGTCCCCCAGCGGCCTCCAGATGGTCTGGGAGGGCAGTTCAGCTGTGGCTGCGCATAGCAGACATACAACGGACGGTGGGCCCAGACCCAGGCTGTGTAGACCCAGCCCCCCCGCCCCGCAGTGCCTAGGTCACCCACTAACGCCCCAGGCCTGGTCTTGGCTGGGCGTGACTGTTACCCTCAAAAGCAGGCAGCTCCAGGGTAAAAGGTGCCCTGCCCTGTAGAGCCCACCTTCCTTCCCAGGGCTGCGGCTGGGTAGGTTTGTAGCCTTCATCACGGGCCACCTCCAGCCACTGGACCGCTGGCCCCTGCCCTGTCCTGGGGAGTGTGGTCCTGCGACTTCTAAGTGGCCGCAAGCCACCTGACTCCCCCAACACCACACTCTACCTCTCAAGCCCAGGTCTCTCCCTAGTGACCCACCCAGCACATTTAGCTAGCTGAGCCCCACAGCCAGAGGTCCTCAGGCCCTGCTTTCAGGGCAGTTGCTCTGAAGTCGGCAAGGGGGAGTGACTGCCTGGCCACTCCATGCCCTCCAAGAGCTCCTTCTGCAGGAGCGTACAGAACCCAGGGCCCTGGCACCCGTGCAGACCCTGGCCCACCCCACCTGGGCGCTCAGTGCCCAAGAGATGTCCACACCTAGGATGTCCCGCGGTGGGTGGGGGGCCCGAGAGACGGGCAGGCCGGGGGCAGGCCTGGCCATGCGGGGCCGAACCGGGCACTGCCCAGCGTGGGGCGCGGGGGCCACGGCGCGCGCCCCCAGCCCCCGGGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACCGCGTCCGCCCCGCGAGCACAGAGCCTCGCCTTTGCCGATCCGCCGCCCGTCCACACCCGCCGCCAGGTAAGCCCGGCCAGCCGACCGGGGCAGGCGGCTCACGGCCCGGCCGCAGGCGGCCGCGGCCCCTTCGCCCGTGCAGAGCCGCCGTCTGGGCCGCAGCGGGGGGCGCATGGGGGGGGAACCGGACCGCCGTGGGGGGCGCGGGAGAAGCCCCTGGGCCTCCGGAGATGGGGGACACCCCACGCCAGTTCGGAGGCGCGAGGCCGCGCTCGGGAGGCGCGCTCCGGGGGTGCCGCTCTCGGGGCGGGGGCAACCGGCGGGGTCTTTGTCTGAGCCGGGCTCTTGCCAATGGGGATCGCAGGGTGGGCGCGGCGGAGCCCCCGCCAGGCCCGGTGGGGGCTGGGGCGCCATTGCGCGTGCGCGCTGGTCCTTTGGGCGCTAACTGCGTGCGCGCTGGGAATTGGCGCTAATTGCGCGTGCGCGCTGGGACTCAAGGCGCTAACTGCGCGTGCGTTCTGGGGCCCGGGGTGCCGCGGCCTGGGCTGGGGCGAAGGCGGGCTCGGCCGGAAGGGGTGGGGTCGCCGCGGCTCCCGGGCGCTTGCGCGCACTTCCTGCCCGAGCCGCTGGCCGCCCGAGGGTGTGGCCGCTGCGTGCGCGCGCGCCGACCCGGCGCTGTTTGAACCGGGCGGAGGCGGGGCTGGCGCCCGGTTGGGAGGGGGTTGGGGCCTGGCTTCCTGCCGCGCGCCGCGGGGACGCCTCCGACCAGTGTTTGCCTTTTATGGTAATAACGCGGCCGGCCCGGCTTCCTTTGTCCCCAATCTGGGCGCGCGCCGGCGCCCCCTGGCGGCCTAAGGACTCGGCGCGCCGGAAGTGGCCAGGGCGGGGGCGACCTCGGCTCACAGCGCGCCCGGCTAT (서열번호 29) |
heIF4A1 | GTTGATTTCCTTCATCCCTGGCACACGTCCAGGCAGTGTCGAATCCATCTCTGCTACAGGGGAAAACAAATAACATTTGAGTCCAGTGGAGACCGGGAGCAGAAGTAAAGGGAAGTGATAACCCCCAGAGCCCGGAAGCCTCTGGAGGCTGAGACCTCGCCCCCCTTGCGTGATAGGGCCTACGGAGCCACATGACCAAGGCACTGTCGCCTCCGCACGTGTGAGAGTGCAGGGCCCCAAGATGGCTGCCAGGCCTCGAGGCCTGACTCTTCTATGTCACTTCCGTACCGGCGAGAAAGGCGGGCCCTCCAGCCAATGAGGCTGCGGGGCGGGCCTTCACCTTGATAGGCACTCGAGTTATCCAATGGTGCCTGCGGGCCGGAGCGACTAGGAACTAACGTCATGCCGAGTTGCTGAGCGCCGGCAGGCGGGGCCGGGGCGGCCAAACCAATGCGATGGCCGGGGCGGAGTCGGGCGCTCTATAAGTTGTCGATAGGCGGGCACTCCGCCCTAGTTTCTAAGGACCATG (서열번호 30) |
hGAPDH | AGTTCCCCAACTTTCCCGCCTCTCAGCCTTTGAAAGAAAGAAAGGGGAGGGGGCAGGCCGCGTGCAGTCGCGAGCGGTGCTGGGCTCCGGCTCCAATTCCCCATCTCAGTCGCTCCCAAAGTCCTTCTGTTTCATCCAAGCGTGTAAGGGTCCCCGTCCTTGACTCCCTAGTGTCCTGCTGCCCACAGTCCAGTCCTGGGAACCAGCACCGATCACCTCCCATCGGGCCAATCTCAGTCCCTTCCCCCCTACGTCGGGGCCCACACGCTCGGTGCGTGCCCAGTTGAACCAGGCGGCTGCGGAAAAAAAAAAGCGGGGAGAAAGTAGGGCCCGGCTACTAGCGGTTTTACGGGCGCACGTAGCTCAGGCCTCAAGACCTTGGGCTGGGACTGGCTGAGCCTGGCGGGAGGCGGGGTCCGAGTCACCGCCTGCCGCCGCGCCCCCGGTTTCTATAAATTGAGCCCGCAGCCTCCCGCTTCGCTCTCTGCTCCTCCTGTTCGACAGTCAGCCGCATCTTCTTTTGCGTCGCCAGGTGAAGACGGGCGGAGAGAAACCCGGGAGGCTAGGGACGGCCTGAAGGCGGCAGGGGCGGGCGCAGGCCGGATGTGTTCGCGCCGCTGCGGGGTGGGCCCGGGCGGCCTCCGCATTGCAGGGGCGGGCGGAGGACGTGATGCGGCGCGGGCTGGGCATGGAGGCCTGGTGGGGGAGGGGAGGGGAGGCGTGGGTGTCGGCCGGGGCCACTAGGCGCTCACTGTTCTCTCCCTCCGCGCAGCCGAGCCACATCGCTGAGACAC (서열번호 31) |
hGRP78 | AGTGCGGTTACCAGCGGAAATGCCTCGGGGTCAGAAGTCGCAGGAGAGATAGACAGCTGCTGAACCAATGGGACCAGCGGATGGGGCGGATGTTATCTACCATTGGTGAACGTTAGAAACGAATAGCAGCCAATGAATCAGCTGGGGGGGCGGAGCAGTGACGTTTATTGCGGAGGGGGCCGCTTCGAATCGGCGGCGGCCAGCTTGGTGGCCTGGGCCAATGAACGGCCTCCAACGAGCAGGGCCTTCACCAATCGGCGGCCTCCACGACGGGGCTGGGGGAGGGTATATAAGCCGAGTAGGCGACGGTGAGGTCGACGCCGGCCAAGACAGCACAGACAGATTGACCTATTGGGGTGTTTCGCGAGTGTGAGAGGGAAGCGCCGCGGCCTGTATTTCTAGACCTGCCCTTCGCCTGGTTCGTGGCGCCTTGTGACCCCGGGCCCCTGCCGCCTGCAAGTCGGAAATTGCGCTGTGCTCCTGTGCTACGGCCTGTGGCTGGACTGCCTGCTGCTGCCCAACTGGCTGGCAC (서열번호 32) |
hGRP94 | TAGTTTCATCACCACCGCCACCCCCCCGCCCCCCCGCCATCTGAAAGGGTTCTAGGGGATTTGCAACCTCTCTCGTGTGTTTCTTCTTTCCGAGAAGCGCCGCCACACGAGAAAGCTGGCCGCGAAAGTCGTGCTGGAATCACTTCCAACGAAACCCCAGGCATAGATGGGAAAGGGTGAAGAACACGTTGCCATGGCTACCGTTTCCCCGGTCACGGAATAAACGCTCTCTAGGATCCGGAAGTAGTTCCGCCGCGACCTCTCTAAAAGGATGGATGTGTTCTCTGCTTACATTCATTGGACGTTTTCCCTTAGAGGCCAAGGCCGCCCAGGCAAAGGGGCGGTCCCACGCGTGAGGGGCCCGCGGAGCCATTTGATTGGAGAAAAGCTGCAAACCCTGACCAATCGGAAGGAGCCACGCTTCGGGCATCGGTCACCGCACCTGGACAGCTCCGATTGGTGGACTTCCGCCCCCCCTCACGAATCCTCATTGGGTGCCGTGGGTGCGTGGTGCGGCGCGATTGGTGGGTTCATGTTTCCCGTCCCCCGCCCGCGAGAAGTGGGGGTGAAAAGCGGCCCGACCTGCTTGGGGTGTAGTGGGCGGACCGCGCGGCTGGAGGTGTGAGGATCCGAACCCAGGGGTGGGGGGTGGAGGCGGCTCCTGCGATCGAAGGGGACTTGAGACTCACCGGCCGCACGTC (서열번호 33) |
hHSP70 | GGGCCGCCCACTCCCCCTTCCTCTCAGGGTCCCTGTCCCCTCCAGTGAATCCCAGAAGACTCTGGAGAGTTCTGAGCAGGGGGCGGCACTCTGGCCTCTGATTGGTCCAAGGAAGGCTGGGGGGCAGGACGGGAGGCGAAAACCCTGGAATATTCCCGACCTGGCAGCCTCATCGAGCTCGGTGATTGGCTCAGAAGGGAAAAGGCGGGTCTCCGTGACGACTTATAAAAGCCCAGGGGCAAGCGGTCCGGATAACGGCTAGCCTGAGGAGCTGCTGCGACAGTCCACTACCTTTTTCGAGAGTGACTCCCGTTGTCCCAAGGCTTCCCAGAGCGAACCTGTGCGGCTGCAGGCACCGGCGCGTCGAGTTTCCGGCGTCCGGAAGGACCGAGCTCTTCTCGCGGATCCAGTGTTCCGTTTCCAGCCCCCAATCTCAGAGCGGAGCCGACAGAGAGCAGGGAACCC (서열번호 34) |
hKINb | GCCCCACCCCCGTCCGCGTTACAACCGGGAGGCCCGCTGGGTCCTGCACCGTCACCCTCCTCCCTGTGACCGCCCACCTGATACCCAAACAACTTTCTCGCCCCTCCAGTCCCCAGCTCGCCGAGCGCTTGCGGGGAGCCACCCAGCCTCAGTTTCCCCAGCCCCGGGCGGGGCGAGGGGCGATGACGTCATGCCGGCGCGCGGCATTGTGGGGCGGGGCGAGGCGGGGCGCCGGGGGGAGCAACACTGAGACGCCATTTTCGGCGGCGGGAGCGGCGCAGGCGGCCGAGCGGGACTGGCTGGGTCGGCTGGGCTGCTGGTGCGAGGAGCCGCGGGGCTGTGCTCGGCGGCCAAGGGGACAGCGCGTGGGTGGCCGAGGATGCTGCGGGGCGGTAGCTCCGGCGCCCCTCGCTGGTGACTGCTGCGCCGTGCCTCACACAGCCGAGGCGGGCTCGGCGCACAGTCGCTGCTCCGCGCTCGCGCCCGGCGGCGCTCCAGGTGCTGACAGCGCGAGAGAGCGCGGCCTCAGGAGCAACAC (서열번호 35) |
hUBIb | TTCCAGAGCTTTCGAGGAAGGTTTCTTCAACTCAAATTCATCCGCCTGATAATTTTCTTATATTTTCCTAAAGAAGGAAGAGAAGCGCATAGAGGAGAAGGGAAATAATTTTTTAGGAGCCTTTCTTACGGCTATGAGGAATTTGGGGCTCAGTTGAAAAGCCTAAACTGCCTCTCGGGAGGTTGGGCGCGGCGAACTACTTTCAGCGGCGCACGGAGACGGCGTCTACGTGAGGGGTGATAAGTGACGCAACACTCGTTGCATAAATTTGCGCTCCGCCAGCCCGGAGCATTTAGGGGCGGTTGGCTTTGTTGGGTGAGCTTGTTTGTGTCCCTGTGGGTGGACGTGGTTGGTGATTGGCAGGATCCTGGTATCCGCTAACAGGTACTGGCCCACAGCCGTAAAGACCTGCGGGGGCGTGAGAGGGGGGAATGGGTGAGGTCAAGCTGGAGGCTTCTTGGGGTTGGGTGGGCCGCTGAGGGGAGGGGAGGGCGAGGTGACGCGACACCCGGCCTTTCTGGGAGAGTGGGCCTTGTTGACCTAAGGGGGGCGAGGGCAGTTGGCACGCGCACGCGCCGACAGAAACTAACAGACATTAACCAACAGCGATTCCGTCGCGTTTACTTGGGAGGAAGGCGGAAAAGAGGTAGTTTGTGTGGCTTCTGGAAACCCTAAATTTGGAATCCCAGTATGAGAATGGTGTCCCTTCTTGTGTTTCAATGGGATTTTTACTTCGCGAGTCTTGTGGGTTTGGTTTTGTTTTCAGTTTGCCTAACACCGTGCTTAGGTTTGAGGCAGATTGGAGTTCGGTCGGGGGAGTTTGAATATCCGGAACAGTTAGTGGGGAAAGCTGTGGACGCTTGGTAAGAGAGCGCTCTGGATTTTCCGCTGTTGACGTTGAAACCTTGAATGACGAATTTCGTATTAAGTGACTTAGCCTTGTAAAATTGAGGGGAGGCTTGCGGAATATTAACGTATTTAAGGCATTTTGAAGGAATAGTTGCTAATTTTGAAGAATATTAGGTGTAAAAGCAAGAAATACAATGATCCTGAGGTGACACGCTTATGTTTTACTTTTAAACTAGGTCACC (서열번호 36) |
표적 발현 카세트를 추가로 포함하는 발현 시스템
일부 양태에서, 키메라 단백질은 키메라 전사 인자이고, 본 개시는 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트를 추가로 제공한다.
"표적 발현 카세트"는 키메라 전사 인자-조절 가능한 발현을 갖는 유전자를 포함하는 발현 카세트를 지칭한다. 발현은 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)의 존재에 기초하여 키메라 전사 인자에 의해 조절된다.
일부 양태에서, 본 개시는 키메라 전사 인자-반응성 프로모터(CTF-반응성 프로모터)에 작동 가능하게 연결된 관심 유전자를 암호화하는 폴리뉴클레오티드 분자를 제공한다. CTF-반응성 프로모터는 변형된 ER-LBD를 포함하는 키메라 전사 인자에 반응하고, 4-OHT와 같은 비-내인성 리간드에 반응하여 유도 가능한 합성 유도성 프로모터이다.
일부 구현예에서, CTF-반응성 프로모터는 본원에 기술된 바와 같은 키메라 전사 인자에 결합하는 코어 프로모터 서열 및 결합 도메인을 포함한다.
결합 도메인은 하나 이상의 징크 핑거 결합 부위를 포함할 수 있다. 결합 도메인은 1, 2, 3, 4,5 ,6 7, 8, 9, 10개, 또는 그 이상의 징크 핑거 결합 부위를 포함할 수 있다. 일부 구현예에서, 결합 도메인은 하나의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 2개의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 3개의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 4개의 징크 핑거 결합 부위를 포함한다. 징크 핑거 결합 부위를 포함하는 예시적인 결합 도메인은 서열 cgggtttcgtaacaatcgcatgaggattcgcaacgccttcGGCGTAGCCGATGTCGCGctcccgtctcagtaaaggtcGGCGTAGCCGATGTCGCGcaatcggactgccttcgtacGGCGTAGCCGATGTCGCGcgtatcagtcgcctcggaacGGCGTAGCCGATGTCGCGcattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA(서열번호 37)에 나타나 있다.
코어 프로모터 서열은 최소 프로모터를 포함할 수 있다. 최소 프로모터의 예는 minP, minCMV, YB_TATA, 및 minTK를 포함한다.
일부 양태에서, 변형된 ER-LBD를 포함하는 키메라 단백질은 키메라 전사 인자이고, 이종 작제물은 키메라 전사 인자 반응성 프로모터를 포함하는 표적 발현 카세트를 추가로 포함한다. 일부 양태에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자를 암호화하는 폴리뉴클레오티드 분자를 포함하는 발현 카세트를 포함하는 제1 이종 작제물, 및 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트를 포함하는 제2 이종 작제물이 본원에 제공된다.
일부 구현예에서, 본 개시의 조작된 폴리뉴클레오티드 또는 작제물은 다수의 폴리펩티드를 생산하도록 구성된다. 예를 들어, 폴리뉴클레오티드는 2개의 상이한 폴리펩티드를 생산하도록 구성될 수 있다. 폴리뉴클레오티드 분자는 본원에 기술된 바와 같은 키메라 단백질 및 키메라 단백질에 반응하는 프로모터의 조절 하에 발현되는 관심 폴리펩티드를 포함하는 폴리펩티드를 생산하도록 구성될 수 있다.
일부 구현예에서, 본원에 기술된 바와 같은 ER-LBD 또는 키메라 단백질 및 ER-LBD 또는 키메라 단백질에 의해 전사적으로 조절될 수 있는 관심 유전자는 동일한 폴리뉴클레오티드 분자 또는 이종 작제물에 의해 암호화될 수 있다.
일부 구현예에서, 조작된 핵산은 다중시스트론성일 수 있는데, 즉, 하나를 초과하는 개별 폴리펩티드(예를 들어, 다중 외인성 폴리뉴클레오티드)가 단일 전사체로부터 생산될 수 있다. 조작된 핵산은 다양한 링커의 사용을 통해 다중시스트론성일 수 있는데, 예를 들어, 제1 외인성 폴리뉴클레오티드를 암호화하는 폴리뉴클레오티드 서열은 제2 외인성 폴리뉴클레오티드를 암호화하는 뉴클레오티드 서열에 예컨대, 5'에서 3' 배향으로 제1 유전자:링커:제2 유전자로 연결될 수 있다. 링커 폴리뉴클레오티드 서열은 하나 이상의 2A 리보솜 스키핑 요소, 예를 들어 T2A를 암호화할 수 있다. 다른 2A 리보솜 스키핑 요소는 E2A, P2A 및 F2A를 포함하나, 이에 제한되지 않는다. 2A 리보솜 스키핑 요소는 번역 중 생산되는, 제1 및 제2 유전자에 의해 암호화되는 별개의 폴리펩티드의 생산을 허용한다. 링커는 퓨린 절단 부위 또는 TEV 절단 부위와 같은 절단 가능한 링커 폴리펩티드 서열을 암호화할 수 있고, 여기서 발현 후 절단 가능한 링커 폴리펩티드는 제1 및 제2 유전자에 의해 암호화된 별도의 폴리펩티드가 생산되도록 절단된다. 절단 가능한 링커는 절단을 추가로 촉진하는, 가요성 링커(예를 들어, Gly-Ser-Gly 서열)와 같은 폴리펩티드 서열을 포함할 수 있다.
링커는 내부 리보솜 진입 부위(IRES)를 암호화할 수 있어, 번역 중 제1 및 제2 유전자에 의해 암호화된 별도의 폴리펩티드가 생산된다. 링커는 바이러스 스플라이스 수용기와 같은 스플라이스 수용기를 암호화할 수 있다.
링커는 2A 리보솜 스키핑에 이어 2A 잔기의 완전한 제거를 허용하는 퓨린 부위의 추가 절단을 통해 별도의 폴리펩티드를 생산할 수 있는 퓨린-2A 링커와 같은 링커의 조합일 수 있다. 일부 구현예에서, 링커의 조합은 퓨린 서열, 가요성 링커 및 2A 링커를 포함할 수 있다. 따라서, 일부 구현예에서, 링커는 퓨린-Gly-Ser-Gly-2A 융합 폴리펩티드이다. 일부 구현예에서, 링커는 퓨린-Gly-Ser-Gly-T2A 융합 폴리펩티드이다.
일반적으로, 다중시스트론 시스템은 임의의 수의 유전자 또는 이의 부분을 발현하기 위해 임의의 수 또는 조합의 링커를 사용할 수 있다(예를 들어, 제1, 제2 및 제3 폴리펩티드에 의해 암호화된 별도의 폴리펩티드가 생산되도록, 조작된 핵산은 각각 링커에 의해 분리된 제1, 제2 및 제3 폴리펩티드 분자를 암호화할 수 있다).
본원에서 사용되는 "링커"는 제1 폴리펩티드 서열 및 제2 폴리펩티드 서열을 연결하는 폴리펩티드 또는 전술된 다중시스트론 링커를 지칭할 수 있다.
전사후 조절 요소
일부 구현예에서, 본 개시의 조작된 핵산은 전사후 조절 요소(PRE)를 포함한다. PRE는 3차 RNA 구조 안정성 및 3' 말단 형성을 가능하게 하여 유전자 발현을 향상시킬 수 있다. PRE의 비제한적 예는 B형 간염 바이러스 PRE(HPRE) 및 우드척 간염 바이러스 PRE(WPRE)를 포함한다. 일부 구현예에서, 전사후 조절 요소는 우드척 간염 바이러스 전사후 조절 요소(WPRE)이다. 일부 구현예에서, WPRE는 WPRE 요소의 알파, 베타, 및 감마 구성요소를 포함한다. 일부 구현예에서, WPRE는 WPRE 요소의 알파 구성요소를 포함한다. WPRE 서열의 예는 서열번호 38 및 서열번호 39를 포함한다.
조작된 세포
또한, 본 개시의 하나 이상의 폴리뉴클레오티드 분자 또는 작제물을 포함하는 세포, 및 세포를 생산하는 방법이 본원에 제공된다. 이들 세포는 본원에서 "조작된 세포"로 지칭된다. 통상적으로 하나 이상의 조작된 핵산을 포함하는 이러한 세포는 자연에서 발생하지 않는다. 일부 구현예에서, 세포는 하나 이상의 조작된 폴리뉴클레오티드를 재조합적으로 발현하는 단리된 세포이다. 일부 구현예에서, 조작된 폴리뉴클레오티드는 하나 이상의 벡터 또는 세포의 게놈으로부터 선택된 유전자좌로부터 발현된다. 일부 구현예에서, 세포는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 폴리뉴클레오티드를 포함하도록 조작된다.
본 개시의 조작된 세포는 세포의 게놈 내로 통합된 조작된 폴리뉴클레오티드를 포함할 수 있다. 조작된 세포는 예를 들어, 플라스미드 또는 mRNA와 같은 일시적 발현 시스템으로 조작된, 세포의 게놈으로 통합되지 않고 발현할 수 있는 조작된 폴리뉴클레오티드를 포함할 수 있다.
조작된 세포 유형
본 개시의 조작된 세포는 인간 세포일 수 있다. 조작된 세포는 인간 일차 세포일 수 있다. 조작된 일차 세포는 임의의 체세포일 수 있다. 조작된 일차 세포는 임의의 줄기 세포일 수 있다. 일부 구현예에서, 조작된 세포는 대상체로부터 유래된다. 일부 구현예에서, 조작된 세포는 대상체에 대하여 동종이계이다.
본 개시의 조작된 세포는 대상체, 예컨대, 암이 있는 것으로 알려지거나 의심되는 대상체로부터 단리될 수 있다. 세포 단리 방법은 당업자에게 공지되어 있고, FACS 분류, 양성 단리 기술 및 음성 단리, 자기 단리, 및 이들의 조합과 같은 세포-표면 마커 발현에 기초한 분류 기술을 포함하지만 이에 제한되지는 않는다. 조작된 세포는 치료를 받는 대상체에 대하여 동종이형일 수 있다. 동종이형 변형된 세포는 치료를 받는 대상체에 HLA-일치될 수 있다. 조작된 세포는 배양된 세포, 예컨대, 생체 외 배양된 세포일 수 있다. 조작된 세포는 생체 외 배양된 세포, 예컨대, 대상체로부터 단리된 일차 세포일 수 있다. 배양된 세포는 하나 이상의 사이토카인과 함께 배양될 수 있다.
일부 구현예에서, 본 개시의 조작된 세포는 T 세포(예를 들어, CD8+ T 세포, CD4+ T 세포, 또는 감마-델타 T 세포), 세포독성 T 림프구(CTL), 조절 T 세포, 자연 살해 T(NKT) 세포, 자연 살해(NK) 세포, B 세포, 종양 침윤 림프구(TIL), 선천 림프 세포, 비만 세포, 호산구, 호염기구, 호중구, 골수 세포, 대식세포(예를 들어, M1 대식 세포 또는 M2 대식 세포), 단핵구, 수지상 세포, 적혈구, 혈소판 세포, 뉴런, 희소돌기아교세포, 별아교세포, 플라코드-유래 세포, 슈반 세포, 심근세포, 내피 세포, 결절 세포, 미세아교세포, 간세포, 담관세포, 베타 세포, 인간 배아 줄기 세포(ESC), ESC-유래 세포, 다능성 줄기 세포, 간엽 기질 세포(MSC), 유도된 다능성 줄기 세포(iPSC), 및 iPSC-유래 세포로부터 선택된다.
일부 구현예에서, 본 개시의 조작된 세포는 T 세포(예를 들어, CD8+ T 세포, CD4+ T 세포, 또는 감마-델타 T 세포)이다. 일부 구현예에서, 본 개시의 조작된 것은 세포독성 T 림프구(CTL)이다. 일부 구현예에서, 본 개시의 조작된 세포는 조절 T 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 자연 살해 T(NKT) 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 자연 살해(NK) 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 B 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 종양 침윤 림프구(TIL)이다. 일부 구현예에서, 본 개시의 조작된 세포는 선천성 림프 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 비만 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 호산구이다. 일부 구현예에서, 본 개시의 조작된 세포는 호염기구이다. 일부 구현예에서, 본 개시의 조작된 세포는 호중구이다. 일부 구현예에서, 본 개시의 조작된 세포는 골수 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 대식세포, 예를 들어, M1 대식세포 또는 M2 대식세포)이다. 일부 구현예에서, 본 개시의 조작된 세포는 단핵구이다. 일부 구현예에서, 본 개시의 조작되거나 단리된 세포는 수지상 세포이다. 일부 구현예에서, 본 개시의 조작되된 세포는 적혈구이다. 일부 구현예에서, 본 개시의 조작된 세포는 혈소판 세포이다. 일부 구현예에서, 본 개시의 세포는 뉴런이다. 일부 구현예에서, 본 개시의 세포는 희소돌기아교세포이다. 일부 구현예에서, 본 개시의 세포는 별아교세포이다. 일부 구현예에서, 본 개시의 세포는 플라코드-유래 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 슈반 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 심근세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 내피 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 결절 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 미세아교세포이다. 일부 구현예에서, 본 개시의 조작되된 세포는 간세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 담관세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 베타 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 인간 배아 줄기 세포(ESC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 ESC-유래 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 다능성 줄기 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 간엽 기질 세포(MSC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 유도된 다능성 줄기 세포(iPSC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 iPSC-유래 세포이다. 일부 구현예에서, 조작된 세포는 자가 유래이다. 일부 구현예에서, 조작된 세포는 동종이계이다. 일부 구현예에서, 본 개시의 조작되된 세포는 CD34+ 세포, CD3+ 세포, CD8+ 세포, CD16+ 세포, 및/또는 CD4+ 세포이다.
일부 구현예에서, 본 개시의 세포는 선암종 세포, 방광 종양 세포, 뇌 종양 세포, 유방 종양 세포, 자궁경부 종양 세포, 결장직장 종양 세포, 식도 종양 세포, 신경교종 세포, 신장 종양 세포, 간 종양 세포, 폐 종양 세포, 흑색종 세포, 중피종 세포, 난소 종양 세포, 췌장 종양 세포, 전립선 종양 세포, 피부 종양 세포, 갑상선 종양 세포, 및 자궁 종양 세포로부터 선택된 종양 세포이다.
또한 본 개시의 조작된 세포를 배양하는 단계를 포함하는 방법이 본원에 제공된다. 본원에 기재된 조작된 세포를 배양하는 방법은 공지되어 있다. 당업자는 배양 조건이 특정 조작된 관심 세포에 의존할 것임을 인식할 것이다. 당업자는 배양 조건이 조작된 세포의 특정 하류 용도, 예를 들어 조작된 세포의 대상체에게로의 후속 투여를 위한 특정 배양 조건에 의존할 것임을 인식할 것이다.
세포 조작 방법
본원에 기술된 바와 같은 임의의 폴리뉴클레오티드 분자 또는 작제물로 세포를 조작하기 위한 조성물 및 방법이 또한 본원에 제공된다.
일반적으로, 세포는 본 개시의 하나 이상의 폴리뉴클레오티드의 도입(즉, 전달)을 통해 조작된다. 전달 방법은 바이러스 매개 전달, 지질 매개 형질주입, 나노입자 전달, 전기천공, 초음파 처리 및 물리적 수단에 의한 세포막 변형을 포함하지만, 이에 제한되지 않는다. 당업자는 전달 방법의 선택이 조작될 특정 세포 유형에 의존할 수 있음을 이해할 것이다.
바이러스 매개 전달
바이러스 벡터 기반 전달 플랫폼을 사용하여 세포를 조작할 수 있다. 일반적으로, 바이러스 벡터 기반 전달 플랫폼은 숙주 세포에 도입(즉, 전달)을 통해 세포를 조작한다. 예를 들어, 바이러스 벡터 기반 전달 플랫폼은 본원에 기재된 임의의 조작된 핵산을 도입함으로써 세포를 조작할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 핵산일 수 있고, 따라서 조작된 핵산은 조작된 바이러스 유래 핵산을 포함할 수도 있다. 이러한 조작한 바이러스-유래 핵산은 재조합 바이러스 또는 조작된 바이러스로도 지칭될 수 있다.
바이러스 벡터 기반 전달 플랫폼은 동일한 핵산 내에서 하나를 초과하는 조작된 핵산, 유전자 또는 이식유전자를 암호화할 수 있다. 예를 들어, 조작된 바이러스 유래 핵산, 예를 들어, 재조합 바이러스 또는 조작된 바이러스는 하나 이상의 효과기 분자를 암호화하는 본원에 기재된 임의의 조작된 핵산을 포함하지만, 이에 제한되지 않는 하나 이상의 이식유전자를 암호화할 수 있다. 하나 이상의 이식유전자는 본원에 기재된 폴리펩티드(예를 들어, 변형된 ER-LBD)를 발현하도록 구성될 수 있다. 바이러스 벡터 기반 전달 플랫폼은 변형된 ER-LBD를 암호화하는 이식유전자에 더해 하나 이상의 유전자, 예를 들어 시스 작용 요소 또는 유전자라고 지칭되는, 바이러스 감염성 및/또는 바이러스 생산에 필요한 바이러스 유전자(예를 들어, 캡시드 단백질, 외피 단백질, 바이러스 중합효소, 바이러스 전사효소 등)를 암호화할 수 있다.
바이러스 벡터 기반 전달 플랫폼은 하나를 초과하는 바이러스 벡터, 예컨대, 본원에 기재되고, 트랜스-작용 요소 또는 유전자로 지칭되는 조작된 핵산, 유전자, 또는 이식유전자를 암호화하는 별도의 바이러스 벡터를 포함할 수 있다. 예를 들어, 헬퍼 의존성 바이러스 벡터 기반 전달 플랫폼은 변형된 ER-LBD를 암호화하는 벡터에 더하여 하나 이상의 추가의 개별 벡터에 대한 바이러스 감염성 및/또는 바이러스 생산에 필요한 추가 유전자를 제공할 수 있다. 하나의 바이러스 벡터는 하나 초과의 조작된 폴리뉴클레오티드, 예컨대 변형된 ER-LBD를 생산하도록 구성된 조작된 폴리뉴클레오티드 및 관심 유전자를 생산하도록 구성된 조작된 폴리뉴클레오티드를 전달하는 하나의 벡터를 전달할 수 있다. 하나 초과의 바이러스 벡터는 하나 초과의 조작된 핵산, 예컨대, 변형된 ER-LBD를 생산하도록 구성된 조작된 폴리뉴클레오티드를 전달하는 제1 벡터 및 추가의 조작된 폴리뉴클레오티드를 전달하는 제2 벡터를 전달할 수 있다. 사용되는 바이러스 벡터의 수는 전술된 바이러스 벡터 기반 백신 플랫폼의 패키징 용량에 의존할 수 있고, 당업자는 적절한 수의 바이러스 벡터를 선택할 수 있다.
일반적으로, 임의의 바이러스 벡터 기반 시스템은 분자의 시험관 내 생산에 사용될 수 있거나, 예를 들어, 생체 내 전달을 위한 생체 내 및 생체 외 유전자 요법 절차에서 사용될 수 있다. 적절한 바이러스 벡터 기반 시스템의 선택은 화물/페이로드 크기, 바이러스 시스템의 면역원성, 관심 표적 세포, 유전자 발현 강도 및 시기, 그리고 당업자가 인식하는 기타 요인과 같은 다양한 요인에 따를 것이다.
바이러스 벡터 기반 전달 플랫폼은 RNA 기반 바이러스 또는 DNA 기반 바이러스일 수 있다. 예시적인 바이러스 벡터 기반 전달 플랫폼은 단순 포진 바이러스, 아데노바이러스, 홍역 바이러스, 인플루엔자 바이러스, 인디애나 베시큘로바이러스, 뉴캐슬병 바이러스, 백시니아 바이러스, 소아마비 바이러스, 점액종 바이러스, 레오바이러스, 볼거리 바이러스, 마라바 바이러스, 광견병 바이러스, 로타바이러스, 간염 바이러스, 풍진 바이러스, 뎅기열 바이러스, 치쿤구니야 바이러스, 호흡기 세포융합 바이러스, 림프구성 맥락수막염 바이러스, 모르빌리바이러스, 렌티바이러스, 복제 레트로바이러스, 랍도바이러스, 세네카 밸리 바이러스, 신드비스 바이러스, 및 이들의 임의의 변이체 또는 유도체를 포함하지만 이에 제한되지 않는다. 다른 예시적인 바이러스 벡터 기반 전달 플랫폼은 당업계에 기술되어 있고, 예를 들어 우두, 계두, 자가 복제 알파바이러스, 마라바바이러스, 아데노바이러스(예를 들어, Tatsis 등의 문헌[ Adenoviruses, Molecular Therapy (2004) 10, 616*?*629] 참조), 또는 2, 3 또는 혼성 2/3세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로 하도록 설계된 임의의 세대의 재조합 렌티바이러스를 포함하지만, 이에 제한되지 않는 렌티바이러스(예를 들어, Hu 등의 문헌[Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61], Sakuma 등의 문헌[Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18], Cooper 등의 문헌[Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promotor, Nucl. Acids Res. (2015) 43 (1): 682-690], Zufferey 등의 문헌[Self-Inactivating Lentivirus Vector for Safe and Efficient In vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880] 참조)이다.
서열은 세포하 구획을 표적으로 하는 하나 이상의 서열이 선행될 수 있다. 숙주 세포 내로 도입(즉, 전달) 시, 감염된 세포(즉, 조작된 세포)는 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드)를 발현할 수 있고, 일부 경우에는 이를 분비할 수 있다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 예를 들어, 미국 특허 제4,722,848호에 기재되어 있다. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 Stover 등의 문헌 [Nature 351:456-460 (1991)]에 기재되어 있다. 조작된 핵산의 도입(즉, 전달)에 유용한 매우 다양한 다른 벡터, 예를 들어, 살모넬라 티피 벡터 등은 본원의 설명으로부터 당업자에게 명백할 것이다.
바이러스 벡터 기반 전달 플랫폼은 본원에서 종양용해성 바이러스로 지칭되는, 종양 세포를 표적으로 하는 바이러스일 수 있다. 종양용해성 바이러스의 예는 종양용해성 단순포진 바이러스, 종양용해성 아데노바이러스, 종양용해성 홍역 바이러스, 종양용해성 인플루엔자 바이러스, 종양용해성 인디애나 소포바이러스, 종양용해성 뉴캐슬병 바이러스, 종양용해성 백시니아 바이러스, 종양용해성 소아마비 바이러스, 종양용해성 점액종 바이러스, 종양용해성 레오바이러스, 종양용해성 이하선염 바이러스, 종양용해성 마라바 바이러스, 종양용해성 광견병 바이러스, 종양용해성 로타바이러스, 종양용해성 간염 바이러스, 종양용해성 풍진 바이러스, 종양용해성 뎅기열 바이러스, 종양용해성 치쿤구니야 바이러스, 종양용해성 호흡기 세포융합 바이러스, 종양용해성 림프구성 맥락수막염 바이러스, 종양용해성 모르빌리바이러스, 종양용해성 렌티바이러스, 종양용해성 복제 레트로바이러스, 종양용해성 랍도바이러스, 종양용해성 세네카 밸리 바이러스, 종양용해성 신드비스 바이러스, 및 이들의 임의의 변이체 또는 유도체를 포함하나, 이에 한정되지는 않는다. 본원에 기재된 임의의 종양용해성 바이러스는 하나 이상의 이식유전자(예를 들어, 본원에 기재된 조작된 핵산)를 포함하는 재조합 종양용해성 바이러스일 수 있다. 이식유전자는 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드) 및 선택적으로 관심 유전자를 발현하도록 구성될 수 있다.
일부 구현예에서, 바이러스는 렌티바이러스, 레트로바이러스, 종양용해성 바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 및 바이러스-유사 입자 (VLP)로부터 선택된다.
바이러스 벡터 기반 전달 플랫폼은 레트로바이러스 기반일 수 있다. 일반적으로, 레트로바이러스 벡터는 최대 6~10 kb의 외래 서열에 대한 패키징 용량을 갖는 시스 작용 긴 말단 반복부로 구성된다. 최소 시스 작용 LTR은 벡터의 복제 및 패키징에 충분하고, 그런 다음 이는 하나 이상의 조작된 핵산(예를 들어, 변형된 ER-LBD를 암호화하는 이식유전자)을 표적 세포에 통합하여 영구적인 이식유전자 발현을 제공하는 데 사용된다. 레트로바이러스 기반 전달 시스템은 쥣과 백혈병, 바이러스(MuLV), 긴팔원숭이 백혈병 바이러스(GaLV), 원숭이 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV), 및 이들의 조합을 기반으로 하는 시스템을 포함하지만, 이에 한정되지 않는다(예를 들어, Buchscher 등의 문헌[J. Virol. 66:2731-2739 (1992)]; Johann 등의 문헌[J. Virol. 66:1635-1640 (1992)]; Sommnerfelt 등의 문헌[Virol. 176:58-59 (1990)]; Wilson 등의 문헌[J. Virol. 63:2374-2378 (1989)]; Miller 등의 문헌[J, Virol. 65:2220-2224 (1991)]; PCT/US94/05700 참조). 다른 레트로바이러스 시스템은 피닉스 레트로바이러스 시스템을 포함한다.
바이러스 벡터 기반 전달 플랫폼은 렌티바이러스 기반일 수 있다. 일반적으로, 렌티바이러스 벡터는 비분열 세포를 형질도입하거나 감염시킬 수 있고 통상적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 렌티바이러스 기반 전달 플랫폼은 ViraPower 시스템(ThermoFisher) 또는 pLenti 시스템(Cell Biolabs)과 같은 HIV 기반일 수 있다. 렌티바이러스 기반 전달 플랫폼은 SIV, 또는 FIV-기반일 수 있다. 다른 예시적인 렌티바이러스 기반 전달 플랫폼은 미국 특허 번호 제7,311,907호; 제7,262,049호; 제7,250,299호; 제7,226,780호; 제7,220,578호; 제7,211,247호; 제7,160,721호; 제7,078,031호; 제7,070,993호; 제7,056,699호; 제6,955,919호에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.
바이러스 벡터 기반 전달 플랫폼은 아데노바이러스 기반일 수 있다. 일반적으로, 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하고, 세포 분열이 필요하지 않고, 높은 역가 및 발현 수준을 달성하고, 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 일반적으로, 아데노바이러스는 숙주의 게놈에 통합되지 않기 때문에 감염된 세포 내에서 이식유전자의 일시적인 발현을 위해 아데노바이러스를 사용할 수 있다. 아데노바이러스 기반 전달 플랫폼은 Li 등의 문헌[Invest Opthalmol Vis Sci 35:2543 2549, 1994]; Borras 등의 문헌[Gene Ther 6:515 524, 1999]; Li 및 Davidson의 문헌[PNAS 92:7700 7704, 1995]; Sakamoto 등의 문헌[H Gene Ther 5:1088 1097, 1999]; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다. 다른 예시적인 아데노바이러스 기반 전달 플랫폼은 미국 특허 번호 제5585362호; 제6,083,716호, 제7,371,570호; 제7,348,178호; 제7,323,177호; 제7,319,033호; 제7,318,919호; 및 제7,306,793호 및 국제 특허 출원 WO96/13597에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.
바이러스 벡터 기반 전달 플랫폼은 아데노 연관 바이러스(AAV) 기반일 수 있다. 아데노-연관 바이러스("AAV") 벡터는 조작된 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산)으로 세포를 형질도입하기 위해 사용될 수 있다. AAV 시스템은 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드)의 시험관 내 생산에 사용될 수 있거나, 예를 들어, 변형된 ER-LBD의 생체 내 전달을 위해 생체 내 및 생체 외 유전자 요법 절차에 사용될 수 있다(예를 들어, West 등의 문헌[Virology 160:38-47 (1987)]; 미국 특허 제4,797,368호; 제5,436,146호; 제6,632,670호; 제6,642,051호; 제7,078,387호; 제7,314,912호; 제6,498,244호; 제7,906,111호; 미국 특허 공보 US 2003-0138772, US 2007/0036760, 및 US 2009/0197338; Gao,등의 문헌[J. Virol, 78(12):6381-6388 (June 2004)]; Gao, 등의 문헌[Proc Natl Acad Sci USA, 100(10):6081-6086 (May 13, 2003)]; 및 국제 특허 출원 WO 2010/138263 및 WO 93/24641; Kotin의 문헌[Human Gene Therapy 5:793-801 (1994)]; Muzyczka의 문헌[J. Clin. Invest. 94:1351 (1994)] 참조, 각각은 사실상 본원에 참조로서 포함된다). 재조합 AAV 벡터를 구축하기 위한 예시적인 방법은 미국 특허 제5,173,414호; Tratschin등의 문헌[Mol. Cell. Biol. 5:3251-3260 (1985)]; Tratschin, 등의 문헌[Mol. Cell, Biol. 4:2072-2081 (1984)]; Hermonat & Muzyczka의 문헌[PNAS 81:64666470 (1984)]; 및 Samuiski 등의 문헌[J. Virol. 63:03822-3828 (1989)]에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다. 일반적으로, AAV-기반 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV.Rh10, AAV11 및 이들의 변이체 중 어느 하나에 상응하는 아미노산 서열을 갖는 캡시드 단백질을 포함한다.
바이러스 벡터 기반 전달 플랫폼은 바이러스 유사 입자(VLP) 플랫폼일 수 있다. 일반적으로, VLP는 바이러스 구조 단백질을 생성하고 생성된 바이러스 입자를 정제하여 구성된다. 그런 다음, 정제 후, 화물/페이로드(예를 들어, 본원에 기재된 임의의 조작된 핵산)는 생체 외에서 정제된 입자 내에 캡슐화된다. 따라서, VLP의 생산은 바이러스 구조 단백질을 암호화하는 핵산과 화물/페이로드를 암호화하는 핵산의 분리를 유지한다. VLP 생산에 사용되는 바이러스 구조 단백질은 포유동물, 효모, 곤충, 박테리아를 포함하는 다양한 발현 시스템, 또는 생체 내 번역 발현 시스템에서 생산될 수 있다. 정제된 바이러스 입자는 원하는 화물의 존재하에 변성 및 개질되어 당업자에게 공지된 방법을 사용하여 VLP를 생성할 수 있다. VLP의 생산은 Seow 등의 문헌 [Mol Ther. 2009 May; 17(5): 767-777]에 상세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.
바이러스 벡터 기반 전달 플랫폼은 다양한 세포를 표적화(즉, 감염)시키거나, 세포의 좁은 하위세트를 표적화하거나, 특정 세포를 표적화하도록 조작될 수 있다. 일반적으로, 바이러스 벡터 기반 전달 플랫폼에 대해 선택된 외피 단백질은 바이러스 친화성을 결정한다. 바이러스 벡터 기반 전달 플랫폼에 사용되는 바이러스는 특정 관심 세포를 표적으로 하기 위해 유사형을 지정할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 범친화성일 수 있고 다양한 세포를 감염시킬 수 있다. 예를 들어, 범친화성 바이러스 벡터 기반 전달 플랫폼은 VSV-G 외피를 포함할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 양친성일 수 있고 포유동물 세포를 감염시킬 수 있다. 따라서, 당업자는 원하는 세포 유형을 표적화하기 위한 적절한 친화성, 유사형 및/또는 외피 단백질을 선택할 수 있다.
지질 구조 전달 시스템
본 개시의 조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질)은 지질 매개 전달 시스템을 사용하여 세포 내로 도입될 수 있다. 일반적으로, 지질 매개 전달 시스템은 내부 구획을 감싸는 외부 지질막으로 구성된 구조를 사용한다. 지질 기반 구조의 예는 지질 기반 나노입자, 리포솜, 미셀, 엑소좀, 소포, 세포외 소포, 세포 또는 조직을 포함하지만, 이에 한정되지 않는다. 지질 구조 전달 시스템은 시험관 내, 생체 내 또는 생체 외에서 화물/페이로드(예를 들어, 본원에 기재된 임의의 조작된 핵산)를 전달할 수 있다.
지질 기반 나노입자는 단층 리포솜, 다중층 리포솜, 및 지질 제제를 포함할 수 있지만 이에 제한되지 않는다. 본원에 사용된 "리포솜"은 원하는 화물, 예를 들어, 본원에 기재된 임의의 조작된 핵산과 같은 조작된 핵산을 지질 쉘 또는 지질 응집체 내에 포함시켜 형성된 지질 비히클의 시험관 내 제제를 포괄하는 일반 용어이다. 리포솜은 일반적으로 인지질을 포함하는 이중층 막, 및 일반적으로 수용성 조성물을 포함하는 내부 매질을 갖는 소포 구조를 갖는 것을 특징으로 할 수 있다. 리포솜은 에멀젼, 발포체, 미셀, 불용성 단층, 액정, 인지질 분산액, 라멜라층 등을 포함하지만 이에 한정되지는 않는다. 리포솜은 단층 리포솜일 수 있다. 리포솜은 다중층 리포솜일 수 있다. 리포솜은 다소포성 리포솜일 수 있다. 리포솜은 양전하, 음전하 또는 중성으로 하전될 수 있다. 특정 구현예에서, 리포솜은 전하가 중성이다. 리포솜은 일반적으로 중성 및 음으로 하전된 인지질과 콜레스테롤과 같은 스테롤을 포함하는 표준 소포 형성 지질로부터 형성될 수 있다. 지질의 선택은 일반적으로 원하는 목적, 예를 들어 리포솜 크기, 산 불안정성 및 혈류 내 리포솜의 안정성과 같은 생체 내 전달 기준을 고려하여 인도된다. 예를 들어, Szoka 등의 문헌[Ann. Rev. Biophys. Bioeng. 9; 467 (1980)], 미국 특허 제4,235,871호, 제4,501,728호, 제4,501,728호, 제4,837,028호, 및 제5,019,369호에 기술된 바와 같이 다양한 방법으로 리포솜을 제조할 수 있고, 각각은 사실상 본원에 참조로서 포함된다.
다중층 리포솜은 인지질을 포함하는 지질이 과량의 수용액에 현탁되어 다중 지질층이 수성 매질에 의해 분리될 때 자발적으로 생성된다. 물과 용해된 용질은 자가 재배열을 겪는 지질 성분에 따라 지질 이중층 사이의 닫힌 구조에 갇힌다. 원하는 화물(예를 들어, 폴리펩티드, 핵산, 소분자 약물, 조작된 핵산, 예를 들어 본원에 기재된 임의의 조작된 핵산, 바이러스 벡터, 바이러스 기반 전달 시스템 등)은 리포솜의 수성 내부에 캡슐화, 리포솜 및 폴리펩티드/핵산 둘 다와 결합된 연결 분자를 통해 리포솜에 부착, 리포솜의 지질 이중층 내에 산재, 리포솜에 포획, 리포솜과 복합체화, 또는 그렇지 않으면 표적 개체에 전달될 수 있도록 리포솜과 결합될 수 있다. 친유성 분자 또는 친유성 영역을 가진 분자도 또한 지질 이중층에 용해되거나 결합될 수 있다.
본 구현예에 따라 사용되는 리포솜은 당업자에게 공지된 바와 같이 상이한 방법에 의해 제조될 수 있다. 리포솜의 제조는 WO 2016/201323, 국제 출원 PCT/US85/01161 및 PCT/US89/05040, 및 미국 특허 제4,728,578호, 제4,728,575호, 제4,737,323호, 제4,533,254호, 제4,162,282호, 제4,310,505호, 및 제4,921,706호에 추가 세부사항이 기재되어 있고; 각각은 사실상 본원에 참조로서 포함된다.
리포솜은 양이온성 리포솜일 수 있다. 양이온성 리포솜의 예는 미국 특허 제5,962,016호; 제5,030,453호; 제6,680,068호, 미국 출원 제2004/0208921호, 및 국제 특허 출원 WO03/015757A1, WO04029213A2, 및 WO02/100435A1에 상세히 기재되어 있고, 각각은 그 전체가 참조로서 본원에 포함된다.
지질 매개 유전자 전달 방법은 예를 들어, WO 96/18372; WO 93/24640; Mannino & Gould-Fogerite의 문헌[BioTechniques 6(7): 682-691 (1988)]; 미국 특허 제5,279,833호 Rose 미국 특허 제5,279,833호; WO91/06309; 및 Felgner 등의 문헌[Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)]에 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.
엑소좀은 원형질막과 다소포체의 융합 후 세포외 환경으로 방출되는 세포내 이입 기원의 작은 막 소포이다. 엑소좀의 크기는 30 내지 100 nm 직경 범위이다. 이들의 표면은 공여자 세포의 세포막에서 나온 지질 이중층으로 구성되어 있고, 엑소좀을 생산한 세포의 세포질을 함유하고, 표면에 모세포의 막 단백질을 나타낸다. 핵산의 전달에 유용한 엑소좀은 당업자에게 공지되어 있고, 예를 들어, 사실상 참조로서 본원에 포함된 미국 특허 제9,889,210호에 상세히 기재된 엑소좀이다.
본원에 사용된 바와 같이, 용어 "세포외 소포" 또는 "EV"는 내부 공간을 둘러싸는 막을 포함하는 세포 유래 소포를 지칭한다. 일반적으로, 세포외 소포는 이들이 유래된 세포보다 작은 직경을 갖는 모든 막 결합 소포를 포함한다. 일반적으로 세포외 소포는 직경이 20 nm 내지 1000 nm 범위이고, 세포외 소포의 외부 표면에 표시되는 내부 공간에 및/또는 막에 걸쳐 있는 다양한 거대분자 화물을 포함할 수 있다. 화물은 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산), 단백질, 탄수화물, 지질, 소분자, 및/또는 이들의 조합을 포함할 수 있다. 예로서 그리고 제한 없이, 세포외 소포는 세포사멸체, 세포의 단편, 직접 또는 간접 조작(예를 들어, 연속 압출 또는 알칼리 용액으로 처리)에 의해 세포로부터 유래된 소포, 소포화된 소기관, 및 살아있는 세포에 의해 (예를 들어, 직접적인 원형질막 출아 또는 후기 엔도솜과 원형질막의 융합에 의해) 생성된 소포를 포함한다. 세포외 소포는 살아있는 유기체 또는 죽은 유기체, 이식된 조직 또는 기관, 및/또는 배양된 세포로부터 유래될 수 있다.
본원에 사용된 용어 "엑소좀"은 내부 공간을 둘러싸는 막을 포함하는 세포 유래 작은 (직경 20~300 nm, 보다 바람직하게는 직경 40~200 nm 사이) 소포를 지칭하고, 이는 직접적인 원형질막 출아 또는 후기 엔도솜과 원형질막의 융합에 의해 세포로부터 생성된다. 엑소좀은 지질 또는 지방산 및 폴리펩티드를 포함하고 선택적으로 페이로드(예를 들어, 치료제), 수용자(예를 들어, 표적화 모이어티), 폴리뉴클레오티드(예를 들어, 핵산, RNA, 또는 DNA, 예를 들어 본원에 기재된 임의의 조작된 핵산), 당(예를 들어, 단순 당, 다당류, 또는 글리칸) 또는 다른 분자를 포함한다. 엑소좀은 생산자 세포로부터 유래될 수 있고, 그의 크기, 밀도, 생화학적 매개변수, 또는 이들의 조합에 기초하여 생산자 세포로부터 단리될 수 있다. 엑소좀은 세포외 소포의 일종이다. 일반적으로, 엑소좀 생산/생물발생은 생산자 세포의 파괴를 초래하지 않는다. 엑소좀 및 엑소좀의 제조는 그 전체가 참조로서 본원에 포함된 WO 2016/201323에 추가로 상세히 기재되어 있다.
본원에 사용된 용어 "나노소포"("미세소포"로도 지칭됨)는 내부 공간을 둘러싸는 막을 포함하는 세포 유래 작은 (직경 20~250 nm, 보다 바람직하게는 직경 30~150 nm 사이) 소포를 지칭하고, 이는 직접 또는 간접적 조작에 의해 세포로부터 생성되어 상기 나노소포가 상기 조작 없이 상기 생산자 세포에 의해 생성되지 않는다. 일반적으로, 나노소포는 세포외 소포의 아종이다. 생산자 세포의 적절한 조작은 연속 압출, 알칼리 용액 처리, 초음파 처리 또는 이들의 조합을 포함하지만 이에 한정되지는 않는다. 나노소포의 생산은 일부 경우에 상기 생산자 세포의 파괴를 초래할 수 있다. 바람직하게는, 나노소포 집단은 원형질막으로부터의 직접 출아 또는 원형질막과 후기 엔도솜의 융합에 의해 생산자 세포로부터 유래된 소포가 실질적으로 없다. 나노소포는 지질 또는 지방산 및 폴리펩티드, 및 선택적으로 페이로드(예를 들어, 치료제), 수용자(예를 들어, 표적화 모이어티), 폴리뉴클레오티드(예를 들어, 핵산, RNA, 또는 DNA, 예컨대, 본원에 기재된 임의의 조작된 핵산), 당(예를 들어, 단순 당, 다당류, 또는 글리칸) 또는 다른 분자를 포함한다. 나노소포는 일단 상기 조작에 따라 생산자 세포로부터 유래되면, 이의 크기, 밀도, 생화학적 매개변수, 또는 이들의 조합에 기초하여 생산자 세포로부터 단리될 수 있다.
지질 나노입자(LNP)는 일반적으로, 지질의 양친매성 성질에 의존하여 막 및 소포 유사 구조를 형성하는 합성 지질 구조이다(Riley 2017). 일반적으로, 이들 소포는 표적 세포의 막으로 흡수되고 화물을 세포질 내로 방출함으로써 본원에 기재된 임의의 조작된 핵산 또는 바이러스 시스템과 같은 화물/페이로드를 전달한다. LNP 형성에 사용되는 지질은 양이온성, 음이온성 또는 중성일 수 있다. 지질은 합성 또는 천연 유래일 수 있고, 일부 경우에는 생분해성이다. 지질은 지방, 콜레스테롤, 인지질, 폴리에틸렌글리콜(PEG) 접합체(페길화 지질)을 포함하지만, 이에 제한되지 않는 지질 접합체, 왁스, 오일, 글리세리드 및 지용성 비타민을 포함할 수 있다. 지질 조성물은 일반적으로 양이온성, 중성, 음이온성 및 양친매성 지질과 같은 물질의 정의된 혼합물을 포함한다. 일부 예에서, 특정 지질은 LNP 응집을 방지하거나, 지질 산화를 방지하거나, 추가 모이어티의 부착을 용이하게 하는 기능적 화학기를 제공하기 위해 포함된다. 지질 조성물은 전체 LNP 크기와 안정성에 영향을 줄 수 있다. 한 예에서, 지질 조성물은 디리놀레일메틸- 4-디메틸아미노부티레이트(MC3) 또는 MC3-유사 분자를 포함한다. MC3 및 MC3-유사 지질 조성물은 PEG 또는 PEG-접합 지질, 스테롤, 또는 중성 지질과 같은 하나 이상의 다른 지질을 포함하도록 제형화될 수 있다. 또한, LNP는 특정 세포 유형의 표적화를 촉진하기 위해 추가로 조작되거나 기능화될 수 있다. LNP 설계에서 또 다른 고려 사항은 표적화 효율성과 세포 독성 간의 균형이다.
미셀은, 일반적으로, 단일 사슬 지질을 사용하여 형성되는 구형 합성 지질 구조로, 여기서 단일 사슬 지질의 친수성 머리는 외층 또는 막을 형성하고 단일 사슬 지질의 소수성 꼬리는 미셀 중심을 형성한다. 미셀은 통상적으로 지질 단일층만 포함하는 지질 구조를 지칭한다. 미셀은 Quader 등의 문헌 (Mol Ther. 2017 Jul 5; 25(7): 1501-1513)에 보다 상세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.
발현 벡터와 같은, 혈청에 직접 노출된 핵산 벡터는 혈청 뉴클레아제에 의한 핵산 분해 또는 유리 핵산에 의한 면역계의 오프-타켓 자극을 포함하여 여러 가지 바람직하지 않은 결과를 초래할 수 있다. 유사하게, 혈청에 직접 노출된 바이러스 전달 시스템은 원하지 않는 면역 반응 및/또는 바이러스 전달 시스템의 중화를 유발할 수 있다. 따라서 조작된 핵산 및/또는 바이러스 전달 시스템의 캡슐화는 분해를 방지하는 동시에 잠재적인 오프-타겟 영향을 방지하는 데 사용할 수 있다. 특정 예에서, 조작된 핵산 및/또는 바이러스 전달 시스템은 LNP의 수성 내부와 같은 전달 비히클 내에 완전히 캡슐화된다. LNP 내의 조작된 핵산 및/또는 바이러스 전달 시스템의 캡슐화는 미세유체 액적 생성 장치에서 수행되는 미세유체 혼합 및 액적 생성과 같은 당업자에게 잘 알려진 기술에 의해 수행될 수 있다. 이러한 장치는 표준 T-접합 장치 또는 흐름 초점 장치를 포함하지만 이에 한정되지는 않는다. 한 예에서, MC3 또는 MC3-유사 함유 조성물과 같은 원하는 지질 제형은 조작된 핵산 또는 바이러스 전달 시스템 및 임의의 다른 원하는 제제와 병행하여 액적 생성 장치에 제공되어, 전달 벡터 및 원하는 제제는 MC3 또는 MC3 유사 기반 LNP의 내부에 완전히 캡슐화된다. 한 예에서, 액적 생성 장치는 생성된 LNP의 크기 범위 및 크기 분포를 제어할 수 있다. 예를 들어, LNP는 직경 1 내지 1000 나노미터, 예를 들어, 1, 10, 50, 100, 500, 또는 1000 나노미터 범위의 크기를 가질 수 있다. 액적 생성 후, 화물/페이로드(예를 들어, 조작된 핵산 및/또는 바이러스 전달 시스템)를 캡슐화하는 전달 비히클은 투여를 위해 준비하도록 추가로 처리되거나 조작될 수 있다.
나노입자 전달
나노물질은 조작된 핵산(예를 들어, 본원에 기술된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 핵산)을 전달하는 데 사용될 수 있다. 나노물질 비히클은 중요하게는 비면역원성 물질로 만들어질 수 있고 일반적으로 전달 벡터 자체에 대한 면역을 유발하는 것을 피할 수 있다. 이러한 물질은 지질(이전에 기술된 바와 같음), 무기 나노물질, 및 기타 중합체 물질을 포함할 수 있지만, 이에 한정되지 않는다. 나노물질 입자는 Riley 등의 문헌 (Recent Advances in Nanomaterials for Gene Delivery*?*A Review. Nanomaterials 2017, 7(5), 94)에 더욱 자세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.
게놈 편집 시스템
게놈 편집 시스템은 조작된 핵산, 예를 들어 본 개시의 변형된 ER-LBD를 암호화는 핵산을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. 일반적으로, "게놈 편집 시스템"은 외인성 유전자를 숙주 세포의 게놈에 통합하는 임의의 시스템을 지칭한다. 게놈 편집 시스템은 트랜스포존 시스템, 뉴클레아제 게놈 편집 시스템, 및 바이러스 벡터 기반 전달 플랫폼을 포함하지만 이에 한정되지 않는다.
트랜스포존 시스템은 조작된 핵산, 예컨대 본 개시의 조작된 핵산을 숙주 게놈 내로 통합하기 위해 사용될 수 있다. 트랜스포존은 일반적으로 화물/페이로드 핵산 및 트랜스포사제 옆에 있는 말단 역반복체(TIR)를 포함한다. 트랜스포존 시스템은 TIR-측면 화물과 함께 시스 또는 트랜스로 트랜스포존을 제공할 수 있다. 트랜스포존 시스템은 레트로트랜스포존 시스템 또는 DNA 트랜스포존 시스템일 수 있다. 일반적으로, 트랜스포존 시스템은 화물/페이로드(예를 들어, 조작된 핵산)를 숙주 게놈에 무작위로 통합한다. 트랜스포존 시스템의 예는, 각각이 사실상 참조로서 본원에 포함된, Hudecek 등의 문헌 [Crit Rev Biochem Mol Biol. 2017 Aug;52(4):355-380], 및 미국 특허 제6,489,458호, 제6,613,752호 및 제7,985,739호에 더욱 자세히 기술된, Tc1/마리너 트랜스포존 슈퍼패밀리, 예를 들어 Sleeping Beauty 트랜스포존 시스템의 트랜스포존을 사용하는 시스템을 포함한다. 트랜스포존 시스템의 다른 예는 미국 특허 제6,218,185호 및 제6,962,810호에 상세히 기재된 PiggyBac 트랜스포존 시스템을 포함하고, 이들 각각은 사실상 본원에 참고로 포함된다.
뉴클레아제 게놈 편집 시스템은 조작된 핵산, 예를 들어, 본 개시의 단리된 폴리뉴클레오티드 또는 이종 작제물을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. 이론에 얽매이지 않기를 바라며, 일반적으로, 외인성 유전자를 도입하기 위해 사용되는 뉴클레아제-매개 유전자 편집 시스템은 세포의 천연 DNA 복구 기전, 특히 상동 재조합(HR) 복구 경로를 이용한다. 간단히, 게놈 DNA에 대한 손상(통상적으로 이중 가닥 파손) 후, 세포는 병변을 복구하기 위한 DNA 합성 중 5' 및 3' 말단 모두에서 동일하거나 실질적으로 동일한 서열을 갖는 다른 DNA 공급원을 주형으로 사용하여 손상을 해결할 수 있다. 자연스러운 상황에서, HDR은 세포에 있는 다른 염색체를 주형으로 사용할 수 있다. 유전자 편집 시스템에서, 외인성 폴리뉴클레오티드는 상동 재조합 주형(HRT 또는 HR 주형)으로 사용하기 위해 세포에 도입된다. 일반적으로, HRT 내의 5' 및 3' 상보적 말단 사이에 포함된 병변이 있는 염색체에서 원래 발견되지 않은 임의의 추가 외인성 서열(예를 들어, 유전자 또는 유전자의 일부)은 주형화된 HDR 중 주어진 게놈 유전자좌에 혼입(즉, "통합")될 수 있다. 따라서, 주어진 게놈 유전자좌에 대한 통상적인 HR 주형은 내인성 게놈 표적 유전자좌의 제1 영역과 동일한 뉴클레오티드 서열, 내인성 게놈 표적 유전자좌의 제2 영역과 동일한 뉴클레오티드 서열, 및 화물/페이로드 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산, 예컨대, 임의의 조작된 핵산)을 암호화하는 뉴클레오티드 서열을 갖는다.
일부 예에서, HR 주형은 선형일 수 있다. 선형 HR 주형의 예는 선형화된 플라스미드 벡터, ssDNA, 합성된 DNA, 및 PCR 증폭된 DNA를 포함하지만, 이에 제한되지 않는다. 특정 예에서, HR 주형은 플라스미드와 같은 원형일 수 있다. 원형 주형은 슈퍼코일 주형을 포함할 수 있다.
도입될 외인성 서열에 대하여, HR 주형의 5' 및 3' 말단에서 발견되는 동일하거나 실질적으로 동일한 서열은 일반적으로 아암(arms)(HR 아암)으로 지칭된다. HR 아암은 내인성 게놈 표적 유전자좌의 영역과 동일(즉, 100% 동일)할 수 있다. HR 아암은 일부 예에서 내인성 게놈 표적 유전자좌의 영역과 실질적으로 동일할 수 있다. 실질적으로 동일한 HR 아암이 사용될 수 있지만, HDR 경로의 효율성이 100% 미만의 동일성을 갖는 HR 아암에 의해 영향을 받을 수 있으므로 HR 아암이 동일한 것이 유리할 수 있다.
각각의 HR 아암, 즉, 5' 및 3' HR 아암은 동일한 크기이거나 다른 크기일 수 있다. 각각의 HR 아암은 각각 길이가 50, 100, 200, 300, 400, 또는 500개 염기 이상일 수 있다. 일반적으로 HR 아암의 길이는 임의의 길이일 수 있지만, HR 아암 길이 및 전체 주형 크기가 전체 편집 효율성에 미치는 영향과 같은 실용적인 고려 사항도 고려할 수 있다. HR 아암은 절단 부위에 바로 인접한 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다. 각각의 HR 아암은 절단 부위에 바로 인접한 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다. 각각의 HR 아암은 절단 부위의 특정 거리 내, 예컨대, 서로 1개 염기쌍, 10개 염기쌍 이하, 50개 염기쌍 이하, 또는 100개 염기쌍 이하 이내 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다.
뉴클레아제 게놈 편집 시스템은 클러스터링된 규칙적으로 간격이 있는 짧은 회문 반복(CRISPR) 패밀리 뉴클레아제 또는 이의 유도체, 전사 활성인자-유사 효과기 뉴클레아제(TALEN) 또는 이의 유도체, 징크-핑거 뉴클레아제(ZFN) 또는 이의 유도체, 및 귀소 엔도뉴클레아제(HE) 또는 이의 유도체를 포함하지만, 이에 한정되지 않는, 표적 게놈 유전자좌를 절단하기 위한 다양한 뉴클레아제를 사용할 수 있다.
CRISPR-매개 유전자 편집 시스템은 조작된 핵산, 예를 들어 본원에 기재된 조작된 핵산을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. CRISPR 시스템은 M. Adli("The CRISPR tool kit for genome editing and beyond" Nature Communications; volume 9 (2018), Article number: 1911)에 더욱 상세히 기재되어 있고, 교시하는 모든 내용에 대해 본원에 참조로 포함된다. 일반적으로, CRISPR-매개 유전자 편집 시스템은 CRISPR-연관(Cas) 뉴클레아제 및 특정 표적 서열로의 절단을 지시하는 RNA(들)를 포함한다. 예시적인 CRISPR-매개 유전자 편집 시스템은 Cas9 뉴클레아제 및 CRISPR RNA(crRNA) 도메인 및 트랜스-활성화 CRISPR(tracrRNA) 도메인을 갖는 RNA(들)로 구성된 CRISPR/Cas9 시스템이다. crRNA는 통상적으로 2개의 RNA 도메인을 갖는다: 염기쌍 혼성화를 통해 표적 서열("정의된 뉴클레오티드 서열"), 예를 들어, 게놈 서열에 대한 특이성을 지시하는 가이드 RNA 서열(gRNA); 및 tracrRNA에 혼성화하는 RNA 도메인. tracrRNA는 게놈 유전자좌에 대한 뉴클레아제(예를 들어, Cas9)와 상호 작용하고 이에 의해 이의 동원을 촉진할 수 있다. crRNA 및 tracrRNA 폴리뉴클레오티드는 별도의 폴리뉴클레오티드일 수 있다. crRNA 및 tracrRNA 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA)로도 지칭되는, 단일 폴리뉴클레오티드일 수 있다. 여기에서는 Cas9 시스템이 설명되어 있지만, Cpf1 시스템과 같은 다른 CRISPR 시스템을 사용할 수 있다. 뉴클레아제는 이의 유도체, 예컨대, Cas9 기능적 돌연변이체, 예를 들어, 일반적으로 Cas9 효소에 의해 통상적으로 생성되는 완전한 이중 가닥 파손과 대조적으로 정의된 뉴클레오티드 서열의 단일 가닥의 절단만을 매개하는 Cas9 "니카아제" 돌연변이체를 포함할 수 있다.
일반적으로, CRISPR 시스템의 구성 요소는 서로 상호 작용하여 리보핵단백질(RNP) 복합체를 형성하여 서열 특이적 절단을 매개한다. 일부 CRISPR 시스템에서, 각 구성 요소를 별도로 생산하여 RNP 복합체를 형성하는 데 사용할 수 있다. 일부 CRISPR 시스템에서, 각 구성 요소는 시험관 내에서 별도로 생산되고 시험관 내에서 서로 접촉(즉, "복합체화")되어 RNP 복합체를 형성할 수 있다. 그런 다음 시험관 내 생산된 RNP는 세포의 세포질 및/또는 핵, 예를 들어, T 세포의 세포질 및/또는 핵으로 도입(즉, "전달")될 수 있다. 시험관 내에서 생산된 RNP 복합체는 전기천공, 지질 매개 형질주입, 물리적 수단에 의한 세포막 변형, 지질 나노입자(LNP), 바이러스 유사 입자(VLP), 및 초음파 처리를 포함하지만 이에 한정되지 않는 다양한 수단에 의해 세포에 전달할 수 있다. 특정 예에서, 시험관 내에서 생산된 RNP 복합체는 Nucleofactor/Nucleofection® 전기천공 기반 전달 시스템(Lonza®)을 사용하여 세포에 전달될 수 있다. 다른 전기천공 시스템은 MaxCyte 전기천공 시스템, Miltenyi CliniMACS 전기천공 시스템, Neon 전기천공 시스템, 및 BTX 전기천공 시스템을 포함하지만, 이에 한정되지 않는다. CRISPR 뉴클레아제, 예를 들어, Cas9는 당업자에게 공지된 다양한 단백질 생산 기술을 사용하여 시험관 내에서 생산(즉, 합성 및 정제)될 수 있다. CRISPR 시스템 RNA, 예를 들어, sgRNA는 시험관 내 전사 또는 화학적 합성과 같은 당업자에게 공지된 다양한 RNA 생산 기술을 사용하여 시험관 내 생산(즉, 합성 및 정제)될 수 있다.
시험관 내에서 생산된 RNP 복합체는 다양한 뉴클레아제 대 gRNA 비율로 복합체를 형성할 수 있다. 시험관 내에서 생산된 RNP 복합체는 또한 CRISPR-매개 편집 시스템에서 상이한 양으로 사용될 수 있다. 예를 들어, 편집하고자 하는 세포의 수에 따라, 반응에서 많은 수의 세포를 편집할 때 첨가되는 RNP 복합체의 양을 줄이는 것과 같이 총 RNP 첨가량을 조절할 수 있다.
일부 CRISPR 시스템에서, 각각의 구성 요소(예를 들어, Cas9 및 sgRNA)는 폴리뉴클레오티드에 의해 별도로 암호화될 수 있으며, 각각의 폴리뉴클레오티드는 함께 또는 개별적으로 세포 내로 도입된다. 일부 CRISPR 시스템에서, 각각의 구성 요소는 단일 폴리뉴클레오티드(즉, 다중-프로모터 또는 다중시스트론 벡터, 하기 예시적인 다중시스트론 시스템의 설명 참조)에 의해 암호화되고 세포 내로 도입될 수 있다. 세포 내에서 각각의 폴리뉴클레오티드 암호화된 CRISPR 구성 요소의 발현(예를 들어, 뉴클레아제의 번역 및 CRISPR RNA의 전사) 후, RNP 복합체가 세포 내에서 형성될 수 있고 이어서 부위-특이적 절단을 지시할 수 있다.
일부 RNP는 핵으로의 RNP 전달을 촉진하는 모이어티를 갖도록 조작될 수 있다. 예를 들어, Cas9 뉴클레아제는 핵 국소화 신호(NLS) 도메인을 가질 수 있으므로, Cas9 RNP 복합체가 세포의 세포질 내로 전달되거나 Cas9의 번역 및 후속 RNP 형성 후에, NLS가 Cas9 RNP의 핵으로의 추가 이동을 촉진할 수 있다.
본원에 기재된 세포는 비-바이러스 방법을 사용하여 조작될 수 있고, 예를 들어, 본원에 기재된 뉴클레아제 및/또는 CRISPR 매개 유전자 편집 시스템은 비-바이러스 방법을 사용하여 세포에 전달될 수 있다. 본원에 기재된 세포는 바이러스 방법을 사용하여 조작될 수 있고, 예를 들어, 본원에 기재된 뉴클레아제 및/또는 CRISPR 매개 유전자 편집 시스템은 아데노바이러스, 레트로바이러스, 렌티바이러스 또는 본원에 기재된 임의의 다른 바이러스 기반 전달 방법과 같은 바이러스 방법을 사용하여 세포에 전달될 수 있다.
일부 CRISPR 시스템에서, 하나를 초과하는 CRISPR 조성물이 제공될 수 있어서 각각이 동일한 유전자 또는 표적 뉴클레오티드 서열보다 많은 일반 게놈 유전자좌를 개별적으로 표적화한다. 예를 들어, 2개의 개별 CRISPR 조성물은 서로의 특정 거리 내에서 2개의 상이한 표적 뉴클레오티드 서열에서 절단을 지시하기 위해 제공될 수 있다. 일부 CRISPR 시스템에서, 동일한 유전자 또는 일반 게놈 유전자좌의 반대 가닥을 각각 별도로 표적화하도록 하나를 초과하는 CRISPR 조성물이 제공될 수 있다. 예를 들어, 2개의 개별 CRISPR "니카아제" 조성물은 동일한 유전자 또는 일반 게놈 유전자좌의 반대 가닥에서 절단을 지시하기 위해 제공될 수 있다.
일반적으로, 본원에 기재된 CRISPR-매개 편집 시스템의 특징은 다른 뉴클레아제-기반 게놈 편집 시스템에 적용될 수 있다. TALEN은 조작된 부위 특이적 뉴클레아제이고, 이는 TALE(전사 활성화제 유사 효과기)의 DNA 결합 도메인 및 제한 엔도뉴클레아제 Fokl의 촉매 도메인으로 구성된다. DNA 결합 도메인의 단량체의 고도로 가변적인 잔기 영역에 존재하는 아미노산을 변경함으로써, 상이한 인공 TALEN을 생성하여 다양한 뉴클레오티드 서열을 표적화할 수 있다. DNA 결합 도메인은 후속적으로 뉴클레아제를 표적 서열로 지시하고 이중 가닥 파손을 생성한다. TALEN-기반 시스템은 미국 특허 제12/965,590호; 미국 특허 제8,450,471호; 미국 특허 제8,440,431호; 미국 특허 제8,440,432호; 미국 특허 제10,172,880호; 및 미국 특허 제13/738,381호에 더욱 상세히 기술되어 있으며, 이들 모두는 그 전체가 참조로서 본원에 포함된다. ZFN-기반 편집 시스템은 미국 특허 제6,453,242호; 제6,534,261호; 제6,599,692호; 제6,503,717호; 제6,689,558호; 제7,030,215호; 제6,794,136호; 제7,067,317호; 제7,262,054호; 제7,070,934호; 제7,361,635호; 제7,253,273호 및 미국 특허 공개 번호 제2005/0064474호; 제2007/0218528호; 제2005/0267061호에 상세히 기재되어 있고, 모두 그 전체가 사실상 참조로서 본원에 포함된다.
기타 조작 전달 시스템
조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드)을 세포 또는 다른 표적 수용자 개체로 도입하기 위한 다양한 추가 수단, 예컨대 본원에 기재된 임의의 지질 구조.
전기천공법을 사용하여 폴리뉴클레오티드를 수용자 개체에 전달할 수 있다. 전기천공법은 전기장을 적용하여 표적 세포 또는 개체의 외막 또는 껍질을 일시적으로 투과시켜 화물/페이로드를 표적 세포 또는 개체의 내부 구획으로 내부화하는 방법이다. 일반적으로, 방법은 관심 화물(예를 들어, 본원에 기재된 임의의 조작된 핵산)을 함유하는 용액에서 2개의 전극 사이에 세포 또는 표적 개체를 배치하는 단계를 포함한다. 그런 다음, 화물이 세포의 세포질과 같은 개체의 내부로 들어갈 수 있도록 하는 일시적인 설정 전압을 적용함으로써 세포의 지질막이 파괴, 즉 투과화된다. 세포의 예에서, 세포의 다수는 아닐지라도 적어도 일부는 생존할 수 있다. 세포 및 다른 개체는 시험관 내, 생체 내 또는 생체 외에서 전기천공될 수 있다. 전기천공 조건(예를 들어, 세포 수, 화물 농도, 복구 조건, 전압, 시간, 정전용량, 펄스 유형, 펄스 길이, 부피, 큐벳 길이, 전기천공 용액 조성 등)은 세포 또는 다른 수용자 개체의 유형, 전달할 화물, 원하는 내부화의 효율성, 및 원하는 생존율을 포함하지만, 이에 제한되지 않는 여러 인자에 따라 다르다. 이러한 기준의 최적화는 당업자의 범위 내에 있다. 다양한 장치 및 프로토콜을 전기천공에 사용할 수 있다. 예는 Neon® 형질주입 시스템, MaxCyte® Flow Electroporation??, Lonza® Nucleofector?? 시스템, 및 Bio-Rad® 전기천공 시스템을 포함하지만, 이에 한정되지 않는다.
조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드)을 세포 또는 다른 표적 수용자 개체로 도입하기 위한 다른 수단은 초음파 처리, 유전자 총, 유체역학적 주입 및 물리적 수단에 의한 세포막 변형을 포함하지만, 이에 한정되지 않는다.
생체 내에서 조작된 mRNA, 예를 들어 네이키드 플라스미드 또는 mRNA를 전달하기 위한 조성물 및 방법은 Kowalski 등의 문헌 [Mol Ther. 2019 Apr 10; 27(4): 710-728] 및 Kaczmarek 등의 문헌 [Genome Med. 2017; 9: 60.]에 자세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.
사용 방법
본원에 기재된 바와 같은 변형된 ER-LBD, 키메라 단백질, 또는 세포를 사용하는 방법도 또한 본 개시에 포함된다.
일부 양태에서, 방법은 관심 유전자의 전사를 조절하는 단계를 포함한다. 전사를 조절하는 방법은 (i) 변형된 ER-LBD를 포함하는 키메라 전사 인자를 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계; 키메라 단백질의 발현에 적합한 조건 하에 형질전환된 세포를 배양하는 단계; 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함할 수 있다.
일부 구현예에서, 전사를 조절하는 방법은 전사를 활성화하는 방법이다. 전사 활성화는 키메라 단백질을 사용하여 달성될 수 있다
일부 구현예에서, 방법은 전사를 활성화하는 단계를 포함한다. 전사 활성화는, 예를 들어, 변형된 ER-LBD, DNA 결합 도메인, 및 전사 활성화 도메인을 포함하는 키메라 단백질을 사용하여 달성될 수 있다.
일부 구현예에서, 방법은 전사를 억제하는 단계를 포함한다. 전사 억제는, 예를 들어, 변형된 ER-LBD, DNA 결합 도메인, 및 전사 억제 도메인을 포함하는 키메라 단백질을 사용하여 달성될 수 있다.
일부 양태에서, 방법은 키메라 단백질의 국소화를 조절하는 단계를 포함한다. 국소화를 조절하는 방법은 변형된 ER-LBD 도메인 및 관심 폴리펩티드를 포함하는 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계; 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함할 수 있다. 일부 구현예에서, 국소화를 조절하는 단계는 핵 국소화를 유도하는 단계를 포함한다.
일부 양태에서, 비-내인성 리간드는 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여된다.
생체 내 방법
본원에 제공된 방법은 또한, 예를 들어, 생체 내에서 변형된 ER-LBD 또는 키메라 단백질을 발현하는 세포에 비-내인성 리간드를 전달함으로써 생체 내에서 국소화를 변형시키거나 전사를 조절하는 단계를 포함한다.
일부 구현예에서, 형질전환된 세포는 인간 또는 동물에 존재하며, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함한다. 일부 구현예에서, 대상체에게 투여되는 비-내인성 리간드는 타목시펜을 포함한다. 타목시펜의 경구 투여 시, 약물은 간에서 활성 타목시펜 대사산물로 전환된다. 일부 구현예에서, 활성 타목시펜 대사산물은 4-하이드록시-타목시펜 ("4-OHT"), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로부터 선택된다. 일부 구현예에서, 비-내인성 리간드는 약 1 mg/일 내지 약 100 mg/일의 농도로 대상체에게 투여된다. 특정 구현예에서, 비-내인성 리간드는 약 40 mg/일의 농도로 대상체에게 투여된다.
일부 양태에서, 본원에 제공된 방법은, 예를 들어, (i) 본원에 기술된 키메라 전사 인자로 형질전환된 세포 및 (ii) 비-내인성 리간드를 대상체에게 전달함으로써 생체 내에서 관심 유전자의 전사를 조절하는 단계를 또한 포함한다. 일부 구현예에서, 형질전환된 세포는 관심 유전자에 작동 가능하게 연결된 키메라-전사 인자 반응성 프로모터를 포함하는 표적 유전자 발현 카세트를 포함한다.
일부 구현예에서, 대상체는 인간 또는 동물이고, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 비-내인성 리간드의 약리학적 용량을 인간 또는 동물에게 투여하는 단계를 포함한다.
일부 양태에서, 본원에 제공된 방법은 또한 본원에 기재된 조작된 세포를 생체 내 생산할 수 있는, 예를 들어, 본원에 기재된 폴리뉴클레오티드 분자를 생체 내 세포에 전달할 수 있는 조성물을 전달하는 단계를 포함한다. 이러한 조성물은 임의의 바이러스 매개 전달 플랫폼, 임의의 지질 구조 전달 시스템, 임의의 나노입자 전달 시스템, 임의의 게놈 편집 시스템, 또는 생체 내 세포 조작을 할 수 있는 본원에 기재된 임의의 다른 조작 전달 시스템을 포함한다.
본원에 제공된 방법은 또한 본원에 기술된 바와 같은 변형된 ER-LBD, 키메라 단백질, 또는 키메라 전사 인자 중 어느 하나(및 일부 구현예에서, 키메라 전사 인자에 의해 조절된 유전자)를 생체 내 생산할 수 있는 조성물을 전달하는 단계를 포함한다. 변형된 ER-LBD, 키메라 단백질, 또는 키메라 전사 인자(및 일부 구현예에서, 키메라 전사 인자에 의해 조절된 유전자)를 생체 내 생산할 수 있는 조성물은, 이에 한정되지는 않으나, 본원에 기재된 임의의 조작된 핵산을 포함한다. 유도 가능한 전사 인자(및 일부 구현예에서, 유도 가능한 전사 인자에 의해 조절되는 유전자)의 생체 내 생산이 가능한 조성물은 네이키드 mRNA 또는 네이키드 플라스미드일 수 있다.
약학적 조성물
본 개시의 변형된 ER-LBD, 키메라 단백질, 및 세포는 약학적 조성물로 제형화될 수 있다. 이들 조성물은 하나 이상의 조작된 핵산 또는 조작된 세포에 더하여, 약학적으로 허용 가능한 부형제, 담체, 완충제, 안정화제 또는 당업자에게 널리 공지된 다른 물질을 포함할 수 있다. 이러한 물질은 독성이 없어야 하며 활성 성분의 효능을 방해해서는 안 된다. 담체 또는 다른 물질의 정확한 특성은 투여 경로, 예를 들어 경구, 정맥내, 피부 또는 피하, 비강, 근육내, 복강내 경로에 따라 달라질 수 있다.
개체에게 제공되는 것이 본 개시에 따른 세포, 폴리펩티드, 핵산, 소분자 또는 기타 약학적으로 유용한 화합물이든 간에, 투여는 바람직하게는 개체에게 혜택을 나타내기에 충분한 "치료적 유효량" 또는 "예방적 유효량" (경우에 따라, 예방이 요법으로 간주될 수 있지만)이다. 투여되는 실제 양, 투여 속도 및 시간 경과는 치료되는 질환의 성질 및 중증도에 따라 달라질 것이다. 투여량의 결정 등과 같은 치료 처방은 일반의 및 기타 의사의 책임이고 일반적으로 치료할 장애, 개별 환자의 상태, 전달 부위, 투여 방법 및 실무자에게 알려진 기타 인자를 고려한다. 전술한 기술 및 프로토콜의 예는 문헌[Remington's Pharmaceutical Sciences, 16th edition, Osol, A. (ed), 1980]에서 찾을 수 있다.
조성물은 치료될 상태에 따라 단독으로 또는 동시에 또는 순차적으로 다른 치료와 조합하여 투여될 수 있다.
추가 구현예
하기 단락은 추가적으로 나열된 구현예를 제공한다.
1.
서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).
2.
서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고 변형된 ER-LBD는 하나 이상의 추가 아미노산 치환으로 인해 내인성 리간드와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).
3.
서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).
4.
단락 1 내지 3 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재하는, 변형된 ER-LBD.
5.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함하는, 변형된 ER-LBD.
6.
단락 5에 있어서, 서열번호 1의 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M343F, M343I, M343L, 및 M343V.
7.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함하는, 변형된 ER-LBD.
8.
단락 7에 있어서, 서열번호 1의 위치 344에서의 아미노산 치환은 G344M인, 변형된 ER-LBD.
9.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함하는, 변형된 ER-LBD.
10.
단락 9에 있어서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S인, 변형된 ER-LBD.
11.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함하는, 변형된 ER-LBD.
12.
단락 11에 있어서, 서열번호 1의 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L346I, L346M, L346F, 및 L346V.
13.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함하는, 변형된 ER-LBD.
14.
단락 13에 있어서, 서열번호 1의 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.
15.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함하는, 변형된 ER-LBD.
16.
단락 15에 있어서, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K인, 변형된 ER-LBD.
17.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함하는, 변형된 ER-LBD.
18.
단락 17에 있어서, 서열번호 1의 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L349I, L349M, L349F, 및 L349V.
19.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함하는, 변형된 ER-LBD.
20.
단락 19에 있어서, 서열번호 1의 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: A350F, A350I, A350L, A350M 및 A350V.
21.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함하는, 변형된 ER-LBD.
22.
단락 21에 있어서, 서열번호 1의 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.
23.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함하는, 변형된 ER-LBD.
24.
단락 23에 있어서, 서열번호 1의 위치 352에서의 아미노산 치환은 R352K인, 변형된 ER-LBD.
25.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함하는, 변형된 ER-LBD.
26.
단락 25에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L354I, L354M, L354F, 및 L354V.
27.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함하는, 변형된 ER-LBD.
28.
단락 27에 있어서, 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q인, 변형된 ER-LBD.
29.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함하는, 변형된 ER-LBD.
30.
단락 29에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L384I, L384M, L384F, 및 L384V.
31.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함하는, 변형된 ER-LBD.
32.
단락 31에 있어서, 서열번호 1의 위치 386에서의 아미노산 치환은 I386V인, 변형된 ER-LBD.
33.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함하는, 변형된 ER-LBD.
34.
단락 33에 있어서, 서열번호 1의 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L387I, L387M, L387F, 및 L387V.
35.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함하는, 변형된 ER-LBD.
36.
단락 35에 있어서, 서열번호 1의 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M388I, M388L, 및 M388F.
37.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함하는, 변형된 ER-LBD.
38.
단락 37에 있어서, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M인, 변형된 ER-LBD.
39.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함하는, 변형된 ER-LBD.
40.
단락 39에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L391I, L391M, L391F, 및 L391V.
41.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함하는, 변형된 ER-LBD.
42.
단락 41에 있어서, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M인, 변형된 ER-LBD.
43.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함하는, 변형된 ER-LBD.
44.
단락 43에 있어서, 서열번호 1의 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: F404I, F404L, F404M, 및 F404V.
45.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함하는, 변형된 ER-LBD 1.
46.
단락 45에 있어서, 서열번호 1의 위치 407에서의 아미노산 치환은 N407D인, 변형된 ER-LBD.
47.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함하는, 변형된 ER-LBD.
48.
단락 47에 있어서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V인, 변형된 ER-LBD.
49.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함하는, 변형된 ER-LBD.
50.
단락 49에 있어서, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D인, 변형된 ER-LBD.
51.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함하는, 변형된 ER-LBD.
52.
단락 51에 있어서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E인, 변형된 ER-LBD.
53.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함하는, 변형된 ER-LBD.
54.
단락 53에 있어서, 서열번호 1의 위치 417에서의 아미노산 치환은 C417S인, 변형된 ER-LBD.
55.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함하는, 변형된 ER-LBD.
56.
단락 55에 있어서, 서열번호 1의 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V418I, V418L, V418M, 및 V418F.
57.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함하는, 변형된 ER-LBD.
58.
단락 57에 있어서, 서열번호 1의 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: G420I, G420M, G420F, 및 G420V.
59.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함하는, 변형된 ER-LBD.
60.
단락 59에 있어서, 서열번호 1의 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M421I, M421L, M421F, 및 M421V.
61.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함하는, 변형된 ER-LBD.
62.
단락 61에 있어서, 서열번호 1의 위치 422에서의 아미노산 치환은 V422I인, 변형된 ER-LBD.
63.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함하는, 변형된 ER-LBD.
64.
단락 63에 있어서, 서열번호 1의 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: I424L, I424M, I424F, 및 I424V.
65.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함하는, 변형된 ER-LBD.
66.
단락 65에 있어서, 서열번호 1의 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L428I, L428M, L428F, 및 L428V.
67.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함하는, 변형된 ER-LBD.
68.
단락 67에 있어서, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P인, 변형된 ER-LBD.
69.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함하는, 변형된 ER-LBD.
70.
단락 69에 있어서, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A인, 변형된 ER-LBD.
71.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함하는, 변형된 ER-LBD.
72.
단락 71에 있어서, 서열번호 1의 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: G521A, G521F, G521I, G521L, G521M, 및 G521V.
73.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함하는, 변형된 ER-LBD.
74.
단락 73에 있어서, 서열번호 1의 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M522I, M522L, 및 M522V.
75.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함하는, 변형된 ER-LBD.
76.
단락 75에 있어서, 서열번호 1의 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: H524A, H524I, H524L, H524F, 및 H524V.
77.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함하는, 변형된 ER-LBD.
78.
단락 77에 있어서, 서열번호 1의 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.
79.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함하는, 변형된 ER-LBD.
80.
단락 79에 있어서, 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L인, 변형된 ER-LBD.
81.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함하는, 변형된 ER-LBD.
82.
단락 81에 있어서, 서열번호 1의 위치 527에서의 아미노산 치환은 S527N인, 변형된 ER-LBD.
83.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함하는, 변형된 ER-LBD.
84.
단락 83에 있어서, 서열번호 1의 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M528F, M528I, 및 M528V.
85.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함하는, 변형된 ER-LBD.
86.
단락 85에 있어서, 서열번호 1의 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V533F 및 V533W.
87.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함하는, 변형된 ER-LBD.
88.
단락 87에 있어서, 서열번호 1의 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V534Q 및 V534R.
89.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함하는, 변형된 ER-LBD.
90.
단락 89에 있어서, 서열번호 1의 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L536F, 및 L536M, L536R, 및 L536Y.
91.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함하는, 변형된 ER-LBD.
92.
단락 91에 있어서, 서열번호 1의 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: Y537E 및 Y537S.
93.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함하는, 변형된 ER-LBD.
94.
단락 93에 있어서, 서열번호 1의 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: D538G 및 D538K.
95.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함하는, 변형된 ER-LBD.
96.
단락 95에 있어서, 서열번호 1의 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L539A 및 L539R.
97.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함하는, 변형된 ER-LBD.
98.
단락 97에 있어서, 서열번호 1의 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L540A 및 L540F.
99.
단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함하는, 변형된 ER-LBD.
100.
단락 99에 있어서, 서열번호 1의 위치 547에서의 아미노산 치환은 H547A인, 변형된 ER-LBD.
101.
단락 1 내지 100 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환인, 변형된 ER-LBD.
102.
단락 101에 있어서, 2개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있는, 변형된 ER-LBD: 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525.
103.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하는, 변형된 ER-LBD.
104.
단락 103에 있어서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고 서열번호 1의 위치 348에서의 아미노산 치환은 N348K인, 변형된 ER-LBD.
105.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하는, 변형된 ER-LBD.
106.
단락 105에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 389에서의 아미노산 치환은 I389M인, 변형된 ER-LBD.
107.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하는, 변형된 ER-LBD.
108.
단락 107에 있어서, 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고 서열번호 1의 위치 392에서의 아미노산 치환은 V392M인, 변형된 ER-LBD.
109.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하는, 변형된 ER-LBD.
110.
단락 109에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.
111.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하는, 변형된 ER-LBD.
112.
단락 111에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 384에서의 아미노산 치환은 L384M인, 변형된 ER-LBD.
113.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하는, 변형된 ER-LBD.
114.
단락 113에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M인, 변형된 ER-LBD.
115.
단락 102에 있어서, 2개의 아미노산 치환은 위치 387 및 391에 존재하는, 변형된 ER-LBD.
116.
단락 115에 있어서, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.
117.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재하는, 변형된 ER-LBD.
118.
단락 117에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M인, 변형된 ER-LBD.
119.
단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재하는, 변형된 ER-LBD.
120.
단락 117에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.
121.
단락 1 내지 120 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환인, 변형된 ER-LBD.
122.
단락 121에 있어서, 3개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525.
123.
단락 122에 있어서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하는, 변형된 ER-LBD.
124.
단락 123에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.
125.
단락 122에 있어서, 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하는, 변형된 ER-LBD.
126.
단락 125에 있어서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
127.
단락 1 내지 126 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환인, 변형된 ER-LBD.
128.
단락 127에 있어서, 4개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525.
129.
단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하는, 변형된 ER-LBD.
130.
단락 129에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I인, 변형된 ER-LBD.
131.
단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하는, 변형된 ER-LBD.
132.
단락 131에 있어서, 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이며, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L인, 변형된 ER-LBD.
133.
단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하는, 변형된 ER-LBD.
134.
단락 133에 있어서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N인, 변형된 ER-LBD.
135.
단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하는, 변형된 ER-LBD.
136.
단락 135에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P인, 변형된 ER-LBD.
137.
단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하는, 변형된 ER-LBD.
138.
단락 137에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
139.
단락 1 내지 138 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환인, 변형된 ER-LBD.
140.
단락 139에 있어서, 5개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 및 524.
141.
단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하는, 변형된 ER-LBD.
142.
단락 141에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
143.
단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하는, 변형된 ER-LBD.
144.
단락 143에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
145.
단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.
146.
단락 145에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
147.
단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하는, 변형된 ER-LBD.
148.
단락 147에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
149.
단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463 및 524에 존재하는, 변형된 ER-LBD.
150.
단락 149에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
151.
단락 1 내지 150 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 6개의 아미노산 치환인, 변형된 ER-LBD.
152.
단락 151에 있어서, 6개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 및 524.
153.
단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.
154.
단락 153에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
155.
단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.
156.
단락 155에 있어서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
157.
단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하는, 변형된 ER-LBD.
158.
단락 157에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
159.
단락 1 내지 158 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환인, 변형된 ER-LBD.
160.
단락 159에 있어서, 7개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524.
161.
단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.
162.
단락 161에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
163.
단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하는, 변형된 ER-LBD.
164.
단락 163에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.
165.
단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하는, 변형된 ER-LBD.
166.
단락 165에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
167.
단락 1 내지 166 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 8개의 아미노산 치환인, 변형된 ER-LBD.
168.
단락 167에 있어서, 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하는, 변형된 ER-LBD.
169.
단락 168에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
170.
단락 1 내지 169 중 어느 하나에 있어서, 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함하는, 변형된 ER-LBD.
171.
단락 1 내지 170 중 어느 하나에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD.
172.
단락 1 내지 171 중 어느 하나의 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질.
173.
단락 172에 있어서, 관심 폴리펩티드는 핵산 결합 도메인을 포함하는, 키메라 단백질.
174.
단락 173에 있어서, 핵산 결합 도메인은 징크 핑거 도메인을 포함하는, 키메라 단백질.
175.
단락 174에 있어서, 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함하는, 키메라 단백질.
176.
단락 172 내지 175 중 어느 하나에 있어서, 키메라 단백질은 키메라 전사 인자를 포함하고, 관심 폴리펩티드는 핵산 결합 도메인 및 전사 조절인자 도메인을 포함하는, 키메라 단백질.
177.
단락 176에 있어서, 전사 조절인자 도메인은 전사 활성인자인, 키메라 단백질.
178.
단락 177에 있어서, 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된, 키메라 단백질.
179.
단락 178에 있어서, 전사 활성인자는 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자인, 키메라 단백질.
180.
단락 1 내지 171 중 어느 하나의 변형된 ER-LBD를 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.
181.
단락 172 내지 179 중 어느 하나의 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.
182.
단락 180의 폴리뉴클레오티드 분자에 작동가능하게 연결된 프로모터를 포함하는 이종 작제물.
183.
단락 181의 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물.
184.
단락 182의 이종 작제물을 포함하는 플라스미드.
185.
단락 183의 이종 작제물을 포함하는 플라스미드.
186.
단락 182의 이종 작제물 또는 단락 184의 플라스미드를 포함하는 세포.
187.
단락 183의 이종 작제물 또는 단락 185의 플라스미드를 포함하는 세포.
188.
관심 유전자의 전사를 조절하기 위한 유전자 스위치로서,
(a)
단락 176의 키메라 단백질로서, 키메라 단백질은 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는 키메라 단백질; 및
(b)
비-내인성 리간드로서, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는, 비-내인성 리간드를 포함하는, 유전자 스위치.
189.
구현예 188에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 유전자 스위치.
190.
단락 188 또는 단락 189에 있어서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절자, 공동 활성화 분자, 종양 미세환경 조절제 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화하는, 유전자 스위치.
191.
단락 190에 있어서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화하는, 유전자 스위치: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파.
192.
단락 191에 있어서, 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화하는, 유전자 스위치.
193.
관심 유전자의 전사를 조절하는 방법으로서, (i) 단락 176의 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하는, 방법.
194.
단락 193에 있어서, 방법은 키메라 단백질이 전사를 조절하도록 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하는, 방법.
195.
단락 193 또는 단락 194에 있어서, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화하는 단계를 포함하는, 방법.
196.
단락 193 또는 단락 194에 있어서, 전사를 조절하는 단계는 관심 유전자의 전사를 억제하는 단계를 포함하는, 방법.
197.
단락 193 내지 196 중 어느 하나에 있어서, 표적 발현 카세트는 단락 174의 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되는, 방법.
198.
단락 193 내지 196 중 어느 하나에 있어서, 표적 발현 카세트는 제2 이종 작제물에 의해 암호화되는, 방법.
199.
키메라 단백질의 국소화를 조절하는 방법으로서, 단락 172 내지 179 중 어느 하나의 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함하는, 방법.
200.
단락 199에 있어서, 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하는, 방법.
201.
단락 193, 또는 단락 195 내지 단락 200 중 어느 하나에 있어서, 형질전환된 세포는 인간 또는 동물에 존재하고, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함하는, 방법.
202.
단락 193 내지 201 중 어느 하나에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법.
203.
단락 201 또는 단락 202에 있어서, 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여되는, 방법.
실시예
하기는 본 개시를 수행하기 위한 특정 구현예의 실시예이다. 실시예는 단지 예시 목적으로 제공되며, 어떠한 방식으로도 본 개시의 범위를 제한하는 것으로 의도되지 않는다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위한 노력이 이루어졌지만, 일부 실험적 오류 및 편차가 물론 허용되어야 한다.
본 개시의 실행은 달리 지시되지 않는 한, 당업계의 기술 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법을 사용할 것이다. 이러한 기술은 문헌에서 완전히 설명된다. 예를 들어, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman 및 Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick 및 N. Kaplan eds., Academic Press, Inc.) ; Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey 및 Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A 및 B(1992) 참조.
실시예 1: 리간드 결합을 조절하는 것으로 예측되는 ERT2 돌연변이
서열번호 2의 ERT2와 비교했을 때, 4-OHT에 대한 민감도가 증가될 것으로 예측되는 돌연변이를 식별하기 위해, ERT2로 알려진 에스트로겐 수용체 알파의 돌연변이체 형태에 대한 4-OHT, 엔독시펜 및 에스트라디올 결합에 대한 인실리코 모델링을 수행하였다.
물질 및 방법
에스트라디올과 ERα(PDB: 1QKU, 해상도 3.2 Å) 사이 및 4-OHT와 ERα(PDB: 3ERT, 해상도 1.9 Å) 사이의 복합체의 이용 가능한 결정 구조를 사용하여 에스트라디올과 ERT2, 4-OHT와 ERT2, 및 엔독시펜과 ERT2 사이의 복합체의 모델을 생성하였다. ERT2 서열은 3개의 잔기(G400V/M543A/L544A)가 ERα와 상이하다. 이용 가능한 구조가 모두 이 영역으로만 해상되었으므로, 306 내지 551의 잔기만이 구조 모델에 사용되었다.
표준 프로토콜(Kannan et al. ACS Omega. 2017 Nov 30; 2(11): 7881-7891.)을 사용하여, apo ERT2, ERT2 - 에스트라디올, ERT2 - 4-OHT 및 ERT2 - 엔독시펜 복합체에 대해 MD 시뮬레이션을 수행하였다(각 시뮬레이션은 각각 100 ns간 3회 수행함). ERT2 및 결합된 리간드/약물 둘 다는 시뮬레이션 동안 안정적으로 유지되었다(표준 측정 사용). 시뮬레이션의 마지막 절반(50 ns) 동안 생성된 형태(시뮬레이션은 평형화된 것으로 간주됨)를 후속 분석에 사용하였다.
결과
개선된 4-OHT 결합에 대해 제1 세트의 돌연변이를 인 실리코 분석하였다. 다른 에스트로겐 수용체 단백질에 대한 상동성 위치에 존재하는 아미노산에 기초하여, 리간드 결합 포켓 내의 잔기에 대한 18개의 돌연변이를 선택하였다. 선택된 18개의 돌연변이 중, 17개의 돌연변이체는 야생형 ERT2보다 적어도 1.8 kcal/mol 만큼 더 단단히 결합하고; M517A 돌연변이만이 4-OHT의 결합을 불안정하게 하는 것으로 보인다(도 1a). 다음으로, 에스트라디올의 결합에 대한 돌연변이의 효과를 보기 위해 결합 에너지 계산을 수행하였다. 4-OHT(M517A를 제외한 모든 돌연변이는 음성 △△G 값으로 표시된 바와 같이 결합을 선호함)와 비교하여, 대부분의 돌연변이(도 1b)는 에스트라디올의 결합에 무시할 만한 효과를 가졌다(대부분의 돌연변이에 대해 2 kcal/mol 보다 큰 4-OHT의 △△G 값과 비교하여, 모든 돌연변이에 대한 △△G 값은 2 kcal/mol 이내임). 돌연변이 L409V, M517A 및 N407D만이 에스트라디올에 대해 1 kcal/mol 초과하는 결합의 증가를 나타냈지만, L409V 및 N407D 둘 모두는 각각 3 및 4 kcal/mol 만큼 4-OHT에 더 단단히 결합한다. 제1 세트의 돌연변이는 아래 표 6에 나타나 있다.
돌연변이 | ||
G344M | I389M | C417S |
L345S | V392M | M421I |
N348K | N407D | V422I |
R352K | L409V | M517A |
L384M | N413D | Y526L |
I386V | Q414E | S527N |
개선된 4-OHT 결합에 대해 제2 세트의 돌연변이를 인 실리코 분석하였다. 야생형 ERT2와 비교하여, 4-OHT에 대한 민감도가 증가된 추가 돌연변이체를 식별하기 위해, 리간드 결합 포켓의 5개의 추가 부위(표 6에 나타낸 것에 추가)에서 19개의 상이한 돌연변이에 대해 ERT2에 대한 4-OHT 및 에스트라디올 결합에 대하여 분자 도킹 시뮬레이션을 수행하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 돌연변이 19개 모두 1.8 kcal/mol 내지 7 kcal/mol 범위로 4-OHT에 대한 결합개선을 나타냈다(도 2 참조). 제2 세트의 돌연변이는 표 7에 나타나 있다.
돌연변이 | ||
L354I | L387I | L391V |
L354M | L387M | G420I |
L354F | L387F | G420M |
L354V | L387V | G420F |
L384I | L391I | G420V |
L384V | L391M | |
L384F | L391F |
개선된 4-OHT 결합에 대해 제3 세트의 돌연변이를 인 실리코 분석하였다. 리간드 결합 포켓 내의 추가 6개의 잔기 위치(잔기 428, 346, 349, 418, 421, 및 424)에서 총 23개의 돌연변이를 분자 도킹 시뮬레이션을 위해 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 돌연변이 중 6개(L346F, L349M, V418I, V418M, I424M, 및 M421L)는 4-OHT에 대해 적어도 약 1.5 kcal/mol만큼 개선된 결합을 나타냈다(도 3). 이들 23개의 돌연변이는 표 8에 나타나 있다.
돌연변이 | ||
L346I | V418I | I424M |
L346M | V418L | I424F |
L346F | V418M | I424V |
L346V | V418F | L428I |
L349I | M421L | L428M |
L349M | M421F | L428F |
L349F | M421V | L428V |
L349V | I424L |
개선된 4-OHT 결합에 대해 제4 세트의 돌연변이를 인 실리코 분석하였다. 리간드 결합 포켓 내의 추가 6개의 잔기 위치(잔기 528, 343, 388, 522, 414, 및 521)에서 총 23개의 돌연변이를 분자 도킹 시뮬레이션을 위해 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 23개의 돌연변이 중 18개는 4-OHT에 대해 적어도 약 1.0 kcal/mol 만큼 개선된 결합을 나타냈다(도 4). 제4 세트의 돌연변이는 표 9에 나타나 있다.
돌연변이 | ||
M343I | F404L | G521V |
M343L | F404M | M522I |
M343F | F404V | M522L |
M343V | G521A | M522V |
M388I | G521I | M528I |
M388L | G521L | M528F |
M388F | G521M | M528V |
F404I | G521F |
개선된 4-OHT 결합에 대해 제5 세트의 돌연변이를 인 실리코 분석하였다. 분자 도킹 시뮬레이션을 위해 5개의 추가 잔기 위치(잔기 524, 525, 347, 350, 및 351)에서 총 38개의 돌연변이를 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 38개의 돌연변이 중 28개는 4-OHT에 대해 적어도 약 1.0 kcal/mol 만큼 그리고 최대 약 4.5 kcal/mol의 개선된 결합을 나타냈다(도 5). 제5 세트의 돌연변이는 표 10에 나타나 있다.
돌연변이 | |
H524A | T347S |
H524I | A350I |
H524L | A350L |
H524F | A350M |
H524V | A350F |
L525N | A350V |
L525Q | D351N |
L525I | D351Q |
L525M | D351E |
L525F | D351I |
L525S | D351L |
L525T | D351M |
L525V | D351F |
T347V | D351V |
세트 1~5에 대한 모든 돌연변이를 엔독시펜 및 에스트라디올에 대한 결합에 대해 분자 도킹 시뮬레이션으로 추가로 분석하여 엔독시펜 및 에스트라디올에 대한 결합 에너지를 결정하였다(kcal/mol 단위의 △△G로 계산됨). 또한, 에스트라디올 결합과 비교하여 엔독시펜 결합의 결합 에너지 간의 차이를 △△△G 값으로 계산하였다. 4-OHT, 엔독시펜, 및 에스트라디올 각각에 대한 결합 에너지, 및 에스트라디올 결합과 비교한 4-OHT 및 엔독시펜의 결합 에너지 차이의 요약이 표 11에 나타나 있다.
4-OHT(△△G)
(kcal/mol) |
END(△△G)
(kcal/mol) |
EST(△△G)
(kcal/mol) |
4-OHT-EST(△△△G)
(kcal/mol) |
END-EST(△△△G)(kcal/mol) | |
M343I | -3.4 | -2.2 | 1.5 | -4.9 | -3.7 |
M343L | -2.2 | -1.6 | 0.9 | -3.1 | -2.6 |
M343V | 0 | -0.7 | 1.8 | -1.8 | -2.5 |
M343F | -2 | -1.6 | 2.2 | -4.2 | -3.8 |
G344M | -1.6 | -1.4 | -0.6 | -1 | -0.8 |
L345S | -4.3 | 1.1 | -0.1 | -4.2 | 1.2 |
L346I | 2.2 | -0.8 | -0.9 | 3.1 | 0.1 |
L346M | -0.4 | -0.8 | -0.5 | 0.1 | -0.3 |
L346V | 1.3 | 0.8 | 0.5 | 0.8 | 0.3 |
L346F | -1.7 | -0.8 | -0.1 | -1.6 | -0.6 |
T347I | -0.1 | -0.7 | 0.4 | -0.5 | -1.1 |
T347L | -1.6 | -1.2 | 0.5 | -2 | -1.7 |
T347M | -2.4 | -2.3 | -1.9 | -0.5 | -0.3 |
T347N | -0.3 | -2.7 | 1.1 | -1.4 | -3.8 |
T347R | -3.3 | -4.3 | -0.8 | -2.5 | -3.5 |
T347V | -1.7 | -0.9 | 0 | -1.7 | -0.9 |
T347D | 0.4 | 3.8 | 0.4 | 0 | 3.4 |
T347E | -1.2 | 2.5 | 1.1 | -2.3 | 1.4 |
T347F | -3.2 | -2.2 | 0.1 | -3.3 | -2.2 |
T347K | -1.3 | -2.5 | 1.4 | -2.7 | -3.9 |
T347Q | -0.4 | 0.4 | 1.3 | -1.8 | -0.9 |
T347S | 0.2 | -2.7 | 1.1 | -0.9 | -3.7 |
N348K | -5.5 | -3.6 | 0.8 | -6.3 | -4.4 |
L349I | 3.4 | 1.4 | 2 | 1.4 | -0.6 |
L349M | -1.5 | -2 | 2.6 | -4.1 | -4.6 |
L349V | 0.5 | 1.5 | 1.7 | -1.2 | -0.2 |
L349F | 0.9 | -0.8 | -0.7 | 1.6 | -0.1 |
A350L | 0.6 | -0.6 | 1 | -0.4 | -1.6 |
A350M | -0.5 | -2 | 1.3 | -1.8 | -3.3 |
A350V | -0.2 | -1.1 | 0.5 | -0.7 | -1.5 |
A350F | -0.7 | -2.3 | -1 | 0.4 | -1.3 |
A350I | -1.3 | -3.8 | 0.6 | -1.9 | -4.4 |
D351I | -1.2 | -3.5 | 2 | -3.2 | -5.5 |
D351L | -1.7 | -3.2 | 0.4 | -2.1 | -3.6 |
D351M | -3.6 | -3 | -0.2 | -3.4 | -2.9 |
D351N | -1.3 | -2.1 | 1.8 | -3.2 | -4 |
D351V | -3.2 | -3.8 | 0.6 | -3.8 | -4.4 |
D351E | -1.2 | 1 | 0.7 | -1.8 | 0.3 |
D351F | -3.4 | -2.2 | 1.2 | -4.6 | -3.4 |
D351Q | -3 | 0.1 | 0.3 | -3.2 | -0.2 |
R352K | -3.8 | -2.5 | 0.1 | -3.9 | -2.6 |
L354I | -6.9 | -2.5 | 0.9 | -7.8 | -3.4 |
L354M | -4.2 | -1.3 | 0.9 | -5.1 | -2.2 |
L354V | -3.5 | -2.5 | 1.5 | -5 | -4 |
L354F | -4.9 | -2.6 | 0.7 | -5.6 | -3.3 |
L384I | -2.7 | -4.6 | 0.3 | -3 | -4.9 |
L384M | -3.3 | 0 | 1.4 | -4.7 | -1.4 |
L384V | -3.6 | -2.5 | 3.2 | -6.9 | -5.7 |
L384F | -2.6 | -0.4 | 3 | -5.5 | -3.3 |
I386V | -1.8 | -3.4 | 0.4 | -2.2 | -3.8 |
L387I | -2.9 | -2.6 | 0.4 | -3.2 | -3 |
L387M | -7.3 | -1.9 | 0.3 | -7.5 | -2.2 |
L387V | -5 | -2.4 | -0.7 | -4.3 | -1.6 |
L387F | -2 | -0.4 | 1.1 | -3 | -1.4 |
M388I | -3.2 | -1.7 | 0.3 | -3.5 | -2 |
M388L | 1 | -0.7 | 1.9 | -0.9 | -2.6 |
M388F | -1.8 | -1.6 | 1.2 | -3 | -2.8 |
I389M | -4.6 | -2.1 | 0.6 | -5.2 | -2.7 |
L391I | -5.8 | -2.8 | 2 | -7.8 | -4.8 |
L391M | -4.1 | -4.5 | 0 | -4.1 | -4.5 |
L391V | -5.6 | -3.4 | 1.5 | -7.1 | -4.9 |
L391F | -7.2 | -1.5 | 0.1 | -7.3 | -1.6 |
V392M | -3.9 | -2.6 | 0.6 | -4.5 | -3.2 |
F404I | -2.2 | -1.3 | 2 | -4.2 | -3.4 |
F404L | -2.8 | -1.7 | -0.5 | -2.3 | -1.2 |
F404M | -1.5 | -0.3 | 2.2 | -3.7 | -2.4 |
F404V | 1 | -1 | 1.4 | -0.4 | -2.4 |
N407D | -3.5 | -2.2 | -1.1 | -2.4 | -1.1 |
L409V | -2.5 | -1.8 | -1.2 | -1.3 | -0.6 |
N413D | -4.7 | -0.8 | -0.4 | -4.3 | -0.4 |
Q414E | -4.5 | -1.8 | -0.1 | -4.4 | -1.7 |
C417S | -2.6 | -1 | 1.2 | -3.8 | -2.2 |
V418I | -2.3 | -1.1 | 1.9 | -4.2 | -3.1 |
V418L | 1.5 | -1.3 | 2 | -0.5 | -3.2 |
V418M | -1.2 | -1.8 | 1.4 | -2.6 | -3.2 |
V418F | 0.4 | -2.6 | 0.6 | -0.3 | -3.2 |
G420I | -5.3 | -2.8 | -0.2 | -5.1 | -2.6 |
G420M | -6 | -3.9 | -1.2 | -4.8 | -2.7 |
G420V | -4 | -2.5 | 0.1 | -4.1 | -2.6 |
G420F | -4.6 | -4 | 3.3 | -7.9 | -7.3 |
M421I | -3.3 | -2.1 | 0.1 | -3.4 | -2.2 |
M421L | -0.9 | -1.7 | 0 | -0.9 | -1.7 |
M421V | 0.5 | 0.4 | 0.4 | 0.1 | 0 |
M421F | 0.3 | -1.4 | -0.7 | 1 | -0.8 |
V422I | -2.4 | -2.2 | -0.7 | -1.7 | -1.5 |
I424L | 0.8 | -0.8 | -0.6 | 1.3 | -0.2 |
I424M | -1.4 | -1.8 | 0.3 | -1.7 | -2 |
I424V | 0.8 | -1.8 | 3.1 | -2.3 | -4.9 |
I424F | 1.3 | -1.4 | 0.8 | 0.5 | -2.2 |
L428I | 1.3 | -0.5 | 0.5 | 0.8 | -1.1 |
L428M | 0 | -1.9 | 0.9 | -0.9 | -2.8 |
L428V | -0.2 | -0.1 | 2.3 | -2.4 | -2.4 |
L428F | 1.3 | 0.7 | 1.3 | 0 | -0.6 |
M517A | 1.2 | 0.8 | -1.1 | 2.3 | 1.9 |
G521A | -2 | 0 | 0.2 | -2.2 | -0.2 |
G521I | -3.2 | -0.3 | 2.3 | -5.5 | -2.6 |
G521L | -2 | -1 | 1.9 | -3.9 | -2.9 |
G521M | -1.7 | -2.5 | 3.3 | -5 | -5.8 |
G521V | -1.8 | -1.1 | 0.5 | -2.3 | -1.6 |
G521F | -2 | -1.8 | 3.4 | -5.4 | -5.3 |
M522I | -2.9 | -2 | 1.7 | -4.6 | -3.7 |
M522L | 0.8 | -0.7 | 0.1 | 0.7 | -0.8 |
M522V | -0.5 | -1 | -0.7 | 0.2 | -0.3 |
H524A | -2.1 | -3 | -0.4 | -1.7 | -2.6 |
H524I | -3 | -3 | 2.8 | -5.8 | -5.8 |
H524L | -1.2 | -1.3 | 2 | -3.3 | -3.3 |
H524V | -3.6 | -3.3 | 0.6 | -4.2 | -4 |
H524F | -2.1 | -3.9 | 2.7 | -4.8 | -6.6 |
L525I | -1.8 | -2.1 | 0.5 | -2.3 | -2.6 |
L525M | -1.2 | -1.8 | -0.2 | -0.9 | -1.5 |
L525N | -4.4 | -1.4 | -0.4 | -4 | -0.9 |
L525T | -1.2 | -2.3 | 0.6 | -1.7 | -2.9 |
L525V | -3.6 | -4.5 | -1 | -2.7 | -3.5 |
L525F | -0.8 | -1.1 | -0.4 | -0.4 | -0.6 |
L525Q | -2.8 | -3.4 | -1.4 | -1.4 | -2 |
L525S | 1.8 | -2.4 | 0.3 | 1.5 | -2.7 |
Y526L | -2.8 | -2 | 0.1 | -2.9 | -2.1 |
S527N | -5.8 | -3 | 1.5 | -7.3 | -4.5 |
M528I | -1 | -2.5 | 0.5 | -1.5 | -2.9 |
M528V | -1 | -1.1 | 3 | -4 | -4.1 |
M528F | -1.5 | -1 | 2.5 | -4 | -3.5 |
제6 세트의 돌연변이를 인 실리코 분석하여 작용제-결합 확인(즉, 에스트라디올-결합 형태)을 불안정하게 하고/하거나 길항제-결합 확인(즉, 4-OHT 또는 엔독시펜-결합 형태)을 안정화시키는 돌연변이체를 식별하였다. 작용제-결합 형태와 길항제-결합 형태 사이의 주요 구조적 차이는 나선 12의 배향 및 도킹 부위에 있다(H12, 도 6 참조). 나선 12 내 8개의 잔기 위치에서 총 14개의 돌연변이(잔기 538, 536, 539, 540, 547, 534, 533, 및 537)를 분석을 위해 선택하였다. 길항제-결합 형태의 돌연변이체 ERT2 및 야생형 ERT2의 자유 에너지의 차이, 및 작용제-결합 형태의 돌연변이체 ERT2 및 야생형 ERT2의 자유 에너지의 차이를 △G 값으로 계산하였다. 다음으로, △△G 값을 계산하였는데, 음의 값은 ERT2 돌연변이체의 길항제-결합 형태가 돌연변이체의 작용제-결합 형태보다 선호됨을 나타내고, 양의 값은 작용제 형태가 길항제-결합 형태보다 선호됨을 나타낸다. 14개의 돌연변이 중 7개(D538K, L536F, L536Y, L536M, L539R, H547A, 및 V534R)가 길항제 확인을 안정화시켰다(도 7 참조). 제6 세트의 돌연변이는 표 12에 나타나 있다.
돌연변이 | |
V533F | Y537E |
V533W | D538K |
V534R | L539R |
V534Q | L539A |
L536F | L540A |
L536M | L540F |
L536Y | H547A |
실시예 2: 형질감염 스크리닝에 의해 식별되는 약물 민감도가 증가한 ERT2 돌연변이체
ERT2 돌연변이체를 4-OHT에 반응하여 리포터 발현을 유도하는 능력에 대해 형질감염 검정에 의해 분석하였다. 제1 형질감염 스크리닝에서, 실시예 1에 기술된 돌연변이를 갖는 ERT2를 암호화하는 작제물을 서열번호 3에 도시된 바와 같이 "야생형" ERT2의 배경에서 생산하였다(G400V/M543A/L544A/V595A 사중 아미노산 치환을 포함함). 각각의 ERT2 작제물은 DNA 결합을 위한 ZF10-1 도메인, p65 전사 활성화 도메인, 및 ERT2 돌연변이체를 포함하였다. 각각의 작제물을 4-OHT에 대한 민감도에 대해 시험하였다. 각각의 돌연변이체를 HEK293T + YBTATA_mCherry 리포터 세포주를 형질감염하기 위한 발현 작제물에 클로닝하였다. 제2 형질감염 스크리닝에서, 실시예 1에 기술된 추가 ERT2 돌연변이체를 암호화하는 작제물을 생산하고 4-OHT에 대한 민감도에 대해 시험하였다. 스크리닝을 위해, 세포를 3가지 상이한 농도의 4-OHT(0.025, 0.1, 및 0.25 uM)로 처리한 다음, 형광 활성화 세포 분류(FACS)에 의해 mCherry 발현을 검정하였다(도 8a~8c, 도 9a~9c, 및 도 10a~10c).
물질 및 방법
HEK293T 세포를 YBTATA 최소 프로모터에 연결된 4개의 ZF10-1 결합 부위로 이루어진 합성 프로모터를 암호화하는 렌티바이러스로 형질도입하였다. 이러한 합성 프로모터는 mCherry의 발현을 유발한다. 이 세포주의 세포는 "리포터 세포"로 불린다.
1일차에, 리포터 세포를 24 웰 플레이트에 1.5e5 세포/웰로 플레이팅하였다. 2일차에, 세포를 ERT 돌연변이체로 형질감염시켰다. 각각의 웰에 0.6 ug DNA, 1.8 uL Fugene, 및 30 uL Optimem의 혼합물을 만들었으며, 여기서 DNA는 p65에 융합된 ZF10-1 및 ERT2 돌연변이체를 암호화한다. 일부 스크리닝에서, GFP를 암호화하는 플라스미드를 대조군으로서 포함시켜 유세포 계측법으로 형질감염된 세포를 선택하였다. 3일차에, 세포를 1:20의 비율로 분할하고 96 웰 플레이트에 시딩하였다. 세포를 0, 0.025, 0.1, 또는 0.25 uM 4-OHT로 처리하였다. 5일차에, 배지를 제거하고, 세포를 트립신화한 다음, FACS 완충액 + Sytox Red(APC 채널 중의 형광) 생존 염료에 재현탁하였다. 세포를 유세포 계측기 상에서 실행하고, 세포용 FSC/SSC, 생존 세포용 FSC/Sytox Red , 단일 세포용 FSC/FSC-폭, 및 가능한 경우(형질감염 대조군이 포함된 경우) 형질감염된 세포용 GFP+에 의해 게이팅하였다. 각 약물 농도에서 mCherry 양성 세포의 백분율을 도표화하고 야생형 ERT2와 비교하였고, 4-OHT에 더 민감한 돌연변이체를 식별하였다.
결과
도 8a~8c, 도 9a~9c, 및 도 10a~10c에 나타낸 바와 같이, 형질감염 스크리닝은 ERT2(서열번호 3)와 비교하여 mCherry 발현의 유도가 개선된 돌연변이체를 식별하였다. 제1 형질감염 스크리닝에서, 다음의 17개의 돌연변이체에 대해 개선된 발현 유도가 관찰되었다: L354I(SB03498), L391V(SB03505), Q414E(SB03383), L409V(SB03375), S463P(SB03393), L384M(SB03377), L354I+L384M(SB03511), N413D(SB03381), M517A(SB03379), G344M(SB03372), I386V(SB03373), N407D(SB03380), C417S(SB03371), R352K(SB03384), Y537S(SB03389), M388F(SB03579), 및 G521A(SB03587), 가장 큰 발현 개선은 다음의 7종의 돌연변이체에 의해 유도됨: L354I(SB03498), L391V(SB03505), Q414E(SB03383), L409V(SB03375), 및 S463P(SB03393),(도 8a~8c). 제2 형질감염 스크리닝에서, 10종의 돌연변이체에 대해 발현 유도 개선이 관찰되었다: I424L(SB03558), M421L(SB03566), M421F(SB03567), T347E(SB03801), L536M(SB03828), Y537E(SB03839), T347I(SB03802), 및 T347M(SB03805), V418I(SB03550), 및 V533W(SB03838), 발현의 강한 개선은 하기 6종의 돌연변이체에 의해 유도됨: I424L(SB03558), M421L(SB03566), M421F(SB03567), T347E(SB03801), L536M(SB03828), 및 Y537E(SB03839)(도 9a~9c). 제3 형질감염 스크리닝(도 10a~10c)에서, 표 13에 나타낸 돌연변이체에 대해 발현 유도 개선이 관찰되었다.
표 13.
작제물 |
설명 |
SB03771 | H524L |
SB03894 | L354I + Q414E |
SB03893 | L354I +L384M + Q414E |
SB03892 | L391V + Q414E |
SB03772 | H524F |
SB03882 | L409V + L391V |
SB03883 | L409V + L354I +L384M |
SB03881 | L409V + S463P |
SB03888 | S463P + L354I |
SB03884 | L409V + L354I |
SB03890 | L391V + L354I +L384M |
SB03887 | S463P + L354I +L384M |
SB03885 | L409V + Q414E |
SB03891 | L391V + L354I |
SB03886 | S463P + L391V |
SB03889 | S463P + Q414E |
실시예 3: 형질도입 스크리닝에 의해 식별되는 약물 민감도가 증가한 돌연변이체
ERT2 돌연변이체를 4-OHT에 반응하여 리포터 발현을 유도하는 능력에 대해 3회의 형질도입 스크리닝에 의해 분석하였다. 돌연변이체 L354I + L384M(제1 형질감염 스크리닝에서 식별됨)을 3개의 형질도입 스크리닝 모두에 포함시켰다. 실시예 2의 형질감염 스크리닝에서 4-OHT에 대한 개선된 반응을 나타낸 ERT2 돌연변이체를 암호화하는 렌티바이러스 벡터를 클로닝하였다. 실시예 2에 기술된 바와 같은 리포터 세포주를 ERT2 돌연변이체를 암호화하는 렌티바이러스로 형질도입하고, 다양한 4-OHT 농도에 반응하여 mCherry 발현을 유도하는 돌연변이체의 능력을 평가하였다.
물질 및 방법
형질도입 스크리닝을 위해, 1일차에, 리포터 세포를 12 웰 플레이트에 2e5 세포/웰로 플레이팅하였다. 2일차에, 형질감염 스크리닝으로부터 유래한 리드 ERT 돌연변이체를 암호화하는 렌티바이러스로 세포를 형질도입하였다. 3일차 및 4일차에, 세포를 계대하여 플레이트 상에서 90%를 초과하는 컨플루언스를 유지시켰다. 5일차에, 세포를 96 웰 플레이트에 시딩하고, 0, 0.001, 0.0025, 0.004, 0.025, 0.05, 0.1, 또는 0.25 uM 4-OHT로 처리하였다. 8일차에, 배지를 제거하고 세포를 트립신화한 다음, FACS 완충액 + Sytox Red(APC 채널 중의 형광) 생존 염료에 재현탁하였다. 세포를 유세포 계측기 상에서 실행하고 세포에 대해 FSC/SSC, 생존 세포에 대해 FSC/Sytox Red로 게이팅하였고, 각 약물 농도에서 mCherry 양성 세포의 백분율을 도표화하고 더 민감한 돌연변이체를 발견하기 위해 야생형 ERT2와 비교하였다(도 11a). 2가지 약물 농도 0.004 및 0.025 uM 4-OHT에서 mCherry 양성 세포의 백분율도 막대 그래프에 도시되어 있다(도 11b).
결과
도 11a 및 도 11b를 참조하면, 제1 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 개선된 4-OHT 결합을 갖는 것으로 식별된 여러 돌연변이체에 대한 개선된 4-OHT 반응을 확인하였다. 특히, 돌연변이체 L354I, L391V, Q414E, L409V, S463P, L384M, 및 L354I+L384M은 모두 야생형 ERT2(작제물 3422, 서열번호 3)와 비교하여 개선된 4-OHT 반응을 나타냈다. 제1 형질도입 스크리닝에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체가 표 14에 나타나 있다.
작제물 |
설명 |
SB03498 | L354I |
SB03505 | L391V |
SB03383 | Q414E |
SB03375 | L409V |
SB03393 | S463P |
SB03377 | L384M |
SB03511 | L354I + L384M |
도 12에 도시된 바와 같이, 제2 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 식별된 돌연변이체에 대한 개선된 4-OHT 반응을 확인하였다. 특히, 돌연변이체 M517A, 및 N413D, 및 L354I + L384M은 야생형 ERT2(작제물 3422)와 비교하여 개선된 4-OHT 반응을 나타냈다. 특히, L354I + L384M 돌연변이체의 개선된 4-OHT 반응은 제1 및 제2 형질도입 스크리닝 모두에서 확인되었다. 제2 형질도입 스크리닝에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체가 표 15에 나타나 있다.
작제물 |
설명 |
SB03379 | M517A |
SB03381 | N413D |
SB03511 | L354I + L384M |
도 13에 도시된 바와 같이, 제3 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 식별된 돌연변이체에 대해서 4-OHT 반응의 개선을 확인하였다. 특히, 돌연변이체 I524L, M421L, 및 L354I +L384M은 야생형 ERT2(작제물 3422)와 비교하여 개선된 4-OHT 반응을 나타냈다. 제3 형질도입 스크린에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체는 표 16에 나타나 있다.
작제물 |
설명 |
SB03558 | I524L |
SB03566 | M421L |
SB03511 | L354I + L384M |
실시예 4: 엔독시펜 온 스위치를 개발하기 위한 ERT2 돌연변이체 라이브러리 스크린
물질 및 방법
ERT2 돌연변이체 조합 라이브러리 스크리닝
HEK293T 세포를 조합 ERT2 돌연변이체 라이브러리인, 약 800개의 고유한 ER-LBD 변이체로 구성되되, 각각은 이들의 포함에 대한 이론적 근거에 따라 표 18에 주어진 돌연변이체의 고유한 조합인 SB04401로 형질도입하였다(도 14a). 각 세포가 세포 당 고유한 ER-LBD 변이체를 갖는 균질한 세포주를 생성하기 위해, 형질도입된 HEK293T 세포의 바이러스 통합을 카피 수 검정에 의해 정량화하였다. 세포 당 ERT2 돌연변이체 라이브러리의 카피가 1 미만인 평균 바이러스 통합을 갖는 세포주를 식별하고 퓨로마이신 선별을 거쳤다. 그런 다음, 선별된 세포주를 SB01066 mCherry 리포터로 형질도입하였다(도 14b). 그런 다음, 형질도입된 세포를 mCherry 리포터를 통해 엔독시펜 및 4-OHT에 대한 민감도에 대해 시험하였는데, ER-LBD 변이체가 약 0.1 nM 내지 최대 약 1 uM만큼 낮은 시험된 농도에 민감한 경우 발현할 것이다. mCherry를 발현하는 세포 및 이에 따라 엔독시펜의 처리에 반응하는 세포를 분류한 다음, 상기 분류된 세포로부터 게놈 DNA를 단리하였다. 변이체는 ERT2 코딩 서열의 PCR 증폭에 이어서 PCR 산물을 pcr4 TOPO 벡터(Life Technologies) 내로 삽입함으로써 단리된 게놈 DNA로부터 식별하였다. 그런 다음, 수득된 콜로니를 Sanger 시퀀싱을 위해 제출하였다. 식별된 돌연변이체를 작제물, 예를 들어, SB06136 - SB06153(ZF10-1_p65_ERT2 돌연변이체)에 클로닝하였다.
돌연변이 | 근거 |
L391V | 세트 2: ERT2에 대한 4-OHT/엔독시펜의 친화도 개선, 리간드 결합 포켓에서의 단일 점 돌연변이 |
L409V | 세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이, 에스트라디올에 대한 결합 증가 |
Q414E | 세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이 |
N413D | 세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이 |
S463P | 음성 대조군, 임상 돌연변이 |
M421L | 세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이 |
M517A | 세트 1: ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이, 약 1 kcal/mol로 에스트라디올에 결합함(비교하면, 4-OHT 결합은 약 1.5 kcal/mol 만큼 불리함) |
L354I | 세트 2: ERT2에 대한 4-OHT/엔독시펜의 친화도 개선, 리간드 결합 포켓에서의 단일 점 돌연변이 |
L384M | 세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이 |
H524L | 세트 5: 리간드 결합 포켓에서의 MD 시뮬레이션에 초점을 맞춘, 4-OHT 및 엔독시펜에 대한 결합을 개선하기 위한 ERT2의 합리적인 최적화 |
mCherry 리포터를 사용한 U87MG에서의 ERT2 돌연변이체 검증
형질도입 약 16시간 전에 100k U87MG :1066 세포를 12 웰 플레이트 포맷으로 16 웰에 시딩하였다. 형질도입 동안, 각각의 웰 내의 세포를 100k pg의 ERT2 변이체 작제물의 바이러스로 형질도입하였다. 형질도입 후, 세포를 24 웰 플레이트 포맷으로 웰 당 50k 세포로 분할하고, 약물-무함유 배지 또는 다양한 엔독시펜 또는 4-OHT 약물 조건으로 처리하였다. 엔독시펜 또는 4-OHT로 세포를 처리한 후 약 2일차에, 세포를 수집하고, 유세포 계측법으로 mCherry 리포터 발현을 정량화하였다.
결과
ERT2 돌연변이체 라이브러리의 스크리닝은 1 nM에서 엔독시펜에 민감한 ERT2 변이체의 하위 집합을 식별하였다. 이러한 하위 집합 중에서, 15개의 변이체(표 19)를 U87MG 세포에서 0 pM, 10 pM, 50 pM, 100 pM, 및 1 nM의 엔독시펜(도 15a) 및 4-OHT(도 15b)의 농도 범위에서 mCherry 리포터를 활성화하는 능력에 대해 검증하였다(SB01066; 도 14b). 엔독시펜 또는 4-OHT로 치료한 후 약 24시간차에 mCherry의 발현을 정량화하였다. 입증된 바와 같이, 15개의 변이체 모두 약 1 nM 이하의 농도에서 엔독시펜 및 4-OHT에 민감했던 반면, 음성 대조군 U87MG 및 U87MG:1066 음성 대조군은 민감도를 나타내지 않았다.
작제물 | 설명 |
SB06136 | ZF10-1_p65_ERT2_돌연변이체 81 |
SB06138 | ZF10-1_p65_ERT2_돌연변이체 93 |
SB06139 | ZF10-1_p65_ERT2_돌연변이체 86 |
SB06140 | ZF10-1_p65_ERT2_돌연변이체 95 |
SB06141 | ZF10-1_p65_ERT2_돌연변이체 88 |
SB06142 | ZF10-1_p65_ERT2_돌연변이체 77 |
SB06143 | ZF10-1_p65_ERT2_돌연변이체 49 |
SB06144 | ZF10-1_p65_ERT2_돌연변이체 58 |
SB06145 | ZF10-1_p65_ERT2_돌연변이체 62 |
SB06146 | ZF10-1_p65_ERT2_돌연변이체 63 |
SB06147 | ZF10-1_p65_ERT2_돌연변이체 55 |
SB06149 | ZF10-1_p65_ERT2_돌연변이체 41 |
SB06150 | ZF10-1_p65_ERT2_돌연변이체 43 |
SB06151 | ZF10-1_p65_ERT2_돌연변이체 46 |
SB06152 | ZF10-1_p65_ERT2_돌연변이체 40 |
야생형 ERT2와 비교하여, 엔독시펜 및 4-OHT에 대한 민감도에 대해 이전 스크린에서 선택된 ERT2 변이체(표 20)를 추가로 시험하였다. 시험은 야생형 ERT2의 활성화가 약 25 nM 엔독시펜 및 약 25 nM 4-OHT에서 시작되는 반면, 시험된 3개의 ERT2 변이체는 1 nM 및 0.1 nM 엔독시펜 및 1 nM 및 0.1 nM 4-OHT에서 mCherry 발현을 활성화시킨다는 것을 보여주었다(도 16a~16d). 예시적인 열 지도는 2.2 pM 에스트라디올을 포함하여 다양한 농도에서 시험된 작제물의 mCherry 발현의 배수 활성화를 보여준다(도 16b). ERT2는 에스트라디올에 비민감성이 되도록 돌연변이된 ER-알파이며, 리드 ERT2 변이체는 생물학적으로 관찰된 에스트라디올 농도에 계속 비민감성인 것으로 확인되었다. 배수 활성화는 각각의 시험 조건의 gMFI mCherry 수준을 리포터(SB01066)가 형질도입된 U87MG 세포의 gMFI mCherry 수준으로 나누어 계산하였다.
작제물 | 설명 |
SB06141 | ZF10-1_p65_ERT2_돌연변이체 88 |
SB06146 | ZF10-1_p65_ERT2_돌연변이체 63 |
SB06149 | ZF10-1_p65_ERT2_돌연변이체 41 |
SB03422 | ZF10-1_p65_ERT2 야생형 |
SB01066 | pMinYBTATA: mCherry 리포터 |
실시예 5: NK 세포에서 ERT2 돌연변이체 검증
물질 및 방법
NK 세포에서 mCherry 리포터를 이용한 ERT2 돌연변이체의 검증
10일의 공급 세포 활성화 후, NK 세포를 ERT2 돌연변이체 바이러스 및 리포터 SB01066 바이러스와 공동 형질도입하였다(실험 설정 1). 형질도입 후 2일차에, 형질도입된 NK 세포를 0 nM, 0.01 nM, 0.1 nM, 1 nM, 및 10 nM의 농도 범위에서 엔독시펜 또는 4-OHT로 처리하였다. 4일차에, 유세포 계측법으로 세포를 mCherry 발현에 대해 확인하였다.
실험 설정 1
NK 세포에서 IL12 리포터를 이용한 ERT2 돌연변이체의 검증
10일의 공급 세포 활성화 후, NK 세포를 ERT2/IL12 벡터로 형질도입하였다(표 22; 실험 설정 2). 형질도입 후 2일차에, 형질도입된 NK 세포를 0 nM, 0.1 nM, 1 nM, 10 nM, 100 nM, 및 1000 nM의 농도 범위에서 엔독시펜으로 처리하였다. 4일차에, Luminex를 통해 세포를 IL-12 발현에 대해 확인하였다.
실험 설정 2
결과
이전의 스크리닝으로부터 선택한 ERT2 변이체(표 21; 도 17a~17b)를 일차 NK 세포에서 엔독시펜 및 4-OHT에 대한 민감도에 대해 추가로 시험하였다. 시험된 변이체 중에서, SB06142(돌연변이체 77; L354I/L391V/N413D/M421L/S463P/M517A/H524L), SB06136(돌연변이체 81; L384M/L391V/N413D/M421L/S463P/H524L), 및 SB06145(돌연변이체 62; L409V/N413D/Q414E/M421L/S463P/H524L)는 0.1 nM의 농도에서 엔독시펜 및 4-OHT 둘 다에 민감하였다(도 17a~17b).
작제물 | 설명 |
SB06136 | ZF10-1_p65_ERT2_돌연변이체 81 |
SB06138 | ZF10-1_p65_ERT2_돌연변이체 93 |
SB06139 | ZF10-1_p65_ERT2_돌연변이체 86 |
SB06140 | ZF10-1_p65_ERT2_돌연변이체 95 |
SB06141 | ZF10-1_p65_ERT2_돌연변이체 88 |
SB06142 | ZF10-1_p65_ERT2_돌연변이체 77 |
SB06143 | ZF10-1_p65_ERT2_돌연변이체 49 |
SB06144 | ZF10-1_p65_ERT2_돌연변이체 58 |
SB06145 | ZF10-1_p65_ERT2_돌연변이체 62 |
SB06146 | ZF10-1_p65_ERT2_돌연변이체 63 |
SB06147 | ZF10-1_p65_ERT2_돌연변이체 55 |
SB06149 | ZF10-1_p65_ERT2_돌연변이체 41 |
SB06150 | ZF10-1_p65_ERT2_돌연변이체 43 |
SB06151 | ZF10-1_p65_ERT2_돌연변이체 46 |
SB06152 | ZF10-1_p65_ERT2_돌연변이체 40 |
치료 폴리펩티드의 전달을 입증하기 위해, ERT2/IL-12 벡터를 표 22에 나타낸 바와 같이 작제하고, 일차 NK 세포에서 엔독시펜에 대한 민감도에 대해 시험하였다. NK 세포에서 ERT2/IL-12 벡터를 시험한 결과, SB06142로부터의 ERT2 - L354I / L391V / N413D / S463P / H524L을 사용한 TL10009 및 crIL12 CD16 CS는 IL-12에서 최상의 유도 및 배수 변화를 나타내는 것으로 나타났다(도18a~18b).
TL# | SB# |
유도성 IL-12
(4x ZF5BS YBTATA에 의해 유도됨) |
절연체 | 프로모터: ZF | ZF DNA 결합 도메인 | 활성인자 | ERT2 돌연변이체 |
TL10006 | SB07123 | ZFN_YB-TATA-sIL-12 1x AUSLDE | A2 | SFFV: 5-7 | ZF5-7 | P65 | 돌연변이체 81 |
TL10007 | SB07127 | ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM | A2 | SV40: 5-7 | ZF5-7 | P65 | 돌연변이체 81 |
TL10008 | SB07129 | ZFN_YB-TATA-sIL-12 1x AUSLDE | A2 | SFFV: 5-7 | ZF5-7 | P65 | 돌연변이체 77 |
TL10009 | SB07133 | ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM | A2 | SV40: 5-7 | ZF5-7 | P65 | 돌연변이체 77 |
TL10010 | SB07135 | ZFN_YB-TATA-sIL-12 1x AUSLDE | A2 | SFFV: 5-7 | ZF5-7 | P65 | 돌연변이체 62 |
TL10011 | SB07139 | ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM | A2 | SV40: 5-7 | ZF5-7 | P65 | 돌연변이체 62 |
명칭 | 서열번호 | 서열 |
에스트로겐 수용체 (아미노산 서열) |
1 | MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAYEFNAAAAANAQVYGQTGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSPFLQPHGQQVPYYLENEPSGYTVREAGPPAFYRPNSDNRRQGGRERLASTNDKGSMAMESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV |
ERT2 예시 | 2 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV |
ERT2 예시 | 3 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
펩티드 링커 | 4 | GGGGSGGGGSGGGGSVDGF |
펩티드 링커 | 5 | ASGGGGSAS |
징크 핑거 단백질 도메인 ZF10-1 | 6 | SRPGERPFQCRICMRNFSRRHGLDRHTRTHTGEKPFQCRICMRNFSDHSSLKRHLRTHTGSQKPFQCRICMRNFSVRHNLTRHLRTHTGEKPFQCRICMRNFSDHSNLSRHLKTHTGSQKPFQCRICMRNFSQRSSLVRHLRTHTGEKPFQCRICMRNFSESGHLKRHLRTHLRGS |
최소 프로모터; minP | 7 | AGAGGGTATATAATGGAAGCTCGACTTCCAG |
NFkB 반응 요소 단백질 프로모터; 5x NFkB-RE | 8 | GGGAATTTCCGGGGACTTTCCGGGAATTTCCGGGGACTTTCCGGGAATTTCC |
CREB 반응 요소 단백질 프로모터; 4x CRE | 9 | CACCAGACAGTGACGTCAGCTGCCAGATCCCATGGCCGTCATACTGTGACGTCTTTCAGACACCCCATTGACGTCAATGGGAGAA |
NFAT 반응 요소 단백질 프로모터; 3x NFAT 결합 부위 | 10 | GGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGT |
SRF 반응 요소 단백질 프로모터; 5x SRE | 11 | AGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCT |
SRF 반응 요소 단백질 프로모터 2; 5x SRF-RE | 12 | AGTATGTCCATATTAGGACATCTACCATGTCCATATTAGGACATCTACTATGTCCATATTAGGACATCTTGTATGTCCATATTAGGACATCTAAAATGTCCATATTAGGACATCT |
AP1 반응 요소 단백질 프로모터; 6x AP1-RE | 13 | TGAGTCAGTGACTCAGTGAGTCAGTGACTCAGTGAGTCAGTGACTCAG |
TCF-LEF 반응 요소 프로모터; 8x TCF-LEF-RE | 14 | AGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGTATAAGATCAAAGGGCCTAAGATCAAAGGGACTAAGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGCCTA |
SBEx4 | 15 | GTCTAGACGTCTAGACGTCTAGACGTCTAGAC |
SMAD2/3 - CAGACA x4 | 16 | CAGACACAGACACAGACACAGACA |
STAT3 결합 부위 | 17 | GGATCCGGTACTCGAGATCTGCGATCTAAGTAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCAC |
CMV | 18 | GTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTC |
EF1a | 19 | GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGCCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGACCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGTCCTCGCGCCGCCGTGTATCGCCCCGCCCCGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGTCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA |
EFS | 20 | GGATCTGCGATCGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGCTGAAGCTTCGAGGGGCTCGCATCTCTCCTTCACGCGCCCGCCGCCCTACCTGAGGCCGCCATCCACGCCGGTTGAGTCGCGTTCTGCCGCCTCCCGCCTGTGGTGCCTCCTGAACTGCGTCCGCCGTCTAGGTAAGTTTAAAGCTCAGGTCGAGACCGGGCCTTTGTCCGGCGCTCCCTTGGAGCCTACCTAGACTCAGCCGGCTCTCCACGCTTTGCCTGACCCTGCTTGCTCAACTCTACGTCTTTGTTTCGTTTTCTGTTCTGCGCCGTTACAGATCCAAGCTGTGACCGGCGCCTAC |
MND | 21 | TTTATTTAGTCTCCAGAAAAAGGGGGGAATGAAAGACCCCACCTGTAGGTTTGGCAAGCTAGGATCAAGGTTAGGAACAGAGAGACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGTTGGAACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGATGGTCCCCAGATGCGGTCCCGCCCTCAGCAGTTTCTAGAGAACCATCAGATGTTTCCAGGGTGCCCCAAGGACCTGAAATGACCCTGTGCCTTATTTGAACTAACCAATCAGTTCGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTCCCCGAGCTCAATAAAAGAGCCCA |
PGK | 22 | GGGGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCGGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAG |
SFFV | 23 | GTAACGCCATTTTGCAAGGCATGGAAAAATACCAAACCAAGAATAGAGAAGTTCAGATCAAGGGCGGGTACATGAAAATAGCTAACGTTGGGCCAAACAGGATATCTGCGGTGAGCAGTTTCGGCCCCGGCCCGGGGCCAAGAACAGATGGTCACCGCAGTTTCGGCCCCGGCCCGAGGCCAAGAACAGATGGTCCCCAGATATGGCCCAACCCTCAGCAGTTTCTTAAGACCCATCAGATGTTTCCAGGCTCCCCCAAGGACCTGAAATGACCCTGCGCCTTATTTGAATTAACCAATCAGCCTGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTTCCCGAGCTCTATAAAAGAGCTCACAACCCCTCACTCGGCGCGCCAGTCCTCCGACAGACTGAGTCGCCCGGG |
SV40 | 24 | CTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCT |
UbC | 25 | GCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGGAGCGTTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTTGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCACAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTAAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGGTTTGTCGTCTGGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAAGCTTCTGCAGGTCGACTCTAGAAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGAC |
hEF1aV1 | 26 | GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGTCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA |
hCAGG | 27 | ACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGGAGTCGCTGCGACGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTC |
hEF1aV2 | 28 | GGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAG |
hACTb | 29 | CCACTAGTTCCATGTCCTTATATGGACTCATCTTTGCCTATTGCGACACACACTCAATGAACACCTACTACGCGCTGCAAAGAGCCCCGCAGGCCTGAGGTGCCCCCACCTCACCACTCTTCCTATTTTTGTGTAAAAATCCAGCTTCTTGTCACCACCTCCAAGGAGGGGGAGGAGGAGGAAGGCAGGTTCCTCTAGGCTGAGCCGAATGCCCCTCTGTGGTCCCACGCCACTGATCGCTGCATGCCCACCACCTGGGTACACACAGTCTGTGATTCCCGGAGCAGAACGGACCCTGCCCACCCGGTCTTGTGTGCTACTCAGTGGACAGACCCAAGGCAAGAAAGGGTGACAAGGACAGGGTCTTCCCAGGCTGGCTTTGAGTTCCTAGCACCGCCCCGCCCCCAATCCTCTGTGGCACATGGAGTCTTGGTCCCCAGAGTCCCCCAGCGGCCTCCAGATGGTCTGGGAGGGCAGTTCAGCTGTGGCTGCGCATAGCAGACATACAACGGACGGTGGGCCCAGACCCAGGCTGTGTAGACCCAGCCCCCCCGCCCCGCAGTGCCTAGGTCACCCACTAACGCCCCAGGCCTGGTCTTGGCTGGGCGTGACTGTTACCCTCAAAAGCAGGCAGCTCCAGGGTAAAAGGTGCCCTGCCCTGTAGAGCCCACCTTCCTTCCCAGGGCTGCGGCTGGGTAGGTTTGTAGCCTTCATCACGGGCCACCTCCAGCCACTGGACCGCTGGCCCCTGCCCTGTCCTGGGGAGTGTGGTCCTGCGACTTCTAAGTGGCCGCAAGCCACCTGACTCCCCCAACACCACACTCTACCTCTCAAGCCCAGGTCTCTCCCTAGTGACCCACCCAGCACATTTAGCTAGCTGAGCCCCACAGCCAGAGGTCCTCAGGCCCTGCTTTCAGGGCAGTTGCTCTGAAGTCGGCAAGGGGGAGTGACTGCCTGGCCACTCCATGCCCTCCAAGAGCTCCTTCTGCAGGAGCGTACAGAACCCAGGGCCCTGGCACCCGTGCAGACCCTGGCCCACCCCACCTGGGCGCTCAGTGCCCAAGAGATGTCCACACCTAGGATGTCCCGCGGTGGGTGGGGGGCCCGAGAGACGGGCAGGCCGGGGGCAGGCCTGGCCATGCGGGGCCGAACCGGGCACTGCCCAGCGTGGGGCGCGGGGGCCACGGCGCGCGCCCCCAGCCCCCGGGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACCGCGTCCGCCCCGCGAGCACAGAGCCTCGCCTTTGCCGATCCGCCGCCCGTCCACACCCGCCGCCAGGTAAGCCCGGCCAGCCGACCGGGGCAGGCGGCTCACGGCCCGGCCGCAGGCGGCCGCGGCCCCTTCGCCCGTGCAGAGCCGCCGTCTGGGCCGCAGCGGGGGGCGCATGGGGGGGGAACCGGACCGCCGTGGGGGGCGCGGGAGAAGCCCCTGGGCCTCCGGAGATGGGGGACACCCCACGCCAGTTCGGAGGCGCGAGGCCGCGCTCGGGAGGCGCGCTCCGGGGGTGCCGCTCTCGGGGCGGGGGCAACCGGCGGGGTCTTTGTCTGAGCCGGGCTCTTGCCAATGGGGATCGCAGGGTGGGCGCGGCGGAGCCCCCGCCAGGCCCGGTGGGGGCTGGGGCGCCATTGCGCGTGCGCGCTGGTCCTTTGGGCGCTAACTGCGTGCGCGCTGGGAATTGGCGCTAATTGCGCGTGCGCGCTGGGACTCAAGGCGCTAACTGCGCGTGCGTTCTGGGGCCCGGGGTGCCGCGGCCTGGGCTGGGGCGAAGGCGGGCTCGGCCGGAAGGGGTGGGGTCGCCGCGGCTCCCGGGCGCTTGCGCGCACTTCCTGCCCGAGCCGCTGGCCGCCCGAGGGTGTGGCCGCTGCGTGCGCGCGCGCCGACCCGGCGCTGTTTGAACCGGGCGGAGGCGGGGCTGGCGCCCGGTTGGGAGGGGGTTGGGGCCTGGCTTCCTGCCGCGCGCCGCGGGGACGCCTCCGACCAGTGTTTGCCTTTTATGGTAATAACGCGGCCGGCCCGGCTTCCTTTGTCCCCAATCTGGGCGCGCGCCGGCGCCCCCTGGCGGCCTAAGGACTCGGCGCGCCGGAAGTGGCCAGGGCGGGGGCGACCTCGGCTCACAGCGCGCCCGGCTAT |
heIF4A1 | 30 | GTTGATTTCCTTCATCCCTGGCACACGTCCAGGCAGTGTCGAATCCATCTCTGCTACAGGGGAAAACAAATAACATTTGAGTCCAGTGGAGACCGGGAGCAGAAGTAAAGGGAAGTGATAACCCCCAGAGCCCGGAAGCCTCTGGAGGCTGAGACCTCGCCCCCCTTGCGTGATAGGGCCTACGGAGCCACATGACCAAGGCACTGTCGCCTCCGCACGTGTGAGAGTGCAGGGCCCCAAGATGGCTGCCAGGCCTCGAGGCCTGACTCTTCTATGTCACTTCCGTACCGGCGAGAAAGGCGGGCCCTCCAGCCAATGAGGCTGCGGGGCGGGCCTTCACCTTGATAGGCACTCGAGTTATCCAATGGTGCCTGCGGGCCGGAGCGACTAGGAACTAACGTCATGCCGAGTTGCTGAGCGCCGGCAGGCGGGGCCGGGGCGGCCAAACCAATGCGATGGCCGGGGCGGAGTCGGGCGCTCTATAAGTTGTCGATAGGCGGGCACTCCGCCCTAGTTTCTAAGGACCATG |
hGAPDH | 31 | AGTTCCCCAACTTTCCCGCCTCTCAGCCTTTGAAAGAAAGAAAGGGGAGGGGGCAGGCCGCGTGCAGTCGCGAGCGGTGCTGGGCTCCGGCTCCAATTCCCCATCTCAGTCGCTCCCAAAGTCCTTCTGTTTCATCCAAGCGTGTAAGGGTCCCCGTCCTTGACTCCCTAGTGTCCTGCTGCCCACAGTCCAGTCCTGGGAACCAGCACCGATCACCTCCCATCGGGCCAATCTCAGTCCCTTCCCCCCTACGTCGGGGCCCACACGCTCGGTGCGTGCCCAGTTGAACCAGGCGGCTGCGGAAAAAAAAAAGCGGGGAGAAAGTAGGGCCCGGCTACTAGCGGTTTTACGGGCGCACGTAGCTCAGGCCTCAAGACCTTGGGCTGGGACTGGCTGAGCCTGGCGGGAGGCGGGGTCCGAGTCACCGCCTGCCGCCGCGCCCCCGGTTTCTATAAATTGAGCCCGCAGCCTCCCGCTTCGCTCTCTGCTCCTCCTGTTCGACAGTCAGCCGCATCTTCTTTTGCGTCGCCAGGTGAAGACGGGCGGAGAGAAACCCGGGAGGCTAGGGACGGCCTGAAGGCGGCAGGGGCGGGCGCAGGCCGGATGTGTTCGCGCCGCTGCGGGGTGGGCCCGGGCGGCCTCCGCATTGCAGGGGCGGGCGGAGGACGTGATGCGGCGCGGGCTGGGCATGGAGGCCTGGTGGGGGAGGGGAGGGGAGGCGTGGGTGTCGGCCGGGGCCACTAGGCGCTCACTGTTCTCTCCCTCCGCGCAGCCGAGCCACATCGCTGAGACAC |
hGRP78 | 32 | AGTGCGGTTACCAGCGGAAATGCCTCGGGGTCAGAAGTCGCAGGAGAGATAGACAGCTGCTGAACCAATGGGACCAGCGGATGGGGCGGATGTTATCTACCATTGGTGAACGTTAGAAACGAATAGCAGCCAATGAATCAGCTGGGGGGGCGGAGCAGTGACGTTTATTGCGGAGGGGGCCGCTTCGAATCGGCGGCGGCCAGCTTGGTGGCCTGGGCCAATGAACGGCCTCCAACGAGCAGGGCCTTCACCAATCGGCGGCCTCCACGACGGGGCTGGGGGAGGGTATATAAGCCGAGTAGGCGACGGTGAGGTCGACGCCGGCCAAGACAGCACAGACAGATTGACCTATTGGGGTGTTTCGCGAGTGTGAGAGGGAAGCGCCGCGGCCTGTATTTCTAGACCTGCCCTTCGCCTGGTTCGTGGCGCCTTGTGACCCCGGGCCCCTGCCGCCTGCAAGTCGGAAATTGCGCTGTGCTCCTGTGCTACGGCCTGTGGCTGGACTGCCTGCTGCTGCCCAACTGGCTGGCAC |
hGRP94 | 33 | TAGTTTCATCACCACCGCCACCCCCCCGCCCCCCCGCCATCTGAAAGGGTTCTAGGGGATTTGCAACCTCTCTCGTGTGTTTCTTCTTTCCGAGAAGCGCCGCCACACGAGAAAGCTGGCCGCGAAAGTCGTGCTGGAATCACTTCCAACGAAACCCCAGGCATAGATGGGAAAGGGTGAAGAACACGTTGCCATGGCTACCGTTTCCCCGGTCACGGAATAAACGCTCTCTAGGATCCGGAAGTAGTTCCGCCGCGACCTCTCTAAAAGGATGGATGTGTTCTCTGCTTACATTCATTGGACGTTTTCCCTTAGAGGCCAAGGCCGCCCAGGCAAAGGGGCGGTCCCACGCGTGAGGGGCCCGCGGAGCCATTTGATTGGAGAAAAGCTGCAAACCCTGACCAATCGGAAGGAGCCACGCTTCGGGCATCGGTCACCGCACCTGGACAGCTCCGATTGGTGGACTTCCGCCCCCCCTCACGAATCCTCATTGGGTGCCGTGGGTGCGTGGTGCGGCGCGATTGGTGGGTTCATGTTTCCCGTCCCCCGCCCGCGAGAAGTGGGGGTGAAAAGCGGCCCGACCTGCTTGGGGTGTAGTGGGCGGACCGCGCGGCTGGAGGTGTGAGGATCCGAACCCAGGGGTGGGGGGTGGAGGCGGCTCCTGCGATCGAAGGGGACTTGAGACTCACCGGCCGCACGTC |
hHSP70 | 34 | GGGCCGCCCACTCCCCCTTCCTCTCAGGGTCCCTGTCCCCTCCAGTGAATCCCAGAAGACTCTGGAGAGTTCTGAGCAGGGGGCGGCACTCTGGCCTCTGATTGGTCCAAGGAAGGCTGGGGGGCAGGACGGGAGGCGAAAACCCTGGAATATTCCCGACCTGGCAGCCTCATCGAGCTCGGTGATTGGCTCAGAAGGGAAAAGGCGGGTCTCCGTGACGACTTATAAAAGCCCAGGGGCAAGCGGTCCGGATAACGGCTAGCCTGAGGAGCTGCTGCGACAGTCCACTACCTTTTTCGAGAGTGACTCCCGTTGTCCCAAGGCTTCCCAGAGCGAACCTGTGCGGCTGCAGGCACCGGCGCGTCGAGTTTCCGGCGTCCGGAAGGACCGAGCTCTTCTCGCGGATCCAGTGTTCCGTTTCCAGCCCCCAATCTCAGAGCGGAGCCGACAGAGAGCAGGGAACCC |
hKINb | 35 | GCCCCACCCCCGTCCGCGTTACAACCGGGAGGCCCGCTGGGTCCTGCACCGTCACCCTCCTCCCTGTGACCGCCCACCTGATACCCAAACAACTTTCTCGCCCCTCCAGTCCCCAGCTCGCCGAGCGCTTGCGGGGAGCCACCCAGCCTCAGTTTCCCCAGCCCCGGGCGGGGCGAGGGGCGATGACGTCATGCCGGCGCGCGGCATTGTGGGGCGGGGCGAGGCGGGGCGCCGGGGGGAGCAACACTGAGACGCCATTTTCGGCGGCGGGAGCGGCGCAGGCGGCCGAGCGGGACTGGCTGGGTCGGCTGGGCTGCTGGTGCGAGGAGCCGCGGGGCTGTGCTCGGCGGCCAAGGGGACAGCGCGTGGGTGGCCGAGGATGCTGCGGGGCGGTAGCTCCGGCGCCCCTCGCTGGTGACTGCTGCGCCGTGCCTCACACAGCCGAGGCGGGCTCGGCGCACAGTCGCTGCTCCGCGCTCGCGCCCGGCGGCGCTCCAGGTGCTGACAGCGCGAGAGAGCGCGGCCTCAGGAGCAACAC |
hUBIb | 36 | TTCCAGAGCTTTCGAGGAAGGTTTCTTCAACTCAAATTCATCCGCCTGATAATTTTCTTATATTTTCCTAAAGAAGGAAGAGAAGCGCATAGAGGAGAAGGGAAATAATTTTTTAGGAGCCTTTCTTACGGCTATGAGGAATTTGGGGCTCAGTTGAAAAGCCTAAACTGCCTCTCGGGAGGTTGGGCGCGGCGAACTACTTTCAGCGGCGCACGGAGACGGCGTCTACGTGAGGGGTGATAAGTGACGCAACACTCGTTGCATAAATTTGCGCTCCGCCAGCCCGGAGCATTTAGGGGCGGTTGGCTTTGTTGGGTGAGCTTGTTTGTGTCCCTGTGGGTGGACGTGGTTGGTGATTGGCAGGATCCTGGTATCCGCTAACAGGTACTGGCCCACAGCCGTAAAGACCTGCGGGGGCGTGAGAGGGGGGAATGGGTGAGGTCAAGCTGGAGGCTTCTTGGGGTTGGGTGGGCCGCTGAGGGGAGGGGAGGGCGAGGTGACGCGACACCCGGCCTTTCTGGGAGAGTGGGCCTTGTTGACCTAAGGGGGGCGAGGGCAGTTGGCACGCGCACGCGCCGACAGAAACTAACAGACATTAACCAACAGCGATTCCGTCGCGTTTACTTGGGAGGAAGGCGGAAAAGAGGTAGTTTGTGTGGCTTCTGGAAACCCTAAATTTGGAATCCCAGTATGAGAATGGTGTCCCTTCTTGTGTTTCAATGGGATTTTTACTTCGCGAGTCTTGTGGGTTTGGTTTTGTTTTCAGTTTGCCTAACACCGTGCTTAGGTTTGAGGCAGATTGGAGTTCGGTCGGGGGAGTTTGAATATCCGGAACAGTTAGTGGGGAAAGCTGTGGACGCTTGGTAAGAGAGCGCTCTGGATTTTCCGCTGTTGACGTTGAAACCTTGAATGACGAATTTCGTATTAAGTGACTTAGCCTTGTAAAATTGAGGGGAGGCTTGCGGAATATTAACGTATTTAAGGCATTTTGAAGGAATAGTTGCTAATTTTGAAGAATATTAGGTGTAAAAGCAAGAAATACAATGATCCTGAGGTGACACGCTTATGTTTTACTTTTAAACTAGGTCACC |
ZF 결합 부위 | 37 | cgggtttcgtaacaatcgcatgaggattcgcaacgccttcGGCGTAGCCGATGTCGCGctcccgtctcagtaaaggtcGGCGTAGCCGATGTCGCGcaatcggactgccttcgtacGGCGTAGCCGATGTCGCGcgtatcagtcgcctcggaacGGCGTAGCCGATGTCGCGcattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA |
예시적인 WPRE | 38 | TCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTAATGCCTCTGTATCATGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCGGGGAAGCTGACGTCCTTTCCATGGCTGCTCGCCTGTGTTGCCAACTGGATCCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCTCTCAATCCAGCGGACCTCCCTTCCCGAGGCCTTCTGCCGGTTCTGCGGCCTCTCCCGCGTCTTCGCTTTCGGCCTCCGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTGTTTCGCCTCGGCGTCCGGTCCGTGTTGCTTGGTCGTCACCTGTGCAGAATTGCGAACCATGGATTCCA |
예시적인 WPRE | 39 | TCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTAATGCCTCTGTATCATGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCAACTGGATCCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCTCTCAATCCAGCGGACCTCCCTTCCCGAGGCCTTCTGCCGGTTCTGCGGCCTCTCCCGCGTCTTCGCTTTCGGCCTCCGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTGTTTCGCCTCGGCGTCCGGTCCGTGTTGCTTGGTCGTCACCTGTGCAGAATTGCGAACCATGGATTCCA |
SB03422 야생형 |
40 |
SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06136 rld.ERT2.돌연변이체.81 L384M / L391V / N413D / M421L / S463P / H524L |
41 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06138 rld.ERT2.돌연변이체.93 L384M / L391V / N413D / M421L / S463P / H524L |
42 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06139 rld.ERT2.돌연변이체.86 L354I / L384M / L391V / S463P |
43 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06140 rld.ERT2.돌연변이체.95 L354I / L384M / L409V / N413D / M421L / S463P / H524F |
44 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06141 rld.ERT2.돌연변이체.88 L391V / N413D / Q414E / S463P / H524F |
45 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06142 rld.ERT2.돌연변이체.77 L354I / L391V / N413D / M421L / S463P / M517A / H524L |
46 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06143 rld.ERT2.돌연변이체49 L391V / Q414E / M421L / S463P / H524F |
47 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRNEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06144 rld.ERT2.돌연변이.58 L354I / L409V / N413D / M421L / H524L |
48 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06145 rld.ERT2.돌연변이체.62 L409V / N413D / Q414E / M421L / S463P / H524L |
49 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06146 rld.ERT2.돌연변이체.63 L354I / L391V / N413D / Q414E / M421L / M517A / H524F |
50 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06147 rld.ERT2.돌연변이체.55 L354I / L409V / M421L / S463P / H524L |
51 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRNQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06149 rld.ERT2.돌연변이체.41 L354I / L391V / L409V / N413D / Q414E / H524L |
52 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLVLDRDEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06150 rld.ERT2.돌연변이.43 Q414E / S463P / H524L |
53 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06151 rld.ERT2.돌연변이체.46 L384M / L391V / L409V / N413D / M421L / S463P / M517A / H524F |
54 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
SB06152 rld.ERT2.돌연변이체.40 L384M / L391V / N413D / H524F |
55 | SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA |
4X ZF5 BD + YB-TATA 최소 (Syn 프로모터) | 56 | cgggtttcgtaacaatcgcatgaggattcgcaacgcctttGAAGCAGTCGACGCCGAAgtcccgtctcagtaaaggttGAAGCAGTCGACGCCGAAgaatcggactgccttcgtatGAAGCAGTCGACGCCGAAggtatcagtcgcctcggaatGAAGCAGTCGACGCCGAAgattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA |
IL-12 | 57 | ATGTGCCATCAGCAACTCGTCATCTCCTGGTTCTCCCTTGTGTTCCTCGCTTCCCCTCTGGTCGCCATTTGGGAACTGAAGAAGGACGTCTACGTGGTCGAGCTGGATTGGTACCCGGACGCCCCTGGAGAAATGGTCGTGCTGACTTGCGATACGCCAGAAGAGGACGGCATAACCTGGACCCTGGATCAGAGCTCCGAGGTGCTCGGAAGCGGAAAGACCCTGACCATTCAAGTCAAGGAGTTCGGCGACGCGGGCCAGTACACTTGCCACAAGGGTGGCGAAGTGCTGTCCCACTCCCTGCTGCTGCTGCACAAGAAAGAGGATGGAATCTGGTCCACTGACATCCTCAAGGACCAAAAAGAACCGAAGAACAAGACCTTCCTCCGCTGCGAAGCCAAGAACTACAGCGGTCGGTTCACCTGTTGGTGGCTGACGACAATCTCCACCGACCTGACTTTCTCCGTGAAGTCGTCACGGGGATCAAGCGATCCTCAGGGCGTGACCTGTGGAGCCGCCACTCTGTCCGCCGAGAGAGTCAGGGGAGACAACAAGGAATATGAGTACTCCGTGGAATGCCAGGAGGACAGCGCCTGCCCTGCCGCGGAAGAGTCCCTGCCTATCGAGGTCATGGTCGATGCCGTGCATAAGCTGAAATACGAGAACTACACTTCCTCCTTCTTTATCCGCGACATCATCAAGCCTGACCCCCCCAAGAACTTGCAGCTGAAGCCACTCAAGAACTCCCGCCAAGTGGAAGTGTCTTGGGAATATCCAGACACTTGGAGCACCCCGCACTCATACTTCTCGCTCACTTTCTGTGTGCAAGTGCAGGGAAAGTCCAAACGGGAGAAGAAAGACCGGGTGTTCACCGACAAAACCTCCGCCACTGTGATTTGTCGGAAGAACGCGTCAATCAGCGTCCGGGCGCAGGATAGATACTACTCGTCCTCCTGGAGCGAATGGGCCAGCGTGCCTTGTTCCGGTGGCGGATCAGGCGGAGGTTCAGGAGGAGGCTCCGGAGGAGGTTCCCGGAACCTCCCTGTGGCAACCCCCGACCCTGGAATGTTCCCGTGCCTACACCACTCCCAAAACCTCCTGAGGGCTGTGTCGAACATGTTGCAGAAGGCCCGCCAGACCCTTGAGTTCTACCCCTGCACCTCGGAAGAAATTGATCACGAGGACATCACCAAGGACAAGACCTCGACCGTGGAAGCCTGCCTGCCGCTGGAACTGACCAAGAACGAATCGTGTCTGAACTCCCGCGAGACAAGCTTTATCACTAACGGCAGCTGCCTGGCGTCGAGAAAGACCTCATTCATGATGGCGCTCTGTCTTTCCTCGATCTACGAAGATCTGAAGATGTATCAGGTCGAGTTCAAGACCATGAACGCCAAGCTGCTCATGGACCCGAAGCGGCAGATCTTCCTGGACCAGAATATGCTCGCCGTGATTGATGAACTGATGCAGGCCCTGAATTTCAACTCCGAGACTGTGCCTCAAAAGTCCAGCCTGGAAGAACCGGACTTCTACAAGACCAAGATCAAGCTGTGCATCCTGTTGCACGCTTTCCGCATTCGAGCCGTGACCATTGACCGCGTGATGTCCTACCTGAACGCCAGT |
IL-12 | 58 | MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS |
AU/SLDE (데스타블리자티-온 도메인) | 59 | ATTTATTTATTTATTTATTTAacatcggttccCTGTTTAATATTTAAACAG |
A2 (절연체) | 60 | AGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGT |
ZF5-7 DBD(ZF DNA BD) | 61 | ATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCT |
ZF5-7 DBD(ZF DNA BD) | 62 | MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS |
P65(전사 활성인자) | 63 | GATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCC |
P65(전사 활성인자) AA | 64 | DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS |
돌연변이체 81 (ERT 돌연변이체) | 65 | gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca |
돌연변이체 81(ERT 돌연변이체) | 66 | AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT |
SB07123 벡터 | 67 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
돌연변이체 77 (ERT 돌연변이체) | 68 | gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca |
돌연변이체 77 (ERT 돌연변이체) | 69 | AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT |
SB07129 벡터 | 70 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
돌연변이체 62 (ERT 돌연변이체) | 71 | gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca |
돌연변이체 62 (ERT 돌연변이체) | 72 | AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT |
SB07135 벡터 | 73 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
LR1 분할 N 용어 링커 + CD16Tace(절단 부위) | 74 | AGCGGCGGAGGTGGTAGCGGAGGCGGAGGATCTGGAATTACACAGGGACTCGCCGTGTCTACAATCTCCAGCTTCTTTGGTGGCGGTAGTGGCGGCGGTGGCAGTGGCGGTGGATCTCTTCAA |
LR1 분할 N 용어 링커 + CD16Tace(절단 부위) | 75 | SGGGGSGGGGSGITQGLAVSTISSFFGGGSGGGGSGGGSLQ |
B7-1(TM 도메인) | 76 | CTGCTGCCAAGCTGGGCCATCACACTGATCTCCGTGAACGGCATCTTCGTGATCTGTTGCCTGACCTACTGCTTCGCCCCTCGGTGCAGAGAGCGGAGAAGAAACGAACGGCTGCGGAGAGAATCTGTGCGGCCTGTG |
B7-1(TM 도메인) | 77 | LLPSWAITLISVNGIFVICCLTYCFAPRCRERRRNERLRRESVRPV |
SV40 프로모터 | 78 | GTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAA |
SB07127 벡터 | 79 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
SB07133 벡터 | 80 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
SB07139 벡터 | 81 | aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc |
WRPW 모티프 | 82 | WRPW |
IL-12 | 83 | ATGTGTCACCAGCAGCTGGTCATCAGCTGGTTCAGCCTGGTGTTCCTGGCCTCTCCTCTGGTGGCCATCTGGGAGCTGAAGAAAGACGTGTACGTGGTGGAACTGGACTGGTATCCCGATGCTCCTGGCGAGATGGTGGTGCTGACCTGCGATACCCCTGAAGAGGACGGCATCACCTGGACACTGGATCAGTCTAGCGAGGTGCTCGGCAGCGGCAAGACCCTGACCATCCAAGTGAAAGAGTTTGGCGACGCCGGCCAGTACACCTGTCACAAAGGCGGAGAAGTGCTGAGCCACAGCCTGCTGCTGCTCCACAAGAAAGAGGATGGCATTTGGAGCACCGACATCCTGAAGGACCAGAAAGAGCCCAAGAACAAGACCTTCCTGAGATGCGAGGCCAAGAACTACAGCGGCCGGTTCACATGTTGGTGGCTGACCACCATCAGCACCGACCTGACCTTCAGCGTGAAGTCCAGCAGAGGCAGCAGTGATCCTCAGGGCGTTACATGTGGCGCCGCTACACTGTCTGCCGAAAGAGTGCGGGGCGACAACAAAGAATACGAGTACAGCGTGGAATGCCAAGAGGACAGCGCCTGTCCAGCCGCCGAAGAGTCTCTGCCTATCGAAGTGATGGTGGACGCCGTGCACAAGCTGAAGTACGAGAACTACACCTCCAGCTTTTTCATCCGGGACATCATCAAGCCCGATCCTCCAAAGAACCTGCAGCTGAAGCCTCTGAAGAACAGCAGACAGGTGGAAGTGTCCTGGGAGTACCCCGACACCTGGTCTACACCCCACAGCTACTTCAGCCTGACCTTTTGCGTGCAAGTGCAGGGCAAGTCCAAGCGCGAGAAAAAGGACCGGGTGTTCACCGACAAGACCAGCGCCACCGTGATCTGCAGAAAGAACGCCAGCATCAGCGTCAGAGCCCAGGACCGGTACTACAGCAGCTCTTGGAGCGAATGGGCCAGCGTGCCATGTTCTGGCGGAGGAAGCGGTGGCGGATCAGGTGGTGGATCTGGCGGCGGATCTAGAAACCTGCCTGTGGCCACTCCTGATCCTGGCATGTTCCCTTGTCTGCACCACAGCCAGAACCTGCTGAGAGCCGTGTCCAACATGCTGCAGAAGGCCAGACAGACCCTGGAATTCTACCCCTGCACCAGCGAGGAAATCGACCACGAGGACATCACCAAGGATAAGACCAGCACCGTGGAAGCCTGCCTGCCTCTGGAACTGACCAAGAACGAGAGCTGCCTGAACAGCCGGGAAACCAGCTTCATCACCAACGGCTCTTGCCTGGCCAGCAGAAAGACCTCCTTCATGATGGCCCTGTGCCTGAGCAGCATCTACGAGGACCTGAAGATGTACCAGGTGGAATTCAAGACCATGAACGCCAAGCTGCTGATGGACCCCAAGCGGCAGATCTTCCTGGACCAGAATATGCTGGCCGTGATCGACGAGCTGATGCAGGCCCTGAACTTCAACAGCGAGACAGTGCCCCAGAAGTCTAGCCTGGAAGAACCCGACTTCTACAAGACCAAGATCAAGC TGTGCATCCTGCTGCACGCCTTCCGGATCAGAGCCGTGACCATCGACAGAGTGATGAGCTACCTGAACGCCTCT |
본 개시는 바람직한 구현예 및 다양한 대안적인 구현예를 참조하여 구체적으로 도시되고 설명되었지만, 관련 기술분야의 통상의 기술자는 본 개시 및 첨부된 청구범위의 사상 및 범위를 벗어나지 않고 형태 및 세부사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다.
본 명세서의 본문 내에서 인용된 모든 참고문헌, 발행된 특허 및 특허 출원은 사실상 그 전체가 참조로 본원에 포함된다.
SEQUENCE LISTING
<110> SENTI BIOSCIENCES, INC.
<120> ERT2 MUTANTS AND USES THEREOF
<130> STB-028WO
<140>
<141>
<150> 63/171,227
<151> 2021-04-06
<160> 83
<170> PatentIn version 3.5
<210> 1
<211> 595
<212> PRT
<213> Homo sapiens
<400> 1
Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His
1 5 10 15
Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys
20 25 30
Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys
35 40 45
Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala
50 55 60
Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr
65 70 75 80
Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly
85 90 95
Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His
100 105 110
Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val
115 120 125
Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala
130 135 140
Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly
145 150 155 160
Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met
165 170 175
Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala
180 185 190
Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe
195 200 205
Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr
210 215 220
Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys
225 230 235 240
Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg
245 250 255
Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp
260 265 270
Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala
275 280 285
Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn
290 295 300
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
305 310 315 320
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
325 330 335
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
340 345 350
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
355 360 365
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
370 375 380
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly
385 390 395 400
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
405 410 415
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
420 425 430
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
435 440 445
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
450 455 460
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
465 470 475 480
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
485 490 495
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
500 505 510
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
515 520 525
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu
530 535 540
Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val
545 550 555 560
Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser
565 570 575
His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro
580 585 590
Ala Thr Val
595
<210> 2
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Val
305 310
<210> 3
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 3
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 4
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 4
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Val
1 5 10 15
Asp Gly Phe
<210> 5
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 5
Ala Ser Gly Gly Gly Gly Ser Ala Ser
1 5
<210> 6
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His
35 40 45
Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu
65 70 75 80
Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu
100 105 110
Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 7
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
agagggtata taatggaagc tcgacttcca g 31
<210> 8
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 8
gggaatttcc ggggactttc cgggaatttc cggggacttt ccgggaattt cc 52
<210> 9
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
caccagacag tgacgtcagc tgccagatcc catggccgtc atactgtgac gtctttcaga 60
caccccattg acgtcaatgg gagaa 85
<210> 10
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 10
ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata cagaaggcgt 60
ggaggaaaaa ctgtttcata cagaaggcgt 90
<210> 11
<211> 115
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 11
aggatgtcca tattaggaca tctaggatgt ccatattagg acatctagga tgtccatatt 60
aggacatcta ggatgtccat attaggacat ctaggatgtc catattagga catct 115
<210> 12
<211> 115
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 12
agtatgtcca tattaggaca tctaccatgt ccatattagg acatctacta tgtccatatt 60
aggacatctt gtatgtccat attaggacat ctaaaatgtc catattagga catct 115
<210> 13
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
tgagtcagtg actcagtgag tcagtgactc agtgagtcag tgactcag 48
<210> 14
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
agatcaaagg gtttaagatc aaagggctta agatcaaagg gtataagatc aaagggccta 60
agatcaaagg gactaagatc aaagggttta agatcaaagg gcttaagatc aaagggccta 120
<210> 15
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 15
gtctagacgt ctagacgtct agacgtctag ac 32
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
cagacacaga cacagacaca gaca 24
<210> 17
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 17
ggatccggta ctcgagatct gcgatctaag taagcttggc attccggtac tgttggtaaa 60
gccac 65
<210> 18
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 18
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctc 588
<210> 19
<211> 1179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 19
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120
gatgccgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660
gcgcgaccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720
gtcctcgcgc cgccgtgtat cgccccgccc cgggcggcaa ggctggcccg gtcggcacca 780
gttgcgtgag cggaaagatg gccgcttccc ggtcctgctg cagggagctc aaaatggagg 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179
<210> 20
<211> 544
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 20
ggatctgcga tcgctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg 60
agaagttggg gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa 120
actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 180
atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 240
agctgaagct tcgaggggct cgcatctctc cttcacgcgc ccgccgccct acctgaggcc 300
gccatccacg ccggttgagt cgcgttctgc cgcctcccgc ctgtggtgcc tcctgaactg 360
cgtccgccgt ctaggtaagt ttaaagctca ggtcgagacc gggcctttgt ccggcgctcc 420
cttggagcct acctagactc agccggctct ccacgctttg cctgaccctg cttgctcaac 480
tctacgtctt tgtttcgttt tctgttctgc gccgttacag atccaagctg tgaccggcgc 540
ctac 544
<210> 21
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 21
tttatttagt ctccagaaaa aggggggaat gaaagacccc acctgtaggt ttggcaagct 60
aggatcaagg ttaggaacag agagacagca gaatatgggc caaacaggat atctgtggta 120
agcagttcct gccccggctc agggccaaga acagttggaa cagcagaata tgggccaaac 180
aggatatctg tggtaagcag ttcctgcccc ggctcagggc caagaacaga tggtccccag 240
atgcggtccc gccctcagca gtttctagag aaccatcaga tgtttccagg gtgccccaag 300
gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc agttcgcttc tcgcttctgt 360
tcgcgcgctt ctgctccccg agctcaataa aagagccca 399
<210> 22
<211> 511
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 22
ggggttgggg ttgcgccttt tccaaggcag ccctgggttt gcgcagggac gcggctgctc 60
tgggcgtggt tccgggaaac gcagcggcgc cgaccctggg tctcgcacat tcttcacgtc 120
cgttcgcagc gtcacccgga tcttcgccgc tacccttgtg ggccccccgg cgacgcttcc 180
tgctccgccc ctaagtcggg aaggttcctt gcggttcgcg gcgtgccgga cgtgacaaac 240
ggaagccgca cgtctcacta gtaccctcgc agacggacag cgccagggag caatggcagc 300
gcgccgaccg cgatgggctg tggccaatag cggctgctca gcggggcgcg ccgagagcag 360
cggccgggaa ggggcggtgc gggaggcggg gtgtggggcg gtagtgtggg ccctgttcct 420
gcccgcgcgg tgttccgcat tctgcaagcc tccggagcgc acgtcggcag tcggctccct 480
cgttgaccga atcaccgacc tctctcccca g 511
<210> 23
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
gtaacgccat tttgcaaggc atggaaaaat accaaaccaa gaatagagaa gttcagatca 60
agggcgggta catgaaaata gctaacgttg ggccaaacag gatatctgcg gtgagcagtt 120
tcggccccgg cccggggcca agaacagatg gtcaccgcag tttcggcccc ggcccgaggc 180
caagaacaga tggtccccag atatggccca accctcagca gtttcttaag acccatcaga 240
tgtttccagg ctcccccaag gacctgaaat gaccctgcgc cttatttgaa ttaaccaatc 300
agcctgcttc tcgcttctgt tcgcgcgctt ctgcttcccg agctctataa aagagctcac 360
aacccctcac tcggcgcgcc agtcctccga cagactgagt cgcccggg 408
<210> 24
<211> 344
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 60
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 120
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 180
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 240
ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag 300
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agct 344
<210> 25
<211> 1229
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 25
gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 60
agacgaaggg cgcaggagcg ttcctgatcc ttccgcccgg acgctcagga cagcggcccg 120
ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 180
cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 240
gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 300
taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 360
cttgtttgtg gatcgctgtg atcgtcactt ggtgagttgc gggctgctgg gctggccggg 420
gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac cgccaagggc 480
tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga gcgcacaaaa 540
tggcggctgt tcccgagtct tgaatggaag acgcttgtaa ggcgggctgt gaggtcgttg 600
aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg 660
cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa 720
gtttgtcact gactggagaa ctcgggtttg tcgtctggtt gcgggggcgg cagttatgcg 780
gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg cctcgtcgtg tcgtgacgtc 840
acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc 900
ttttctccgt cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc 960
gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg 1020
tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag 1080
tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa 1140
ttttcagtgt tagactagta aagcttctgc aggtcgactc tagaaaattg tccgctaaat 1200
tctggccgtt tttggctttt ttgttagac 1229
<210> 26
<211> 1179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720
ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179
<210> 27
<211> 1718
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 27
actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 60
cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 120
ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 180
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 240
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 300
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 360
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 420
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 480
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 540
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 600
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcggggag tcgctgcgac 660
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 720
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 780
agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc 840
tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg 900
tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg 960
cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc 1020
ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt 1080
gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc cctccccgag 1140
ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg 1200
ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg 1260
ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg 1320
cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt 1380
tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc 1440
gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc cttcgtgcgt 1500
cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg ggggacggct 1560
gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc ggcggctcta 1620
gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg ggcaacgtgc 1680
tggttattgt gctgtctcat cattttggca aagaattc 1718
<210> 28
<211> 212
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60
ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120
gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180
tttttcgcaa cgggtttgcc gccagaacac ag 212
<210> 29
<211> 2379
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
ccactagttc catgtcctta tatggactca tctttgccta ttgcgacaca cactcaatga 60
acacctacta cgcgctgcaa agagccccgc aggcctgagg tgcccccacc tcaccactct 120
tcctattttt gtgtaaaaat ccagcttctt gtcaccacct ccaaggaggg ggaggaggag 180
gaaggcaggt tcctctaggc tgagccgaat gcccctctgt ggtcccacgc cactgatcgc 240
tgcatgccca ccacctgggt acacacagtc tgtgattccc ggagcagaac ggaccctgcc 300
cacccggtct tgtgtgctac tcagtggaca gacccaaggc aagaaagggt gacaaggaca 360
gggtcttccc aggctggctt tgagttccta gcaccgcccc gcccccaatc ctctgtggca 420
catggagtct tggtccccag agtcccccag cggcctccag atggtctggg agggcagttc 480
agctgtggct gcgcatagca gacatacaac ggacggtggg cccagaccca ggctgtgtag 540
acccagcccc cccgccccgc agtgcctagg tcacccacta acgccccagg cctggtcttg 600
gctgggcgtg actgttaccc tcaaaagcag gcagctccag ggtaaaaggt gccctgccct 660
gtagagccca ccttccttcc cagggctgcg gctgggtagg tttgtagcct tcatcacggg 720
ccacctccag ccactggacc gctggcccct gccctgtcct ggggagtgtg gtcctgcgac 780
ttctaagtgg ccgcaagcca cctgactccc ccaacaccac actctacctc tcaagcccag 840
gtctctccct agtgacccac ccagcacatt tagctagctg agccccacag ccagaggtcc 900
tcaggccctg ctttcagggc agttgctctg aagtcggcaa gggggagtga ctgcctggcc 960
actccatgcc ctccaagagc tccttctgca ggagcgtaca gaacccaggg ccctggcacc 1020
cgtgcagacc ctggcccacc ccacctgggc gctcagtgcc caagagatgt ccacacctag 1080
gatgtcccgc ggtgggtggg gggcccgaga gacgggcagg ccgggggcag gcctggccat 1140
gcggggccga accgggcact gcccagcgtg gggcgcgggg gccacggcgc gcgcccccag 1200
cccccgggcc cagcacccca aggcggccaa cgccaaaact ctccctcctc ctcttcctca 1260
atctcgctct cgctcttttt ttttttcgca aaaggagggg agagggggta aaaaaatgct 1320
gcactgtgcg gcgaagccgg tgagtgagcg gcgcggggcc aatcagcgtg cgccgttccg 1380
aaagttgcct tttatggctc gagcggccgc ggcggcgccc tataaaaccc agcggcgcga 1440
cgcgccacca ccgccgagac cgcgtccgcc ccgcgagcac agagcctcgc ctttgccgat 1500
ccgccgcccg tccacacccg ccgccaggta agcccggcca gccgaccggg gcaggcggct 1560
cacggcccgg ccgcaggcgg ccgcggcccc ttcgcccgtg cagagccgcc gtctgggccg 1620
cagcgggggg cgcatggggg gggaaccgga ccgccgtggg gggcgcggga gaagcccctg 1680
ggcctccgga gatgggggac accccacgcc agttcggagg cgcgaggccg cgctcgggag 1740
gcgcgctccg ggggtgccgc tctcggggcg ggggcaaccg gcggggtctt tgtctgagcc 1800
gggctcttgc caatggggat cgcagggtgg gcgcggcgga gcccccgcca ggcccggtgg 1860
gggctggggc gccattgcgc gtgcgcgctg gtcctttggg cgctaactgc gtgcgcgctg 1920
ggaattggcg ctaattgcgc gtgcgcgctg ggactcaagg cgctaactgc gcgtgcgttc 1980
tggggcccgg ggtgccgcgg cctgggctgg ggcgaaggcg ggctcggccg gaaggggtgg 2040
ggtcgccgcg gctcccgggc gcttgcgcgc acttcctgcc cgagccgctg gccgcccgag 2100
ggtgtggccg ctgcgtgcgc gcgcgccgac ccggcgctgt ttgaaccggg cggaggcggg 2160
gctggcgccc ggttgggagg gggttggggc ctggcttcct gccgcgcgcc gcggggacgc 2220
ctccgaccag tgtttgcctt ttatggtaat aacgcggccg gcccggcttc ctttgtcccc 2280
aatctgggcg cgcgccggcg ccccctggcg gcctaaggac tcggcgcgcc ggaagtggcc 2340
agggcggggg cgacctcggc tcacagcgcg cccggctat 2379
<210> 30
<211> 529
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 30
gttgatttcc ttcatccctg gcacacgtcc aggcagtgtc gaatccatct ctgctacagg 60
ggaaaacaaa taacatttga gtccagtgga gaccgggagc agaagtaaag ggaagtgata 120
acccccagag cccggaagcc tctggaggct gagacctcgc cccccttgcg tgatagggcc 180
tacggagcca catgaccaag gcactgtcgc ctccgcacgt gtgagagtgc agggccccaa 240
gatggctgcc aggcctcgag gcctgactct tctatgtcac ttccgtaccg gcgagaaagg 300
cgggccctcc agccaatgag gctgcggggc gggccttcac cttgataggc actcgagtta 360
tccaatggtg cctgcgggcc ggagcgacta ggaactaacg tcatgccgag ttgctgagcg 420
ccggcaggcg gggccggggc ggccaaacca atgcgatggc cggggcggag tcgggcgctc 480
tataagttgt cgataggcgg gcactccgcc ctagtttcta aggaccatg 529
<210> 31
<211> 794
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 31
agttccccaa ctttcccgcc tctcagcctt tgaaagaaag aaaggggagg gggcaggccg 60
cgtgcagtcg cgagcggtgc tgggctccgg ctccaattcc ccatctcagt cgctcccaaa 120
gtccttctgt ttcatccaag cgtgtaaggg tccccgtcct tgactcccta gtgtcctgct 180
gcccacagtc cagtcctggg aaccagcacc gatcacctcc catcgggcca atctcagtcc 240
cttcccccct acgtcggggc ccacacgctc ggtgcgtgcc cagttgaacc aggcggctgc 300
ggaaaaaaaa aagcggggag aaagtagggc ccggctacta gcggttttac gggcgcacgt 360
agctcaggcc tcaagacctt gggctgggac tggctgagcc tggcgggagg cggggtccga 420
gtcaccgcct gccgccgcgc ccccggtttc tataaattga gcccgcagcc tcccgcttcg 480
ctctctgctc ctcctgttcg acagtcagcc gcatcttctt ttgcgtcgcc aggtgaagac 540
gggcggagag aaacccggga ggctagggac ggcctgaagg cggcaggggc gggcgcaggc 600
cggatgtgtt cgcgccgctg cggggtgggc ccgggcggcc tccgcattgc aggggcgggc 660
ggaggacgtg atgcggcgcg ggctgggcat ggaggcctgg tgggggaggg gaggggaggc 720
gtgggtgtcg gccggggcca ctaggcgctc actgttctct ccctccgcgc agccgagcca 780
catcgctgag acac 794
<210> 32
<211> 532
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
agtgcggtta ccagcggaaa tgcctcgggg tcagaagtcg caggagagat agacagctgc 60
tgaaccaatg ggaccagcgg atggggcgga tgttatctac cattggtgaa cgttagaaac 120
gaatagcagc caatgaatca gctggggggg cggagcagtg acgtttattg cggagggggc 180
cgcttcgaat cggcggcggc cagcttggtg gcctgggcca atgaacggcc tccaacgagc 240
agggccttca ccaatcggcg gcctccacga cggggctggg ggagggtata taagccgagt 300
aggcgacggt gaggtcgacg ccggccaaga cagcacagac agattgacct attggggtgt 360
ttcgcgagtg tgagagggaa gcgccgcggc ctgtatttct agacctgccc ttcgcctggt 420
tcgtggcgcc ttgtgacccc gggcccctgc cgcctgcaag tcggaaattg cgctgtgctc 480
ctgtgctacg gcctgtggct ggactgcctg ctgctgccca actggctggc ac 532
<210> 33
<211> 701
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 33
tagtttcatc accaccgcca cccccccgcc cccccgccat ctgaaagggt tctaggggat 60
ttgcaacctc tctcgtgtgt ttcttctttc cgagaagcgc cgccacacga gaaagctggc 120
cgcgaaagtc gtgctggaat cacttccaac gaaaccccag gcatagatgg gaaagggtga 180
agaacacgtt gccatggcta ccgtttcccc ggtcacggaa taaacgctct ctaggatccg 240
gaagtagttc cgccgcgacc tctctaaaag gatggatgtg ttctctgctt acattcattg 300
gacgttttcc cttagaggcc aaggccgccc aggcaaaggg gcggtcccac gcgtgagggg 360
cccgcggagc catttgattg gagaaaagct gcaaaccctg accaatcgga aggagccacg 420
cttcgggcat cggtcaccgc acctggacag ctccgattgg tggacttccg ccccccctca 480
cgaatcctca ttgggtgccg tgggtgcgtg gtgcggcgcg attggtgggt tcatgtttcc 540
cgtcccccgc ccgcgagaag tgggggtgaa aagcggcccg acctgcttgg ggtgtagtgg 600
gcggaccgcg cggctggagg tgtgaggatc cgaacccagg ggtggggggt ggaggcggct 660
cctgcgatcg aaggggactt gagactcacc ggccgcacgt c 701
<210> 34
<211> 465
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
gggccgccca ctcccccttc ctctcagggt ccctgtcccc tccagtgaat cccagaagac 60
tctggagagt tctgagcagg gggcggcact ctggcctctg attggtccaa ggaaggctgg 120
ggggcaggac gggaggcgaa aaccctggaa tattcccgac ctggcagcct catcgagctc 180
ggtgattggc tcagaaggga aaaggcgggt ctccgtgacg acttataaaa gcccaggggc 240
aagcggtccg gataacggct agcctgagga gctgctgcga cagtccacta cctttttcga 300
gagtgactcc cgttgtccca aggcttccca gagcgaacct gtgcggctgc aggcaccggc 360
gcgtcgagtt tccggcgtcc ggaaggaccg agctcttctc gcggatccag tgttccgttt 420
ccagccccca atctcagagc ggagccgaca gagagcaggg aaccc 465
<210> 35
<211> 538
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 35
gccccacccc cgtccgcgtt acaaccggga ggcccgctgg gtcctgcacc gtcaccctcc 60
tccctgtgac cgcccacctg atacccaaac aactttctcg cccctccagt ccccagctcg 120
ccgagcgctt gcggggagcc acccagcctc agtttcccca gccccgggcg gggcgagggg 180
cgatgacgtc atgccggcgc gcggcattgt ggggcggggc gaggcggggc gccgggggga 240
gcaacactga gacgccattt tcggcggcgg gagcggcgca ggcggccgag cgggactggc 300
tgggtcggct gggctgctgg tgcgaggagc cgcggggctg tgctcggcgg ccaaggggac 360
agcgcgtggg tggccgagga tgctgcgggg cggtagctcc ggcgcccctc gctggtgact 420
gctgcgccgt gcctcacaca gccgaggcgg gctcggcgca cagtcgctgc tccgcgctcg 480
cgcccggcgg cgctccaggt gctgacagcg cgagagagcg cggcctcagg agcaacac 538
<210> 36
<211> 1091
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
ttccagagct ttcgaggaag gtttcttcaa ctcaaattca tccgcctgat aattttctta 60
tattttccta aagaaggaag agaagcgcat agaggagaag ggaaataatt ttttaggagc 120
ctttcttacg gctatgagga atttggggct cagttgaaaa gcctaaactg cctctcggga 180
ggttgggcgc ggcgaactac tttcagcggc gcacggagac ggcgtctacg tgaggggtga 240
taagtgacgc aacactcgtt gcataaattt gcgctccgcc agcccggagc atttaggggc 300
ggttggcttt gttgggtgag cttgtttgtg tccctgtggg tggacgtggt tggtgattgg 360
caggatcctg gtatccgcta acaggtactg gcccacagcc gtaaagacct gcgggggcgt 420
gagagggggg aatgggtgag gtcaagctgg aggcttcttg gggttgggtg ggccgctgag 480
gggaggggag ggcgaggtga cgcgacaccc ggcctttctg ggagagtggg ccttgttgac 540
ctaagggggg cgagggcagt tggcacgcgc acgcgccgac agaaactaac agacattaac 600
caacagcgat tccgtcgcgt ttacttggga ggaaggcgga aaagaggtag tttgtgtggc 660
ttctggaaac cctaaatttg gaatcccagt atgagaatgg tgtcccttct tgtgtttcaa 720
tgggattttt acttcgcgag tcttgtgggt ttggttttgt tttcagtttg cctaacaccg 780
tgcttaggtt tgaggcagat tggagttcgg tcgggggagt ttgaatatcc ggaacagtta 840
gtggggaaag ctgtggacgc ttggtaagag agcgctctgg attttccgct gttgacgttg 900
aaaccttgaa tgacgaattt cgtattaagt gacttagcct tgtaaaattg aggggaggct 960
tgcggaatat taacgtattt aaggcatttt gaaggaatag ttgctaattt tgaagaatat 1020
taggtgtaaa agcaagaaat acaatgatcc tgaggtgaca cgcttatgtt ttacttttaa 1080
actaggtcac c 1091
<210> 37
<211> 243
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 37
cgggtttcgt aacaatcgca tgaggattcg caacgccttc ggcgtagccg atgtcgcgct 60
cccgtctcag taaaggtcgg cgtagccgat gtcgcgcaat cggactgcct tcgtacggcg 120
tagccgatgt cgcgcgtatc agtcgcctcg gaacggcgta gccgatgtcg cgcattcgta 180
agaggctcac tctcccttac acggagtgga taactagttc tagagggtat ataatggggg 240
cca 243
<210> 38
<211> 672
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 60
aactatgttg ctccttttac gctgtgtgga tatgctgctt taatgcctct gtatcatgct 120
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 180
tatgaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 240
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 300
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 360
ggggctaggt tgctgggcac tgataattcc gtggtgttgt cggggaagct gacgtccttt 420
ccatggctgc tcgcctgtgt tgccaactgg atcctgcgcg ggacgtcctt ctgctacgtc 480
ccttcggctc tcaatccagc ggacctccct tcccgaggcc ttctgccggt tctgcggcct 540
ctcccgcgtc ttcgctttcg gcctccgacg agtcggatct ccctttgggc cgcctccccg 600
cctgtttcgc ctcggcgtcc ggtccgtgtt gcttggtcgt cacctgtgca gaattgcgaa 660
ccatggattc ca 672
<210> 39
<211> 672
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 60
aactatgttg ctccttttac gctgtgtgga tatgctgctt taatgcctct gtatcatgct 120
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 180
tatgaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 240
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 300
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 360
ggggctaggt tgctgggcac tgataattcc gtggtgttgt cggggaaatc atcgtccttt 420
ccttggctgc tcgcctgtgt tgccaactgg atcctgcgcg ggacgtcctt ctgctacgtc 480
ccttcggctc tcaatccagc ggacctccct tcccgaggcc ttctgccggt tctgcggcct 540
ctcccgcgtc ttcgctttcg gcctccgacg agtcggatct ccctttgggc cgcctccccg 600
cctgtttcgc ctcggcgtcc ggtccgtgtt gcttggtcgt cacctgtgca gaattgcgaa 660
ccatggattc ca 672
<210> 40
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 41
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 41
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 42
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 43
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 44
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 44
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 45
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 46
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 47
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 47
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 48
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 49
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 50
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 51
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 51
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 52
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 52
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 53
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 53
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 54
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 54
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 55
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 55
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 56
<211> 243
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 56
cgggtttcgt aacaatcgca tgaggattcg caacgccttt gaagcagtcg acgccgaagt 60
cccgtctcag taaaggttga agcagtcgac gccgaagaat cggactgcct tcgtatgaag 120
cagtcgacgc cgaaggtatc agtcgcctcg gaatgaagca gtcgacgccg aagattcgta 180
agaggctcac tctcccttac acggagtgga taactagttc tagagggtat ataatggggg 240
cca 243
<210> 57
<211> 1623
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
atgtgccatc agcaactcgt catctcctgg ttctcccttg tgttcctcgc ttcccctctg 60
gtcgccattt gggaactgaa gaaggacgtc tacgtggtcg agctggattg gtacccggac 120
gcccctggag aaatggtcgt gctgacttgc gatacgccag aagaggacgg cataacctgg 180
accctggatc agagctccga ggtgctcgga agcggaaaga ccctgaccat tcaagtcaag 240
gagttcggcg acgcgggcca gtacacttgc cacaagggtg gcgaagtgct gtcccactcc 300
ctgctgctgc tgcacaagaa agaggatgga atctggtcca ctgacatcct caaggaccaa 360
aaagaaccga agaacaagac cttcctccgc tgcgaagcca agaactacag cggtcggttc 420
acctgttggt ggctgacgac aatctccacc gacctgactt tctccgtgaa gtcgtcacgg 480
ggatcaagcg atcctcaggg cgtgacctgt ggagccgcca ctctgtccgc cgagagagtc 540
aggggagaca acaaggaata tgagtactcc gtggaatgcc aggaggacag cgcctgccct 600
gccgcggaag agtccctgcc tatcgaggtc atggtcgatg ccgtgcataa gctgaaatac 660
gagaactaca cttcctcctt ctttatccgc gacatcatca agcctgaccc ccccaagaac 720
ttgcagctga agccactcaa gaactcccgc caagtggaag tgtcttggga atatccagac 780
acttggagca ccccgcactc atacttctcg ctcactttct gtgtgcaagt gcagggaaag 840
tccaaacggg agaagaaaga ccgggtgttc accgacaaaa cctccgccac tgtgatttgt 900
cggaagaacg cgtcaatcag cgtccgggcg caggatagat actactcgtc ctcctggagc 960
gaatgggcca gcgtgccttg ttccggtggc ggatcaggcg gaggttcagg aggaggctcc 1020
ggaggaggtt cccggaacct ccctgtggca acccccgacc ctggaatgtt cccgtgccta 1080
caccactccc aaaacctcct gagggctgtg tcgaacatgt tgcagaaggc ccgccagacc 1140
cttgagttct acccctgcac ctcggaagaa attgatcacg aggacatcac caaggacaag 1200
acctcgaccg tggaagcctg cctgccgctg gaactgacca agaacgaatc gtgtctgaac 1260
tcccgcgaga caagctttat cactaacggc agctgcctgg cgtcgagaaa gacctcattc 1320
atgatggcgc tctgtctttc ctcgatctac gaagatctga agatgtatca ggtcgagttc 1380
aagaccatga acgccaagct gctcatggac ccgaagcggc agatcttcct ggaccagaat 1440
atgctcgccg tgattgatga actgatgcag gccctgaatt tcaactccga gactgtgcct 1500
caaaagtcca gcctggaaga accggacttc tacaagacca agatcaagct gtgcatcctg 1560
ttgcacgctt tccgcattcg agccgtgacc attgaccgcg tgatgtccta cctgaacgcc 1620
agt 1623
<210> 58
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 58
Met Cys His Gln Gln Leu Val Ile Ser Trp Phe Ser Leu Val Phe Leu
1 5 10 15
Ala Ser Pro Leu Val Ala Ile Trp Glu Leu Lys Lys Asp Val Tyr Val
20 25 30
Val Glu Leu Asp Trp Tyr Pro Asp Ala Pro Gly Glu Met Val Val Leu
35 40 45
Thr Cys Asp Thr Pro Glu Glu Asp Gly Ile Thr Trp Thr Leu Asp Gln
50 55 60
Ser Ser Glu Val Leu Gly Ser Gly Lys Thr Leu Thr Ile Gln Val Lys
65 70 75 80
Glu Phe Gly Asp Ala Gly Gln Tyr Thr Cys His Lys Gly Gly Glu Val
85 90 95
Leu Ser His Ser Leu Leu Leu Leu His Lys Lys Glu Asp Gly Ile Trp
100 105 110
Ser Thr Asp Ile Leu Lys Asp Gln Lys Glu Pro Lys Asn Lys Thr Phe
115 120 125
Leu Arg Cys Glu Ala Lys Asn Tyr Ser Gly Arg Phe Thr Cys Trp Trp
130 135 140
Leu Thr Thr Ile Ser Thr Asp Leu Thr Phe Ser Val Lys Ser Ser Arg
145 150 155 160
Gly Ser Ser Asp Pro Gln Gly Val Thr Cys Gly Ala Ala Thr Leu Ser
165 170 175
Ala Glu Arg Val Arg Gly Asp Asn Lys Glu Tyr Glu Tyr Ser Val Glu
180 185 190
Cys Gln Glu Asp Ser Ala Cys Pro Ala Ala Glu Glu Ser Leu Pro Ile
195 200 205
Glu Val Met Val Asp Ala Val His Lys Leu Lys Tyr Glu Asn Tyr Thr
210 215 220
Ser Ser Phe Phe Ile Arg Asp Ile Ile Lys Pro Asp Pro Pro Lys Asn
225 230 235 240
Leu Gln Leu Lys Pro Leu Lys Asn Ser Arg Gln Val Glu Val Ser Trp
245 250 255
Glu Tyr Pro Asp Thr Trp Ser Thr Pro His Ser Tyr Phe Ser Leu Thr
260 265 270
Phe Cys Val Gln Val Gln Gly Lys Ser Lys Arg Glu Lys Lys Asp Arg
275 280 285
Val Phe Thr Asp Lys Thr Ser Ala Thr Val Ile Cys Arg Lys Asn Ala
290 295 300
Ser Ile Ser Val Arg Ala Gln Asp Arg Tyr Tyr Ser Ser Ser Trp Ser
305 310 315 320
Glu Trp Ala Ser Val Pro Cys Ser Gly Gly Gly Ser Gly Gly Gly Ser
325 330 335
Gly Gly Gly Ser Gly Gly Gly Ser Arg Asn Leu Pro Val Ala Thr Pro
340 345 350
Asp Pro Gly Met Phe Pro Cys Leu His His Ser Gln Asn Leu Leu Arg
355 360 365
Ala Val Ser Asn Met Leu Gln Lys Ala Arg Gln Thr Leu Glu Phe Tyr
370 375 380
Pro Cys Thr Ser Glu Glu Ile Asp His Glu Asp Ile Thr Lys Asp Lys
385 390 395 400
Thr Ser Thr Val Glu Ala Cys Leu Pro Leu Glu Leu Thr Lys Asn Glu
405 410 415
Ser Cys Leu Asn Ser Arg Glu Thr Ser Phe Ile Thr Asn Gly Ser Cys
420 425 430
Leu Ala Ser Arg Lys Thr Ser Phe Met Met Ala Leu Cys Leu Ser Ser
435 440 445
Ile Tyr Glu Asp Leu Lys Met Tyr Gln Val Glu Phe Lys Thr Met Asn
450 455 460
Ala Lys Leu Leu Met Asp Pro Lys Arg Gln Ile Phe Leu Asp Gln Asn
465 470 475 480
Met Leu Ala Val Ile Asp Glu Leu Met Gln Ala Leu Asn Phe Asn Ser
485 490 495
Glu Thr Val Pro Gln Lys Ser Ser Leu Glu Glu Pro Asp Phe Tyr Lys
500 505 510
Thr Lys Ile Lys Leu Cys Ile Leu Leu His Ala Phe Arg Ile Arg Ala
515 520 525
Val Thr Ile Asp Arg Val Met Ser Tyr Leu Asn Ala Ser
530 535 540
<210> 59
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 59
atttatttat ttatttattt aacatcggtt ccctgtttaa tatttaaaca g 51
<210> 60
<211> 266
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
agagcgagat tccgtctcaa agaaaaaaaa agtaatgaaa tgaataaaat gagtcctaga 60
gccagtaaat gtcgtaaatg tctcagctag tcaggtagta aaaggtctca actaggcagt 120
ggcagagcag gattcaaatt cagggctgtt gtgatgcctc cgcagactct gagcgccacc 180
tggtggtaat ttgtctgtgc ctcttctgac gtggaagaac agcaactaac acactaacac 240
ggcatttact atgggccagc cattgt 266
<210> 61
<211> 531
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
atgtctagac ctggcgagag gcccttccag tgccggatct gcatgcggaa cttcagcaac 60
atgagcaacc tgaccagaca cacccggaca cacacaggcg agaagccttt tcagtgcaga 120
atctgtatgc gcaatttctc cgacagaagc gtgctgcgga gacacctgag aacccacacc 180
ggcagccaga aaccattcca gtgtcgcatc tgtatgagaa actttagcga cccctccaat 240
ctggcccggc acaccagaac acataccggg gaaaaaccct ttcagtgtag gatatgcatg 300
aggaattttt ccgaccggtc cagcctgagg cggcacctga ggacacatac tggctcccaa 360
aagccgttcc aatgtcggat atgtatgcgc aactttagcc agagcggcac cctgcacaga 420
cacacaagaa cccatactgg cgagaaacct ttccaatgta gaatctgcat gcgaaatttt 480
tcccagcggc ctaatctgac caggcatctg aggacccacc tgagaggatc t 531
<210> 62
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 62
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Asn Met Ser Asn Leu Thr Arg His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp
35 40 45
Arg Ser Val Leu Arg Arg His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Pro Ser Asn
65 70 75 80
Leu Ala Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Ser Leu Arg Arg His
100 105 110
Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Gln Ser Gly Thr Leu His Arg His Thr Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Gln Arg Pro Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser
<210> 63
<211> 573
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 63
gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 60
ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 120
tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 180
gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 240
ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 300
gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 360
ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 420
actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 480
ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 540
gacttctcag ccctgctgag tcagatcagc tcc 573
<210> 64
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 64
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
1 5 10 15
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
20 25 30
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
35 40 45
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
50 55 60
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
65 70 75 80
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
85 90 95
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
100 105 110
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
115 120 125
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
130 135 140
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
145 150 155 160
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
165 170 175
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
180 185 190
<210> 65
<211> 936
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 65
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180
atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 240
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300
tggatggaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 360
ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 420
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660
cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 720
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900
tacatcacgg gggaggcaga gggtttccct gccaca 936
<210> 66
<211> 312
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 66
Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile
1 5 10 15
Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln
20 25 30
Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu
35 40 45
Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu
50 55 60
Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys
65 70 75 80
Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu
85 90 95
Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp Arg
100 105 110
Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu
115 120 125
Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp
130 135 140
Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly
145 150 155 160
Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val
165 170 175
Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His
180 185 190
Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met
195 200 205
Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln
210 215 220
Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met
225 230 235 240
Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp
245 250 255
Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser
260 265 270
Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr
275 280 285
Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly
290 295 300
Glu Ala Glu Gly Phe Pro Ala Thr
305 310
<210> 67
<211> 11809
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 67
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440
agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500
cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560
acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620
tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680
atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740
atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800
atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860
ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920
ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980
tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040
gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100
acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160
ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220
cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280
acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340
aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400
gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460
ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520
tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580
tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640
gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700
gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760
aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820
tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880
gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940
agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000
gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060
tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120
gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180
tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240
cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300
cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360
cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420
aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480
agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540
tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600
ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660
cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720
tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780
gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840
tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900
gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960
ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020
agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080
atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140
cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200
accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260
aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320
agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380
accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440
aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500
atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560
caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620
agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680
ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740
agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800
gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860
gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920
gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980
ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040
ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100
cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160
ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220
gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280
atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520
atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 5580
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640
tggatggaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 5700
ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 5760
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000
cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 6060
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240
tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840
acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900
tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960
ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020
tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080
gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260
gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320
atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380
tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440
ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680
tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740
atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860
tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920
ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980
cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040
gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100
cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160
tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220
gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280
ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340
ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400
tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460
atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520
ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580
aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640
gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700
tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760
tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820
ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880
ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940
tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000
tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060
tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120
gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809
<210> 68
<211> 936
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180
atgggcttac tgaccaacct ggcagacagg gagatcgttc acatgatcaa ctgggcgaag 240
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300
tggctagaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 360
ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 420
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660
cggctggccc agctcctcct catcctctcc cacatcaggc acgccagtaa caaaggcatg 720
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900
tacatcacgg gggaggcaga gggtttccct gccaca 936
<210> 69
<211> 312
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 69
Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile
1 5 10 15
Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln
20 25 30
Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu
35 40 45
Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu
50 55 60
Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala Lys
65 70 75 80
Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu
85 90 95
Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp Arg
100 105 110
Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu
115 120 125
Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp
130 135 140
Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly
145 150 155 160
Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val
165 170 175
Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His
180 185 190
Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met
195 200 205
Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln
210 215 220
Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly Met
225 230 235 240
Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp
245 250 255
Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser
260 265 270
Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr
275 280 285
Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly
290 295 300
Glu Ala Glu Gly Phe Pro Ala Thr
305 310
<210> 70
<211> 11809
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 70
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440
agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500
cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560
acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620
tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680
atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740
atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800
atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860
ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920
ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980
tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040
gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100
acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160
ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220
cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280
acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340
aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400
gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460
ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520
tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580
tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640
gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700
gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760
aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820
tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880
gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940
agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000
gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060
tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120
gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180
tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240
cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300
cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360
cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420
aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480
agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540
tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600
ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660
cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720
tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780
gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840
tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900
gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960
ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020
agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080
atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140
cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200
accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260
aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320
agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380
accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440
aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500
atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560
caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620
agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680
ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740
agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800
gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860
gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920
gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980
ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040
ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100
cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160
ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220
gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280
atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520
atgggcttac tgaccaacct ggcagacagg gagatcgttc acatgatcaa ctgggcgaag 5580
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640
tggctagaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 5700
ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 5760
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000
cggctggccc agctcctcct catcctctcc cacatcaggc acgccagtaa caaaggcatg 6060
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240
tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840
acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900
tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960
ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020
tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080
gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260
gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320
atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380
tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440
ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680
tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740
atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860
tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920
ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980
cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040
gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100
cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160
tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220
gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280
ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340
ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400
tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460
atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520
ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580
aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640
gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700
tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760
tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820
ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880
ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940
tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000
tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060
tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120
gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809
<210> 71
<211> 936
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 71
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180
atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 240
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300
tggctagaga tcctgatgat tggtctcgtc tggcgctcca tggagcaccc agtgaagcta 360
ctgtttgctc ctaacttggt gttggacagg gacgagggaa aatgtgtaga gggcctggtg 420
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660
cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 720
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900
tacatcacgg gggaggcaga gggtttccct gccaca 936
<210> 72
<211> 312
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 72
Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile
1 5 10 15
Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln
20 25 30
Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu
35 40 45
Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu
50 55 60
Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys
65 70 75 80
Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu
85 90 95
Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg
100 105 110
Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val Leu
115 120 125
Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp
130 135 140
Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly
145 150 155 160
Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val
165 170 175
Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His
180 185 190
Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met
195 200 205
Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln
210 215 220
Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met
225 230 235 240
Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp
245 250 255
Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser
260 265 270
Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr
275 280 285
Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly
290 295 300
Glu Ala Glu Gly Phe Pro Ala Thr
305 310
<210> 73
<211> 11809
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 73
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440
agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500
cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560
acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620
tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680
atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740
atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800
atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860
ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920
ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980
tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040
gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100
acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160
ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220
cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280
acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340
aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400
gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460
ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520
tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580
tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640
gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700
gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760
aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820
tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880
gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940
agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000
gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060
tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120
gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180
tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240
cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300
cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360
cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420
aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480
agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540
tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600
ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660
cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720
tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780
gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840
tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900
gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960
ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020
agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080
atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140
cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200
accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260
aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320
agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380
accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440
aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500
atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560
caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620
agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680
ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740
agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800
gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860
gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920
gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980
ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040
ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100
cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160
ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220
gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280
atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340
gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400
aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460
gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520
atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 5580
agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640
tggctagaga tcctgatgat tggtctcgtc tggcgctcca tggagcaccc agtgaagcta 5700
ctgtttgctc ctaacttggt gttggacagg gacgagggaa aatgtgtaga gggcctggtg 5760
gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820
gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880
cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940
acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000
cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 6060
gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120
gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180
acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240
tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840
acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900
tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960
ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020
tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080
gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260
gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320
atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380
tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440
ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680
tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740
atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860
tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920
ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980
cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040
gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100
cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160
tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220
gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280
ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340
ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400
tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460
atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520
ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580
aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640
gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700
tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760
tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820
ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880
ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940
tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000
tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060
tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120
gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809
<210> 74
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 74
agcggcggag gtggtagcgg aggcggagga tctggaatta cacagggact cgccgtgtct 60
acaatctcca gcttctttgg tggcggtagt ggcggcggtg gcagtggcgg tggatctctt 120
caa 123
<210> 75
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 75
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ile Thr Gln Gly
1 5 10 15
Leu Ala Val Ser Thr Ile Ser Ser Phe Phe Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Ser Leu Gln
35 40
<210> 76
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 76
ctgctgccaa gctgggccat cacactgatc tccgtgaacg gcatcttcgt gatctgttgc 60
ctgacctact gcttcgcccc tcggtgcaga gagcggagaa gaaacgaacg gctgcggaga 120
gaatctgtgc ggcctgtg 138
<210> 77
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Leu Leu Pro Ser Trp Ala Ile Thr Leu Ile Ser Val Asn Gly Ile Phe
1 5 10 15
Val Ile Cys Cys Leu Thr Tyr Cys Phe Ala Pro Arg Cys Arg Glu Arg
20 25 30
Arg Arg Asn Glu Arg Leu Arg Arg Glu Ser Val Arg Pro Val
35 40 45
<210> 78
<211> 330
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 78
gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 60
atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 120
agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 180
atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 240
tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa gtagtgagga 300
ggcttttttg gaggcctagg cttttgcaaa 330
<210> 79
<211> 11892
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 79
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440
ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500
ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560
gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620
ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680
cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740
cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800
acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860
ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920
tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980
ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040
cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100
tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160
attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220
tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280
cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340
cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400
tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460
gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520
accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580
gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640
agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700
cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760
cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820
tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880
aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940
gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000
gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060
caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120
ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180
caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240
tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300
gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360
gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420
attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480
cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540
gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600
aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660
tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720
ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780
gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840
gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900
ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020
cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200
ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260
taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320
ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380
caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440
tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500
tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560
aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620
acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680
ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740
aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800
cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860
agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920
cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980
tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040
gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100
ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160
ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220
tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280
acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340
aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400
aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460
cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520
tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580
gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagctgg 5640
ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700
aggtccacct tctagaatgt gcctggatgg agatcctgat gattggtgtg gtctggcgct 5760
ccatggagca cccagtgaag ctactgtttg ctcctaactt gctcttggac agggaccagg 5820
gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880
tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940
attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000
tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060
tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120
ggcacatgag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180
ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240
gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300
catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360
aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540
aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600
cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660
ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720
ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900
cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960
atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020
cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080
ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140
ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380
aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440
ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500
attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560
tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680
gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740
aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800
atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980
gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040
gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100
acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160
atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220
caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280
agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340
gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400
ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460
cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520
catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580
ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640
gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700
attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760
tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820
ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880
accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940
agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000
ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060
gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120
gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180
tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240
gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640
gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700
attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760
gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820
gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880
catgattacg cc 11892
<210> 80
<211> 11892
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 80
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440
ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500
ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560
gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620
ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680
cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740
cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800
acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860
ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920
tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980
ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040
cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100
tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160
attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220
tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280
cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340
cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400
tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460
gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520
accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580
gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640
agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700
cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760
cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820
tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880
aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940
gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000
gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060
caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120
ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180
caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240
tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300
gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360
gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420
attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480
cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540
gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600
aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660
tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720
ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780
gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840
gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900
ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020
cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200
ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260
taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320
ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380
caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440
tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500
tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560
aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620
acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680
ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740
aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800
cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860
agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920
cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980
tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040
gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100
ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160
ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220
tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280
acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340
aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400
aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460
cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520
tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580
gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagatcg 5640
ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700
aggtccacct tctagaatgt gcctggctag agatcctgat gattggtgtg gtctggcgct 5760
ccatggagca cccagtgaag ctactgtttg ctcctaactt gctcttggac agggaccagg 5820
gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880
tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940
attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000
tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060
tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120
ggcacgccag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180
ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240
gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300
catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360
aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540
aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600
cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660
ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720
ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900
cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960
atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020
cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080
ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140
ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380
aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440
ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500
attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560
tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680
gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740
aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800
atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980
gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040
gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100
acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160
atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220
caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280
agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340
gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400
ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460
cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520
catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580
ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640
gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700
attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760
tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820
ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880
accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940
agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000
ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060
gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120
gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180
tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240
gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640
gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700
attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760
gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820
gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880
catgattacg cc 11892
<210> 81
<211> 11892
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 81
aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60
cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120
gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180
cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240
ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300
cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360
aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420
aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480
gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540
caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600
cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660
tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720
ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780
gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840
gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900
acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960
tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020
ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080
tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140
atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200
ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260
ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320
tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380
ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440
ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500
ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560
gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620
ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680
cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740
cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800
acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860
ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920
tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980
ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040
cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100
tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160
attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220
tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280
cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340
cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400
tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460
gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520
accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580
gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640
agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700
cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760
cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820
tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880
aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940
gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000
gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060
caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120
ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180
caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240
tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300
gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360
gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420
attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480
cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540
gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600
aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660
tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720
ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780
gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840
gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900
ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020
cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200
ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260
taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320
ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380
caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440
tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500
tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560
aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620
acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680
ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740
aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800
cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860
agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920
cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980
tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040
gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100
ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160
ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220
tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280
acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340
aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400
aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460
cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520
tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580
gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagctgg 5640
ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700
aggtccacct tctagaatgt gcctggctag agatcctgat gattggtctc gtctggcgct 5760
ccatggagca cccagtgaag ctactgtttg ctcctaactt ggtgttggac agggacgagg 5820
gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880
tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940
attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000
tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060
tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120
ggcacatgag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180
ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240
gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300
catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360
aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540
aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600
cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660
ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720
ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900
cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960
atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020
cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080
ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140
ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380
aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440
ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500
attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560
tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680
gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740
aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800
atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980
gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040
gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100
acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160
atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220
caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280
agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340
gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400
ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460
cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520
catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580
ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640
gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700
attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760
tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820
ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880
accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940
agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000
ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060
gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120
gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180
tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240
gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640
gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700
attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760
gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820
gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880
catgattacg cc 11892
<210> 82
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 82
Trp Arg Pro Trp
1
<210> 83
<211> 1623
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 83
atgtgtcacc agcagctggt catcagctgg ttcagcctgg tgttcctggc ctctcctctg 60
gtggccatct gggagctgaa gaaagacgtg tacgtggtgg aactggactg gtatcccgat 120
gctcctggcg agatggtggt gctgacctgc gatacccctg aagaggacgg catcacctgg 180
acactggatc agtctagcga ggtgctcggc agcggcaaga ccctgaccat ccaagtgaaa 240
gagtttggcg acgccggcca gtacacctgt cacaaaggcg gagaagtgct gagccacagc 300
ctgctgctgc tccacaagaa agaggatggc atttggagca ccgacatcct gaaggaccag 360
aaagagccca agaacaagac cttcctgaga tgcgaggcca agaactacag cggccggttc 420
acatgttggt ggctgaccac catcagcacc gacctgacct tcagcgtgaa gtccagcaga 480
ggcagcagtg atcctcaggg cgttacatgt ggcgccgcta cactgtctgc cgaaagagtg 540
cggggcgaca acaaagaata cgagtacagc gtggaatgcc aagaggacag cgcctgtcca 600
gccgccgaag agtctctgcc tatcgaagtg atggtggacg ccgtgcacaa gctgaagtac 660
gagaactaca cctccagctt tttcatccgg gacatcatca agcccgatcc tccaaagaac 720
ctgcagctga agcctctgaa gaacagcaga caggtggaag tgtcctggga gtaccccgac 780
acctggtcta caccccacag ctacttcagc ctgacctttt gcgtgcaagt gcagggcaag 840
tccaagcgcg agaaaaagga ccgggtgttc accgacaaga ccagcgccac cgtgatctgc 900
agaaagaacg ccagcatcag cgtcagagcc caggaccggt actacagcag ctcttggagc 960
gaatgggcca gcgtgccatg ttctggcgga ggaagcggtg gcggatcagg tggtggatct 1020
ggcggcggat ctagaaacct gcctgtggcc actcctgatc ctggcatgtt cccttgtctg 1080
caccacagcc agaacctgct gagagccgtg tccaacatgc tgcagaaggc cagacagacc 1140
ctggaattct acccctgcac cagcgaggaa atcgaccacg aggacatcac caaggataag 1200
accagcaccg tggaagcctg cctgcctctg gaactgacca agaacgagag ctgcctgaac 1260
agccgggaaa ccagcttcat caccaacggc tcttgcctgg ccagcagaaa gacctccttc 1320
atgatggccc tgtgcctgag cagcatctac gaggacctga agatgtacca ggtggaattc 1380
aagaccatga acgccaagct gctgatggac cccaagcggc agatcttcct ggaccagaat 1440
atgctggccg tgatcgacga gctgatgcag gccctgaact tcaacagcga gacagtgccc 1500
cagaagtcta gcctggaaga acccgacttc tacaagacca agatcaagct gtgcatcctg 1560
ctgcacgcct tccggatcag agccgtgacc atcgacagag tgatgagcta cctgaacgcc 1620
tct 1623
Claims (15)
- 서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 상기 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함하되, 상기 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 상기 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 또는 내인성 리간드와 비교했을 때 하나 이상의 추가 아미노산 치환으로 인해 비-내인성 리간드에 대한 더 큰 민감도 및/또는 선택성을 갖고,
선택적으로, 상기 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함하고/하거나,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD. - 제1항에 있어서, 상기 하나 이상의 추가 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재하는, 변형된 ER-LBD: 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547.
- 제2항에 있어서,
a. 상기 하나 이상의 위치는 서열번호 1의 위치 343을 포함하되, 선택적으로 서열번호 1의 위치 343에서의 아미노산 치환은 M343F, M343I, M343L, 및 M343V로 이루어진 군으로부터 선택되거나;
b. 상기 하나 이상의 위치는 서열번호 1의 위치 344 를 포함하되, 선택적으로 서열번호 1의 위치 344에서의 아미노산 치환은 G344M이거나;
c. 상기 하나 이상의 위치는 서열번호 1의 위치 345를 포함하되, 선택적으로 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이거나;
d. 상기 하나 이상의 위치는 서열번호 1의 위치 346을 포함하되, 선택적으로 서열번호 1의 위치 346에서의 아미노산 치환은 L346I, L346M, L346F, 및 L346V로 이루어진 군으로부터 선택되거나;
e. 상기 하나 이상의 위치는 서열번호 1의 위치 347을 포함하되, 선택적으로 서열번호 1의 위치 347에서의 아미노산 치환은 T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V로 이루어진 군으로부터 선택되거나;
f. 상기 하나 이상의 위치는 서열번호 1의 위치 348을 포함하되, 선택적으로 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이거나;
g. 상기 하나 이상의 위치는 서열번호 1의 위치 349를 포함하되, 선택적으로 서열번호 1의 위치 349에서의 아미노산 치환은 L349I, L349M, L349F, 및 L349V로 이루어진 군으로부터 선택되거나;
h. 상기 하나 이상의 위치는 서열번호 1의 위치 350을 포함하되, 선택적으로 서열번호 1의 위치 350에서의 아미노산 치환은 A350F, A350I, A350L, A350M 및 A350V로 이루어진 군으로부터 선택되거나;
i. 상기 하나 이상의 위치는 서열번호 1의 위치 351을 포함하되, 선택적으로 서열번호 1의 위치 351에서의 아미노산 치환은 D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V로 이루어진 군으로부터 선택되거나;
j. 상기 하나 이상의 위치는 서열번호 1의 위치 352를 포함하되, 선택적으로 서열번호 1의 위치 352에서의 아미노산 치환은 R352K이거나;
k. 상기 하나 이상의 위치는 서열번호 1의 위치 354를 포함하되, 선택적으로 서열번호 1의 위치 354에서의 아미노산 치환은 L354I, L354M, L354F, 및 L354V로 이루어진 군으로부터 선택되거나;
l. 상기 하나 이상의 위치는 서열번호 1의 위치 380을 포함하되, 선택적으로 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q이거나;
m. 상기 하나 이상의 위치는 서열번호 1의 위치 384를 포함하되, 선택적으로 서열번호 1의 위치 384에서의 아미노산 치환은 L384I, L384M, L384F, 및 L384V로 이루어진 군으로부터 선택되거나;
n. 상기 하나 이상의 위치는 서열번호 1의 위치 386을 포함하되, 선택적으로 서열번호 1의 위치 386에서의 아미노산 치환은 I386V이거나;
o. 상기 하나 이상의 위치는 서열번호 1의 위치 387을 포함하되, 선택적으로 서열번호 1의 위치 387에서의 아미노산 치환은 L387I, L387M, L387F, 및 L387V로 이루어진 군으로부터 선택되거나;
p. 상기 하나 이상의 위치는 서열번호 1의 위치 388을 포함하되, 선택적으로 서열번호 1의 위치 388에서의 아미노산 치환은 M388I, M388L, 및 M388F로 이루어진 군으로부터 선택되거나;
q. 상기 하나 이상의 위치는 서열번호 1의 위치 389를 포함하되, 선택적으로 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이거나;
r. 상기 하나 이상의 위치는 서열번호 1의 위치 391을 포함하되, 선택적으로 서열번호 1의 위치 391에서의 아미노산 치환은 L391I, L391M, L391F, 및 L391V로 이루어진 군으로부터 선택되거나;
s. 상기 하나 이상의 위치는 서열번호 1의 위치 392를 포함하되, 선택적으로 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이거나;
t. 상기 하나 이상의 위치는 서열번호 1의 위치 404를 포함하되, 선택적으로 서열번호 1의 위치 404에서의 아미노산 치환은 F404I, F404L, F404M, 및 F404V로 이루어진 군으로부터 선택되거나;
u. 상기 하나 이상의 위치는 서열번호 1의 위치 407을 포함하되, 선택적으로 서열번호 1의 위치 407에서의 아미노산 치환은 N407D이거나;
v. 상기 하나 이상의 위치는 서열번호 1의 위치 409를 포함하되, 선택적으로 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이거나;
w. 상기 하나 이상의 위치는 서열번호 1의 위치 413을 포함하되, 선택적으로 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이거나;
x. 상기 하나 이상의 위치는 서열번호 1의 위치 414를 포함하되, 선택적으로 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이거나;
y. 상기 하나 이상의 위치는 서열번호 1의 위치 417을 포함하되, 선택적으로 서열번호 1의 위치 417에서의 아미노산 치환은 C417S이거나;
z. 상기 하나 이상의 위치는 서열번호 1의 위치 418을 포함하되, 선택적으로 서열번호 1의 위치 418에서의 아미노산 치환은 V418I, V418L, V418M, 및 V418F로 이루어진 군으로부터 선택되거나;
aa. 상기 하나 이상의 위치는 서열번호 1의 위치 420을 포함하되, 선택적으로 서열번호 1의 위치 420에서의 아미노산 치환은 G420I, G420M, G420F, 및 G420V로 이루어진 군으로부터 선택되거나;
bb. 상기 하나 이상의 위치는 서열번호 1의 위치 421을 포함하되, 선택적으로 서열번호 1의 위치 421에서의 아미노산 치환은 M421I, M421L, M421F, 및 M421V로 이루어진 군으로부터 선택되거나;
cc. 상기 하나 이상의 위치는 서열번호 1의 위치 422를 포함하되, 선택적으로 서열번호 1의 위치 422에서의 아미노산 치환은 V422I이거나;
dd. 상기 하나 이상의 위치는 서열번호 1의 위치 424를 포함하되, 선택적으로 서열번호 1의 위치 424에서의 아미노산 치환은 I424L, I424M, I424F, 및 I424V로 이루어진 군으로부터 선택되거나;
ee. 상기 하나 이상의 위치는 서열번호 1의 위치 428을 포함하되, 선택적으로 서열번호 1의 위치 428에서의 아미노산 치환은 L428I, L428M, L428F, 및 L428V로 이루어진 군으로부터 선택되거나;
ff. 상기 하나 이상의 위치는 서열번호 1의 위치 463을 포함하되, 선택적으로 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이거나;
gg. 상기 하나 이상의 위치는 서열번호 1의 위치 517을 포함하되, 선택적으로 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이거나;
hh. 상기 하나 이상의 위치는 서열번호 1의 위치 521을 포함하되, 선택적으로 서열번호 1의 위치 521에서의 아미노산 치환은 G521A, G521F, G521I, G521L, G521M, 및 G521V로 이루어진 군으로부터 선택되거나;
ii. 상기 하나 이상의 위치는 서열번호 1의 위치 522를 포함하되, 선택적으로 서열번호 1의 위치 522에서의 아미노산 치환은 M522I, M522L, 및 M522V로 이루어진 군으로부터 선택되거나;
jj. 상기 하나 이상의 위치는 서열번호 1의 위치 524를 포함하되, 선택적으로 서열번호 1의 위치 524에서의 아미노산 치환은 H524A, H524I, H524L, H524F, 및 H524V로 이루어진 군으로부터 선택되거나;
kk. 상기 하나 이상의 위치는 서열번호 1의 위치 525를 포함하되, 선택적으로 서열번호 1의 위치 525에서의 아미노산 치환은 L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V로 이루어진 군으로부터 선택되거나;
ll. 상기 하나 이상의 위치는 서열번호 1의 위치 526을 포함하되, 선택적으로 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L이거나;
mm. 상기 하나 이상의 위치는 서열번호 1의 위치 527을 포함하되, 선택적으로 서열번호 1의 위치 527에서의 아미노산 치환은 S527N이거나;
nn. 상기 하나 이상의 위치는 서열번호 1의 위치 528을 포함하되, 선택적으로 서열번호 1의 위치 528에서의 아미노산 치환은 M528F, M528I, 및 M528V로 이루어진 군으로부터 선택되거나;
oo. 상기 하나 이상의 위치는 서열번호 1의 위치 533을 포함하되, 선택적으로 서열번호 1의 위치 533에서의 아미노산 치환은 V533F 및 V533W로 이루어진 군으로부터 선택되거나;
pp. 상기 하나 이상의 위치는 서열번호 1의 위치 534를 포함하되, 선택적으로 서열번호 1의 위치 534에서의 아미노산 치환은 V534Q 및 V534R로 이루어진 군으로부터 선택되거나;
qq. 상기 하나 이상의 위치는 서열번호 1의 위치 536을 포함하되, 선택적으로 서열번호 1의 위치 536에서의 아미노산 치환은 L536F, 및 L536M, L536R, 및 L536Y로 이루어진 군으로부터 선택되거나;
rr. 상기 하나 이상의 위치는 서열번호 1의 위치 537을 포함하되, 선택적으로 서열번호 1의 위치 537에서의 아미노산 치환은 Y537E 및 Y537S로 이루어진 군으로부터 선택되거나;
ss. 상기 하나 이상의 위치는 서열번호 1의 위치 538을 포함하되, 선택적으로 서열번호 1의 위치 538에서의 아미노산 치환은 D538G 및 D538K로 이루어진 군으로부터 선택되거나;
tt. 상기 하나 이상의 위치는 서열번호 1의 위치 539를 포함하되, 선택적으로 서열번호 1의 위치 539에서의 아미노산 치환은 L539A 및 L539R로 이루어진 군으로부터 선택되거나;
uu. 상기 하나 이상의 위치는 서열번호 1의 위치 540을 포함하되, 선택적으로 서열번호 1의 위치 540에서의 아미노산 치환은 L540A 및 L540F로 이루어진 군으로부터 선택되거나;
vv. 상기 하나 이상의 위치는 서열번호 1의 위치 547을 포함하되, 선택적으로 서열번호 1의 위치 547에서의 아미노산 치환은 H547A인, 변형된 ER-LBD. - 제1항 내지 제3항 중 어느 한 항에 있어서,
a. 상기 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환이며, 선택적으로 상기 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하되, 상기 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이고.
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하되, 상기 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 387 및 391에 존재하되, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고/이거나
b. 상기 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환이며, 선택적으로 상기 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나,
c. 상기 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환이며, 선택적으로 상기 4개의 아미노산 치환 각각은 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이며, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이고.
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하되, 상기 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은M388I이고, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하되, 상기 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고.
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고/이거나;
d. 상기 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환이며, 선택적으로 상기 5개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463 및 524에 존재하되, 상기 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나
e. 상기 하나 이상의 추가 아미노산 치환은 6개의 아미노산 치환이며, 선택적으로 상기 6개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나;
f. 상기 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환이며, 선택적으로 상기 7개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384 에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고/이거나;
g. 상기 하나 이상의 추가 아미노산 치환은 8개의 아미노산 치환이고, 선택적으로, 상기 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD. - 제1항 내지 제4항 중 어느 하나의 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질로서.
선택적으로, 상기 관심 폴리펩티드는 핵산 결합 도메인을 포함하되, 선택적으로, 상기 핵산 결합 도메인은 징크 핑거 도메인을 포함하고, 선택적으로, 상기 핵산 결합 도메인은 징크 핑거 도메인을 포함하고, 선택적으로, 상기 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함하거나,
선택적으로 상기 키메라 단백질은 키메라 전사 인자를 포함하고, 상기 관심 폴리펩티드는 핵산 결합 도메인 및 전자 조절인자 도메인을 포함하되, 선택적으로 상기 전사 조절인자 도메인은 전사 활성인자이고, 선택적으로 상기 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A-관련 단백질 p300의 히스톤 아세틸트랜스퍼라아제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택되거나,
선택적으로, 전사 조절인자 도메인은 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자인, 키메라 단백질. - 제1항 내지 제4항 중 어느 하나의 변형된 ER-LBD 또는 제5항의 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.
- 제6항의 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물.
- 제7항의 이종 작제물을 포함하는 플라스미드.
- 제7항의 이종 작제물 또는 제8항의 플라스미드를 포함하는 세포.
- 관심 유전자의 전사를 조절하기 위한 유전자 스위치로서,
(a) 제5항의 키메라 단백질로서, 상기 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는 것인, 키메라 단백질;
(b) 비-내인성 리간드로서, 상기 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는, 비-내인성 리간드를 포함하는, 유전자 스위치. - 제10항에 있어서,
a. 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되고/되거나;
b. 상기 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화하고/하거나
c. 상기 관심 유전자는 IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파로 이루어진 군으로부터 선택된 사이토카인을 암호화하고/하거나;
d. 상기 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화하는, 유전자 스위치. - 관심 유전자의 전사를 조절하는 방법으로서, (i) 제5항의 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 상기 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하되,
선택적으로, 상기 방법은 전사를 조절하도록 키메라 단백질을 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하고,
선택적으로, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화시키는 단계를 포함하고,
선택적으로, 상기 표적 발현 카세트는 제5항의 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되거나, 상기 표적 발현 카세트는 제2 이종 작제물에 의해 암호화되고,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법. - 키메라 단백질의 국소화를 조절하는 방법으로서, 제5항의 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함하되,
선택적으로, 상기 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하고,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법. - 제12항 또는 제13항 중 어느 하나에 있어서, 상기 형질전환된 세포는 인간 또는 동물에 존재하고, 상기 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함하는, 방법.
- 제14항에 있어서, 상기 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 상기 비-내인성 리간드가 실질적으로 불활성인 농도로 투여되는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163171227P | 2021-04-06 | 2021-04-06 | |
US63/171,227 | 2021-04-06 | ||
PCT/US2022/023673 WO2022216823A1 (en) | 2021-04-06 | 2022-04-06 | Ert2 mutants and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240004433A true KR20240004433A (ko) | 2024-01-11 |
Family
ID=83546546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237037724A KR20240004433A (ko) | 2021-04-06 | 2022-04-06 | Ert2 돌연변이체 및 이의 용도 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240150433A1 (ko) |
EP (1) | EP4320228A1 (ko) |
JP (1) | JP2024513231A (ko) |
KR (1) | KR20240004433A (ko) |
CN (1) | CN117321192A (ko) |
AU (1) | AU2022255180A1 (ko) |
CA (1) | CA3213591A1 (ko) |
IL (1) | IL307269A (ko) |
WO (1) | WO2022216823A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024163908A2 (en) * | 2023-02-02 | 2024-08-08 | Senti Biosciences, Inc. | Improved ert2 mutants, inducible cell death systems, and uses thereof |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004537293A (ja) * | 2001-05-31 | 2004-12-16 | ノバルティス アクチエンゲゼルシャフト | 新規なエストロゲン受容体リガンド結合ドメイン変異体及び新規なリガンド及び医薬組成物 |
ES2439874T3 (es) * | 2002-05-29 | 2014-01-27 | Regeneron Pharmaceuticals, Inc. | Sistema de expresión en eucariotas inducible |
-
2022
- 2022-04-06 AU AU2022255180A patent/AU2022255180A1/en active Pending
- 2022-04-06 EP EP22785372.8A patent/EP4320228A1/en active Pending
- 2022-04-06 CN CN202280035999.6A patent/CN117321192A/zh active Pending
- 2022-04-06 CA CA3213591A patent/CA3213591A1/en active Pending
- 2022-04-06 WO PCT/US2022/023673 patent/WO2022216823A1/en active Application Filing
- 2022-04-06 KR KR1020237037724A patent/KR20240004433A/ko unknown
- 2022-04-06 JP JP2023561275A patent/JP2024513231A/ja active Pending
- 2022-04-06 IL IL307269A patent/IL307269A/en unknown
-
2023
- 2023-10-05 US US18/481,805 patent/US20240150433A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL307269A (en) | 2023-11-01 |
US20240150433A1 (en) | 2024-05-09 |
EP4320228A1 (en) | 2024-02-14 |
CA3213591A1 (en) | 2022-10-13 |
JP2024513231A (ja) | 2024-03-22 |
WO2022216823A1 (en) | 2022-10-13 |
AU2022255180A1 (en) | 2023-11-16 |
CN117321192A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019204429B2 (en) | Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof | |
US11672874B2 (en) | Methods and compositions for genomic integration | |
KR102451510B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
KR20200032174A (ko) | 강화된 키메라 항원 수용체 및 이의 용도 | |
AU2017248259A1 (en) | Chimeric antigen receptor T cell compositions | |
KR102628872B1 (ko) | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 | |
CN112262214A (zh) | 病毒载体及包装细胞系 | |
US11939594B2 (en) | Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins | |
CN113817775B (zh) | 修饰的阿柏西普、组合物、方法及其在基因治疗中的应用 | |
KR20240022575A (ko) | 아머링된 키메라 수용체 및 이의 사용 방법 | |
KR20240032025A (ko) | 내이의 세포 유형-특이적 유전자 발현을 위한 조성물 및 방법 | |
KR20240001708A (ko) | 유전적 장애의 치료를 위해 생체내 뉴클레아제-매개의 유전자 표적화를 위한 조성물 및 방법 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
KR20240004433A (ko) | Ert2 돌연변이체 및 이의 용도 | |
KR20240021799A (ko) | 청력 손실을 치료하기 위한 유전자 치료 전달 조성물 및 방법 | |
CN113667017A (zh) | 一种可提高CRISPR/Cas9系统同源重组效率的方法和应用 | |
CN117120085A (zh) | Sars-cov-2免疫原性组合物、疫苗和方法 | |
CN115867295A (zh) | 用于靶向hpv感染细胞的组合物和方法 | |
NL2027815B1 (en) | Genomic integration | |
RU2781083C2 (ru) | Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1 | |
WO2024163805A1 (en) | Methods and compositions for genomic integration | |
CN117693592A (zh) | 用于治疗遗传性疾患的体内核酸酶介导的基因靶向的组合物和方法 |