KR20230131178A - 변형된 엔도뉴클레아제를 사용한 유전자 편집 - Google Patents
변형된 엔도뉴클레아제를 사용한 유전자 편집 Download PDFInfo
- Publication number
- KR20230131178A KR20230131178A KR1020237018690A KR20237018690A KR20230131178A KR 20230131178 A KR20230131178 A KR 20230131178A KR 1020237018690 A KR1020237018690 A KR 1020237018690A KR 20237018690 A KR20237018690 A KR 20237018690A KR 20230131178 A KR20230131178 A KR 20230131178A
- Authority
- KR
- South Korea
- Prior art keywords
- lys
- leu
- glu
- ile
- asn
- Prior art date
Links
- 238000010362 genome editing Methods 0.000 title abstract description 19
- 102000004533 Endonucleases Human genes 0.000 title abstract description 3
- 108010042407 Endonucleases Proteins 0.000 title abstract description 3
- 101710163270 Nuclease Proteins 0.000 claims abstract description 558
- 238000000034 method Methods 0.000 claims abstract description 221
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 52
- 230000007017 scission Effects 0.000 claims abstract description 49
- 230000014509 gene expression Effects 0.000 claims abstract description 27
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 claims description 319
- 210000004027 cell Anatomy 0.000 claims description 245
- 108020004414 DNA Proteins 0.000 claims description 240
- 125000005647 linker group Chemical group 0.000 claims description 152
- 150000001413 amino acids Chemical class 0.000 claims description 145
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 117
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 111
- 229920001184 polypeptide Polymers 0.000 claims description 110
- 108020005004 Guide RNA Proteins 0.000 claims description 108
- 108090000623 proteins and genes Proteins 0.000 claims description 104
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 98
- 230000004048 modification Effects 0.000 claims description 84
- 238000012986 modification Methods 0.000 claims description 84
- 102000039446 nucleic acids Human genes 0.000 claims description 62
- 108020004707 nucleic acids Proteins 0.000 claims description 62
- 108091033409 CRISPR Proteins 0.000 claims description 53
- 238000006467 substitution reaction Methods 0.000 claims description 52
- 150000007523 nucleic acids Chemical class 0.000 claims description 49
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 claims description 48
- 239000000203 mixture Substances 0.000 claims description 48
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 45
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 45
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 45
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 45
- 102000053602 DNA Human genes 0.000 claims description 44
- 239000012634 fragment Substances 0.000 claims description 44
- -1 morpholino nucleic acids Chemical class 0.000 claims description 40
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 34
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical class NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 claims description 32
- 210000002865 immune cell Anatomy 0.000 claims description 30
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 claims description 29
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 24
- 230000035772 mutation Effects 0.000 claims description 24
- 101150076800 B2M gene Proteins 0.000 claims description 23
- 238000000338 in vitro Methods 0.000 claims description 22
- 230000008685 targeting Effects 0.000 claims description 22
- 210000004962 mammalian cell Anatomy 0.000 claims description 21
- 102200029613 rs35593767 Human genes 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 20
- 102220089173 rs112475438 Human genes 0.000 claims description 20
- 102220057257 rs730881170 Human genes 0.000 claims description 20
- 239000013603 viral vector Substances 0.000 claims description 19
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical class NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 claims description 18
- ICSNLGPSRYBMBD-UHFFFAOYSA-N 2-aminopyridine Chemical compound NC1=CC=CC=N1 ICSNLGPSRYBMBD-UHFFFAOYSA-N 0.000 claims description 18
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 claims description 18
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 18
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 claims description 18
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 claims description 18
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical class C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 claims description 18
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 claims description 18
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 claims description 18
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 claims description 18
- 229930024421 Adenine Natural products 0.000 claims description 18
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 18
- 229960000643 adenine Drugs 0.000 claims description 18
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 18
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 claims description 18
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 18
- 150000002632 lipids Chemical class 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 235000000346 sugar Nutrition 0.000 claims description 16
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 14
- 108091093037 Peptide nucleic acid Proteins 0.000 claims description 14
- 125000001475 halogen functional group Chemical group 0.000 claims description 14
- 238000004520 electroporation Methods 0.000 claims description 13
- 101000974340 Homo sapiens Nuclear receptor corepressor 1 Proteins 0.000 claims description 12
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 12
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 11
- 239000013612 plasmid Substances 0.000 claims description 11
- 239000002105 nanoparticle Substances 0.000 claims description 10
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical compound C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 claims description 9
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 claims description 9
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 claims description 9
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical class NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 claims description 9
- QSHACTSJHMKXTE-UHFFFAOYSA-N 2-(2-aminopropyl)-7h-purin-6-amine Chemical class CC(N)CC1=NC(N)=C2NC=NC2=N1 QSHACTSJHMKXTE-UHFFFAOYSA-N 0.000 claims description 9
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 claims description 9
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical class NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 claims description 9
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical group CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 9
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical class O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 claims description 9
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 claims description 9
- NJBMMMJOXRZENQ-UHFFFAOYSA-N 6H-pyrrolo[2,3-f]quinoline Chemical compound c1cc2ccc3[nH]cccc3c2n1 NJBMMMJOXRZENQ-UHFFFAOYSA-N 0.000 claims description 9
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical class O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 claims description 9
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical class NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 claims description 9
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical class NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 claims description 9
- 229960005508 8-azaguanine Drugs 0.000 claims description 9
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 claims description 9
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 claims description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 9
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 9
- 229940104302 cytosine Drugs 0.000 claims description 9
- 229950000688 phenothiazine Drugs 0.000 claims description 9
- 150000002991 phenoxazines Chemical class 0.000 claims description 9
- 150000003212 purines Chemical class 0.000 claims description 9
- UBQKCCHYAOITMY-UHFFFAOYSA-N pyridin-2-ol Chemical compound OC1=CC=CC=N1 UBQKCCHYAOITMY-UHFFFAOYSA-N 0.000 claims description 9
- 229940075420 xanthine Drugs 0.000 claims description 9
- 101150118346 HLA-A gene Proteins 0.000 claims description 8
- 102000002488 Nucleoplasmin Human genes 0.000 claims description 8
- 210000002901 mesenchymal stem cell Anatomy 0.000 claims description 8
- 210000002894 multi-fate stem cell Anatomy 0.000 claims description 8
- 108060005597 nucleoplasmin Proteins 0.000 claims description 8
- 241000191967 Staphylococcus aureus Species 0.000 claims description 7
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 239000003085 diluting agent Substances 0.000 claims description 7
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 claims description 7
- 125000005842 heteroatom Chemical group 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 7
- ACVYVLVWPXVTIT-UHFFFAOYSA-M phosphinate Chemical compound [O-][PH2]=O ACVYVLVWPXVTIT-UHFFFAOYSA-M 0.000 claims description 7
- 150000004713 phosphodiesters Chemical class 0.000 claims description 7
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 claims description 7
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 claims description 7
- JRPHGDYSKGJTKZ-UHFFFAOYSA-N selenophosphoric acid Chemical compound OP(O)([SeH])=O JRPHGDYSKGJTKZ-UHFFFAOYSA-N 0.000 claims description 7
- 102220476463 Putative 60S ribosomal protein L37a-like protein_F49Y_mutation Human genes 0.000 claims description 6
- 102220563951 U1 small nuclear ribonucleoprotein A_T11V_mutation Human genes 0.000 claims description 6
- 102220323254 rs150140303 Human genes 0.000 claims description 6
- 102220011252 rs312262808 Human genes 0.000 claims description 6
- 102220018583 rs587776981 Human genes 0.000 claims description 6
- 102200058309 rs61755770 Human genes 0.000 claims description 6
- 102220217056 rs745420669 Human genes 0.000 claims description 6
- 230000008488 polyadenylation Effects 0.000 claims description 5
- 230000003612 virological effect Effects 0.000 claims description 5
- 241001135761 Deltaproteobacteria Species 0.000 claims description 4
- 102220470415 Thymosin beta-10_R27A_mutation Human genes 0.000 claims description 4
- 125000002091 cationic group Chemical group 0.000 claims description 4
- 239000003623 enhancer Substances 0.000 claims description 4
- 239000013604 expression vector Substances 0.000 claims description 4
- 230000007935 neutral effect Effects 0.000 claims description 4
- 231100000590 oncogenic Toxicity 0.000 claims description 4
- 230000002246 oncogenic effect Effects 0.000 claims description 4
- 239000002243 precursor Substances 0.000 claims description 4
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 3
- 241000604451 Acidaminococcus Species 0.000 claims description 2
- 101150000578 HLA-B gene Proteins 0.000 claims description 2
- 102220502941 Geranylgeranyl transferase type-2 subunit alpha_D10E_mutation Human genes 0.000 claims 6
- 102220626214 Periaxin_R1335Q_mutation Human genes 0.000 claims 6
- 102220644232 Tenascin-N_D1135E_mutation Human genes 0.000 claims 6
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims 2
- 230000027455 binding Effects 0.000 abstract description 11
- 230000001413 cellular effect Effects 0.000 abstract description 3
- 235000001014 amino acid Nutrition 0.000 description 133
- 230000001225 therapeutic effect Effects 0.000 description 35
- 102000004169 proteins and genes Human genes 0.000 description 34
- 235000018102 proteins Nutrition 0.000 description 30
- 108091028043 Nucleic acid sequence Proteins 0.000 description 26
- 108010054155 lysyllysine Proteins 0.000 description 26
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 25
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 24
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 description 24
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 23
- 238000012217 deletion Methods 0.000 description 21
- 230000037430 deletion Effects 0.000 description 21
- 238000003780 insertion Methods 0.000 description 19
- 230000037431 insertion Effects 0.000 description 19
- 230000008439 repair process Effects 0.000 description 18
- 241000282414 Homo sapiens Species 0.000 description 16
- 238000003556 assay Methods 0.000 description 16
- 238000002659 cell therapy Methods 0.000 description 16
- 108010073969 valyllysine Proteins 0.000 description 16
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 15
- 108091034117 Oligonucleotide Proteins 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 15
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 14
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 14
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 14
- 206010028980 Neoplasm Diseases 0.000 description 14
- 210000001519 tissue Anatomy 0.000 description 14
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 13
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 13
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 13
- 241000880493 Leptailurus serval Species 0.000 description 13
- 102000004389 Ribonucleoproteins Human genes 0.000 description 13
- 108010081734 Ribonucleoproteins Proteins 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- 239000005090 green fluorescent protein Substances 0.000 description 13
- 230000006780 non-homologous end joining Effects 0.000 description 13
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 12
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 12
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 12
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 12
- 108010068380 arginylarginine Proteins 0.000 description 12
- 108010068265 aspartyltyrosine Proteins 0.000 description 12
- 108010003700 lysyl aspartic acid Proteins 0.000 description 12
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 11
- 238000012408 PCR amplification Methods 0.000 description 11
- 201000011510 cancer Diseases 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 11
- 108010075704 HLA-A Antigens Proteins 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 8
- 108091093088 Amplicon Proteins 0.000 description 8
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 8
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 8
- 238000010354 CRISPR gene editing Methods 0.000 description 8
- 108091029865 Exogenous DNA Proteins 0.000 description 8
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 8
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 8
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 8
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 8
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 8
- 101000662909 Homo sapiens T cell receptor beta constant 1 Proteins 0.000 description 8
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 8
- 102100037272 T cell receptor beta constant 1 Human genes 0.000 description 8
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 8
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 8
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 8
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 8
- 239000000427 antigen Substances 0.000 description 8
- 108091007433 antigens Proteins 0.000 description 8
- 102000036639 antigens Human genes 0.000 description 8
- 239000006172 buffering agent Substances 0.000 description 8
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 108010028295 histidylhistidine Proteins 0.000 description 8
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 8
- 210000000822 natural killer cell Anatomy 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 7
- 108700004991 Cas12a Proteins 0.000 description 7
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 7
- 102220622304 Huntingtin-associated protein 1_D10G_mutation Human genes 0.000 description 7
- 102100022935 Nuclear receptor corepressor 1 Human genes 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 108010053037 kyotorphin Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 6
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 6
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 6
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 6
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 6
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 6
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 6
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 6
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 6
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 6
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 6
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 6
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 6
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 6
- 108091008874 T cell receptors Proteins 0.000 description 6
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 6
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 6
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 5
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 5
- 241000702421 Dependoparvovirus Species 0.000 description 5
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 5
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 5
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 5
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 239000011543 agarose gel Substances 0.000 description 5
- 125000004103 aminoalkyl group Chemical group 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000005782 double-strand break Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000004853 protein function Effects 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 4
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 4
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 4
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 4
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 4
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 4
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 4
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 4
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 4
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 4
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 4
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 4
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 4
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 4
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 4
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 4
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 4
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 4
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 4
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 4
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 4
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 4
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 4
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 4
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 4
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 4
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 4
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 4
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 4
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 4
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 4
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 4
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 4
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 4
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 4
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 4
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 4
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 4
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 4
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 4
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 4
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 4
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 4
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 4
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 4
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 4
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 4
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 4
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 4
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 4
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 4
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 4
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 4
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 4
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 4
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 4
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 4
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 4
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 4
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 4
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 4
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 4
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 4
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 4
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 4
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 4
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 4
- 241000282465 Canis Species 0.000 description 4
- 108091007741 Chimeric antigen receptor T cells Proteins 0.000 description 4
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 241000283073 Equus caballus Species 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 241000282324 Felis Species 0.000 description 4
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 4
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 4
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 4
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 4
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 4
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 4
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 4
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 4
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 4
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 4
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 4
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 4
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 4
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 4
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 4
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 4
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 4
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 4
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 4
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 4
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 4
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 4
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 4
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 4
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 4
- CGWHAXBNGYQBBK-JBACZVJFSA-N Glu-Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)C1=CC=C(O)C=C1 CGWHAXBNGYQBBK-JBACZVJFSA-N 0.000 description 4
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 4
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 4
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 4
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 4
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 4
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 4
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 4
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 4
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 4
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 4
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 4
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 4
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 4
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 4
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 4
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 4
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 4
- 101710154606 Hemagglutinin Proteins 0.000 description 4
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 4
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 4
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 4
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 4
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 4
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 4
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 4
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 4
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 4
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 4
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 4
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 4
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 4
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 4
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 4
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 4
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 4
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 4
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 4
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 4
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 4
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 4
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 4
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 4
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 4
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 4
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 4
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 4
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 4
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 4
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 4
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 4
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 4
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 4
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 4
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 4
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 4
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 4
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 4
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 4
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 4
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 4
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 4
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 4
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 4
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 4
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 4
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 4
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 4
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 4
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 4
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 4
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 4
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 4
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 4
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 4
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 4
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 4
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 4
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 4
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 4
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 4
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 4
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 4
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 4
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 4
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 4
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 4
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 4
- 241001529936 Murinae Species 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 4
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 4
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 4
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 4
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 4
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 4
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 4
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 4
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 4
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 4
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 4
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 4
- 101710176177 Protein A56 Proteins 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 4
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 4
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 4
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 4
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 4
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 4
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 4
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 4
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 4
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 4
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 4
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 4
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 4
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 4
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 4
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 4
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 4
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 4
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 4
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 4
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 4
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 4
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 4
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 4
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 4
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 4
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 4
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 4
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 4
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 4
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 4
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 4
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 4
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 4
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 4
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 4
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 4
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 4
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 4
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 4
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 4
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 4
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 239000000185 hemagglutinin Substances 0.000 description 4
- 230000006058 immune tolerance Effects 0.000 description 4
- 238000009169 immunotherapy Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 230000030648 nucleus localization Effects 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 235000021317 phosphate Nutrition 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- 102220549851 ATP-binding cassette sub-family D member 1_A99D_mutation Human genes 0.000 description 3
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102220466901 Breakpoint cluster region protein_R11K_mutation Human genes 0.000 description 3
- 201000003883 Cystic fibrosis Diseases 0.000 description 3
- 102220596482 Cytochrome c oxidase subunit 4 isoform 1, mitochondrial_P57V_mutation Human genes 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 102220605910 GTPase HRas_S17N_mutation Human genes 0.000 description 3
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101000986086 Homo sapiens HLA class I histocompatibility antigen, A alpha chain Proteins 0.000 description 3
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 3
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 3
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 3
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 3
- 102220577031 M1-specific T cell receptor beta chain_Q69E_mutation Human genes 0.000 description 3
- 102220541925 Neutrophil elastase_L47R_mutation Human genes 0.000 description 3
- 102220479390 Pantetheinase_E32A_mutation Human genes 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 102220510486 Ras-related C3 botulinum toxin substrate 2_N92T_mutation Human genes 0.000 description 3
- 102220513468 Rhophilin-2_H29N_mutation Human genes 0.000 description 3
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 3
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- 102220607244 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial_E37N_mutation Human genes 0.000 description 3
- 102100029454 T cell receptor alpha chain MC.7.G5 Human genes 0.000 description 3
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 3
- 102220559439 T-cell-interacting, activating receptor on myeloid cells protein 1_R63A_mutation Human genes 0.000 description 3
- 101150053558 TRBC1 gene Proteins 0.000 description 3
- 102220470369 Thymosin beta-10_K15A_mutation Human genes 0.000 description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 3
- 102220470680 Transforming growth factor beta-1-induced transcript 1 protein_Y60F_mutation Human genes 0.000 description 3
- 102220480164 Translocating chain-associated membrane protein 1_E88Q_mutation Human genes 0.000 description 3
- 102220634196 Transmembrane protein 126A_H45N_mutation Human genes 0.000 description 3
- 102220477940 Triggering receptor expressed on myeloid cells 1_T25S_mutation Human genes 0.000 description 3
- 102220470555 Tryptase delta_D80T_mutation Human genes 0.000 description 3
- 102220589780 YTH domain-containing family protein 1_N18A_mutation Human genes 0.000 description 3
- 238000002869 basic local alignment search tool Methods 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 102220353788 c.1291G>A Human genes 0.000 description 3
- 102220419659 c.35G>A Human genes 0.000 description 3
- 102220370155 c.67G>A Human genes 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 238000001976 enzyme digestion Methods 0.000 description 3
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 3
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 3
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 3
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 210000001778 pluripotent stem cell Anatomy 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 3
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 102220004521 rs104893806 Human genes 0.000 description 3
- 102220216099 rs1060501969 Human genes 0.000 description 3
- 102220219826 rs1060502663 Human genes 0.000 description 3
- 102220088306 rs1064792858 Human genes 0.000 description 3
- 102200005927 rs121434290 Human genes 0.000 description 3
- 102200058925 rs121909538 Human genes 0.000 description 3
- 102220275854 rs1294224206 Human genes 0.000 description 3
- 102220313252 rs1386345719 Human genes 0.000 description 3
- 102220202173 rs148450358 Human genes 0.000 description 3
- 102200007406 rs148775298 Human genes 0.000 description 3
- 102220259319 rs1553651734 Human genes 0.000 description 3
- 102220009309 rs193922665 Human genes 0.000 description 3
- 102200108015 rs199473048 Human genes 0.000 description 3
- 102200145443 rs2271733 Human genes 0.000 description 3
- 102220032392 rs34751757 Human genes 0.000 description 3
- 102220080264 rs372250472 Human genes 0.000 description 3
- 102220252689 rs373178770 Human genes 0.000 description 3
- 102220018010 rs45517278 Human genes 0.000 description 3
- 102220098915 rs747349777 Human genes 0.000 description 3
- 102200062420 rs749030456 Human genes 0.000 description 3
- 102220097497 rs756499058 Human genes 0.000 description 3
- 102220128472 rs766082334 Human genes 0.000 description 3
- 102220119018 rs776925980 Human genes 0.000 description 3
- 102220184129 rs778408190 Human genes 0.000 description 3
- 102200072124 rs863224863 Human genes 0.000 description 3
- 102220094760 rs876658433 Human genes 0.000 description 3
- 102220143226 rs886058292 Human genes 0.000 description 3
- 102220145630 rs886058977 Human genes 0.000 description 3
- 102220154466 rs886061268 Human genes 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- PUPZLCDOIYMWBV-UHFFFAOYSA-N (+/-)-1,3-Butanediol Chemical compound CC(O)CCO PUPZLCDOIYMWBV-UHFFFAOYSA-N 0.000 description 2
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 2
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- WYDKPTZGVLTYPG-UHFFFAOYSA-N 2,8-diamino-3,7-dihydropurin-6-one Chemical compound N1C(N)=NC(=O)C2=C1N=C(N)N2 WYDKPTZGVLTYPG-UHFFFAOYSA-N 0.000 description 2
- LMNPKIOZMGYQIU-UHFFFAOYSA-N 5-(trifluoromethyl)-1h-pyrimidine-2,4-dione Chemical compound FC(F)(F)C1=CNC(=O)NC1=O LMNPKIOZMGYQIU-UHFFFAOYSA-N 0.000 description 2
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 2
- OHILKUISCGPRMQ-UHFFFAOYSA-N 6-amino-5-(trifluoromethyl)-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NC=C1C(F)(F)F OHILKUISCGPRMQ-UHFFFAOYSA-N 0.000 description 2
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 2
- PFUVOLUPRFCPMN-UHFFFAOYSA-N 7h-purine-6,8-diamine Chemical compound C1=NC(N)=C2NC(N)=NC2=N1 PFUVOLUPRFCPMN-UHFFFAOYSA-N 0.000 description 2
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 239000004322 Butylated hydroxytoluene Substances 0.000 description 2
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 208000005623 Carcinogenesis Diseases 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- 239000001856 Ethyl cellulose Substances 0.000 description 2
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 2
- 206010071602 Genetic polymorphism Diseases 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 102100026964 M1-specific T cell receptor beta chain Human genes 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 2
- WHNWPMSKXPGLAX-UHFFFAOYSA-N N-Vinyl-2-pyrrolidone Chemical compound C=CN1CCCC1=O WHNWPMSKXPGLAX-UHFFFAOYSA-N 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- VYGQUTWHTHXGQB-FFHKNEKCSA-N Retinol Palmitate Chemical compound CCCCCCCCCCCCCCCC(=O)OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C VYGQUTWHTHXGQB-FFHKNEKCSA-N 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 241001421775 Thereus Species 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 108010087408 alpha-beta T-Cell Antigen Receptors Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- SESFRYSPDFLNCH-UHFFFAOYSA-N benzyl benzoate Chemical compound C=1C=CC=CC=1C(=O)OCC1=CC=CC=C1 SESFRYSPDFLNCH-UHFFFAOYSA-N 0.000 description 2
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 235000010354 butylated hydroxytoluene Nutrition 0.000 description 2
- 229940095259 butylated hydroxytoluene Drugs 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 230000036952 cancer formation Effects 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 231100000504 carcinogenesis Toxicity 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000003013 cytotoxicity Effects 0.000 description 2
- 231100000135 cytotoxicity Toxicity 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 239000003995 emulsifying agent Substances 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 235000019325 ethyl cellulose Nutrition 0.000 description 2
- 229920001249 ethyl cellulose Polymers 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229920000609 methyl cellulose Polymers 0.000 description 2
- 235000010981 methylcellulose Nutrition 0.000 description 2
- 239000001923 methylcellulose Substances 0.000 description 2
- LXCFILQKKLGQFO-UHFFFAOYSA-N methylparaben Chemical compound COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 2
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 2
- 239000008108 microcrystalline cellulose Substances 0.000 description 2
- 229940016286 microcrystalline cellulose Drugs 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 2
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 102220024919 rs199472829 Human genes 0.000 description 2
- 102220086621 rs864622077 Human genes 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 2
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 2
- 235000002639 sodium chloride Nutrition 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 235000010356 sorbitol Nutrition 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- JNYAEWCLZODPBN-JGWLITMVSA-N (2r,3r,4s)-2-[(1r)-1,2-dihydroxyethyl]oxolane-3,4-diol Chemical compound OC[C@@H](O)[C@H]1OC[C@H](O)[C@H]1O JNYAEWCLZODPBN-JGWLITMVSA-N 0.000 description 1
- 229940058015 1,3-butylene glycol Drugs 0.000 description 1
- OKMWKBLSFKFYGZ-UHFFFAOYSA-N 1-behenoylglycerol Chemical compound CCCCCCCCCCCCCCCCCCCCCC(=O)OCC(O)CO OKMWKBLSFKFYGZ-UHFFFAOYSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- JNODDICFTDYODH-UHFFFAOYSA-N 2-hydroxytetrahydrofuran Chemical compound OC1CCCO1 JNODDICFTDYODH-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102000006306 Antigen Receptors Human genes 0.000 description 1
- 108010083359 Antigen Receptors Proteins 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 238000011357 CAR T-cell therapy Methods 0.000 description 1
- 238000010440 CRISPR–Cas3 gene editing Methods 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 1
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 229920002785 Croscarmellose sodium Polymers 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 102220525369 Cytochrome c oxidase assembly factor 7_W26C_mutation Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 102000016675 EF-hand domains Human genes 0.000 description 1
- 108050006297 EF-hand domains Proteins 0.000 description 1
- 102000001301 EGF receptor Human genes 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- 101710151864 HLA class I histocompatibility antigen, A alpha chain Proteins 0.000 description 1
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 1
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 1
- 108010035452 HLA-A1 Antigen Proteins 0.000 description 1
- 108010058607 HLA-B Antigens Proteins 0.000 description 1
- 108010052199 HLA-C Antigens Proteins 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 1
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 1
- 101100395310 Homo sapiens HLA-A gene Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 1
- 101000581981 Homo sapiens Neural cell adhesion molecule 1 Proteins 0.000 description 1
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 1
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- 108091036060 Linker DNA Proteins 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- 101150076359 Mhc gene Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 229920000881 Modified starch Polymers 0.000 description 1
- 101100170937 Mus musculus Dnmt1 gene Proteins 0.000 description 1
- 102100027347 Neural cell adhesion molecule 1 Human genes 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- 241001180199 Planctomycetes Species 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- 229920001800 Shellac Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000194007 Streptococcus canis Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 101710191487 T cell receptor alpha chain constant Proteins 0.000 description 1
- 208000015560 TCR-alpha-beta-positive T-cell deficiency Diseases 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- VJHCJDRQFCCTHL-UHFFFAOYSA-N acetic acid 2,3,4,5,6-pentahydroxyhexanal Chemical compound CC(O)=O.OCC(O)C(O)C(O)C(O)C=O VJHCJDRQFCCTHL-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 229940050528 albumin Drugs 0.000 description 1
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 229940087168 alpha tocopherol Drugs 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 102000006707 alpha-beta T-Cell Antigen Receptors Human genes 0.000 description 1
- 238000002266 amputation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000025194 apoptotic cell clearance Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 229960002903 benzyl benzoate Drugs 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 235000019437 butane-1,3-diol Nutrition 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- FUFJGUQYACFECW-UHFFFAOYSA-L calcium hydrogenphosphate Chemical compound [Ca+2].OP([O-])([O-])=O FUFJGUQYACFECW-UHFFFAOYSA-L 0.000 description 1
- CJZGTCYPCWQAJB-UHFFFAOYSA-L calcium stearate Chemical compound [Ca+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CJZGTCYPCWQAJB-UHFFFAOYSA-L 0.000 description 1
- 239000008116 calcium stearate Substances 0.000 description 1
- 235000013539 calcium stearate Nutrition 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 210000003321 cartilage cell Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 229940045110 chitosan Drugs 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 235000015165 citric acid Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229960005168 croscarmellose Drugs 0.000 description 1
- 229960000913 crospovidone Drugs 0.000 description 1
- 239000001767 crosslinked sodium carboxy methyl cellulose Substances 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical group [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940093499 ethyl acetate Drugs 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 238000011124 ex vivo culture Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229940049654 glyceryl behenate Drugs 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 1
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 1
- 230000008088 immune pathway Effects 0.000 description 1
- 208000018628 immunodeficiency 43 Diseases 0.000 description 1
- 208000018099 immunodeficiency 7 Diseases 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003701 inert diluent Substances 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 239000000845 maltitol Substances 0.000 description 1
- VQHSOMBJVWLPSR-WUJBLJFYSA-N maltitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O VQHSOMBJVWLPSR-WUJBLJFYSA-N 0.000 description 1
- 235000010449 maltitol Nutrition 0.000 description 1
- 229940035436 maltitol Drugs 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 235000006109 methionine Nutrition 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 229960002216 methylparaben Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- CQDGTJPVBWZJAZ-UHFFFAOYSA-N monoethyl carbonate Chemical compound CCOC(O)=O CQDGTJPVBWZJAZ-UHFFFAOYSA-N 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000004789 organ system Anatomy 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- WVDDGKGOMKODPV-ZQBYOMGUSA-N phenyl(114C)methanol Chemical compound O[14CH2]C1=CC=CC=C1 WVDDGKGOMKODPV-ZQBYOMGUSA-N 0.000 description 1
- 239000008055 phosphate buffer solution Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 229940068968 polysorbate 80 Drugs 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000004800 polyvinyl chloride Substances 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 235000013809 polyvinylpolypyrrolidone Nutrition 0.000 description 1
- 229920000523 polyvinylpolypyrrolidone Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 229940069328 povidone Drugs 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000011769 retinyl palmitate Substances 0.000 description 1
- 229940108325 retinyl palmitate Drugs 0.000 description 1
- 235000019172 retinyl palmitate Nutrition 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 208000037921 secondary disease Diseases 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000004208 shellac Substances 0.000 description 1
- ZLGIYFNHBLSMPS-ATJNOEHPSA-N shellac Chemical compound OCCCCCC(O)C(O)CCCCCCCC(O)=O.C1C23[C@H](C(O)=O)CCC2[C@](C)(CO)[C@@H]1C(C(O)=O)=C[C@@H]3O ZLGIYFNHBLSMPS-ATJNOEHPSA-N 0.000 description 1
- 229940113147 shellac Drugs 0.000 description 1
- 235000013874 shellac Nutrition 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 229960001866 silicon dioxide Drugs 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 229960001790 sodium citrate Drugs 0.000 description 1
- 235000011083 sodium citrates Nutrition 0.000 description 1
- 239000008109 sodium starch glycolate Substances 0.000 description 1
- 229920003109 sodium starch glycolate Polymers 0.000 description 1
- 229940079832 sodium starch glycolate Drugs 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002704 solution binder Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 229940100515 sorbitan Drugs 0.000 description 1
- 229960002920 sorbitol Drugs 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 229940032147 starch Drugs 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 229940095064 tartrate Drugs 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000004408 titanium dioxide Substances 0.000 description 1
- 229960005196 titanium dioxide Drugs 0.000 description 1
- 235000010215 titanium dioxide Nutrition 0.000 description 1
- 229960000984 tocofersolan Drugs 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 229940046009 vitamin E Drugs 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
- 239000002076 α-tocopherol Substances 0.000 description 1
- 235000004835 α-tocopherol Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
- C12N5/0636—T lymphocytes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
- C12N5/0646—Natural killers cells [NK], NKT cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0696—Artificially induced pluripotent stem cells, e.g. iPS
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Hematology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Developmental Biology & Embryology (AREA)
- Transplantation (AREA)
- Epidemiology (AREA)
- Veterinary Medicine (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Saccharide Compounds (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicinal Preparation (AREA)
Abstract
본 개시내용은 독특한 결합 및 절단 성질을 가진 조작된 뉴클레아제, 및 유전자 편집을 위해 상기 변형된 엔도뉴클레아제를 사용하여 세포 유전자 발현을 변경하는 방법에 관한 것이다.
Description
상호참조
본원은 전체적으로 본원에 참고로 포함되는, 2020년 11월 4일에 출원된 미국 가출원 제63/109,396호의 이익을 주장한다.
세포 요법은 건강한 인간 세포를 주입하여 손상된 조직을 재생하거나, 누락 또는 오작동 효소 또는 단백질을 생성하거나, 암을 비롯한 무수한 질환들에 대한 의학적 치료로서 면역 세포 기능을 활용한다. 암은 평생 동안 미국인의 약 1/3에 영향을 미치며 이 수치는 상승할 것으로 예상된다. 암은 유방, 폐, 전립선, 피부색, 방광 피부 및 혈액을 비롯한 거의 모든 장기 시스템에서 발생할 수 있다. 대부분의 치료는 오프-표적 효과 및 광범위한 부작용을 나타내는 독성 물질(화학요법제 및 방사선)을 다량 투여하고 종종 영향을 받은 조직의 침습적 절제를 포함한다. 면역요법은 환자 자신의 면역 시스템을 사용하여 암 세포를 표적으로 하여 사멸시킨다. 세포 면역요법은 전형적으로 유전자 편집을 통해 환자의 면역 세포를 프로그래밍하여, 이러한 세포를 표적으로 하여 암 세포를 선택적으로 사멸시키는 단계를 포함한다. 종양을 공격하도록 환자의 면역 세포를 변형시키는 것은 효과적이고 덜 침습적인 치료가 될 가능성이 있다. 손상된 조직을 재생하거나 누락 또는 오작동 효소를 생성하기 위한 조작된 세포 요법은 유전자 편집 기술을 통해 프로그래밍된 환자 자신의 세포 및 종종 유도 다분화능 줄기 세포도 사용한다. 유전자 편집 기술의 적용은 환자의 면역 세포 또는 줄기 세포의 변화를 가능하게 하고 다양한 질환 및 병태에 대한 요법 또는 치료의 일부로서 이용될 수 있다.
유전자 편집은 디자이너 뉴클레아제에 의존하여 특정 DNA 서열을 인식하고 절단한 후, 선천성 세포 DNA 복구 경로, 즉 비상동 말단 연결(NHEJ) 및 상동성 유도 복구(HDR)를 이용하여 표적화 변형을 게놈에 도입하는 유전자 치료 접근법이다. 이러한 뉴클레아제는 관심 있는 표적 유전자좌에서 이중 가닥 절단을 정확하게 도입하도록 설계될 수 있다. 유전자 편집은 생체외 및 생체내 환경 둘 다에서 표적화 파괴, 삽입, 절제 및 보정을 가능하게 함으로써 관심 있는 게놈 서열을 영구적으로 변형시킬 수 있는 가능성을 열어준다. 기존 유전자 편집 기술, 예컨대, CRISPR-Cas9(및 Cas9 융합체), 메가뉴클레아제, 징크 핑거 단백질, 제IIS형 제한 엔도뉴클레아제(FokI 및 FokI 융합체) 및 TALENS는 많은 유전 질환들에 대한 치료제로서 의미가 있을 만큼 충분한 수의 세포에서 특정 길이의 유전자 결실을 도입하거나 표적 유전자를 정확하게 복구하는 능력 면에서 제한된다. 더욱이, 고도로 프로그래밍 가능한 RNA-가이드 뉴클레아제, 예컨대, 단량체 Cas9의 경우, 연구는 그의 표적 부위에만 예측 가능하게 결합하고 절단하고 복구하기 위한 특이성이 제한된다고 암시하므로, 환자에서 의도치 않게 2차 질환을 야기할 수 있는, 세포 게놈 DNA의 잠재적인 유해한 변화에 대한 우려가 제기된다.
박테리아의 선천성 면역 시스템을 구성하는 제II형 CRISPR 시스템의 구성요소인 Cas9(CRISPR 관련) 단백질은 그의 사용 용이성으로 인해 게놈 편집 분야에서 패러다임 변화를 야기하였다. 원하는 서열을 절단하도록 Cas9를 프로그래밍하는 것은 표적 부위에 상보적이도록 Cas9 관련 가이드 RNA의 서열을 변경하는 간단한 문제이다. Cas9 표적화 프로그래밍의 용이성은 다른 시약(징크 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성화제 유사 이펙터 뉴클레아제(TALEN))에 필요한 보다 집중적인 단백질 조작과 대조된다. Cas9는 제II형 CRISPR 시스템의 단백질과 함께, 다양한 유기체에서 무수한 게놈 편집 적용에 사용되었으며 현재 인간에서 치료 적용 영역에 진입하고 있다. 스페시픽 바이올로직스(Specific Biologics)(캐나다 온타리오주 토론토)라는 이름으로 공개된 국제 특허 출원(PCT/IB2020/054229, 이의 내용은 본원에 참고로 포함됨)은 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 92, I-TevI 링커 영역의 아미노산 93 내지 169를 포함하는 링커 영역 및 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9("saCas9") 도메인을 포함하는 버전인 이중 절단 키메라 뉴클레아제 TevSaCas9를 설명한다. 이 출원은 TevSaCas9를 제조하는 방법도 설명한다. 관련된 암을 표적으로 하도록 면역 세포를 변형시키기 위한 TevSaCas9의 변형은 암 치료 세포 요법의 효율 및 효과를 더 높일 수 있다. 또한, 줄기 세포를 변형시키기 위한 TevSaCas9의 변형은 손상된 조직의 치료 또는 누락 효소 또는 단백질의 교체의 효과를 더 높일 수 있다.
면역 시스템은 표면 단백질(항원)을 식별함으로써 외래 물질 및/또는 세포를 인식한다. T 세포 표면에 존재하는 수용체는 항원을 표적으로 하고 T 세포를 활성화시킬 뿐만 아니라 다른 다운스트림 면역 경로도 시작한다. 키메라 항원 수용체 T 세포(CAR-T 세포)는 면역요법 및 혈액과 고형 종양의 치료에 사용되는 인공 T 세포 수용체(TCR)를 생성하는 유전적으로 변형된 T 세포이다. CAR-T 세포 요법은 T 세포가 환자로부터 채취되고 암 세포에 특이적인 항원을 인식하도록 유전적으로 변경되는 세포 요법의 일종이다. 변형된 세포는 암 조직을 표적으로 하고 파괴하기 위해 환자에게 다시 주입된다. T 세포는 환자의 혈액(자가) 또는 건강한 공여자의 혈액(동종)으로부터 채취될 수 있다. 항원 인식 시, 자극된 CAR-T 세포는 증식, 세포독성, 및 다른 세포 유형을 활성화시키는 추가 인자, 예컨대, 사이토카인, 인터류킨 및 성장 인자의 분비를 증가시킨다. 세포 고갈, 독성 및 삽입 발암을 제한하기 위해 세포 요법(예컨대, 키메라 항원 수용체 T 세포 요법)에서는 유전자를 넉아웃시키는 것이 바람직하다(Lui J et al., (2019), Front Immunol, 10(456):1-8).
현재 기술은 주로 세포 요법의 생성을 위한 바이러스 벡터의 사용에 의존한다. 바이러스 벡터의 사용은 매우 효율적이지만, 안전성에 관한 의문이 남아 있다. 세포 요법을 변형시키는 데 이용되는 무작위 삽입은 오프-표적 내생성 유전자 기능을 파괴할 수 있고 종양형성(즉, 암) 및 세포 독성을 유발할 수 있다. 효과적인 세포 요법을 생성하기 위해 안전하고 효율적인 도구가 표적 유전자의 정확한 파괴 및 외래 DNA의 통합에 필요하다. CRISPR 기술을 세포 요법에 적용하면 CAR T 세포의 키메라 항원 수용체 및 내생성 유전자를 더 잘 변형시킬 수 있고 현재 T 세포 요법의 한계를 극복할 수 있다. 이러한 발전이 해당 분야에서 전반적으로 혁명을 일으킬 것으로 예상되지만, 현재 유전자 편집 접근법은 변형의 효능, 뉴클레아제의 특이성과 관련된 안전성 문제, 및 표적 세포 유형으로의 유전자 편집 도구의 전달에 의해 제한된다. 본 발명의 첫 번째 단계는 증가된 효율로 (개별적으로 및 동시에) 유전자를 넉아웃시키거나 외생성(exogenous) 유전자, 예컨대, 키메라 항원 수용체(CAR)를 발현시키기 위해 면역 세포(예컨대, T 세포) 또는 유도 다분화능 줄기 세포(iPSC)의 DNA를 변형시켜 이 세포들을 조작하도록 의도적으로 설계되었다. 본 발명은 다른 세포 유형을 조작하는 데 사용될 수도 있다.
본원은 숙주 거부를 제거하고 세포 요법의 효과를 증가시키기 위해 I-TevI 도메인의 변형된 버전, 링커 펩티드, 및 유전자를 표적으로 하도록 설계된 RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9("SaCas9") 도메인의 변형된 버전을 포함하는 키메라 뉴클레아제("TevSaCas9"로서 지칭됨)를 기술한다. 표적화 세포로 전달될 때, 신규 키메라 뉴클레아제는 외생성 공여자 DNA의 존재 하에 DNA 서열을 교체하거나 외생성 공여자 DNA의 부재 하에 DNA를 결실시킨다. 청구된 본 발명의 또 다른 측면은 유전자를 편집하는 방법 및 본원에 기재된 편집된 유전자로 세포 요법을 생성하는 방법에 관한 것이다. 본원은 I-TevI 도메인 및 CasX 또는 Cas12 뉴클레아제로부터 형성된 키메라 뉴클레아제도 기술한다.
본원은 (a) B2M, TRAC1, TRCB1 및/또는 HLA-A 유전자의 특정 부위를 표적으로 하여 아웃-오프-프레임(out-of-frame) 결실을 생성하는 TevSaCas9의 신규 유사체; (b) 전기천공에 적합한 뉴클레아제 및 외생성 공여자 DNA의 제제; (c) 세포에서 동시에 B2M, TRAC1, TRCB1 및/또는 HLA-A 중 하나 이상을 표적으로 하는 뉴클레아제의 제제(다중체화 유전자 파괴); (d) AAVS1 유전자의 안전한 은닉 부위(safe harbor site)로 표적화된 TevSaCas9 뉴클레아제와 함께 전달될 때 뉴클레아제에 의해 표적화된 2개의 부위 사이에 통합될 수 있는 외생성 공여자 DNA를 함유하는 본 발명의 버전; 및 (e) 변형된 I-TevI 도메인, 링커 도메인 및 RNA-가이드 뉴클레아제 도메인을 포함하는 키메라 뉴클레아제의 신규 유사체를 기술한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 생체외 세포 집단에 투여하는 단계를 포함하는, 유전적으로 조작된 세포 조성물을 제조하는 방법을 기술하는 것으로, 이때 상기 세포 집단은 면역 세포 및 다분화능 세포 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 K26R 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 링커는 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 T95S, V117F, K135R, N140S 또는 Q158R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열로부터 선택된 펩티드이다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스트렙토코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 T267A, L325F, V327I, D333G, A336S, I341L, E345D, D348N, K352E, S360A, T368A, N369E, N371E, S372P, E373K, K386T, N393R, H408N, N410S, I414M, A415T, T438S, Y467F, N471K, D485E, M489F, E506K, R409K, T510E, N515K, Y518F, A539P, F550Y, N551H, S596A, T602I, A611S, I617V, T620K, G654E, N667D, R685K, K695Q, I706V, K722T, A723T, K724N, M731T, F732V, K735Q, S739N, P741L, E742G, E746D, Q747D, I754D, T755I, H757R, K760Q, H761S, P778I, E781K, I783V, N784D, D785E, T786L, L787V, Y788H, K792E, D794T, T798R, L799I, V801I, N803S, L804I, N805K, G806N, D813G, K814E, L818I, I819F, S822P, E824G, L841T, G847S, D848N, Y857H, V875I, I876V, N884K, A888V, L890R, D894G, D895H, P897L, V903I, G920D, F924L, N929Y, E936D, N937G, V941I, N942D, S943L, C945A, E947K, K951R, L952Q, S956N, N957E, Q958K, A959S, N974D, G975K, V983A, N984S, N985D, D986G, I991V, V993L, M995F, I996V, T999N, Y1000K, R1001E, E1002D, L1004I, E1005K, N1006M, M1007N, D1009L, K1010S, R1011T, P1012S, P1013F, I1015L, I1016R, A1020G, S1021K, Q1024K, K1027S, E1039K, H1045K, I0148M 또는 K1050M 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 D10E 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함하고, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인은 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 표적 세포의 게놈 DNA로 전달된다. 특정 실시양태에서, 세포 집단은 면역 세포를 포함한다. 특정 실시양태에서, 면역 세포는 T 세포이다. 특정 실시양태에서, 면역 세포는 천연 킬러(NK) 세포이다. 특정 실시양태에서, 세포 집단은 다분화능 세포를 포함한다. 특정 실시양태에서, 다분화능 세포는 유도 다분화능 세포이다. 특정 실시양태에서, 다분화능 세포는 조혈 줄기 세포 또는 이의 전구체를 포함한다. 특정 실시양태에서, 다분화능 세포는 중간엽 줄기 세포 또는 이의 전구체를 포함한다. 특정 실시양태에서, 다분화능 세포는 유도 다분화능 세포이다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 DNA 발현 카세트를 사용함으로써 표적 세포의 게놈 DNA로 전달된다. 특정 실시양태에서, 상기 방법은 바이러스 벡터를 사용하지 않는다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 전기천공을 이용함으로써 상기 생체외 세포 집단에 투여된다. 특정 실시양태에서, 전기천공은 1000 내지 2500 V의 전류에서 적용된다. 특정 실시양태에서, 방법은 공여자 DNA를 세포 집단에 투여하는 단계를 추가로 포함한다. 특정 실시양태에서, 공여자 DNA는 블런트 말단 및 2개의 뉴클레오타이드 3' 오버행 말단을 포함한다. 특정 실시양태에서, 공여자 DNA는 관심 있는 외생성 유전자를 플랭킹하는 5' 및 3' 상동성을 포함한다. 특정 실시양태에서, 상기 공여자 DNA는 외생성 유전자를 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 공여자 DNA의 부재 하에 투여된다. 특정 실시양태에서, 키메라 뉴클레아제는 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 규정된 길이의 게놈 DNA를 결실시킨다. 특정 실시양태에서, 상기 외생성 유전자는 키메라 항원 수용체를 발현한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 B2M 유전자, TRAC1 유전자, TRCB1 유전자, HLA-A 유전자 또는 HLA-B 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 17 또는 서열번호 18, 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 B2M 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 19 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 TRAC1 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 20 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 TRCB1 유전자를 표적화한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 21 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 HLA-A 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 22 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 AAVS1 유전자를 표적화한다. 특정 실시양태에서, AAVS1 유전자는 외생성 공여자 DNA의 존재 하에 표적화된다. 특정 실시양태에서, 키메라 뉴클레아제는 AAVS1 유전자의 2개의 부위를 표적화한다. 특정 실시양태에서, 외생성 공여자 DNA는 AAVS1 유전자의 2개의 표적화 부위 사이에 통합된다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체(mimetic), 변형된 당 모이어티(moiety) 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스(Planctomycetes) 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아(Deltaproteobacteria)로부터 유래한다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TEVI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TEVI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스(Acidaminococcus) 종 BV3L6으로부터 유래한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, K28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드, 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.
본 발명의 하기 상세한 설명은 본 발명의 일부를 형성하고 본 발명이 실시될 수 있는 특정 실시양태를 예시적으로 보여주는 첨부된 도면을 참조한다. 이 실시양태는 당분야의 숙련된 자가 본 발명을 실시할 수 있도록 충분히 상세하게 설명된다. 다른 실시양태를 이용할 수 있고, 본 발명의 범위를 벗어나지 않으면서 구조적 및 논리적으로 변화시킬 수 있다. 지금부터 단지 예로서 첨부된 도면을 참조할 것이다.
도 1의 A 내지 F는 TevSaCas9가 다수의 가이드 RNA와 복합체를 형성하고 세포 내로 전기천공되어 내생성 T 세포 수용체를 코딩하는 유전자를 파괴하고 외생성 키메라 항원 수용체(CAR)를 코딩하는 서열을 삽입하는 기작의 도면을 도시한다.
도 2의 A 및 B는 B2M 유전자로 표적화된 TevSaCas9가 B2M 유전자를 절단함을 예증한다.
도 3의 A 및 B는 AAVS1 유전자로 표적화된 TevSaCas9가 AAVS1 유전자를 절단함을 예증한다.
도 4의 A 및 B는 TevSaCas9 절단(검은색) 및 절단 부위 내로의 공여자 복구 주형(회색) 삽입 후 B2M 유전자의 표적 부위를 나타내고 복구가 일어남을 보여주는 도면을 보여준다.
도 5의 A 및 B는 TevSaCas9에 의한 절단 후 게놈 내의 AAVS1 안전한 은닉 부위(검은색)를 도시하는 도면이고, 절단된 부위에 삽입된 GFP 리포터의 발현을 보여준다.
도 6은 서열번호 20의 가이드를 사용함으로써 TRBC1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 TRBC1 표적 부위를 절단함을 예증한다.
도 7의 A는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드가 AAVS1 표적 부위에 삽입됨을 예증한다.
도 8의 A 및 B는 전기천공된 리보핵단백질 TevSaCas9가 포유동물 세포에서 B2M 표적 부위를 편집함을 예증한다.
도 9의 A 및 B는 I-TevI과 Cas12a의 융합체가 가이드 RNA에 의해 활성화되어 이중 가닥 DNA 기질을 절단함을 예증한다.
도 10은 상이한 핵 국소화 신호(NLS)를 가진 HEK293 세포의 TevSaCas9에 의한 B2M 유전자의 절단을 예증한다.
도 1의 A 내지 F는 TevSaCas9가 다수의 가이드 RNA와 복합체를 형성하고 세포 내로 전기천공되어 내생성 T 세포 수용체를 코딩하는 유전자를 파괴하고 외생성 키메라 항원 수용체(CAR)를 코딩하는 서열을 삽입하는 기작의 도면을 도시한다.
도 2의 A 및 B는 B2M 유전자로 표적화된 TevSaCas9가 B2M 유전자를 절단함을 예증한다.
도 3의 A 및 B는 AAVS1 유전자로 표적화된 TevSaCas9가 AAVS1 유전자를 절단함을 예증한다.
도 4의 A 및 B는 TevSaCas9 절단(검은색) 및 절단 부위 내로의 공여자 복구 주형(회색) 삽입 후 B2M 유전자의 표적 부위를 나타내고 복구가 일어남을 보여주는 도면을 보여준다.
도 5의 A 및 B는 TevSaCas9에 의한 절단 후 게놈 내의 AAVS1 안전한 은닉 부위(검은색)를 도시하는 도면이고, 절단된 부위에 삽입된 GFP 리포터의 발현을 보여준다.
도 6은 서열번호 20의 가이드를 사용함으로써 TRBC1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 TRBC1 표적 부위를 절단함을 예증한다.
도 7의 A는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드가 AAVS1 표적 부위에 삽입됨을 예증한다.
도 8의 A 및 B는 전기천공된 리보핵단백질 TevSaCas9가 포유동물 세포에서 B2M 표적 부위를 편집함을 예증한다.
도 9의 A 및 B는 I-TevI과 Cas12a의 융합체가 가이드 RNA에 의해 활성화되어 이중 가닥 DNA 기질을 절단함을 예증한다.
도 10은 상이한 핵 국소화 신호(NLS)를 가진 HEK293 세포의 TevSaCas9에 의한 B2M 유전자의 절단을 예증한다.
하기 설명에서, 본원에 개시된 본 실시양태의 철저한 이해를 제공하기 위해 특정 양, 크기 등과 같은 특정 세부사항이 기재된다. 그러나, 본 개시내용이 이러한 특정 세부사항 없이 실시될 수 있다는 것은 당분야의 숙련된 자에게 자명할 것이다. 많은 경우, 이러한 고려사항 등에 관한 세부사항은 본 개시내용의 완전한 이해를 얻기 위해 필요하지 않고 관련 분야에서 통상의 기술을 가진 자의 기술 내에 있기 때문에 생략되었다.
생체외 유전자 편집 방법
본 개시내용은 기존 유전자 편집 기술 및 방법에 비해 다음과 같은 이점을 나타내는 키메라 뉴클레아제 및 생체외 유전자 편집 방법을 기술한다. 예를 들어, 뉴클레아제가 2개의 부위에서 절단하는 경우, 이 뉴클레아제는 정확한 길이의 DNA를 절단한다(I-TevI 및 SaCas9에 의해 표적화된 부위에 따라 약 30개 내지 38개 염기). 본원에 기재된 방법은 게놈으로부터 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개 또는 40개 뉴클레오타이드의 정확한 결실을 생성할 수 있다. 따라서, 표적 부위는 세포에서 유전자 아웃-오프-프레임을 녹킹(knocking)할 정확한 길이 결실을 생성하도록 유전자에서 선택될 수 있다. 기재된 뉴클레아제의 한 실시양태에서, 뉴클레아제는 B2M 유전자(서열번호 1)(MHC 클래스 I 분자의 베타 쇄, 베타-2-마이크로글로빈, IMD43으로서도 알려짐)를 표적으로 하고 절단하여, 다수의 아웃-오프-프레임 결실로 B2M의 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 B2M 유전자(서열번호 2)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 TRAC 유전자(서열번호 3)(TRA, IMD7, TCRA, TRCA, T 세포 수용체 알파 유전자좌, TCRD 및 T 세포 수용체 유전자좌로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 TRCB 유전자(서열번호 4)(T 세포 수용체 베타 유전자좌, TCRBC1, BV05S1J2.2로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 버전은 HLA-A 유전자(서열번호 5)(주조직적합성 복합체, 클래스 I, A, HLA 클래스 I 조직적합성 항원, A 알파 쇄, HLAA, HLA 클래스 I 조직적합성 항원, A-1 알파 쇄, MHC 클래스 I 항원 HLA-A 중쇄, 백혈구 항원 클래스 I-A 및 인간 백혈구 항원 A로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 상기 기재된 뉴클레아제들 중 2개 이상의 뉴클레아제의 조합은 세포에서 각각의 유전자의 판독 프레임을 동시에 파괴할 수 있다. 외생성 공여자 DNA의 존재 하에, 기재된 뉴클레아제는 기존 기술 또는 관행보다 더 높은 퍼센트의 세포에서 표적 DNA 서열을 교체하도록 설계된다. 기재된 뉴클레아제의 추가 실시양태는 AAVS1 유전자좌(서열번호 6)(아데노 관련 바이러스 통합 부위 1 및 AAV로서도 알려짐)를 표적으로 하고 절단한다. 본원에 기재된 실시양태의 또 다른 버전, 즉 AAVS1 유전자좌(서열번호 7)를 표적으로 하고 절단하는 뉴클레아제는 표적 DNA 삽입을 위해 뉴클레아제 절단 부위에 상보적인 말단을 가진 이중 가닥 공여자 DNA 부분으로 향한다.
본 개시내용은 게놈 위치에서 뉴클레오타이드 서열을 삽입 변형시키거나, 결실시키거나 교체하기 위해 기재된 뉴클레아제를 사용하여 세포 집단을 유전적으로 조작하는 방법을 기술한다. 단계는 키메라 뉴클레아제 가이드 RNA 복합체를 형성하는 단계 및 키메라 뉴클레아제 가이드 RNA 복합체를 세포에 투여하는 단계를 포함한다. 이 투여는 전기천공 또는 지질 매개 형질감염(예를 들어, 양이온성 지질) 중 하나 이상의 방법을 이용함으로써 일어날 수 있다. 대안적으로, 가이드 RNA 및/또는 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산은 전기천공, 바이러스 형질도입 및/또는 지질 매개 형질감염으로부터 선택된 방법을 이용함으로써 세포 내로 전달될 수 있다. 게놈을 변경하기 위해 게놈 서열이 추가되는 실시양태에서, 삽입 또는 변경을 달성하기 위해 공여자 DNA도 투여할 수 있다. 공여자 DNA는 선형화된 DNA, 플라스미드 DNA 또는 바이러스 벡터로서 적절하게 제공될 수 있다.
한 측면에서, 본원에 기재된 생체외 유전자 편집 방법을 이용하여 CAR T 또는 CAR NK 세포를 생성한다. 도 1의 A에 예증된 바와 같이, 정제된 TevSaCas9 단백질(1)을 다수의 가이드 RNA(2)와 혼합하여 리보핵단백질 복합체(3)를 형성한다. TevSaCas9에 의해 표적화된 하나 이상의 부위에 상보적인 말단을 함유하는 외생성 공여자 CAR을 코딩하는 공여자 DNA(4)도 리보핵단백질 복합체(3)와 혼합한다. 도 1의 B에 나타낸 바와 같이, 게놈 DNA(7)로부터 발현된 내생성 T 세포 수용체(6)를 코딩하는 T 세포 집단(5)을 리보핵단백질 복합체(3)와 공여자 DNA(4)의 혼합물에 노출시킨다. 도 1의 C에 나타낸 바와 같이, 전기 펄스(8)를 혼합물에 인가하여, 세포막(9)을 투과 가능하게 만든다. 도 1의 D에 도시된 바와 같이, 리보핵단백질 복합체(3) 및 공여자 DNA(4)는 투과 가능한 세포막을 통해 T 세포로 들어간다. 리보핵단백질 복합체(3)는 하나 이상의 핵 국소화 서열("NLS")을 통해 핵(10)으로 표적화된다. 도 1의 E에 나타낸 바와 같이, 리보핵단백질 복합체(3)는 게놈 DNA(7)에서 그의 표적 부위에 결합할 것이다. 도 1의 F에 도시된 바와 같이, 리보핵단백질 복합체(3)는 게놈 DNA(7)를 절단하여 규정된 길이 결실(12)을 생성하거나, 양립 가능한 공여자 DNA(13)가 존재하는 경우, 공여자 DNA(13)를 절단된 부위에 삽입할 것이다. 결실된 게놈 DNA(7)의 영역은 내생성 T 세포 수용체(6)를 코딩하는 유전자를 파괴하고 공여자 DNA(13)는 외생성 CAR(14)을 코딩하여 T 세포를 신규 항원 쪽으로 표적화한다.
청구된 폴리펩티드는 면역 내성 및/또는 외생성 유전자, 예컨대, 키메라 항원 수용체(CAR)의 발현을 위해 면역 세포(예컨대, T 세포), 조혈 줄기 세포, 중간엽 줄기 세포 또는 유도 다분화능 줄기 세포(iPSC)의 DNA를 변형시켜 이 세포를 조작하도록 설계되지만, 이러한 세포 유형으로 제한되지 않는다. 본원에 기재된 방법 및 뉴클레아제에 의해 생체외 변형될 수 있는 세포 유형은 면역 세포, 예컨대, T 세포 또는 NK 세포; 또는 다분화능 세포, 예컨대, 중간엽 줄기 세포, 조혈 줄기 세포, 또는 당분야에 공지된 기법을 이용함으로써 다분화능을 갖도록 유도된 세포를 포함한다.
또한, 본 개시내용은 인간 세포의 게놈에서 DNA 서열의 전부 또는 일부를 표적화 유전자 파괴하여 유전자 아웃-오프-프레임을 녹킹하는 방법으로서, (a) 세포를 생체외에서 뉴클레아제에 노출시키는 단계; 및 (b) 1000 내지 2500 V의 전류를 세포 집단에 인가하여 막을 투과 가능하게 만들어, 청구된 뉴클레아제가 세포 내로 통과할 수 있게 하는 단계를 포함하는 방법에 관한 것이다. 1000 내지 1500 V, 1501 내지 1700 V, 1701 내지 1900 V, 1901 내지 2100 V, 또는 2101 내지 2500 V의 범위의 전류도 인가될 수 있다. 뉴클레아제는 또한 지질감염(lipofection) 또는 중합체 기반 형질감염(transfection)의 이용, 또는 아데노 관련 바이러스 또는 렌티바이러스와 같은 바이러스 벡터의 사용을 통해 세포로 전달될 수 있다. 뉴클레아제는 리보핵단백질 복합체, 뉴클레아제를 코딩하는 DNA 또는 뉴클레아제를 코딩하는 메신저 RNA로서 전달될 수도 있다. 진핵생물 세포에서, 기재된 뉴클레아제(TevSaCas9를 포함함)는 하나 이상의 핵 국소화 서열("NLS")을 통해 세포의 핵을 표적화할 수 있다. 면역 내성 세포 생성의 적용을 위해, B2M, TRAC1, TRBC1, HLA-A 또는 AAVS1(서열번호 1 내지 6) 중 하나 이상을 표적으로 하는 뉴클레아제의 혼합물을 세포 집단에 적용한다. 뉴클레아제를 정확한 게놈 위치로 표적으로 하기 위한 특이적 가이드 RNA는 핵산 또는 메신저 RNA에 의해 코딩되는 뉴클레아제와 함께 포함될 수 있다. DNA의 교체, 복구 또는 삽입을 게놈 위치로 표적으로 하는 적용을 위해, 공여자 DNA는 선형 이중 가닥 DNA, 플라스미드 또는 바이러스 벡터에 의해 단리 및 정제된 핵산으로서 포함될 수도 있다. 공여자 DNA는 뉴클레아제 및 가이드 RNA와 함께 제공될 수 있거나, 별도의 제제로 따로 제공될 수 있거나, 뉴클레아제 및 가이드 RNA의 전달에 비해 상이한 방법에 의해 전달될 수 있다.
본원은 규정된 길이의 DNA 서열을 인간 세포 내로 표적화 삽입하는 방법으로서, (a) 세포를 생체외에서 신규 뉴클레아제에 노출시키는 단계; (b) 1000 내지 2500 V의 전류를 세포 집단에 인가하여 막을 투과 가능하게 만들어, 청구된 뉴클레아제가 세포 내로 통과할 수 있게 하는 단계를 포함하는 방법도 기술한다.
진핵생물 세포에서, 기재된 뉴클레아제(TevSaCas9를 포함함)는 하나 이상의 핵 국소화 서열("NLS")을 통해 세포의 핵을 표적화할 수 있다. 면역 내성 세포 생성의 적용을 위해, B2M, TRAC1, TRBC1, HLA-A 또는 AAVS1(서열번호 1 내지 6) 중 하나 이상을 표적으로 하는 뉴클레아제의 혼합물을 세포 집단에 적용한다.
외생성 공여자 DNA의 존재 하에, 세포는 비상동 말단 연결을 통한 유도 라이게이션(directed-ligation)을 이용하여 표적 게놈 DNA에서 2개의 절단된 부위 사이에 외생성 DNA 서열(전체 또는 일부)을 삽입할 수 있다.
조작된 CAR-T 세포의 적용을 위해, AAVS1 안전한 은닉 부위(서열번호 6)는 키메라 항원 수용체(CAR)를 코딩하는 DNA 서열(서열번호 7)을 함유하는 외생성 공여자 DNA에 의해 표적화된다.
본원은 I-TevI 도메인, 링커 도메인, SaCas9 도메인 및 가이드 RNA의 상이한 조합을 함유하는 키메라 뉴클레아제를 포함하는 신규 변형된 TevSaCas9 뉴클레아제에 관한 것이다. 구체적으로, 키메라 뉴클레아제는 (a) 서열번호 8의 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 I-TevI 도메인; (b) 서열번호 9 내지 14 중 어느 한 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 링커 도메인; 및/또는 서열번호 15 및 16 중 어느 한 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 saCas9를 포함할 수 있다.
B2M 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 17 또는 서열번호 18의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.
TRAC 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 19의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.
TRBC 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 20의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.
HLA-A 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 21의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.
AAVS1 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 22의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.
청구된 발명의 한 실시양태는 면역 내성 세포를 생성하기 위해 다수의 유전자를 동시에 편집하는 데 사용되는 조성물이다. 특히, 이 조성물은 키메라 뉴클레아제에 대해 등몰 비로 서열번호 17 및 19 내지 21의 서열에 따른 가이드 RNA의 혼합물과 조합되는, 이전 단락에서 상기 논의된 키메라 뉴클레아제의 혼합물에 관한 것이다. 또 다른 실시양태에서, 상기 조성물은 키메라 뉴클레아제에 대해 등몰 비로 서열번호 18 내지 21의 서열에 따른 가이드 RNA의 혼합물과 조합되는, 이전 단락에서 상기 논의된 키메라 뉴클레아제의 혼합물에 관한 것이다.
청구된 발명의 한 실시양태는 I-TevI 도메인, 링커 도메인 및 RNA-가이드 뉴클레아제 도메인의 상이한 조합을 함유하는 다른 키메라 뉴클레아제의 조성물이다. 특히, 이 조성물은 서열번호 44 내지 49의 키메라 뉴클레아제에 관한 것이다.
한 측면에서, 본원에 기재된 뉴클레아제는 2개의 상이한 뉴클레아제로부터 형성된 키메라 뉴클레아제이다. 키메라 뉴클레아제는 본원에 기재된 생체외 유전자 편집 적용 및 생체내 적용에 유용하다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아로부터 유래한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스 종 BV3L6으로부터 유래한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, 28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.
본원에 기재된 키메라 뉴클레아제는 본원에 기재된 Cas12, Cas9, CasX 또는 I-TevI 뉴클레아제의 기능성 단편을 포함할 수 있다. 이러한 기능성 단편은 N-말단 결실, C-말단 결실, 또는 뉴클레아제의 N-말단 및 C-말단을 보존하는 개재 결실 중 하나 이상을 포함할 수 있다. I-TevI 뉴클레아제의 이러한 기능성 단편은 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 93, I-TevI 링커 단편의 아미노산 94 내지 150, 징크 핑거 도메인의 아미노산 151 내지 170, 또는 인공 링커 도메인의 아미노산 171 내지 180 중 하나 이상을 포함할 수도 있다. I-TevI 뉴클레아제 도메인의 아미노산 R28은 DNA 절단을 위해 요구된다. 징크 핑거 도메인의 아미노산 C152, C154, C165 및 C168은 I-TevI 뉴클레아제 도메인에 의한 효율적인 DNA 절단을 위해 요구된다. SaCas9 도메인의 이러한 기능성 단편은 하나 이상의 아미노산도 포함할 수 있다. (서열번호 54를 기준으로) 특정 기능성 단편은 뉴클레아제 소엽(lobe)의 아미노산 1 내지 39 및 아미노산 434 내지 1052, 및 인식 소엽의 아미노산 41 내지 424로 본원에 기재되어 있다. 인식 도메인의 기능성 단편은 N-말단 뉴클레아제 소엽에 연결하기 위해 가교 나선 루프를 형성하는 아미노산 41 내지 72를 포함한다. 아미노산 425 내지 433은 인식 루프와 C-말단 뉴클레아제 소엽을 연결하기 위해 링커 루프 도메인을 포함한다. 뉴클레아제 소엽은 RuvC-I 도메인의 아미노산 1 내지 39, RuvC-II 도메인의 아미노산 434 내지 479, RuvC-III 도메인의 아미노산 649 내지 773, HNH 도메인의 아미노산 519 내지 627, 웨지(WED) 도메인의 아미노산 787 내지 908, PAM 상호작용(PI) 도메인의 아미노산 909 내지 1052 중 하나 이상의 기능성 단편을 추가로 포함한다. PAM 상호작용 도메인은 토포이소머라제(Topoisomerase) 상동성(TOPO) 도메인의 아미노산 909 내지 967 및 C-말단 도메인의 아미노산 968 내지 1052의 기능성 단편을 추가로 포함한다. HNH 도메인은 L1 링커 도메인의 아미노산 480 내지 518에 의해 RuvC-II 도메인에 연결되고 L2 링커 도메인의 아미노산 628 내지 648에 의해 RuvC-III 도메인에 연결된다. RuvC-III 도메인과 WED 도메인은 포스페이트 잠긴 루프 도메인의 아미노산 774 내지 786에 의해 연결된다. saCas9 도메인의 아미노산 D10, H557 및 N580은 DNA 절단에 필요하다.
뉴클레아제
일부 실시양태에서, 변형된 TevSaCas9 뉴클레아제의 조성물은 본원에 기재된 바와 같이 I-TevI, SaCas9 도메인 및 가이드 RNA의 상이한 조합을 함유한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아로부터 유래한다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스 종 BV3L6으로부터 유래한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, K28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다.
한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다.
I-TevI 도메인
서열번호 8의 서열은 단백질 안정성을 증가시키고 N-말단 분해를 방해하는 데 도움이 되는 것으로 알려진 위치 2의 글리신 치환을 제외하고 I-TevI의 야생형 버전이다. 본원에서 언급된 특정 치환과 관련하여, 넘버링은 글리신 안정화를 결여하는 단백질의 야생형 버전에 상응한다. 따라서, I-TevI의 안정화된 버전에서 서열번호 8의 위치 27의 라이신은 위치 2의 글리신이 없는 야생형 위치에 상응하는 K26으로서 지칭된다. 다른 I-TevI 돌연변이는 이에 따라 지칭된다. T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V, E81I(I-TevI의 야생형 버전 참조)을 포함하는, I-TevI 뉴클레아제에 거의 영향을 미치지 않는 것으로 알려진 I-TevI 도메인에 대한 여러 I-TevI 치환이 있다. I-TevI의 뉴클레아제 활성은 I-TevI 도메인을 함유하는 키메라 뉴클레아제를, 알려진 I-TevI 표적을 함유하는 선형 DNA와 혼합하고 아가로스 겔에서 절단 반응의 생성물을 분리함으로써 어세이될 수 있다. 예측된 크기의 생성물은 I-TevI 뉴클레아제가 활성을 띠는 경우 존재할 것이다. 특정 실시양태에서, I-TevI에 대한 치환은 야생형 비변형 I-TevI에 비해 적어도 50%, 60%, 70%, 80%, 90% 이상의 I-TevI 뉴클레아제 활성이 보존될 수 있게 한다.
I-TevI 뉴클레아제 도메인의 다른 버전은 I-TevI에 의해 인식되는 서열을 변경하는 돌연변이, 예컨대, K26 및/또는 C39를 포함하는, I-TevI 도메인에 의해 표적화되는 부위 또는 I-TevI 도메인의 활성을 변경하는 돌연변이의 상이한 조합을 함유할 수 있다. 상기 뉴클레아제의 다른 버전은 I-TevI 도메인을 다른 GIY-YIG 뉴클레아제 도메인, 예컨대, I-BmoI, Eco29kI 등으로 치환할 수 있다. I-TevI의 일부 버전은 이. 콜라이에서 발현되었을 때 프로세싱의 결과로서 Met1을 함유하지 않는다.
특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 K26R 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함한다.
링커 도메인
특정 실시양태에서, I-TevI 뉴클레아제 도메인은 링커에 의해 saCas9에 연결된다. 링커는 I-TevI 링커(아미노산 93 내지 150 또는 I-TevI)를 포함할 수 있다. 링커는 대안적으로 또는 추가로 10개 내지 100개의 아미노산을 포함하는 유연한 아미노산 링커를 포함할 수 있다. 이러한 링커는 구조화되지 않을 수 있거나 Gly-Ser 링커를 포함할 수 있다.
특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 링커는 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 T95S, V117F, K135R, N140S 또는 Q158R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열로부터 선택된 펩티드이다.
SaCas9 도메인
뉴클레아제의 다른 버전은 SaCas9 도메인을 서열번호 25 내지 28의 다른 비천연 생성 SaCas9 또는 SpCas9 도메인으로 치환할 수 있다. 키메라 뉴클레아제의 다른 버전은 SaCas9 도메인을, 서열번호 44 내지 48의 키메라 뉴클레아제 TevCas12a 또는 서열번호 49의 TevCasX를 포함하는 다른 뉴클레아제로 치환할 수 있다. 키메라 뉴클레아제의 추가 실시양태는 SaCas9 도메인을 다른 클래스 1 또는 클래스 2 CRISPR-Cas 단백질, CRISPR-Cas3, CRISPR-캐스케이드, Cas13d로 치환할 수 있다. 뉴클레아제의 다른 버전은 SaCas9 도메인을, 핵산에 결합할 수 있는 폴리펩티드 서열, 다른 폴리펩티드 서열에 결합할 수 있는 폴리펩티드 서열, 폴리펩티드 표적화 서열을 포함하는 다른 이종 폴리펩티드 서열로 치환할 수 있다. 다른 이종 서열은 1개 내지 10개의 다른 폴리펩티드 도메인을 포함할 수 있다.
특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 T267A, L325F, V327I, D333G, A336S, I341L, E345D, D348N, K352E, S360A, T368A, N369E, N371E, S372P, E373K, K386T, N393R, H408N, N410S, I414M, A415T, T438S, Y467F, N471K, D485E, M489F, E506K, R409K, T510E, N515K, Y518F, A539P, F550Y, N551H, S596A, T602I, A611S, I617V, T620K, G654E, N667D, R685K, K695Q, I706V, K722T, A723T, K724N, M731T, F732V, K735Q, S739N, P741L, E742G, E746D, Q747D, I754D, T755I, H757R, K760Q, H761S, P778I, E781K, I783V, N784D, D785E, T786L, L787V, Y788H, K792E, D794T, T798R, L799I, V801I, N803S, L804I, N805K, G806N, D813G, K814E, L818I, I819F, S822P, E824G, L841T, G847S, D848N, Y857H, V875I, I876V, N884K, A888V, L890R, D894G, D895H, P897L, V903I, G920D, F924L, N929Y, E936D, N937G, V941I, N942D, S943L, C945A, E947K, K951R, L952Q, S956N, N957E, Q958K, A959S, N974D, G975K, V983A, N984S, N985D, D986G, I991V, V993L, M995F, I996V, T999N, Y1000K, R1001E, E1002D, L1004I, E1005K, N1006M, M1007N, D1009L, K1010S, R1011T, P1012S, P1013F, I1015L, I1016R, A1020G, S1021K, Q1024K, K1027S, E1039K, H1045K, I0148M 또는 K1050M 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 D10E 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함하고, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인은 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.
공여자 DNA 및 치료 세포 집단
본원에 기재된 방법 및 기법은 생체외에서 세포 집단의 세포를 유전적으로 변형시키는 데 유용하다. 이러한 생체외 변형은 치료 세포의 생성에 유용할 수 있다. 이러한 치료적 변형은 게놈 DNA 서열의 제거 또는 파괴를 포함할 수 있다. 다른 치료적 변형은 게놈 DNA 서열의 교체 또는 복구를 포함할 수 있다. 본원에 기재된 공여자 DNA는 예컨대, 기존 유전자를 교체하거나 복구하기(즉, 질환의 원인이 되는 하나 이상의 유전적 돌연변이를 보정하기) 위해 세포 게놈의 특정 부위로 표적화될 수 있거나, 안전한 은닉 부위, 예컨대, AAVS1 부위로 표적화될 수 있다. 외생성 공여자 DNA는 상동 재조합에 의해 혼입되도록 구성될 수 있다. 상동 재조합에 의해 혼입될 이러한 외생성 공여자 DNA는 제1 플랭킹 상동성 영역, 관심 있는 외생성 폴리뉴클레오타이드 서열 및 제2 플랭킹 상동성 영역을 포함할 수 있다. 대안적으로, 외생성 공여자 DNA는 비상동 말단 연결의 도움으로 단일 이중 가닥 절단 또는 중복 이중 가닥 절단에서 게놈 위치 내로 혼입됨으로써 게놈 위치에 삽입될 수 있다.
치료 세포 또는 치료 세포 집단은 다분화능 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 다분화능 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 다분화능 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 다분화능 세포를 포함하거나 이러한 세포로 구성된다. 상기 다분화능 세포는 동물 조직으로부터 단리될 수 있거나, 다분화능 줄기 세포를 유도하는 공지된 방법을 이용함으로써 유도될 수 있다.
치료 세포 또는 치료 세포 집단은 면역 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 면역 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 인간 면역 세포를 포함하거나 인간 면역 세포로 구성된다.
세포는 이종 면역 세포(예를 들어, 말초 혈액 단핵 세포)의 단리된 세포 집단, 또는 특정 면역 세포, 예컨대, 림프구, T 세포, B 세포 또는 NK 세포의 단리 및 정제된 집단일 수 있다. 이러한 세포 집단은 당분야에 공지된 기법, 예컨대, 자석 비드 선택(양성 또는 음성 선택)에 의해 약 80%, 85%, 90% 또는 95% 초과의 고순도로 단리될 수 있다.
치료 세포 또는 치료 세포 집단은 포유동물 조혈 줄기 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 조혈 줄기 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 인간 조혈 줄기 세포를 포함하거나 이러한 세포로 구성된다.
치료 세포 또는 치료 세포 집단은 포유동물 중간엽 줄기 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 중간엽 줄기 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 중간엽 줄기 세포를 포함하거나 이러한 세포로 구성된다.
특정 실시양태에서, 치료 세포는 CAR T 세포이다. 특정 실시양태에서, 치료 세포는 CAR NK 세포이다. 따라서, 본원에 기재된 키메라 뉴클레아제와 함께 전달될 공여자 DNA는 키메라 항원 수용체(CAR)를 코딩할 수 있다. CAR은 일반적으로 항체로부터 유래한 표적화 모이어티, 막횡단 도메인, 및 T 세포 또는 NK 세포에서 세포독성 활성을 활성화시키는 하나 이상의 세포내 신호전달 도메인을 포함한다.
특정 실시양태에서, 치료 세포는 보편적인 CAR T, 또는 면역원성이 감소된 CAR T이다. 이러한 감소된 면역원성은 하나 이상의 파괴를 T 세포 수용체 알파 쇄, T 세포 수용체 베타 쇄 또는 MHC 유전자(예를 들어, B2M, HLA-A, HLA-B 또는 HLA-C)에 도입함으로써 달성될 수 있다.
TevSaCas9 키메라 뉴클레아제가 이중 가닥 DNA를 절단할 때, Cas9는 블런트 말단을 남기고 I-TevI는 2개의 뉴클레오타이드 3' 오버행을 남긴다. 제공된 공여자 DNA는 블런트 말단, 및 TevSaCas9 절단 부위에서 생성된 3' 오버행에 결합하도록 구성된 2개의 뉴클레오타이드 3' 오버행을 포함할 수 있다.
한 측면에서, 공여자 DNA는 기능성 유전자를 코딩하는 것으로 알려지지 않은 게놈 부위에 삽입되도록 의도된 DNA 서열을 포함한다. 이러한 부위의 예는 AAVS1이다. 공여자 DNA는 표적 게놈 DNA에서 발견되지 않는 DNA 서열도 포함하고, 이 서열은 유용한 유전자 및/또는 다른 DNA 요소를 코딩할 수 있다. 특정 실시양태에서, 공여자 DNA는 뉴클레아제에 의해 절단된 길이와 동일한 길이의 이중 가닥 DNA를 포함하고 TevSaCas9에 의해 절단된 DNA 말단에 상보적인 DNA 말단도 포함한다. 특정 실시양태에서, 공여자 DNA는 인산화된 DNA의 5' 말단을 포함한다. 특정 실시양태에서, 공여자 DNA는 I-TevI 표적 부위 및 SaCas9 표적 부위를 포함하는 원형 이중 가닥 DNA를 포함하고, 이때 이중 가닥 DNA로부터 절단된 생성물은 TevSaCas9에 의해 절단된 말단에 상보적인 말단을 함유한다.
가이드 RNA
가이드 RNA의 다른 버전은 B2M, TRAC, TRBC, HLA-A, AVVS1 유전자에서 DNA의 동일한 영역을 표적화할 수 있으나, 집단에서 유전적 다형성을 설명하기 위해 상이한 서열을 함유할 수 있다. 가이드 RNA의 다른 버전은 B2M, TRAC, TRBC, HLA-A, AVVS1에서 상이한 서열을 표적화할 수 있다. 가이드 RNA의 다른 버전은 뉴클레아제를 hROSA26 및 CCR5와 같은 추가 안전한 은닉 부위로 재표적으로 하기 위해 게놈의 다른 서열을 표적화할 수 있다. 다른 버전은 동일한 유전자 내의 여러 서열을 표적으로 하기 위해 가이드 RNA의 혼합물을 함유할 수 있다. 기재된 발명의 가이드 RNA는 활성(예를 들어, 표적 결합 및 뉴클레아제 결합)에 필요한 모든 요소를 포함하는 단일 가닥을 포함할 수 있다. 대안적으로, 가이드 RNA는 2개 이상의 핵산 사이의 염기 페어링으로 인해 단일 모이어티를 형성하는 2개 이상의 비공유 결합된 핵산을 포함할 수 있다. 가이드 RNA의 다른 버전은 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로아데닌; 8-아미노아데닌; 8-티올아데닌; 8-티오알킬아데닌; 8-하이드록시아데닌; 8-할로구아닌; 8-아미노구아닌; 8-티올구아닌; 8-티오알킬구아닌; 8-하이드록실구아닌; 5-할로우라실; 5-브로모우라실; 5-트리플루오로메틸우라실; 5-할로사이토신; 5-브로모사이토신; 5-트리플루오로메틸사이토신; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신을 포함하나 이들로 제한되지 않는, 안정성을 위한 상이한 핵염기를 포함할 수 있다. 가이드 RNA의 다른 버전은 가교된 핵산 또는 잠긴 핵산과 같은 다른 핵산을 포함할 수 있다.
본원에 기재된 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 추가로 포함할 수 있다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다.
공여자 DNA의 조성: 상기 논의된 이중 가닥 공여자 DNA의 다른 버전은 상이한 5'-말단 화학적 변형, 예컨대, 바이오틴을 함유한다. 공여자 DNA의 다른 버전은 2'-플루오로, 2'-아미노 및 2'-O-메틸을 포함하나 이들로 제한되지 않는, 리보스의 2' 위치에 대한 안정성 변형을 포함할 수 있다. 공여자 DNA의 다른 버전은 3'-말단 변형, 예컨대, 도립 dT 또는 바이오틴을 함유할 수 있다. 공여자 DNA의 다른 버전은 리보스 당의 2'-O 및 4'-C 원자가 메틸렌 가교를 통해 연결되어 있는 잠긴 핵산(LNA)을 포함할 수 있다. 이중 가닥 공여자 DNA의 다른 버전은 TevSaCas9 표적 부위를 함유하는 원형 플라스미드 DNA를 포함할 수 있고, 이때 TevSaCas9를 사용한 절단은 게놈 표적의 DNA 말단에 상보적인 DNA 말단을 생성한다. 이중 가닥 공여자 DNA는 합성 또는 증폭된 선형 이중 가닥 DNA를 포함할 수 있다. 특정 실시양태에서, 공여자 DNA는 바이러스 벡터, 예컨대, 아데노 관련 바이러스 또는 렌티바이러스를 사용함으로써 공급된다.
키메라 뉴클레아제의 생성
본원에 기재된 키메라 뉴클레아제는 국제 공개 제WO2020225719A1호에 기재된 바와 같은 이. 콜라이 발현 시스템의 사용을 포함하는 많은 방식으로 생성될 수 있다. 대안적으로, 키메라 뉴클레아제는 표적 세포에서 뉴클레아제의 발현 및 생성을 유도하는 하나 이상의 유전 벡터를 공급함으로써 변형될 표적 세포에 의해 생성될 수 있다. 추가로, 벡터는 키메라 뉴클레아제를 특정 게놈 영역으로 표적으로 하기 위해 가이드 RNA의 발현을 유도하는 서열을 제공할 수 있다.
본원에 기재된 바와 같은 유전적으로 조작된 세포를 생성하는 예시적인 방법이 이하에 기재되어 있다.
세포 집단을 T 플라스크에서 70% 내지 90% 전면생장률(confluency)까지 생장시킨다. 세포를 원심분리로 수거하고 완충제 T(Invitrogen®, 미국 캘리포니아주 칼스바드)에 밀리리터당 1.0 x 107개 세포(밀리리터당 실제 범위 0.2 내지 2 x 107개 세포)로 재현탁한다. 2000 볼트(실제 범위 1100 내지 2500), 20 밀리초(실제 범위 10 내지 30 밀리초) 및 1 펄스(실제 범위 1 내지 4)에서 Neon® 형질감염 시스템(Thermo Fisher Scientific®, 미국 매사추세츠주 왈쌈)을 사용하여, 서열번호 25 내지 49로부터 선택되고 트리스(하이드록시메틸)아미노메탄 또는 포스페이트 완충 식염수에 제제화된 뉴클레아제를 비롯한 본원에 기재된 뉴클레아제로 세포를 전기천공한다. 0.3 g/L 글루타민 및 2 g/L 글루코스(Sigma-Aldrich®, 영국 어바인), 10% 태아 소 혈청(Sigma-Aldrich®, 캐나다 온타리오주 오크빌), 2 mM L- 글루타민 및 100 유닛 페니실린 및 0.1 mg 스트렙토마이신/㎖(Sigma-Aldrich®, 미국 미주리주 세인트루이스)를 함유하는 RPMI1640에서 24시간 동안 세포를 회복시킨다. 사멸 세포 제거 키트(Miltenyi Biotec®, 미국 매사추세츠주 소머빌)를 사용하여 사멸 세포를 제거한다. 중합효소 연쇄 반응으로 표적 유전자를 증폭하고 표적화 앰플리콘 시퀀싱(GENEWIZ, 미국 뉴저지주 사우쓰 플레인필드)으로 편집된 세포의 비율을 측정함으로써 넉아웃 효율을 측정한다. 앰플리콘 시퀀싱은 특정 게놈 영역의 유전적 변이를 분석할 수 있게 하는 표적화 차세대 시퀀싱 방법이다. 이 방법은 PCR을 이용하여 앰플리콘으로서 지칭되는 DNA 서열을 생성한다. 상이한 샘플로부터의 앰플리콘들은 인덱싱 또는 풀링으로서도 지칭되는 다중체화될 수 있고, 이것은 이들이 식별될 수 있도록 바코드(인덱스)를 샘플에 첨가하는 단계를 수반한다. 다중체화 전, 앰플리콘 시퀀싱에 사용되는 개별 샘플은 어댑터를 첨가하고 PCR 증폭을 통해 표적 영역을 농후화함으로써 라이브러리로 변환되어야 한다. 어댑터는 인덱싱된 앰플리콘의 형성을 허용하고 앰플리콘이 시퀀싱을 위해 플로우 셀에 부착될 수 있게 한다. 앰플리콘 시퀀싱은 전형적으로 세포 집단에서 변이체 검출에 사용된다.
생체외 세포 요법의 제조 방법. 변형된 세포 요법의 제조 방법: 뉴클레아제를 세포로 전달하는 다른 방법, 예컨대, 지질 나노입자, 중합체, 바이러스 벡터 또는 세포 침투 펩티드가 사용될 수 있다. 키메라 뉴클레아제 또는 가이드 RNA는 단일 가닥 또는 이중 가닥 형태의 DNA 또는 RNA로서 개별적으로 또는 조합되어 전달될 수 있다. 또한, 키메라 뉴클레아제는 다음 요소들 중 하나 이상을 함유하는 RNA로서 전달될 수 있다: 5' 캡, 5' 비번역 영역, 코딩 서열, 3' 비번역 영역 및 폴리아데닌(폴리-A) 꼬리. RNA는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로아데닌; 8-아미노아데닌; 8-티올아데닌; 8-티오알킬아데닌; 8-하이드록시아데닌; 8-할로구아닌; 8-아미노구아닌; 8-티올구아닌; 8-티오알킬구아닌; 8-하이드록실구아닌; 5-할로우라실; 5-브로모우라실; 5-트리플루오로메틸우라실; 5-할로사이토신; 5-브로모사이토신; 5-트리플루오로메틸사이토신; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신을 포함하나 이들로 제한되지 않는, 안정성을 위한 상이한 핵염기를 포함할 수 있다.
또 다른 실시양태에서, 키메라 뉴클레아제는 레트로바이러스 벡터, 렌티바이러스 벡터, 트랜스포존 벡터 및 아데노 관련 바이러스 벡터를 포함하나 이들로 제한되지 않는 통합 벡터로서 전달될 수 있다. 키메라 뉴클레아제는 또한 NucleofectorTM(Lonza, 스위스 바젤), MaxCyte(미국 메릴랜드주 게이더스버그) 또는 CliniMACS®(독일 베르기쉬 글라드바흐)를 포함하나 이들로 제한되지 않는 다른 전기천공 시스템에 의해 전달될 수 있다.
키메라 뉴클레아제는 약학적으로 허용되는 담체, 희석제 또는 부형제 중 하나 이상을 포함하는 약학 조성물에 추가로 포함될 수 있다. 본원에서 사용된 바와 같이, 용어 "약학적으로 허용되는 부형제"는 본 발명의 약학 조성물의 활성 성분(예를 들어, 본 발명의 화합물)과 양립 가능하고 (바람직하게는 이를 안정화시킬 수 있고) 치료되는 대상체에 유해하지 않는 담체 및 비히클을 의미한다. 예를 들어, 본 발명의 화합물과 함께 더 잘 용해되는 특정 복합체를 형성하는 가용화제는 화합물 전달을 위한 약학 부형제로서 사용될 수 있다. 적합한 담체 및 비히클은 당분야에서 특별한 기술을 가진 자에게 공지되어 있다. 본원에서 사용된 바와 같이, 용어 "부형제"는 모든 이러한 담체, 보조제, 희석제, 용매 또는 다른 불활성 첨가제를 포괄할 것이다. 약학 제제는 당분야에서 통상적으로 사용되는 불활성 희석제, 예를 들어, 물 또는 다른 용매, 가용화제 및 유화제, 예컨대, 에틸 알코올, 이소프로필 알코올, 에틸 카르보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부틸렌 글리콜, 글리세롤, 테트라하이드로푸릴 알코올, 및 소르비탄의 지방산 에스테르, 사이클로덱스트린, 알부민, 히알루론산, 키토산 및 이들의 혼합물을 함유할 수 있다. 폴리에틸렌 글리콜(PEG)은 원하는 성질인 용해도, 안정성, 반감기 및 다른 약학적으로 유리한 성질을 얻기 위해 사용될 수 있다. 안정화 성분의 대표적인 예는 폴리소르베이트 80, L-아르기닌, 폴리비닐피롤리돈, 트레할로스 및 이들의 조합을 포함한다. 사용될 수 있는 다른 부형제, 예컨대, 용액 결합제 또는 항산화제는 부틸화된 하이드록시톨루엔(BHT), 탄산칼슘, 인산칼슘(이염기성), 스테아르산칼슘, 크로스카멜로스, 가교결합된 폴리비닐 피롤리돈, 구연산, 크로스포비돈, 시스테인, 에틸셀룰로스, 젤라틴, 하이드록시프로필 셀룰로스, 하이드록시프로필 메틸셀룰로스, 락토스, 마그네슘 스테아레이트, 말티톨, 만니톨, 메티오닌, 메틸셀룰로스, 메틸 파라벤, 미세결정성 셀룰로스, 폴리비닐 피롤리돈, 포비돈, 전호화 전분, 프로필 파라벤, 레티닐 팔미테이트, 셀락, 이산화규소, 나트륨 카르복시메틸 셀룰로스, 구연산나트륨, 나트륨 전분 글리콜레이트, 소르비톨, 전분(옥수수), 스테아르산, 수크로스, 활석, 이산화티타늄, 비타민 A, 비타민 E(알파-토코페롤), 비타민 C 및 자일리톨을 포함한다.
특정 실시양태
본 개시내용의 특정 넘버링된 실시양태가 기재된다.
1. 변형된 I-TevI 뉴클레아제 도메인, 링커 및 변형된 RNA-가이드 뉴클레아제 도메인을 포함하는 폴리펩티드.
2. 변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제로서, 2개의 활성 뉴클레아제 부위를 가진 키메라 뉴클레아제.
3. 실시양태 2에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8 또는 이의 단편인 키메라 뉴클레아제.
4. 실시양태 2에 있어서, 링커가 서열번호 9 내지 14 중 어느 한 서열로부터 선택된 펩티드 또는 이의 단편인 키메라 뉴클레아제.
5. 실시양태 2에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열 또는 이의 단편인 키메라 뉴클레아제.
6. 실시양태 2에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8 또는 이의 단편이고, 링커가 서열번호 9 내지 14 중 어느 한 서열 또는 이의 단편이고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열 또는 이의 단편인 키메라 뉴클레아제.
7. 실시양태 6에 따른 키메라 뉴클레아제를 투여하는 단계를 포함하는, 표적화 포유동물 유전자를 파괴하는 방법으로서, 표적 세포의 게놈 DNA가 내생성 유전자의 발현을 파괴하도록 변형되는 것인 방법.
8. 실시양태 7에 있어서, 표적화 유전자의 전부가 파괴되는 것인 방법.
9. 실시양태 7에 있어서, 표적화 유전자의 일부가 파괴되는 것인 방법.
10. 실시양태 6에 따른 키메라 뉴클레아제를 투여하는 단계를 포함하는, 세포의 유전적 구성을 편집하는 방법.
11. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 외생성 DNA의 존재 하에 투여되는 것인 방법.
12. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 핵에 투여되는 것인 방법.
13. 실시양태 12에 있어서, 하나 이상의 핵 국소화 서열을 사용하여 키메라 뉴클레아제를 투여하는 것인 방법.
14. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 게놈 DNA로 전달되는 것인 방법.
15. 실시양태 14에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA로 전달되는 것인 방법.
16. 실시양태 15에 있어서, 표적 세포가 면역 세포인 방법.
17. 실시양태 16에 있어서, 면역 세포가 T 세포인 방법.
18. 실시양태 15에 있어서, 표적 세포가 다분화능 세포인 방법.
19. 실시양태 18에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.
20. 실시양태 15에 있어서, DNA 발현 카세트를 사용하여 상기 키메라 뉴클레아제를 표적 세포의 게놈 DNA로 전달하는 것인 방법.
21. 실시양태 10에 있어서, 바이러스 벡터를 사용하지 않는 방법.
22. 실시양태 15에 있어서, 상기 키메라 뉴클레아제를 단리된 표적 세포에 투여하는 것인 방법.
23. 실시양태 22에 있어서, 상기 단리된 표적 세포가 생체외 배양물에서 단리된 것인 방법.
24. 실시양태 23에 있어서, 상기 단리된 표적 세포가 외생성 공여자 세포인 방법.
25. 실시양태 23에 있어서, 키메라 뉴클레아제와 함께 상기 단리된 표적 세포의 생체외 배양물을 전기천공하는 것인 방법.
26. 실시양태 25에 있어서, 전기천공이 1000 내지 2500 V의 전류에서 적용되는 것인 방법.
27. 실시양태 20에 있어서, 상기 키메라 뉴클레아제가 전기천공 후 생체외에서 상기 단리된 표적 세포에 침투하는 것인 방법.
28. 실시양태 14에 있어서, 상기 세포가 동물 세포, 박테리아 세포, 곤충 세포 및 식물 세포로 구성된 군으로부터 단리된 것인 방법.
29. 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는, 규정된 길이의 게놈 DNA를 결실시키는 방법.
30. 실시양태 29에 있어서, 변형된 게놈 DNA가 유전자 아웃-오프-프레임을 녹킹함으로써 내생성 유전자의 발현을 파괴하는 것인 방법.
31. 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는 방법.
32. 실시양태 31에 있어서, 투여된 키메라 뉴클레아제가 외생성 공여자 DNA의 존재 하에 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 것인 방법.
33. 실시양태 32에 있어서, 상기 외생성 공여자 DNA가 표적 세포의 DNA에 삽입되는 것인 방법.
34. 실시양태 31에 있어서, 상기 규정된 길이의 선택된 DNA가 하나 이상의 기능성 유전자 또는 하나 이상의 이의 단편을 포함하는 것인 방법.
35. 표적 세포의 DNA에서 하나 이상의 규정된 길이의 선택된 DNA를 결실시키는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는 방법.
36. 실시양태 35에 있어서, 키메라 뉴클레아제를 외생성 공여자 DNA의 부재 하에 투여하는 것인 방법.
37. 실시양태 32 또는 35에 있어서, 키메라 뉴클레아제가 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 외생성 유전자를 발현시키는 것인 방법.
38. 표적 세포에서 하나 이상의 규정된 길이의 선택된 게놈 DNA를 결실시키고 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하고, 상기 선택된 외생성 DNA가 변형된 게놈 DNA의 결실된 부분에 삽입되거나 선택된 게놈 DNA의 상이한 위치에 삽입되는 것인 방법.
39. 실시양태 32, 35 또는 38에 있어서, 상기 외생성 유전자가 키메라 항원 수용체를 발현하는 것인 방법.
40. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA 상의 2개의 독립적인 부위를 표적으로 하는 것인 방법.
41. 실시양태 40에 있어서, 표적 세포의 게놈 DNA가 표적 세포의 게놈 DNA 상의 독립적인 부위 중 하나에서 절단되는 것인 방법.
42. 실시양태 40에 있어서, 표적 세포의 게놈 DNA가 표적 세포의 게놈 DNA 상의 2개의 독립적인 부위에서 절단되어, 게놈 DNA에서 2개의 절단된 부위를 생성하는 것인 방법.
43. 실시양태 41 또는 42에 있어서, 절단된 게놈 DNA의 길이가 30개 내지 36개 염기인 방법.
44. 실시양태 42에 있어서, 절단이 외생성 공여자 DNA의 존재 하에 일어나는 것인 방법.
45. 실시양태 44에 있어서, 외생성 공여자 DNA가 2개의 절단된 부위 사이에 삽입되는 것인 방법.
46. 실시양태 45에 있어서, 전체 외생성 공여자 DNA가 2개의 절단된 부위 사이에 삽입되는 것인 방법.
47. 실시양태 45에 있어서, 외생성 공여자 DNA의 일부가 2개의 절단된 부위 사이에 삽입되는 것인 방법.
48. 실시양태 45 내지 47에 있어서, 외생성 공여자 DNA가 2개의 절단된 부위 사이에 특정 배향으로 삽입되는 것인 방법.
49. 실시양태 48에 있어서, 외생성 공여자 DNA가 직접적인 라이게이션, 미세상동성 말단 연결 또는 비상동 말단 연결에 의해 게놈 DNA에 결합되는 것인 방법.
50. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 17 또는 서열번호 18, 또는 이의 단편이고; 상기 키메라 뉴클레아제가 B2M 유전자를 표적으로 하고 절단하는 것인 방법.
51. 실시양태 50에 있어서, 상기 키메라 뉴클레아제가 B2M 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.
52. 실시양태 51에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 B2M 단백질 생성 또는 기능을 억제하는 것인 방법.
53. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 19 또는 이의 단편이고; 상기 키메라 뉴클레아제가 TRAC1 유전자를 표적으로 하고 절단하는 것인 방법.
54. 실시양태 53에 있어서, 상기 키메라 뉴클레아제가 TRAC1 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.
55. 실시양태 54에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 TRAC1 단백질 생성 또는 기능을 억제하는 것인 방법.
56. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 20 또는 이의 단편이고; 상기 키메라 뉴클레아제가 TRCB1 유전자를 표적으로 하는 것인 방법.
57. 실시양태 56에 있어서, 상기 키메라 뉴클레아제가 TRCB1 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.
58. 실시양태 57에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 TRCB1 단백질 생성 또는 기능을 억제하는 것인 방법.
59. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 21 또는 이의 단편이고; 상기 키메라 뉴클레아제가 HLA-A 유전자를 표적으로 하고 절단하는 것인 방법.
60. 실시양태 59에 있어서, 상기 키메라 뉴클레아제가 HLA-A 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.
61. 실시양태 60에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 HLA-A 단백질 생성 또는 기능을 억제하는 것인 방법.
62. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 22 또는 이의 단편이고; 상기 키메라 뉴클레아제가 AAVS1 유전자를 표적으로 하는 것인 방법.
63. 실시양태 62에 있어서, AAVS1 유전자가 외생성 공여자 DNA의 존재 하에 표적화되는 것인 방법.
64. 실시양태 63에 있어서, AAVS1 유전자의 안전한 은닉 부위가 표적화되는 것인 방법.
65. 실시양태 63에 있어서, 키메라 뉴클레아제가 AAVS1 유전자의 2개의 부위를 표적으로 하는 것인 방법.
66. 실시양태 65에 있어서, 외생성 공여자 DNA가 AAVS1 유전자의 2개의 표적화 부위 사이에 통합되는 것인 방법.
67. 실시양태 63 내지 66 중 어느 한 실시양태에 있어서, 외생성 공여자 DNA가 키메라 항원 수용체를 발현하는 DNA 서열을 함유하는 것인 방법.
68. 실시양태 67에 있어서, 통합된 외생성 공여자 DNA가 비상동 말단 연결을 통해 유지되는 것인 방법.
69. 실시양태 67에 있어서, 서열번호 7의 CD19를 표적으로 하는 키메라 항원 수용체가 AAVS1 부위에 삽입되는 것인 방법.
70. 실시양태 63에 있어서, LoxP 부위가 AAVS1에 삽입되는 것인 방법.
71. 실시양태 70에 있어서, LoxP 부위가 서열번호 24인 방법.
72. 실시양태 6에 따른 2개 이상의 키메라 뉴클레아제의 혼합물을 투여하는 단계를 포함하는, 면역 내성 세포를 생성하는 방법.
73. 실시양태 72에 따라 키메라 뉴클레아제의 혼합물을 투여하는 단계를 포함하는, 면역 내성 세포를 생성하는 방법으로서, 상기 키메라 뉴클레아제가 B2M, TRAC1, TRBC1, HLA-A 및 AAVS1로 구성된 군으로부터 선택된 하나 이상의 유전자를 표적으로 하는 것인 방법.
74. 실시양태 73에 있어서, 상기 키메라 뉴클레아제의 혼합물이 서열번호 17 또는 18, 19, 20 및 21로 구성된 군으로부터 선택된 다수의 가이드 RNA, 또는 이들의 단편을 함유하는 것인 방법.
75. 실시양태 73에 있어서, 다수의 가이드 RNA를 함유하는 상기 키메라 뉴클레아제의 혼합물을 동시에 투여하는 것인 방법.
76. 실시양태 75에 있어서, 상기 혼합물이 표적 세포의 동일한 외생성 DNA 내의 다수의 서열을 표적으로 하기 위해 다수의 가이드 RNA를 함유하는 것인 방법.
77. 실시양태 75에 있어서, 키메라 뉴클레아제와 가이드 RNA의 비가 등몰인 방법.
78. 서열번호 17 또는 18, 19, 20 및 21로부터 선택된 다수의 가이드 RNA 또는 이들의 단편을 함유하는 키메라 뉴클레아제의 혼합물을 포함하는, 실시양태 2에 따른 키메라 뉴클레아제를 함유하는 제제로서, 상기 키메라 뉴클레아제가 표적 세포의 동일한 외생성 DNA 내의 다수의 서열을 표적으로 하는 것인 제제.
79. 실시양태 76에 있어서, 키메라 뉴클레아제와 가이드 RNA의 비가 등몰인 제제.
80. 실시양태 1에 있어서, 서열번호 29 내지 33 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.
81. 실시양태 1에 있어서, 서열번호 34 내지 38 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.
82. 실시양태 1에 있어서, 서열번호 39 내지 43 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.
83. 실시양태 1에 있어서, 서열번호 44 내지 48 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.
84. 서열번호 29의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.
85. 서열번호 29의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.
86. 서열번호 29의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.
87. 서열번호 29의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.
88. 서열번호 34의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.
89. 서열번호 34의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.
90. 서열번호 34의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.
91. 서열번호 34의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.
92. 서열번호 39의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.
93. 서열번호 39의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.
94. 서열번호 39의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.
95. 서열번호 39의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.
96. 서열번호 44의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.
97. 서열번호 44의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.
98. 서열번호 44의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.
99. 서열번호 44의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.
100. 실시양태 2에 따른 키메라 뉴클레아제를 포함하는 약학적으로 허용되는 제제.
101. 실시양태 6에 따른 키메라 뉴클레아제를 포함하는 약학적으로 허용되는 제제.
102. 실시양태 6에 있어서, 뉴클레아제로 전기천공된 세포를 포함하는 약학적으로 허용되는 제제.
103. 실시양태 100에 있어서, 상기 키메라 뉴클레아제가 서열번호 25 내지 49 중 어느 한 서열인 약학적으로 허용되는 제제.
104. 실시양태 100에 있어서, 외생성 공여자 DNA를 추가로 포함하는 약학적으로 허용되는 제제.
105. 실시양태 102에 따른 약학적으로 허용되는 제제를 투여하는 단계를 포함하는, 질환을 치료하는 방법.
106. 실시양태 103에 있어서, 상기 질환이 암인 방법.
107. 실시양태 72에 따라 면역 세포를 생성하는 단계를 포함하는, 질환을 치료하는 방법으로서, 상기 키메라 뉴클레아제가 면역 세포의 DNA를 변형시키는 것인 방법.
108. 실시양태 105에 있어서, 상기 질환이 암인 방법.
109. 실시양태 102에 따른 약학적으로 허용되는 제제를 투여하는 단계를 포함하는, 인간의 면역 내성을 지지하는 방법.
110. 실시양태 109에 있어서, 실시양태 72에 따라 면역 세포를 생성하는 단계를 포함하는 방법으로서, 상기 키메라 뉴클레아제가 면역 세포의 DNA를 변형시키는 것인 방법.
111. 실시양태 33에 있어서, 상기 외생성 공여자 DNA가 이중 가닥 DNA, 비상보적 말단을 가진 이중 가닥 DNA 또는 원형 이중 가닥 DNA로 구성된 군으로부터 선택된 것인 방법.
112. 실시양태 111에 있어서, 상기 이중 가닥 DNA의 폴리뉴클레오타이드 쇄가 동일한 길이를 갖고 둘 다 실시양태 6에 따른 동일한 키메라 뉴클레아제에 의해 절단된 것인 방법.
113. 실시양태 111에 있어서, 상기 비상보적 DNA 말단이 실시양태 6에 따른 동일한 키메라 뉴클레아제에 의해 절단된 것인 방법.
114. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 둘 다 5' 말단에서 인산화되거나 화학적으로 변형되는 것인 방법.
115. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 하나 이상의 포스포로티오에이트 결합을 함유하는 것인 방법.
116. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 바이오틴에 의해 화학적으로 변형되는 것인 방법.
117. 실시양태 111에 있어서, 상기 원형 이중 가닥 DNA가 I-TevI 및 SaCas9 표적 부위를 포함하는 것인 방법.
118. 실시양태 6에 있어서, 상기 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 25 내지 28 중 하나인 키메라 뉴클레아제.
119. 실시양태 6에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 유전적 다형성을 설명하기 위한 서열을 함유하는 것인 키메라 뉴클레아제.
120. 실시양태 6에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 표적 세포에서 게놈 DNA 상의 안전한 은닉 부위를 표적으로 하는 것인 키메라 뉴클레아제.
121. 실시양태 120에 있어서, 안전한 은닉 부위가 hROSA26 및 CCR5인 키메라 뉴클레아제.
122. 실시양태 7에 있어서, 지질 나노입자, 중합체, 바이러스 벡터 또는 세포 침투 펩티드를 사용하여 상기 키메라 뉴클레아제를 전달하는 것인 방법.
123. 실시양태 20에 있어서, 세포가 폐 세포인 방법.
124. 실시양태 20에 있어서, 키메라 뉴클레아제가 서열번호 31의 폴리펩티드인 방법.
125. 실시양태 20에 있어서, 유전 질환을 치료하기 위해 DNA 발현 카세트를 전달하는 것인 방법.
126. 변형된 I-Tevl 뉴클레아제 도메인, 링커 및 제2 뉴클레아제 도메인을 포함하는, 2개의 활성 뉴클레아제 부위를 가진 키메라 뉴클레아제로서, 활성 부위의 뉴클레아제 활성이 조정되는 것인 키메라 뉴클레아제.
127. 실시양태 126에 있어서, 제2 뉴클레아제가 변형된 RNA-가이드 뉴클레아제이고 가이드 RNA를 추가로 포함하는 것인 키메라 뉴클레아제.
128. 실시양태 126에 따른 키메라 뉴클레아제를 세포 또는 유기체에 투여하는 단계를 포함하는, 게놈 DNA를 편집하는 방법.
129. 실시양태 128에 따른 키메라 뉴클레아제를 세포 또는 유기체로 전달하는 단계를 포함하는, 규정된 길이의 DNA 분자를 결실시키는 방법.
130. 실시양태 128에 따른 키메라 뉴클레아제를 세포 또는 유기체로 전달하는 단계를 포함하는, DNA 분자로부터 선택된 서열을 교체하는 방법.
131. 서열번호 49의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.
132. 서열번호 49의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.
133. 서열번호 49의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.
134. 서열번호 49의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.
정의 및 약어
달리 정의되지 않는 한, 본원에서 사용된 모든 기술 용어, 표기법 및 다른 과학 용어는 본 개시내용이 속하는 분야의 숙련된 자에 의해 일반적으로 이해되는 의미를 갖도록 의도된다. 일부 경우, 일반적으로 이해되는 의미를 가진 용어는 명료성을 위해 및/또는 즉시 참조를 위해 본원에서 정의되므로; 본원에서 이러한 정의의 포함은 당분야에서 일반적으로 이해되는 것과 실질적인 차이를 나타내는 것으로 해석되어서는 안 된다.
본 설명의 골격 및 후속 청구범위 내에서, 달리 표시된 경우를 제외하고, 양, 수량, 퍼센트 등을 표현하는 모든 숫자는 모든 경우 용어 "약"이 앞에 있는 것으로 이해되어야 한다. 본원에서 사용된 바와 같이, 용어 "약"은 ±10%로서 정의된다. 또한, 모든 범위의 수치는 이하에 구체적으로 표시된 것 이외에 최대 및 최소 수치 값의 모든 가능한 조합과 그 안의 모든 가능한 중간 범위를 포함한다.
본원에서 사용된 용어 "및/또는"은 하나 또는 다른 하나 또는 둘 다를 가질 가능성으로서 정의된다. 예를 들어, "A 및/또는 B"는 A 또는 B만을 갖거나 A와 B의 조합을 가진 시나리오를 제공한다. A 및/또는 B 및/또는 C가 청구항에 기재되어 있는 경우, 조성물은 성분으로서 A 단독, B 단독 또는 C 단독을 포함할 수 있거나, A 및 B를 포함하고 C를 포함하지 않을 수 있거나, B 및 C를 포함하고 A를 포함하지 않을 수 있거나, A 및 C를 포함하고 B를 포함하지 않을 수 있거나, A, B 및 C 모두를 포함할 수 있다.
기준 폴리펩티드 서열에 대한 퍼센트(%) 서열 동일성은 서열 비교 컴퓨터 프로그램 ALIGN-2를 이용하여 계산하였을 때, 서열을 정렬하고 필요하다면 최대 퍼센트 서열 동일성을 달성하기 위해 갭을 도입하고 임의의 보존적 치환을 서열 동일성의 일부로서 간주하지 않은 후, 기준 폴리펩티드 서열의 아미노산 잔기와 동일한 후보 서열의 아미노산 잔기의 퍼센트이다. ALIGN-2 서열 비교 컴퓨터 프로그램은 제넨테크 인코포레이티드(Genentech, Inc.)에 의해 개발되었고, 소스 코드는 미국 저작권청(워싱턴 D.C., 20559)에 사용자 문서로 출원되었고, 이 저작권청에 미국 저작권 등록번호 TXU510087로 등록되어 있다. ALIGN-2 프로그램은 제넨테크 인코포레이티드(캘리포니아주 사우스 샌프란시스코)로부터 공개적으로 입수 가능하거나, 원시 코드로부터 컴파일링될 수 있다. ALIGN-2 프로그램은 디지털 UNIX V4.0D를 포함하는 UNIX 운영 시스템 상에서 사용되도록 컴파일링되어야 한다. 모든 서열 비교 파라미터들은 ALIGN-2 프로그램에 의해 설정되고 변경되지 않는다. ALIGN-2가 아미노산 서열 비교를 위해 사용되는 상황에서, 소정의 아미노산 서열 B에 대한 소정의 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로 소정의 아미노산 서열 B에 대한 특정 % 아미노산 서열 동일성을 갖거나 포함하는 소정의 아미노산 서열 A로서 표현될 수 있음)은 다음과 같이 계산된다: 100 곱하기 분수 X/Y, 이때 X는 A와 B의 그 프로그램 정렬에서 서열 정렬 프로그램 ALIGN-2에 의해 동일한 일치로서 점수화된 아미노산 잔기의 수이고, Y는 B의 아미노산 잔기의 총수이다. 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동등하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성은 A에 대한 B의 % 아미노산 서열 동일성과 동등하지 않을 것임이 인식될 것이다. 구체적으로 달리 언급되어 있지 않은 한, 본원에서 사용된 모든 % 아미노산 서열 동일성 값들은 ALIGN-2 컴퓨터 프로그램을 사용함으로써 직전 단락에 기재된 바와 같이 수득된다.
본원에 기재된 임의의 폴리펩티드, I-TevI 도메인, 링커 도메인 또는 Cas 폴리펩티드 뉴클레아제는 본원에 제공된 서열목록에 기재되어 있는 임의의 나열된 폴리펩티드와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일할 수 있거나 이러한 폴리펩티드와 동일할 수 있다. 특정 실시양태에서, 언급된 서열 동일성을 포함하는 폴리펩티드는 폴리펩티드의 야생형 버전의 뉴클레아제 활성 또는 본원에 기재된 돌연변이들 중 어느 한 돌연변이(예를 들어, Cas9의 D10E 돌연변이; 또는 I-TevI의 (K26R, T95S 및 Q158R 돌연변이), (V117F 돌연변이) (K135R/N140S), (V117F/K135R/N140S))에 의해 부여된 변경된 뉴클레아제 활성을 보존할 수 있다.
일부 실시양태에서, 본원에 제공된 폴리펩티드 및 키메라 뉴클레아제의 아미노산 서열 변이체가 예상된다. 변이체는 전형적으로 하나 이상의 치환, 결실, 추가 및/또는 삽입에 의해 본원에 구체적으로 개시된 폴리펩티드와 상이하다. 이러한 변이체는 천연 생성 변이체일 수 있거나, 예를 들어, 본원에 기재된 폴리펩티드 서열들 중 하나 이상을 변형시키고 본원에 기재된 폴리펩티드의 하나 이상의 생물학적 활성을 평가함으로써 합성적으로 생성될 수 있고/있거나, 다수의 공지된 기법들 중 임의의 기법을 이용함으로써 합성적으로 생성될 수 있다. 최종 구축물이 원하는 특성, 예를 들어, 항원 결합을 보유하는 한, 최종 구축물에 도달하기 위해 결실, 삽입 및 치환의 임의의 조합을 만들 수 있다.
본원에서 사용된 바와 같이, 기준 서열에 비해 아미노산 서열 또는 핵산 서열을 기술하기 위해 본원에서 사용될 때 용어 "상동한", "상동성" 또는 "퍼센트 상동성"은 문헌[Proc. Natl. Acad. Sci. USA 90:5873-5877, 1993]에서와 같이 변형된, 문헌[Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87: 2264-2268, 1990]에 기재된 식을 이용함으로써 측정될 수 있다. 이러한 식은 문헌[Altschul et al., J. Mol. Biol. 215: 403-410, 1990]의 기본 국소 정렬 검색 수단(BLAST) 프로그램에 혼입된다. 서열의 퍼센트 상동성은 본원의 출원일 당시 BLAST의 가장 최신 버전을 이용함으로써 측정될 수 있다. 본원에 기재된 핵산 또는 가이드 RNA 중 임의의 핵산 또는 가이드 RNA는 언급된 서열에 의해 부여된 (예를 들어, 유전자 또는 뉴클레아제에 대한) 적절한 결합 활성을 유지하면서 언급된 서열번호에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 상동성을 포함할 수 있다.
단수 형태는 본원에서 이 형태의 하나 또는 하나 초과(즉, 적어도 하나)의 문법적 객체를 지칭하는 데 사용된다. 본원에서 사용된 용어 "및/또는"은 하나 또는 다른 하나 또는 둘 다를 가질 가능성으로서 정의된다. 예를 들어, "A 및/또는 B"는 A 또는 B만을 갖거나 A와 B의 조합을 가진 시나리오를 제공한다. A 및/또는 B 및/또는 C가 청구항에 기재되어 있는 경우, 조성물은 성분으로서 A 단독, B 단독 또는 C 단독을 포함할 수 있거나, A 및 B를 포함하고 C를 포함하지 않을 수 있거나, B 및 C를 포함하고 A를 포함하지 않을 수 있거나, A 및 C를 포함하고 B를 포함하지 않을 수 있거나, A, B 및 C 모두를 포함할 수 있다.
용어 "투여한다" 및 "투여하는"은 본원에서 약물, 의약 또는 다른 형태의 치료제를, 질환 또는 병태를 앓고 있는 환자에게 분배하거나 적용하는 것을 의미하는 데 사용된다.
본원에서 사용된 바와 같이, "완충제"는 약학적으로 허용되고 원하는 pH 범위 내에서 본 발명의 조성물을 유지할 수 있는 임의의 산 또는 염 조합이다. 개시된 조성물의 완충제는 pH를 약 2 내지 약 8.5, 약 5.0 내지 약 8.0, 약 6.0 내지 약 7.5, 약 6.5 내지 약 7.5, 또는 약 6.5로 유지한다. 적합한 완충제는 상기 pH 범위를 유지할 수 있는 임의의 약학적으로 허용되는 완충제, 예를 들어, 아세테이트, 타르트레이트, 포스페이트 또는 시트레이트 완충제를 포함한다. 한 실시양태에서, 완충제는 포스페이트 완충제이다. 또 다른 실시양태에서, 완충제는 아세테이트 완충제이다. 한 실시양태에서, 완충제는 인산수소이나트륨, 염화나트륨, 염화칼륨 및 일염기성 인산칼륨이다.
본원에서 사용된 바와 같이, 용어 "키메라 항원 수용체"는 면역요법에 사용하기 위한 인공 T 세포 수용체를 생성하도록 유전적으로 조작된 T 세포(CAR T 세포로서도 알려짐)를 지칭한다.
본원에서 사용된 바와 같이, 용어 "키메라 뉴클레아제"는 서열 특이성을 제공하기 위한 하나 이상의 DNA 결합 도메인 및 DNA 절단을 위한 하나 이상의 뉴클레아제 도메인을 포함하는 조작된 단백질을 지칭한다.
본원에서 사용된 바와 같이, 용어 "절단한다" 또는 "절단하기 위한" 또는 "절단된" 또는 "절단"은 DNA 분자의 하나 이상의 포스포디에스테르 결합의 분할을 의미한다. 단일 표적 부위에서의 이중 가닥 DNA의 절단은 비상동 말단 연결 또는 상동성 유도 복구에 의해 복구될 수 있는 2개의 DNA 단편을 생성한다. 2개의 표적 부위에서의 이중 가닥 DNA의 절단은 중간 단편의 상실 또는 결실과 함께 비상동 말단 연결 또는 상동성 유도 복구에 의해 복구될 수 있는 3개의 단편을 생성한다. 본원과 관련하여, 2개의 표적 부위에서의 게놈 DNA의 "절단"은 예측 가능한 길이 결실을 생성할 수 있다.
DNA 또는 RNA 단편 또는 표적 부위와 관련하여 본원에서 사용된 바와 같이, 용어 "규정된"은 특정 뉴클레오타이드 길이 또는 특정 뉴클레오타이드 서열을 가진다는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "전달한다" 또는 "전달하기 위한" 또는 "전달된" 또는 "전달"은 유전자 편집 도구(예를 들어, 뉴클레아제, gRNA 및/또는 외생성 공여자 DNA)를 표적 세포로 직접 보내어, 생체내 또는 생체외에서 세포의 게놈 DNA의 유전적 변형을 달성하는 것을 의미한다.
용어 "유전적 조작" 및 문법적으로 동등한 용어는 하나 이상의 결실, 삽입 또는 치환을 표적 세포 또는 개체의 게놈 내로 도입하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "질환" 또는 "병든"은 인간, 동물 또는 식물의 구조 또는 기능 장애, 특히 특정 징후 또는 증상을 생성하거나 특정 위치에 영향을 미치고 단순히 신체적 상해의 직접적인 결과가 아닌 장애를 의미한다.
본원에서 사용된 바와 같이, 용어 "파괴"는 유전자의 발현 또는 기능이 억제되거나 불활성화되는 임의의 과정을 의미한다. "발현 파괴"는 유전 정보가 종종 단백질인 기능성 유전자 생성물의 합성에 사용되는 과정을 변경하거나, 억제하거나 제거하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "도메인" 및 "도메인들"은 단백질 쇄의 나머지 부분과 독립적으로 진화하고 작용하고 존재할 수 있는 소정의 단백질 서열 및 3차 구조의 보존된 부분을 지칭한다. 각각의 도메인은 조밀한 3차원 구조를 형성하며 종종 독립적으로 안정하고 접힐 수 있다. 많은 단백질들은 여러 구조적 도메인들로 구성된다. 하나의 도메인이 다양한 상이한 단백질들에 나타날 수 있다. 분자 진화는 도메인을 구축 블록으로서 사용하고 이들은 상이한 배열로 조합되어 상이한 기능을 가진 단백질을 생성할 수 있다. 일반적으로, 도메인의 길이는 약 50개 아미노산부터 최대 1,500개 아미노산까지 다양하다. 도메인은 종종 기능성 유닛, 예컨대, 칼모듈린의 칼슘 결합 EF 핸드 도메인을 형성한다. 도메인은 독립적으로 안정하기 때문에 유전적 조작에 의해 하나의 단백질과 또 다른 단백질 사이에 "교환"되어 키메라 단백질을 만들 수 있다.
본원에서 사용된 바와 같이, 용어 "편집한다" 또는 "편집하기 위한" 또는 "편집"은 유기체의 게놈 DNA를 변경하는 일군의 기술을 의미한다. 이러한 기술은 유전 물질이 게놈의 특정 위치에서 추가되거나, 제거되거나 변경될 수 있게 한다.
본원에서 사용된 바와 같이, "유효량"은 원하는 반응을 이끌어내기에 충분한 양을 의미한다. 본 발명에서 원하는 생물학적 반응은 T 세포 및 다분화능 줄기 세포를 비롯한 세포의 유전적 변형이다.
본원에서 사용된 바와 같이, 용어 "전기천공"은 세포막의 투과성을 증가시켜, 화학물질, 약물, DNA 또는 단백질이 세포 내로 도입될 수 있게 하기 위해 전기장을 세포에 인가하는 미생물학 기법을 의미한다.
본원에서 사용된 바와 같이, 용어 "내생성"은 유기체 내에서 성장하거나 유기체로부터 유래하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "등몰"은 동등한 수의 몰을 의미한다.
본원에서 사용된 바와 같이, 용어 "생체외"는 천연 조건이 최소한으로 변경된 외부 환경에서 유기체로부터의 조직에서 또는 조직에 대해 수행된 실험 또는 측정을 의미한다. 생체외는 시험될 샘플이 유기체로부터 추출되었음을 의미한다. 생체외 실험은 생체내 실험(온전한 유기체)에서 가능한 것보다 더 제어된 조건 하에 유기체의 세포 또는 조직을 사용할 수 있게 한다. 생체외 표본 사용의 예는 (1) 어세이; (2) 유기체의 암 세포에 대해 효과적인 암 치료제의 발견; (3) 특히 생명을 유지하지 못할 수 있는 다양한 환경(예를 들어, 극한의 압력 또는 온도)에서 물리적, 열적, 전기적, 기계적, 광학적 및 다른 조직 성질의 측정; (4) 수술 절차 개발을 위한 현실적인 모델; (5) 상이한 에너지 유형과 조직의 상호작용에 대한 조사를 포함한다. 본 발명에서, 생체외는 편집된 세포 또는 조직을, 이를 필요로 하는 대상체에게 이식하거나 투여할 목적으로 세포 또는 조직을 편집하는 것을 포함한다.
본원에서 사용된 바와 같이, 용어 "공여자 DNA" 또는 "외생성 공여자 DNA"는 임의의 방법, 예컨대, 비상동 말단 연결, 상동성 유도 복구, 미세상동성 유도 복구 또는 이들의 임의의 조합에 의해 게놈에 삽입되도록 의도된, 본원에 기재된 뉴클레아제와 함께 세포에 공급되는 DNA를 지칭한다. 공여자 DNA는 유기체 또는 세포에 천연적으로 존재하지 않는 유전 요소, 예컨대, 개방 판독 프레임, 엑손, 인트론 또는 발현 카세트를 포함하는 뉴클레오타이드 서열을 삽입할 수 있거나, 기존 유전자를 복구하거나 교체할 수 있다. 대안적으로, 공여자 DNA는 미스센스, 프레임 변동 돌연변이 또는 정지 코돈 돌연변이를 코돈 영역 또는 조절 요소(예를 들어, 프로모터, 스플라이스 공여자/수용자)에 도입함으로써 내생성 유전자를 파괴하도록 삽입될 수 있다. 공여자 DNA는 비제한적 예로서 플라스미드, 선형 단일 또는 이중 가닥 DNA, 합성 단일 또는 이중 가닥 DNA, 또는 바이러스 벡터에 의해 본원에 기재된 세포 또는 유기체에 공급될 수 있다. 공여자 DNA는 본원에 기재된 키메라 뉴클레아제 및 가이드 RNA를 코딩하는 핵산 및/또는 전달 벡터와 구별된다.
본원에서 사용된 바와 같이, 용어 "발현 카세트"는 형질감염된 세포에 의해 발현될 조절 서열에 작동 가능하게 연결된 유전자로 구성된 벡터 DNA의 별개의 구성요소를 지칭한다. 각각의 성공적인 형질감염에서, 발현 카세트는 세포의 기구에게 RNA(들)와 단백질(들)을 만들도록 지시한다. 일부 발현 카세트는 동일한 카세트를 쉽게 변경하여 상이한 단백질을 만들 수 있도록 단백질 코딩 서열의 모듈식 클로닝용으로 설계된다. 발현 카세트는 하나 이상의 유전자 및 이의 발현을 조절하는 서열로 구성된다. 발현 카세트는 3개의 구성요소, 즉 프로모터 서열, 개방 판독 프레임, 및 진핵생물에서 통상적으로 폴리아데닐화 부위를 함유하는 3' 비번역 영역을 포함한다. 정확한 조절 서열이 사용되는 한, 상이한 발현 카세트는 박테리아, 효모, 식물 및 포유동물 세포를 비롯한 다른 유기체 내로 형질감염될 수 있다.
본원에서 사용된 바와 같이, 용어 "단편" 또는 "단편들" 또는 "이의 단편"은 더 큰 독립체로부터 잘려진 작은 부분을 지칭한다. Cas 뉴클레아제 또는 I-TevI 뉴클레아제와 같은 뉴클레아제를 언급할 때 본원에 기재된 단편은 N-말단 또는 C-말단으로부터의 아미노산 잔기 결실, 또는 뉴클레아제의 효소 활성을 보존하는 규정된 내부 결실을 포함한다. 결실은 본원에 기재된 폴리펩티드의 N-말단, C-말단 또는 내부 서열로부터의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 아미노산 결실을 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "기능성 유전자"는 하나의 폴리펩티드 쇄 또는 다른 유전자 생성물을 코딩하는 DNA의 일부를 지칭한다. 따라서, '하나의 유전자/하나의 효소' 가설은 '하나의 시스트론(유전자)/하나의 폴리펩티드' 가설 또는 '하나의 유전자/하나의 기능성 생성물' 가설이 된다.
본원에서 사용된 바와 같이, 용어 "게놈 DNA" 또는 "gDNA"는 유전 물질의 대부분을 나타내는, 유기체의 염색체 DNA를 의미한다. 이것은 박테리아 플라스미드 DNA, 상보적 DNA 또는 미토콘드리아 DNA와 구별된다.
용어 "면역 내성"은 소정의 유기체에서 면역 반응을 이끌어내는 능력을 가진 물질 또는 조직에 대한 면역 시스템의 무반응 상태를 의미한다.
본원에서 사용된 바와 같이, 용어 "포함하는"은 "포함하나 이들로 제한되지 않는"을 의미하는 데 사용된다. "포함하는" 및 "포함하나 이들로 제한되지 않는"은 상호교환 가능하게 사용된다.
본원에서 사용된 바와 같이, 용어 "독립적인 부위"는 또 다른 부위와 연결되거나 서로 연결되지만 동일한 서열이 아니고 별개의 서열로서 간주되는, DNA 분자 또는 단백질/펩티드와 같은 표적 상의 또는 내의 영역을 의미한다.
본원에서 사용된 바와 같이, 용어 "유도 다분화능 줄기 세포"는 체세포로부터 직접 생성될 수 있는 일종의 다분화능 줄기 세포를 의미한다.
본 명세서 및 특히 청구된 발명에서 사용된 바와 같이, 용어 "억제한다" 또는 "억제하기 위한" 또는 "억제하고" 또는 "억제하는" 또는 "억제" 또는 "이의 억제"는 기능을 늦추거나 방해하거나, 효소 또는 다른 작용제의 활성을 감소시키는 능력을 의미한다.
본원에서 사용된 바와 같이, 용어 "삽입"은 전체 유전자 또는 규정된 길이의 DNA 분자를 세포에 추가하는 것, 또는 뉴클레오타이드 서브세트를 유전자에 추가하고/하거나 치환시키는 것을 의미하는 데 사용된다.
본원에서 사용된 바와 같이, 용어 "링커"는 RNA-가이드 뉴클레아제 도메인(Cas9)이 표적 DNA 서열에 결합할 때 아미노산 링커 도메인이 I-TevI 도메인의 이동성을 보장하여 세포 생리학적 조건(전형적으로: pH 약 7.2, 온도 약 37℃, [K+] 약 140 mM, [Na+] 약 5 내지 15 mM, [Cl-] 약 4 mM, [Ca++] 약 0.0001 mM) 하에 그의 표적 서열의 인식, 결합 및 절단을 허용하는 상황을 의미한다. 아미노산 링커의 길이는 Cas9 표적 부위와 I-TevI 표적 부위 사이에 얼마나 많은 뉴클레오타이드가 바람직한지에 영향을 미칠 수 있다. 링커의 특정 아미노산은 TevCas9에 의해 표적화되는 DNA 서열과 특이적으로 접촉할 수도 있다. 이 링커-DNA 접촉은 I-TevI 도메인의 유연성에 영향을 미칠 수 있다. 링커 도메인의 아미노산의 치환은 링커 도메인이 DNA와 접촉하는 능력에 영향을 미칠 수 있다.
본원에서 사용된 바와 같이, 용어 "변형시킨다" 또는 "변형시키기 위한" 또는 "변형시키는" 또는 "변형된" 또는 "변형"은 유기체의 DNA 내에서 원하는 유전자의 뉴클레오타이드를 변경시킴으로써 식물, 동물 또는 미생물의 특성을 변화시키는 기법을 의미한다. 변경은 전체 유전자를 포함하는 뉴클레오타이드 및/또는 이의 단편의 제거 및/또는 추가를 포함할 수 있다. 상기 용어는 신규 기능을 제공하기 위해 기본적 또는 근본적 변화를 만드는 것, 예컨대, 면역 세포(예컨대, T 세포) 또는 유도 다분화능 줄기 세포(iPSC)가 면역 내성을 나타내고/내거나 외생성 유전자, 예컨대, 키메라 항원 수용체(CAR)를 발현하도록 조작함으로써 이 세포의 DNA를 변경하는 것을 의미하지만, 이러한 세포 유형으로 제한되지 않는다. 본원과 관련하여, 이 용어는 일반적으로 세포에서 DNA의 뉴클레오타이드의 추가 또는 결실을 의미한다. 특히, 이 용어는 I-TevI 도메인의 합성된 버전, 링커 펩티드, 및 공지된 세포 요법에서 면역원성을 유발하기 위해 유전자를 표적으로 하도록 설계된 RNA-가이드 뉴클레아제의 변형된 버전을 의미한다.
본원에서 사용된 바와 같이, 용어 "비상동 말단 연결"은 DNA의 이중 가닥 절단을 복구하는 경로를 의미한다. NHEJ는 복구를 안내하기 위해 상동 서열을 요구하는 상동성 유도 복구와 대조적으로 상동 주형을 필요로 하지 않으면서 절단 말단이 직접 라이게이션되기 때문에 "비상동"으로서 지칭된다.
본원에서 사용된 바와 같이, 용어 "뉴클레아제"는 핵산의 뉴클레오타이드 사이의 포스포디에스테르 결합을 절단하는 효소를 지칭한다.
본원에서 사용된 바와 같이, 용어 "뉴클레아제 도메인"은 DNA 가닥의 물리적 절단을 담당하고 단일 가닥 또는 이중 가닥 절단을 도입할 수 있는, 표적 상의 영역을 지칭한다. 예를 들어, 일부 실시양태에서, 뉴클레아제 도메인은 야생형 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 92를 지칭할 수 있거나, 변경된 아미노산 서열 및/또는 결합 또는 뉴클레아제 성질을 가진 이의 변이체를 지칭할 수 있다.
본원에서 사용된 바와 같이, 용어 "아웃-오프-프레임 돌연변이" 또는 "프레임 변동 돌연변이"는 단백질의 생성을 심각하게 파괴하여 완전히 비기능적인 단백질을 생성하거나 단백질을 전혀 생성하지 않게 하는, 하나 이상의 뉴클레오타이드의 제거 또는 추가를 의미한다.
본 방법에 의해 치료될 "환자", "대상체" 또는 "숙주"라는 용어는 인간 또는 비인간 동물을 의미할 수 있다. 비인간 동물은 반려 동물(예를 들어, 고양이, 개) 및 소비를 위해 사육되는 동물(즉, 식용 동물), 예컨대, 소, 돼지 및 닭을 포함한다.
용어 "약학적으로 허용되는 제제"는 당분야에서 인식되어 있고, 임의의 대상 조성물 또는 이의 성분을 하나의 장기 또는 신체의 일부로부터 또 다른 장기 또는 신체의 일부로 운반하거나 수송하는 데 관여하는 약학적으로 허용되는 물질, 조성물 또는 비히클, 예컨대, 액체 또는 고체 충전제, 희석제, 부형제, 용매 또는 캡슐화 물질을 의미한다. 각각의 담체는 대상 조성물 및 이의 성분과 양립 가능하고 환자에게 해롭지 않다는 의미에서 "허용 가능"해야 한다. 약학적으로 허용되는 담체로서 사용될 수 있는 물질의 일부 예는 (1) 당, 예컨대, 덱스트로스, 락토스, 글루코스 및 수크로스; (2) 전분, 예컨대, 옥수수 전분 및 감자 전분; (3) 셀룰로스 및 이의 유도체, 예컨대, 미세결정성 셀룰로스, 나트륨 카르복시메틸 셀룰로스, 메틸 셀룰로스, 에틸 셀룰로스, 하이드록시프로필메틸 셀룰로스(HPMC) 및 셀룰로스 아세테이트; (4) 글리콜, 예컨대, 프로필렌 글리콜; (5) 폴리올, 예컨대, 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; (6) 에스테르, 예컨대, 에틸 올레에이트, 글리세릴 베헤네이트 및 에틸 라우레이트; (7) 완충제, 예컨대, 일염기성 포스페이트 및 이염기성 포스페이트, 트리스/보레이트/EDTA 및 트리스/아세테이트/EDTA; (8) 발열원 무함유 물; (9) 등장성 식염수; (10) 링거 용액; (11) 에틸 알코올; (12) 포스페이트 완충제 용액; (13) 폴리소르베이트; (14) 폴리포스페이트; 및 (15) 약학 제제에 사용되는 다른 무독성 양립 가능한 물질을 포함한다. 개시된 부형제는 하나 이상의 기능을 제공할 수 있다. 예를 들어, 가용화제는 또한 현탁 보조제, 유화제, 방부제 등일 수 있다.
본원에서 사용된 바와 같이, 용어 "다분화능 줄기 세포"는 자가재생되고 신체 조직의 임의의 세포를 생성하는 능력을 가진 세포 유형을 지칭한다.
본원에 기재된 바와 같은 T 세포는 적응성 세포 면역 반응에 관여하는 일종의 면역 세포이다. T 세포는 세포 표면 분자 CD3의 발현에 의해 식별된다. T 세포는 키메라 항원 수용체(CAR)를 발현할 때 치료 세포로서 활용될 수 있다.
본원에 기재된 바와 같은 NK 세포는 면역 반응에 관여하는 일종의 면역 세포이다. NK 세포는 세포 표면 분자 CD56의 발현에 의해 식별된다. NK 세포는 키메라 항원 수용체(CAR)를 발현할 때 치료 세포로서 활용될 수 있다.
본원에 기재된 바와 같은 조혈 줄기 세포(HSC)는 백혈구, 적혈구 및 혈소판을 포함하는 모든 유형의 혈액 세포로 발달할 수 있는 미성숙 세포이다. 조혈 줄기 세포는 말초 혈액과 골수에서 발견된다. 혈액 줄기 세포로서도 지칭된다. 조혈 줄기 세포는 세포 표면 분자 CD34의 발현에 의해 식별된다.
본원에 기재된 바와 같은 중간엽 줄기 세포는 조골세포(골 세포), 연골세포(연골 세포), 근세포(근육 세포) 및 지방세포(지방 세포)를 포함하는 다양한 세포 유형으로 분화할 수 있는 다분화능 간질 세포이다.
본원에서 사용된 바와 같이, 용어 "폴리펩티드"는 단백질 분자의 일부(또는 전체)를 형성하는, 쇄로 함께 결합된 다수의 아미노산 잔기로 구성된 선형 유기 중합체를 의미한다.
단백질 생성 또는 기능과 관련하여 본원에서 사용된 바와 같이, 용어 "적절한"은 생물학적 효과 또는 활성을 실질적으로 보유하거나 본원에 기재된 바와 같은 의도된 용도에 적합한 실질적으로 정상적인 또는 천연 형태의 단백질의 생성을 의미한다.
본원에서 사용된 바와 같이, 용어 "RNA 가이딩" 또는 "가이드 RNA"는 CRISPR 및 Cas9를 이용하는 원핵생물 DNA 편집을 의미한다. 이 원핵생물 DNA 편집 시스템의 경우, RNA-가이드 뉴클레아제는 표적 서열 특이성을 CRISPR-Cas9 시스템에 부여한다. 이 gRNA는 상보적 표적 DNA 서열에 결합하는 비코딩 짧은 RNA 서열이다.
본원에서 사용된 바와 같이, 용어 "선택된 DNA"는 더 많은 수의 DNA 서열로부터 선택되거나 단리된 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "적합한"은 용도 또는 목적에 충분히 맞추어짐을 의미한다.
특히 본 발명과 관련하여 본원에서 사용된 바와 같이, 용어 "표적 부위" 또는 "표적 부위들"은 뉴클레아제로 표적화될 때 뉴클레아제에 의해 결합되고/되거나 절단될 유전자의 위치를 지칭한다. 표적 부위는 다수의 뉴클레오타이드, 예컨대, I-TevI 또는 CRISPR/Cas 뉴클레아제의 절단 부위, 또는 I-TevI 뉴클레아제 또는 CRISPR/Cas 가이드 RNA의 DNA 결합 부위를 포괄할 수 있다. 표적 부위는 다양한 세포 유형 및 유기체 중 임의의 세포 유형 및 유기체의 유전자 또는 유전자간 영역에 있을 수 있다.
본원의 발명과 관련하여 본원에서 사용된 바와 같이, 용어 "표적화한다" 또는 "표적으로 하는" 또는 "표적으로 하기 위한" 또는 "표적화"는 예를 들어, 선택되거나 조작된 DNA 결합 도메인 또는 가이드 RNA를 사용하여 뉴클레아제를 특정 선택된 DNA 서열로 조준하거나 유도하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "바이러스 벡터"는 유전 물질을 세포로 전달하는 데 통상적으로 이용되는 도구를 의미한다. 이 과정은 살아있는 유기체 내부(생체내) 또는 세포 배양물(시험관내)에서 수행될 수 있다. 바이러스 벡터의 예는 AAV 벡터, 렌티바이러스 벡터 및 아데노바이러스 벡터를 포함한다.
본원에서 사용된 바와 같이, 용어 "동시에"는 다수의 gRNA를 가진 CRISPR/Cas9 복합체를 동시에 또는 실질적으로 동시에 투여하는 것을 의미한다. 특정 절차는 순차적으로 일어나지만 작은 간격에 의해 떨어져 있는 단계에서 실행될 수 있음을 이해할 것이다. 예를 들어, 세포의 전기천공 후 약 1시간 이내에 공여자 DNA를 투여한다.
본원에서 사용된 바와 같이, 용어 "치환"은 서열 내의 아미노산을 상이한 아미노산으로 교체하는 것을 의미한다. 본원에서 사용된 바와 같이, 약칭 X10Y는 서열의 10번째 위치에서 발견되는 아미노산 X가 아미노산 Y로 "치환"되었음을 표시한다. 예를 들어, W26C는 아미노산 트립토판-26(Trp, W)이 시스테인(Cys)으로 바뀌었음을 의미한다. 유사하게, 표기 AAX는 AA가 X 위치에서 발견된 아미노산을 대체한 아미노산임을 표시한다. 예를 들어, Lys26은 서열에서 26번째 위치의 아미노산이 라이신으로 교체되었음을 의미한다. 어느 한 약칭의 사용은 상호교환 가능하다. 또한, 아미노산에 대한 1-글자 또는 3-글자 약어의 사용도 상호교환 가능하다.
본원에서 사용된 바와 같이, 용어 "치료하는"은 병태, 질환, 장애 등을 개선하는 임의의 효과, 예를 들어, 경감, 감소, 조절 또는 제거를 포함한다. 본원에서 사용된 바와 같이, "치료하는"은 예방적 치료 및 치료적 치료를 둘 다를 포함할 수 있다. 예를 들어, 치료적 치료는 낭포성 섬유증 또는 비소세포 폐암의 진행을 지연시키거나 억제하거나 예방하는 것, 및 낭포성 섬유증 또는 비소세포 폐암과 관련된 증상을 감소시키거나 제거하는 것을 포함할 수 있다. 예방적 치료는 낭포성 섬유증 또는 비소세포 폐암의 발병을 예방하거나, 억제하거나 지연시키는 것을 포함할 수 있다.
약어
본원에서 사용된 약어는 다음과 같이 정의된다:
AA 아미노산
AAVS1 아데노 관련 바이러스 통합 부위 1
B2M 베타-2 마이크로글로불린
CAR 키메라 항원 수용체
Cas9 CRISPR 관련 단백질 9
Cpf1 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1의 CRISPR
CRISPR 클러스터링 조절 이격된 짧은 팔린드로믹 반복부
CFTR 낭포성 섬유증 막횡단 전도도 조절제 유전자
DNA 데옥시리보핵산
이. 콜라이 에스케리키아 콜라이
EDTA 에틸렌디아민테트라아세트산
EGFR 표피 성장 인자 수용체
HDR 상동성 유도 복구
HLA-A 조직적합성 항원, A 알파 쇄
iPSC 유도 다분화능 줄기 세포
NHEJ 비상동 말단 연결
NLS 핵 국소화 신호
PCR 중합효소 연쇄 반응
RNA 리보핵산
saCas9 스타필로코커스 아우레우스 Cas9
scCas9 스트렙토코커스 캐니스 Cas9
spCas9 스트렙토코커스 피오게네스 Cas9
TALEN 전사 활성화제 유사 이펙터 뉴클레아제
TCR T 세포 수용체
TevCas9 변형된 I-TevI 도메인, 링커 펩티드 및 변형된 RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9
TRAC1 T 세포 수용체 알파 쇄 불변
TRBC1 T 세포 수용체 베타 불변 1
ZFN 징크 핑거 뉴클레아제
실시예
하기 예증적인 실시예는 본원에 기재된 조성물 및 방법의 실시양태를 대표하고 어떠한 방식으로든 제한하기 위한 것이 아니다.
실시예 1 - TevSaCas9는 표적 부위를 절단한다 .
도 2의 A는 서열번호 17의 가이드 RNA의 사용을 통해 B2M 유전자로 표적화된 TevSaCas9가 시험관내에서 B2M DNA 기질을 절단함을 예증한다. 시간 경과에 따른 절단 반응의 생성물을 아가로스 겔에서 가시화한다. 도 2의 B는 처리 48시간 후 상 대비(Phase Contrast) 및 Cytation5(Biotek Instruments Inc, 미국 버지니아주)에서의 GFP 영상화를 이용하여, 절단 가능한 GFP 태그에 융합된 TevSaCas9의 플라스미드 DNA 버전으로 형질감염시킨 포유동물 세포를 영상화한 것이다. 도 2의 C는 수거된 세포로부터 추출된 게놈 DNA의 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이에 의해 검출된 바와 같이 플라스미드 DNA에 의해 코딩된 TevSaCas9에 의한 B2M 유전자의 편집을 입증한다. 도 2의 D는 서열번호 17의 B2M 표적화 가이드 RNA와 복합체를 형성하였고 포유동물 세포 내로 형질감염된, 서열번호 29의 정제된 TevSaCas9 단백질 또는 V117F/K135R/N140S 돌연변이를 함유하는 서열번호 32의 TevSaCas9 단백질을 사용하여 B2M 유전자의 편집을 입증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다.
도 3의 A는 서열번호 22의 가이드의 사용에 의해 AAVS1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 AAVS1 표적 부위(온-표적)를 절단하지만 오프-표적 서열을 절단하지 않음을 예증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출한다. 인 실리코(in silico)에서 예측된 상위 5개의 오프-표적 부위에서의 편집도 T7 엔도뉴클레아제 I 절단 어세이에 의해 측정되었으나, 오프-표적은 검출되지 않았다. 도 3의 B는 AAVS1에 대한 온-표적 및 오프-표적 부위의 서열을 보여준다. 회색으로 강조된 서열은 가이드 RNA 표적 부위를 표시한다. 소문자 뉴클레오타이드는 온-표적에 대한 불일치 위치를 표시한다. 밑줄 표시된 서열은 추정 I-TevI 결합 및 절단 부위를 표시한다. 도 3의 C는 포유동물 세포의 AAVS1 유전자에서 서열번호 37의 Tev[KTQ]-SaCas9[D10E] 및 서열번호 33의 Tev[KTQ]-SaCas9[WT]의 활성을 입증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출한다.
도 6은 서열번호 20의 가이드의 사용에 의해 TRBC1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 TRBC1 표적 부위를 절단함을 예증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 TRBC1 유전자의 편집을 검출한다.
실시예 2 - TevSaCas9는 공여자 DNA를 특정 게놈 부위에 삽입한다.
도 4의 A는 TevSaCas9 절단(검은색) 및 절단 부위 내로의 공여자 올리고뉴클레오타이드 복구 주형의 삽입(회색) 후 B2M 유전자의 표적 부위를 나타내고 올리고뉴클레오타이드 복구가 일어남을 보여주는 도면을 보여준다. 도 4의 B는 공여자 올리고뉴클레오타이드 복구 주형의 삽입을 예증한다. B2M에 대한 TevSaCas9 및 유일무이한 제한 효소 부위를 가진 복구 주형으로 형질감염시킨 세포의 T7 엔도뉴클레아제 I 절단 어세이("T7E1") 및 제한 효소 분해("RE")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다. 올리고뉴클레오타이드 복구 주형의 삽입을 제한 효소 분해로 측정한다.
도 5의 A 및 B는 TevSaCas9에 의한 절단 후 게놈 내의 AAVS1 안전한 은닉 부위(검은색)를 도시하는 도면이다. TevSaCas9 절단 부위와 양립 가능한 말단을 가진 약 1.2 킬로염기의 녹색 형광 단백질(GFP) 리포터 구축물이 회색으로 표시되어 있다. GFP 형광은 리포터 + TevSaCas9 세포에서 관찰되었으나, 리포터만을 가진 세포에서는 관찰되지 않았다. 도 5의 B는 HEK293 세포에서 AAVS1 부위 내로의 GFP 리포터의 삽입 및 발현을 입증한다. 리포터 구축물과 함께 또는 리포터 구축물 없이 TevSaCas9로 처리한 세포를 공-형질감염 48시간 후에 영상화하였다. GFP 양성 세포의 존재는 GFP 리포터의 발현을 표시한다.
도 7의 A는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드 복구 주형("RT")의 서열의 도면이다. 소문자로 표시된 것은 BglII 제한 효소 부위이고 밑줄로 표시된 것은 단일 LoxP 부위이다. 도 7의 B는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드가 AAVS1 표적 부위 내로 삽입됨을 입증한다. BglII 및 LoxP 부위를 가진 복구 주형(RT)과 함께 또는 이 복구 주형 없이 AAVS1로 표적화된 TevSaCas9로 형질감염시킨 세포의 T7 엔도뉴클레아제 I 절단 어세이("T7E1") 및 제한 효소 분해("RE")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7E1 어세이로 AAVS1 유전자의 편집을 검출한다. 올리고뉴클레오타이드 복구 주형의 삽입을 RE 분해로 측정한다. RT를 포함하는, TevSaCas9로 처리된 세포는 AAVS1 표적 부위에서 RT의 삽입을 표시하는 예상된 크기의 RE 분해 생성물을 보여준다.
도 8의 A는 전기천공된 리보핵단백질 TevSaCas9가 포유동물 세포에서 B2M 표적 부위를 편집함을 예증한다. Neon® 형질감염 시스템(Thermo Fisher Scientific®, 미국 매사추세츠주 왈쌈)에서 각각 20 밀리초의 2회 펄스와 함께 1150 볼트를 사용하여 B2M으로 표적화된 1.5 μM의 TevSaCas9 리보핵단백질 복합체로 HEK293 세포를 전기천공하였다. TevSaCas9로 처리된 전기천공된 세포 또는 모의 전기천공된 세포에 대한 T7 엔도뉴클레아제 I 절단 어세이("T7E1")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다. 도 8의 B는 전기천공된 TevSaCas9 리보핵단백질 복합체를 사용하여 공여자 DNA를 B2M 표적 부위에 혼입할 수 있음을 입증한다. 녹색 형광 단백질(GFP) 리포터를 함유하는 2 ㎍의 선형화된 공여자 DNA(RT)가 포함되었다는 점을 제외하고 (A)에서와 같이 HEK293 세포를 전기천공하였다. 그 다음, 형광 활성화 세포 분류를 이용하여 GFP 양성 세포를 단일 세포로 분류하고 세포의 클론 집단을 확장하였다. 게놈 DNA 샘플을 추출하고 B2M 유전자좌를 증폭함으로써 클론에서 GFP 리포터의 존재를 검출하였다. 공여자 DNA 구축물의 크기에 상응하는 아가로스 겔의 밴드(*로 표시됨)가 클론 2에서 관찰되는데, 이는 리포터가 B2M 표적 부위에 성공적으로 통합됨을 시사한다. 도 8의 C는 유도된 공여자 DNA가 다분화능 줄기 세포(iPSC)의 B2M 표적 부위에 혼입될 수 있음을 입증한다. mCherry 형광 리포터를 함유하는 2 ㎍의 선형화된 공여자 DNA("RT")와 함께 또는 이러한 공여자 DNA 없이 B2M으로 표적화된 7.5 ㎍의 TevSaCas9 리보핵단백질 복합체로 iPSC를 전기천공하였다. 세포에 대해서만 모의 전기천공을 수행하였다. 수거된 세포로부터 게놈 DNA를 추출하고 B2M 유전자좌를 PCR로 증폭하였다. 공여자 DNA 구축물의 크기에 상응하는 아가로스 겔의 밴드(*로 표시됨)는 RT의 존재 하에서만 관찰되는데, 이는 공여자 DNA가 B2M 유전자좌에 삽입됨을 시사한다.
실시예 3 - 상이한 핵 국소화 신호(NLS)를 가진 TevSaCas9는 표적 부위를 절단한다 .
도 10은 HEK293 세포에서 상이한 핵 국소화 신호(NLS)를 가진 서열번호 32의 TevSaCas9에 의한 B2M 유전자의 절단을 예증한다. 인간 인플루엔자 헤마글루티닌(HA) 서열("뉴클레오플라스민")에 의해 분리된 서열번호 56의 2개의 C-말단 뉴클레오플라스민 NLS, HA 서열에 의해 분리된 서열번호 55의 2개의 SV40 NLS("이분 SV40"), 또는 2개의 SV40 NLS가 뒤따르는 HA 서열("탠덤 SV40")을 가진, B2M 유전자로 표적화된 TevSaCas9의 T7 엔도뉴클레아제 I 절단 어세이("T7E1")의 결과가 표시되어 있다. 지질감염 시약으로 처리된 세포("모의")도 표시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다.
실시예 4 - I-TevI와 Cas12a의 융합체에 의한 이중 가닥 DNA 절단
도 9의 A 및 B는 I-TevI와 서열번호 47의 Cas12a의 융합체가 가이드 RNA에 의해 활성화되어 이중 가닥 DNA 기질을 절단함을 예증한다. 서열번호 50의 가이드 RNA의 사용에 의해 AAVS1 유전자로 표적화된 정제된 Cas12a 및 TevCas12는 시험관내에서 AAVS1 DNA 기질을 절단한다. "C"로 표시된 레인은 단백질 단독 샘플을 표시한다. 시간 경과에 따른 절단 반응의 생성물을 아가로스 겔에서 가시화한다. Cas12a 절단으로부터 비롯된 2개의 밴드는 단일 절단을 표시한다. 예상외로, TevCas12a에서 여러 절단 생성물이 관찰되는데, 이는 TevCas12a가 가이드 RNA의 존재 하에 이중 가닥 DNA를 비특이적으로 절단함을 시사한다. 도 9의 B는 TevCas12a가 세포에서 AAVS1 표적 부위를 절단함을 입증한다. HEK293 세포를 AAVS1로 표적화된 Cas12a 및 TevCas12a로 지질감염시켰다. 수거된 세포로부터 게놈 DNA를 추출하였고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출하였다. Cas12a 및 TevCas12a 샘플에 유의미하게 더 많은 생성물이 존재한다는 것은 TevCas12a가 세포에서 AAVS1 유전자를 절단함을 시사한다.
본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태가 단지 예로서 제공된다는 것은 당분야의 숙련된 자에게 자명할 것이다. 비로소 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야의 숙련된 자에게 인식될 것이다. 본원에 기재된 본 발명의 실시양태의 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다.
본 명세서에서 인용된 모든 간행물, 특허 출원, 발행된 특허 및 다른 문헌은 각각의 개별 간행물, 특허 출원, 발행된 특허 또는 다른 문헌이 전체적으로 본원에 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것처럼 본원에 참고로 포함된다. 참고로 포함된 문헌에 함유된 정의는 이 정의가 본 개시내용의 정의와 모순되는 범위 내에서 제외된다.
본 발명의 특정 실시양태가 논의되었지만, 본 명세서는 예시적이며 제한적이지 않다. 본 명세서를 검토할 때 본 발명의 많은 변경이 당분야의 숙련된 자에게 명백해질 것이다. 본 발명의 전체 범위는 균등물의 전체 범위와 함께 청구범위를 참고하고, 이러한 변경과 함께 본 명세서를 참고함으로써 결정되어야 한다.
달리 표시되지 않는 한, 본 명세서 및 청구범위에서 사용된 성분, 반응 조건 등의 양을 표현하는 모든 숫자는 모든 경우 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 반대로 표시되어 있지 않는 한, 본 명세서 및 첨부된 청구범위에 제시된 수치 파라미터는 본 발명에 의해 얻고자 하는 원하는 성질에 따라 달라질 수 있는 근사치이다.
상기 논의는 본 발명의 원리 및 다양한 실시양태를 예시하기 위한 것이다. 일단 상기 개시내용이 완전히 이해되면, 다수의 변경, 조합 및 변형은 당분야의 숙련된 자에게 명백해질 것이다. 하기 청구범위는 모든 이러한 변경 및 변형을 포괄하는 것으로 해석되어야 한다.
SEQUENCE LISTING
<110> SPECIFIC BIOLOGICS INC.
<120> GENE EDITING WITH A MODIFIED ENDONUCLEASE
<130> 61414-702.601
<140> PCT/IB2021/060236
<141> 2021-11-04
<150> 63/109,396
<151> 2020-11-04
<160> 67
<170> PatentIn version 3.5
<210> 1
<211> 1675
<212> DNA
<213> Homo sapiens
<400> 1
attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60
gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120
tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180
catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240
cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300
acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360
aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420
tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480
acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540
ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600
ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660
tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720
ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780
tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840
ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900
ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960
ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020
gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080
ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140
acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200
ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260
ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320
ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380
ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440
tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500
aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560
ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620
actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675
<210> 2
<211> 1675
<212> DNA
<213> Homo sapiens
<400> 2
attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60
gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120
tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180
catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240
cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300
acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360
aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420
tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480
acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540
ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600
ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660
tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720
ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780
tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840
ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900
ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960
ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020
gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080
ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140
acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200
ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260
ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320
ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380
ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440
tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500
aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560
ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620
actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675
<210> 3
<211> 1508
<212> DNA
<213> Homo sapiens
<400> 3
ttttgaaacc cttcaaaggc agagacttgt ccagcctaac ctgcctgctg ctcctagctc 60
ctgaggctca gggcccttgg cttctgtccg ctctgctcag ggccctccag cgtggccact 120
gctcagccat gctcctgctg ctcgtcccag tgctcgaggt gatttttacc ctgggaggaa 180
ccagagccca gtcggtgacc cagcttggca gccacgtctc tgtctctgaa ggagccctgg 240
ttctgctgag gtgcaactac tcatcgtctg ttccaccata tctcttctgg tatgtgcaat 300
accccaacca aggactccag cttctcctga agtacacatc agcggccacc ctggttaaag 360
gcatcaacgg ttttgaggct gaatttaaga agagtgaaac ctccttccac ctgacgaaac 420
cctcagccca tatgagcgac gcggctgagt acttctgtgc tgtgagtgat ctcgaaccga 480
acagcagtgc ttccaagata atctttggat cagggaccag actcagcatc cggccaaata 540
tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 600
tctgcctatt caccgatttt gattctcaaa caaatgtgtc acaaagtaag gattctgatg 660
tgtatatcac agacaaaact gtgctagaca tgaggtctat ggacttcaag agcaacagtg 720
ctgtggcctg gagcaacaaa tctgactttg catgtgcaaa cgccttcaac aacagcatta 780
ttccagaaga caccttcttc cccagcccag aaagttcctg tgatgtcaag ctggtcgaga 840
aaagctttga aacagatacg aacctaaact ttcaaaacct gtcagtgatt gggttccgaa 900
tcctcctcct gaaagtggcc gggtttaatc tgctcatgac gctgcggctg tggtccagct 960
gagatctgca agattgtaag acagcctgtg ctccctcgct ccttcctctg cattgcccct 1020
cttctccctc tccaaacaga gggaactctc ctacccccaa ggaggtgaaa gctgctacca 1080
cctctgtgcc cccccggtaa tgccaccaac tggatcctac ccgaatttat gattaagatt 1140
gctgaagagc tgccaaacac tgctgccacc ccctctgttc ccttattgct gcttgtcact 1200
gcctgacatt cacggcagag gcaaggctgc tgcagcctcc cctggctgtg cacattccct 1260
cctgctcccc agagactgcc tccgccatcc cacagatgat ggatcttcag tgggttctct 1320
tgggctctag gtcctggaga atgttgtgag gggtttattt ttttttaata gtgttcataa 1380
agaaatacat agtattcttc ttctcaagac gtggggggaa attatctcat tatcgaggcc 1440
ctgctatgct gtgtgtctgg gcgtgttgta tgtcctgctg ccgatgcctt cattaaaatg 1500
atttggaa 1508
<210> 4
<211> 1221
<212> DNA
<213> Homo sapiens
<400> 4
gggctccagg ctgctctgtt gggtgctgct ttgtctcctg ggagcaggcc cagtaaaggc 60
tggagtcact caaactccaa gatatctgat caaaacgaga ggacagcaag tgacactgag 120
ctgctcccct atctctgggc ataggagtgt atcctggtac caacagaccc caggacaggg 180
ccttcagttc ctctttgaat acttcagtga gacacagaga aacaaaggaa acttccctgg 240
tcgattctca gggcgccagt tctctaactc tcgctctgag atgaatgtga gcaccttgga 300
gctgggggac tcggcccttt atctttgcgc cagcagccgg acagggggcg taaagaattc 360
acccctccac tttgggaacg ggaccaggct cactgtgaca gaggacctga acaaggtgtt 420
cccacccgag gtcgctgtgt ttgagccatc agaagcagag atctcccaca cccaaaaggc 480
cacactggtg tgcctggcca caggcttctt ccctgaccac gtggagctga gctggtgggt 540
gaatgggaag gaggtgcaca gtggggtcag cacggacccg cagcccctca aggagcagcc 600
cgccctcaat gactccagat actgcctgag cagccgcctg agggtctcgg ccaccttctg 660
gcagaacccc cgcaaccact tccgctgtca agtccagttc tacgggctct cggagaatga 720
cgagtggacc caggataggg ccaaacccgt cacccagatc gtcagcgccg aggcctgggg 780
tagagcagac tgtggcttta cctcggtgtc ctaccagcaa ggggtcctgt ctgccaccat 840
cctctatgag atcctgctag ggaaggccac cctgtatgct gtgctggtca gcgcccttgt 900
gttgatggcc atggtcaaga gaaaggattt ctgaaggcag ccctggaagt ggagttagga 960
gcttctaacc cgtcatggtt tcaatacaca ttcttctttt gccagcgctt ctgaagagct 1020
gctctcacct ctctgcatcc caatagatat ccccctatgt gcatgcacac ctgcacactc 1080
acggctgaaa tctccctaac ccagggggac cttagcatgc ctaagtgact aaaccaataa 1140
aaatgttctg gtctggcctg aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1200
aaaaaaaaaa aaaaaaaaaa a 1221
<210> 5
<211> 1434
<212> DNA
<213> Homo sapiens
<400> 5
gatggccgtc atggcgcccc gaaccctcct cctgctactc tcgggggccc tggccctgac 60
ccagacctgg gcgggctccc actccatgag gtatttcttc acatccgtgt cccggcccgg 120
ccgcggggag ccccgcttca tcgccgtggg ctacgtggac gacacgcagt tcgtgcggtt 180
cgacagcgac gccgcgagcc agaagatgga gccgcgggcg ccgtggatag agcaggaggg 240
gccggagtat tgggaccagg agacacggaa tatgaaggcc cactcacaga ctgaccgagc 300
gaacctgggg accctgcgcg gctactacaa ccagagcgag gacggttctc acaccatcca 360
gataatgtat ggctgcgacg tggggccgga cgggcgcttc ctccgcgggt accggcagga 420
cgcctacgac ggcaaggatt acatcgccct gaacgaggac ctgcgctctt ggaccgcggc 480
ggacatggca gctcagatca ccaagcgcaa gtgggaggcg gtccatgcgg cggagcagcg 540
gagagtctac ctggagggcc ggtgcgtgga cgggctccgc agatacctgg agaacgggaa 600
ggagacgctg cagcgcacgg acccccccaa gacacatatg acccaccacc ccatctctga 660
ccatgaggcc accctgaggt gctgggccct gggcttctac cctgcggaga tcacactgac 720
ctggcagcgg gatggggagg accagaccca ggacacggag ctcgtggaga ccaggcctgc 780
aggggatgga accttccaga agtgggcggc tgtggtggtg ccttctggag aggagcagag 840
atacacctgc catgtgcagc atgagggtct gcccaagccc ctcaccctga gatgggagct 900
gtcttcccag cccaccatcc ccatcgtggg catcattgct ggcctggttc tccttggagc 960
tgtgatcact ggagctgtgg tcgctgccgt gatgtggagg aggaagagct cagatagaaa 1020
aggagggagt tacactcagg ctgcaagcag tgacagtgcc cagggctctg atgtgtctct 1080
cacagcttgt aaagtgtgag acagctgcct tgtgtgggac tgagaggcaa gagttgttcc 1140
tgcccttccc tttgtgactt gaagaaccct gactttgttt ctgcaaaggc acctgcatgt 1200
gtctgtgttc gtgtaggcat aatgtgagga ggtggggaga gcaccccacc cccatgtcca 1260
ccatgaccct cttcccacgc tgacctgtgc tccctctcca atcatctttc ctgttccaga 1320
gaggtggggc tgaggtgtct ccatctctgt ctcaacttca tggtgcactg agctgtaact 1380
tcttccttcc ctattaaaat tagaacctga gtataaaaaa aaaaaaaaaa aaaa 1434
<210> 6
<211> 4427
<212> DNA
<213> Homo sapiens
<400> 6
gtcagcgccc cccgcccggc gtctcccggg gccaggtcca ccctctgctg cgccacctgg 60
ggcatcctcc ttccccgttg ccagtctcga tccgccccgt cgttcctggc cctgggcttt 120
gccaccctat gctgacaccc cgtcccagtc ccccttacca ttccccttcg accaccccac 180
ttccgaattg gagccgcttc aactggccct gggcttagcc actctgtgct gaccactctg 240
ccccaggcct ccttaccatt ccccttcgac ctactctctt ccgcattgga gtcgctttaa 300
ctggccctgg ctttggcagc ctgtgctgac ccatgcagtc ctccttacca tccctccctc 360
gacttcccct cttccgatgt tgagcccctc cagccggtcc tggactttgt ctccttccct 420
gccctgccct ctcctgaacc tgagccagct cccatagctc agtctggtct atctgcctgg 480
ccctggccat tgtcactttg cgctgccctc ctctcgcccc cgagtgccct tgctgtgccg 540
ccggaactct gccctctaac gctgccgtct ctctcctgag tccggaccac tttgagctct 600
actggcttct gcgccgcctc tggcccactg tttccccttc ccaggcaggt cctgctttct 660
ctgacctgca ttctctcccc tgggcctgtg ccgctttctg tctgcagctt gtggcctggg 720
tcacctctac ggctggccca gatccttccc tgccgcctcc ttcaggttcc gtcttcctcc 780
actccctctt ccccttgctc tctgctgtgt tgctgcccaa ggatgctctt tccggagcac 840
ttccttctcg gcgctgcacc acgtgatgtc ctctgagcgg atcctccccg tgtctgggtc 900
ctctccgggc atctctcctc cctcacccaa ccccatgccg tcttcactcg ctgggttccc 960
ttttccttct ccttctgggg cctgtgccat ctctcgtttc ttaggatggc cttctccgac 1020
ggatgtctcc cttgcgtccc gcctcccctt cttgtaggcc tgcatcatca ccgtttttct 1080
ggacaacccc aaagtacccc gtctccctgg ctttagccac ctctccatcc tcttgctttc 1140
tttgcctgga caccccgttc tcctgtggat tcgggtcacc tctcactcct ttcatttggg 1200
cagctcccct acccccctta cctctctagt ctgtgctagc tcttccagcc ccctgtcatg 1260
gcatcttcca ggggtccgag agctcagcta gtcttcttcc tccaacccgg gcccctatgt 1320
ccacttcagg acagcatgtt tgctgcctcc agggatcctg tgtccccgag ctgggaccac 1380
cttatattcc cagggccggt taatgtggct ctggttctgg gtacttttat ctgtcccctc 1440
caccccacag tggggccact agggacagga ttggtgacag aaaagcccca tccttaggcc 1500
tcctccttcc tagtctcctg atattgggtc taacccccac ctcctgttag gcagattcct 1560
tatctggtga cacaccccca tttcctggag ccatctctct ccttgccaga acctctaagg 1620
tttgcttacg atggagccag agaggatcct gggagggaga gcttggcagg gggtgggagg 1680
gaaggggggg atgcgtgacc tgcccggttc tcagtggcca ccctgcgcta ccctctccca 1740
gaacctgagc tgctctgacg cggccgtctg gtgcgtttca ctgatcctgg tgctgcagct 1800
tccttacact tcccaagagg agaagcagtt tggaaaaaca aaatcagaat aagttggtcc 1860
tgagttctaa ctttggctct tcacctttct agtccccaat ttatattgtt cctccgtgcg 1920
tcagttttac ctgtgagata aggccagtag ccagccccgt cctggcaggg ctgtggtgag 1980
gaggggggtg tccgtgtgga aaactccctt tgtgagaatg gtgcgtccta ggtgttcacc 2040
aggtcgtggc cgcctctact ccctttctct ttctccatcc ttctttcctt aaagagtccc 2100
cagtgctatc tgggacatat tcctccgccc agagcagggt cccgcttccc taaggccctg 2160
ctctgggctt ctgggtttga gtccttggca agcccaggag aggcgctcag gcttccctgt 2220
cccccttcct cgtccaccat ctcatgcccc tggctctcct gccccttccc tacaggggtt 2280
cctggctctg ctcttcagac tgagccccgt tcccctgcat ccccgttccc ctgcatcccc 2340
cttcccctgc atcccccaga ggccccaggc cacctacttg gcctggaccc cacgagaggc 2400
caccccagcc ctgtctacca ggctgccttt tgggtggatt ctcctccaac tgtggggtga 2460
ctgcttggca aactcactct tcggggtatc ccaggaggcc tggagcattg gggtgggctg 2520
gggttcagag aggagggatt cccttctcag gttacgtggc caagaagcag gggagctggg 2580
tttgggtcag gtctgggtgt ggggtgacca gcttatgctg tttgcccagg acagcctagt 2640
tttagcactg aaaccctcag tcctaggaaa acagggatgg ttggtcactg tctctgggtg 2700
actcttgatt cccggccagt ttctccacct ggggctgtgt ttctcgtcct gcatccttct 2760
ccaggcaggt ccccaagcat cgcccccctg ctgtggctgt tcccaagttc ttagggtacc 2820
ccacgtgggt ttatcaacca cttggtgagg ctggtaccct gcccccattc ctgcacccca 2880
attgccttag tggctagggg gttgggggct agagtaggag gggctggagc caggattctt 2940
agggctgaac agagaagagc tgggggcctg ggctcctggg tttgagagag gaggggctgg 3000
ggcctggact cctgggtccg agggaggagg ggctggggcc tggactcctg ggtctgaggg 3060
tggagggact gggggcctgg actcctgggt ccgagggagg aggggctggg gcctggactc 3120
gtgggtctga gggaggaggg gctgggggcc tggacttctg ggtcttaggg aggcggggct 3180
gggcctggac ccctgggtct gaatggggag aggctggggg cctggactcc ttcatctgag 3240
ggcggaaggg ctggggcctg gcctcctggg ttgaatgggg aggggttggg cctggactct 3300
ggagtccctg gtgcccaggc ctcaggcatc tttcacaggg atgcctgtac tgggcaggtc 3360
cttgaaaggg aaaggcccat tgctctcctt gcccccctcc cctatcgcca tgacaactgg 3420
gtggaaataa acgagccgag ttcatcccgt tcccagggca cgtgcggccc cttcacagcc 3480
cgagtttcca tgacctcatg ctcttggccc tcgtagctcc ctcccgcctc ctccagatgg 3540
gcagctttgg agaggtgagg gacttggggg gtaatttatc ccgtggatct aggagtttag 3600
cttcactcct tcctcagctc cagttcaggt cccggagccc acccagtgtc cacaaggcct 3660
ggggcaagtc cctcctccga ccccctggac ttcggctttt gtccccccaa gttttggacc 3720
cctaagggaa gaatgagaaa cggtggcccg tgtcagcccc tggctgcagg gccccgtgca 3780
gagggggcct cagtgaactg gagtgtgaca gcctggggcc caggcacaca ggtgtgcagc 3840
tgtctcaccc ctctgggagt cccgcccagg cccctgagtc tgtcccagca cagggtggcc 3900
ttcctccacc ctgcatagcc ctgggcccac ggcttcgttc ctgcagagta tctgctgggg 3960
tggtttccga gcttgaccct tggaaggacc tggctgggtt taaggcagga ggggctgggg 4020
gccaggactc ctggctctga aggaggaggg gctggaacct cttccctagt ctgagcactg 4080
gaagcgccac ctgtgggtgg tgacgggggt tttgccgtgt ctaacaggta ccatgtgggg 4140
ttcccgcacc cagatgagaa gccccctccc ttccccgttc acttcctgtt tgcagatagc 4200
caggagtcct ttcgtggttt ccactgagca ctgaaggcct ggccggcctg accactgggc 4260
aaccaggcgt atcttaaaca gccagtggcc agaggctgtt gggtcatttt ccccactgtc 4320
ctagcaccgt gtccctggat ctgttttcgt ggctccctct ggagtcccga cttgctggga 4380
caccgtggct ggggtaggtg cggctgacgg ctgtttccca cccccag 4427
<210> 7
<211> 1707
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60
ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120
gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180
tttttcgcaa cgggtttgcc gccagaacac aggtgtcgtg acgcgggatc cgccaccatg 240
cttctcctgg tgacaagcct tctgctctgt gagttaccac acccagcatt cctcctgatc 300
ccagacatcc agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc 360
accatcagtt gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa 420
ccagatggaa ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca 480
tcaaggttca gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag 540
caagaagata ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga 600
ggggggacta agttggaaat aacaggctcc acctctggat ccggcaagcc cggatctggc 660
gagggatcca ccaagggcga ggtgaaactg caggagtcag gacctggcct ggtggcgccc 720
tcacagagcc tgtccgtcac atgcactgtc tcaggggtct cattacccga ctatggtgta 780
agctggattc gccagcctcc acgaaagggt ctggagtggc tgggagtaat atggggtagt 840
gaaaccacat actataattc agctctcaaa tccagactga ccatcatcaa ggacaactcc 900
aagagccaag ttttcttaaa aatgaacagt ctgcaaactg atgacacagc catttactac 960
tgtgccaaac attattacta cggtggtagc tatgctatgg actactgggg tcaaggaacc 1020
tcagtcaccg tctcctcagc ggccgcaatt gaagttatgt atcctcctcc ttacctagac 1080
aatgagaaga gcaatggaac cattatccat gtgaaaggga aacacctttg tccaagtccc 1140
ctatttcccg gaccttctaa gcccttttgg gtgctggtgg tggttggggg agtcctggct 1200
tgctatagct tgctagtaac agtggccttt attattttct gggtgaggag taagaggagc 1260
aggctcctgc acagtgacta catgaacatg actccccgcc gccccgggcc cacccgcaag 1320
cattaccagc cctatgcccc accacgcgac ttcgcagcct atcgctccag agtgaagttc 1380
agcaggagcg cagacgcccc cgcgtaccag cagggccaga accagctcta taacgagctc 1440
aatctaggac gaagagagga gtacgatgtt ttggacaaga gacgtggccg ggaccctgag 1500
atggggggaa agccgagaag gaagaaccct caggaaggcc tgtacaatga actgcagaaa 1560
gataagatgg cggaggccta cagtgagatt gggatgaaag gcgagcgccg gaggggcaag 1620
gggcacgatg gcctttacca gggtctcagt acagccacca aggacaccta cgacgccctt 1680
cacatgcagg ccctgccccc tcgctaa 1707
<210> 8
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 8
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala
85 90
<210> 9
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 9
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser
65 70 75 80
Gly Gly Ser
<210> 10
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser
65 70 75 80
Gly Gly Ser
<210> 11
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 11
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser
65 70 75 80
Gly Gly Ser
<210> 12
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser
65 70 75 80
Gly Gly Thr Gly Gly Ser
85
<210> 13
<211> 87
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 13
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Gly
65 70 75 80
Gly Ser Gly Gly Gly Gly Ser
85
<210> 14
<211> 95
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 14
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Lys Glu Ser
65 70 75 80
Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser Leu Asp
85 90 95
<210> 15
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<400> 15
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 16
<211> 1053
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Met Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 17
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 17
cgcuacucuc ucuuucuggc c 21
<210> 18
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 18
agcgcgagca cagcuaaggc c 21
<210> 19
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 19
uuuugucugu gauauacaca u 21
<210> 20
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
cuugacagcg gaagugguug c 21
<210> 21
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
ugggucaggg ccagggcccc c 21
<210> 22
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
cccugcucug ggcuucuggg u 21
<210> 23
<211> 1707
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60
ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120
gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180
tttttcgcaa cgggtttgcc gccagaacac aggtgtcgtg acgcgggatc cgccaccatg 240
cttctcctgg tgacaagcct tctgctctgt gagttaccac acccagcatt cctcctgatc 300
ccagacatcc agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc 360
accatcagtt gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa 420
ccagatggaa ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca 480
tcaaggttca gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag 540
caagaagata ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga 600
ggggggacta agttggaaat aacaggctcc acctctggat ccggcaagcc cggatctggc 660
gagggatcca ccaagggcga ggtgaaactg caggagtcag gacctggcct ggtggcgccc 720
tcacagagcc tgtccgtcac atgcactgtc tcaggggtct cattacccga ctatggtgta 780
agctggattc gccagcctcc acgaaagggt ctggagtggc tgggagtaat atggggtagt 840
gaaaccacat actataattc agctctcaaa tccagactga ccatcatcaa ggacaactcc 900
aagagccaag ttttcttaaa aatgaacagt ctgcaaactg atgacacagc catttactac 960
tgtgccaaac attattacta cggtggtagc tatgctatgg actactgggg tcaaggaacc 1020
tcagtcaccg tctcctcagc ggccgcaatt gaagttatgt atcctcctcc ttacctagac 1080
aatgagaaga gcaatggaac cattatccat gtgaaaggga aacacctttg tccaagtccc 1140
ctatttcccg gaccttctaa gcccttttgg gtgctggtgg tggttggggg agtcctggct 1200
tgctatagct tgctagtaac agtggccttt attattttct gggtgaggag taagaggagc 1260
aggctcctgc acagtgacta catgaacatg actccccgcc gccccgggcc cacccgcaag 1320
cattaccagc cctatgcccc accacgcgac ttcgcagcct atcgctccag agtgaagttc 1380
agcaggagcg cagacgcccc cgcgtaccag cagggccaga accagctcta taacgagctc 1440
aatctaggac gaagagagga gtacgatgtt ttggacaaga gacgtggccg ggaccctgag 1500
atggggggaa agccgagaag gaagaaccct caggaaggcc tgtacaatga actgcagaaa 1560
gataagatgg cggaggccta cagtgagatt gggatgaaag gcgagcgccg gaggggcaag 1620
gggcacgatg gcctttacca gggtctcagt acagccacca aggacaccta cgacgccctt 1680
cacatgcagg ccctgccccc tcgctaa 1707
<210> 24
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 24
tcttaagatc tttgctttcc cttctctata acttcgtata gcatacatta tacgaagtta 60
tattcgtct 69
<210> 25
<211> 1053
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Met Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 26
<211> 1053
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 27
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Met Asp Lys Lys Tyr Ser Ile Gly Leu Glu Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 28
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Met Asp Lys Lys Tyr Ser Ile Gly Leu Glu Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 29
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 29
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 30
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 30
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 31
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 31
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 32
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 32
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 33
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 34
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 35
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 36
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 36
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 37
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 38
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 38
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 39
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 39
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 40
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 41
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 41
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 42
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 43
<211> 1232
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
180 185 190
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
195 200 205
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
210 215 220
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
225 230 235 240
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
245 250 255
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
260 265 270
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
275 280 285
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
290 295 300
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
305 310 315 320
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
325 330 335
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
340 345 350
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
355 360 365
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
370 375 380
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
385 390 395 400
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
405 410 415
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
420 425 430
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
435 440 445
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
450 455 460
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
465 470 475 480
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
485 490 495
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
500 505 510
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
515 520 525
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
530 535 540
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
545 550 555 560
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
565 570 575
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
580 585 590
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
595 600 605
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
610 615 620
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
625 630 635 640
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
645 650 655
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
660 665 670
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
675 680 685
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
690 695 700
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
705 710 715 720
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala
725 730 735
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
740 745 750
Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe
755 760 765
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
770 775 780
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
785 790 795 800
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
805 810 815
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
820 825 830
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
835 840 845
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
850 855 860
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
865 870 875 880
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
885 890 895
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
900 905 910
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
915 920 925
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
930 935 940
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
945 950 955 960
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
965 970 975
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
980 985 990
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
995 1000 1005
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met
1010 1015 1020
Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu
1025 1030 1035
Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
1040 1045 1050
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
1055 1060 1065
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val
1070 1075 1080
Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
1085 1090 1095
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile
1100 1105 1110
Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
1115 1120 1125
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
1130 1135 1140
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
1145 1150 1155
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val
1160 1165 1170
Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
1175 1180 1185
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1190 1195 1200
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1205 1210 1215
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1220 1225 1230
<210> 44
<211> 1486
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 44
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val
180 185 190
Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys
195 200 205
His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp
210 215 220
His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr
225 230 235 240
Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser
245 250 255
Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn
260 265 270
Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr
275 280 285
Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His
290 295 300
Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys
305 310 315 320
Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala
325 330 335
Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr
340 345 350
Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile
355 360 365
Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys
370 375 380
His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His
385 390 395 400
Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile
405 410 415
Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr
420 425 430
Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala
435 440 445
Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile
450 455 460
Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg
465 470 475 480
Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser
485 490 495
Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe
500 505 510
Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala
515 520 525
Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe
530 535 540
Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His
545 550 555 560
Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu
565 570 575
Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu
580 585 590
Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys
595 600 605
Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His
610 615 620
Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln
625 630 635 640
Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu
645 650 655
Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp
660 665 670
Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro
675 680 685
Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro
690 695 700
Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala
705 710 715 720
Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe
725 730 735
Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly
740 745 750
Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly
755 760 765
Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile
770 775 780
Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr
785 790 795 800
His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu
805 810 815
Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys
820 825 830
Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr
835 840 845
Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser
850 855 860
Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser
865 870 875 880
Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu
885 890 895
Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp
900 905 910
Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp
915 920 925
Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp
930 935 940
Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu
945 950 955 960
Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg
965 970 975
Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp
980 985 990
Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr
995 1000 1005
Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
1010 1015 1020
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile
1025 1030 1035
Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro
1040 1045 1050
Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1055 1060 1065
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile
1070 1075 1080
Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val
1085 1090 1095
Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
1100 1105 1110
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys
1115 1120 1125
Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
1130 1135 1140
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile
1145 1150 1155
Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
1160 1165 1170
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
1175 1180 1185
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1190 1195 1200
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1205 1210 1215
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1220 1225 1230
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1235 1240 1245
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1250 1255 1260
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1265 1270 1275
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1280 1285 1290
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1295 1300 1305
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1310 1315 1320
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1325 1330 1335
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1340 1345 1350
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1355 1360 1365
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1370 1375 1380
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1385 1390 1395
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1400 1405 1410
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1415 1420 1425
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1430 1435 1440
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1445 1450 1455
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1460 1465 1470
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1475 1480 1485
<210> 45
<211> 1486
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val
180 185 190
Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys
195 200 205
His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp
210 215 220
His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr
225 230 235 240
Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser
245 250 255
Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn
260 265 270
Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr
275 280 285
Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His
290 295 300
Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys
305 310 315 320
Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala
325 330 335
Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr
340 345 350
Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile
355 360 365
Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys
370 375 380
His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His
385 390 395 400
Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile
405 410 415
Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr
420 425 430
Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala
435 440 445
Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile
450 455 460
Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg
465 470 475 480
Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser
485 490 495
Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe
500 505 510
Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala
515 520 525
Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe
530 535 540
Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His
545 550 555 560
Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu
565 570 575
Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu
580 585 590
Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys
595 600 605
Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His
610 615 620
Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln
625 630 635 640
Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu
645 650 655
Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp
660 665 670
Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro
675 680 685
Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro
690 695 700
Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala
705 710 715 720
Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe
725 730 735
Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly
740 745 750
Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly
755 760 765
Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile
770 775 780
Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr
785 790 795 800
His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu
805 810 815
Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys
820 825 830
Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr
835 840 845
Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser
850 855 860
Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser
865 870 875 880
Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu
885 890 895
Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp
900 905 910
Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp
915 920 925
Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp
930 935 940
Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu
945 950 955 960
Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg
965 970 975
Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp
980 985 990
Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr
995 1000 1005
Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
1010 1015 1020
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile
1025 1030 1035
Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro
1040 1045 1050
Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1055 1060 1065
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile
1070 1075 1080
Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val
1085 1090 1095
Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
1100 1105 1110
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys
1115 1120 1125
Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
1130 1135 1140
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile
1145 1150 1155
Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
1160 1165 1170
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
1175 1180 1185
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1190 1195 1200
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1205 1210 1215
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1220 1225 1230
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1235 1240 1245
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1250 1255 1260
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1265 1270 1275
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1280 1285 1290
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1295 1300 1305
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1310 1315 1320
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1325 1330 1335
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1340 1345 1350
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1355 1360 1365
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1370 1375 1380
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1385 1390 1395
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1400 1405 1410
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1415 1420 1425
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1430 1435 1440
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1445 1450 1455
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1460 1465 1470
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1475 1480 1485
<210> 46
<211> 1486
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val
180 185 190
Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys
195 200 205
His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp
210 215 220
His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr
225 230 235 240
Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser
245 250 255
Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn
260 265 270
Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr
275 280 285
Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His
290 295 300
Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys
305 310 315 320
Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala
325 330 335
Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr
340 345 350
Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile
355 360 365
Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys
370 375 380
His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His
385 390 395 400
Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile
405 410 415
Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr
420 425 430
Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala
435 440 445
Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile
450 455 460
Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg
465 470 475 480
Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser
485 490 495
Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe
500 505 510
Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala
515 520 525
Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe
530 535 540
Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His
545 550 555 560
Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu
565 570 575
Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu
580 585 590
Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys
595 600 605
Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His
610 615 620
Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln
625 630 635 640
Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu
645 650 655
Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp
660 665 670
Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro
675 680 685
Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro
690 695 700
Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala
705 710 715 720
Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe
725 730 735
Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly
740 745 750
Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly
755 760 765
Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile
770 775 780
Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr
785 790 795 800
His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu
805 810 815
Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys
820 825 830
Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr
835 840 845
Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser
850 855 860
Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser
865 870 875 880
Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu
885 890 895
Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp
900 905 910
Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp
915 920 925
Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp
930 935 940
Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu
945 950 955 960
Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg
965 970 975
Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp
980 985 990
Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr
995 1000 1005
Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
1010 1015 1020
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile
1025 1030 1035
Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro
1040 1045 1050
Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1055 1060 1065
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile
1070 1075 1080
Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val
1085 1090 1095
Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
1100 1105 1110
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys
1115 1120 1125
Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
1130 1135 1140
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile
1145 1150 1155
Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
1160 1165 1170
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
1175 1180 1185
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1190 1195 1200
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1205 1210 1215
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1220 1225 1230
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1235 1240 1245
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1250 1255 1260
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1265 1270 1275
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1280 1285 1290
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1295 1300 1305
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1310 1315 1320
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1325 1330 1335
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1340 1345 1350
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1355 1360 1365
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1370 1375 1380
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1385 1390 1395
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1400 1405 1410
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1415 1420 1425
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1430 1435 1440
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1445 1450 1455
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1460 1465 1470
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1475 1480 1485
<210> 47
<211> 1486
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 47
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val
180 185 190
Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys
195 200 205
His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp
210 215 220
His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr
225 230 235 240
Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser
245 250 255
Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn
260 265 270
Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr
275 280 285
Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His
290 295 300
Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys
305 310 315 320
Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala
325 330 335
Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr
340 345 350
Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile
355 360 365
Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys
370 375 380
His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His
385 390 395 400
Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile
405 410 415
Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr
420 425 430
Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala
435 440 445
Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile
450 455 460
Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg
465 470 475 480
Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser
485 490 495
Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe
500 505 510
Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala
515 520 525
Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe
530 535 540
Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His
545 550 555 560
Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu
565 570 575
Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu
580 585 590
Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys
595 600 605
Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His
610 615 620
Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln
625 630 635 640
Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu
645 650 655
Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp
660 665 670
Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro
675 680 685
Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro
690 695 700
Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala
705 710 715 720
Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe
725 730 735
Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly
740 745 750
Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly
755 760 765
Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile
770 775 780
Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr
785 790 795 800
His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu
805 810 815
Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys
820 825 830
Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr
835 840 845
Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser
850 855 860
Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser
865 870 875 880
Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu
885 890 895
Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp
900 905 910
Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp
915 920 925
Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp
930 935 940
Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu
945 950 955 960
Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg
965 970 975
Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp
980 985 990
Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr
995 1000 1005
Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
1010 1015 1020
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile
1025 1030 1035
Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro
1040 1045 1050
Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1055 1060 1065
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile
1070 1075 1080
Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val
1085 1090 1095
Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
1100 1105 1110
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys
1115 1120 1125
Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
1130 1135 1140
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile
1145 1150 1155
Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
1160 1165 1170
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
1175 1180 1185
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1190 1195 1200
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1205 1210 1215
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1220 1225 1230
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1235 1240 1245
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1250 1255 1260
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1265 1270 1275
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1280 1285 1290
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1295 1300 1305
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1310 1315 1320
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1325 1330 1335
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1340 1345 1350
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1355 1360 1365
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1370 1375 1380
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1385 1390 1395
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1400 1405 1410
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1415 1420 1425
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1430 1435 1440
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1445 1450 1455
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1460 1465 1470
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1475 1480 1485
<210> 48
<211> 1486
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val
180 185 190
Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys
195 200 205
His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp
210 215 220
His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr
225 230 235 240
Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser
245 250 255
Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn
260 265 270
Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr
275 280 285
Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His
290 295 300
Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys
305 310 315 320
Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala
325 330 335
Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr
340 345 350
Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile
355 360 365
Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys
370 375 380
His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His
385 390 395 400
Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile
405 410 415
Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr
420 425 430
Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala
435 440 445
Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile
450 455 460
Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg
465 470 475 480
Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser
485 490 495
Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe
500 505 510
Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala
515 520 525
Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe
530 535 540
Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His
545 550 555 560
Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu
565 570 575
Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu
580 585 590
Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys
595 600 605
Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His
610 615 620
Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln
625 630 635 640
Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu
645 650 655
Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp
660 665 670
Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro
675 680 685
Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro
690 695 700
Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala
705 710 715 720
Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe
725 730 735
Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly
740 745 750
Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly
755 760 765
Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile
770 775 780
Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr
785 790 795 800
His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu
805 810 815
Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys
820 825 830
Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr
835 840 845
Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser
850 855 860
Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser
865 870 875 880
Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu
885 890 895
Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp
900 905 910
Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp
915 920 925
Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp
930 935 940
Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu
945 950 955 960
Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg
965 970 975
Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp
980 985 990
Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr
995 1000 1005
Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
1010 1015 1020
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile
1025 1030 1035
Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro
1040 1045 1050
Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1055 1060 1065
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile
1070 1075 1080
Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val
1085 1090 1095
Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
1100 1105 1110
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys
1115 1120 1125
Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
1130 1135 1140
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile
1145 1150 1155
Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
1160 1165 1170
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
1175 1180 1185
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1190 1195 1200
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1205 1210 1215
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1220 1225 1230
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1235 1240 1245
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1250 1255 1260
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1265 1270 1275
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1280 1285 1290
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1295 1300 1305
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1310 1315 1320
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1325 1330 1335
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1340 1345 1350
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1355 1360 1365
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1370 1375 1380
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1385 1390 1395
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1400 1405 1410
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1415 1420 1425
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1430 1435 1440
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1445 1450 1455
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1460 1465 1470
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1475 1480 1485
<210> 49
<211> 1156
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr
85 90 95
Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys
100 105 110
Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp
115 120 125
Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp
130 135 140
Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr
145 150 155 160
Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr
165 170 175
Gly Gly Ser Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu
180 185 190
Val Lys Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys
195 200 205
Thr Leu Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu
210 215 220
Asn Leu Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr
225 230 235 240
Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys
245 250 255
Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val
260 265 270
Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln
275 280 285
Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser
290 295 300
Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu
305 310 315 320
Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg
325 330 335
Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys
340 345 350
Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly
355 360 365
Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn
370 375 380
His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser
385 390 395 400
Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala
405 410 415
Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val
420 425 430
Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser
435 440 445
Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His
450 455 460
Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val
465 470 475 480
Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp
485 490 495
Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu
500 505 510
Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn
515 520 525
Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp
530 535 540
Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu
545 550 555 560
Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln
565 570 575
Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp
580 585 590
Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu
595 600 605
Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp
610 615 620
Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser
625 630 635 640
Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg
645 650 655
Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro
660 665 670
Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser
675 680 685
Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys
690 695 700
Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg
705 710 715 720
Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr
725 730 735
Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe
740 745 750
Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys
755 760 765
Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr
770 775 780
Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr
785 790 795 800
Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr
805 810 815
Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn
820 825 830
Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu
835 840 845
Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly
850 855 860
Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln
865 870 875 880
Arg Thr Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly
885 890 895
Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met
900 905 910
Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp
915 920 925
Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly
930 935 940
Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp
945 950 955 960
Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu
965 970 975
Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly
980 985 990
Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys
995 1000 1005
Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu
1010 1015 1020
Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln
1025 1030 1035
Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu
1040 1045 1050
Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser
1055 1060 1065
Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro
1070 1075 1080
Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His
1085 1090 1095
Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
1100 1105 1110
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
1115 1120 1125
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe
1130 1135 1140
Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
1145 1150 1155
<210> 50
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 50
uaauuucuac ucuuguagau 20
<210> 51
<211> 1306
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Cas12a sequence
<400> 51
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu
450 455 460
Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu
465 470 475 480
Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser
485 490 495
Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe
500 505 510
Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu
515 520 525
Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp
530 535 540
Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly
545 550 555 560
Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala
565 570 575
Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met
580 585 590
Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser
595 600 605
Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro
610 615 620
Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu
625 630 635 640
Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr
645 650 655
Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu
660 665 670
Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys
675 680 685
Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys
690 695 700
Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile
705 710 715 720
Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr
725 730 735
Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly
740 745 750
His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe
755 760 765
Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala
770 775 780
Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg
785 790 795 800
Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro
805 810 815
Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg
820 825 830
Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val
835 840 845
Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr
850 855 860
Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala
865 870 875 880
Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys
885 890 895
Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn
900 905 910
Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln
915 920 925
Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp
930 935 940
Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val
945 950 955 960
Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His
965 970 975
Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu
980 985 990
Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys
995 1000 1005
Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val
1025 1030 1035
Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys
1040 1045 1050
Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr
1055 1060 1065
Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val
1070 1075 1080
Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu
1085 1090 1095
Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile
1100 1105 1110
Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1115 1120 1125
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu
1130 1135 1140
Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg
1145 1150 1155
Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1160 1165 1170
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys
1175 1180 1185
Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu
1190 1195 1200
Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile
1205 1210 1215
Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu
1220 1225 1230
Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe
1235 1240 1245
Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn
1265 1270 1275
His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser
1280 1285 1290
Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 52
<211> 977
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
CasX sequence
<400> 52
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val
195 200 205
Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu
225 230 235 240
Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys
245 250 255
Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly
260 265 270
Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys
305 310 315 320
Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 53
<211> 169
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
I-TevI nuclease domain and linker domain sequence
<400> 53
Met Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys Val
1 5 10 15
Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His Phe
20 25 30
Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg Ser
35 40 45
Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu Ile
50 55 60
Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile Lys
65 70 75 80
Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr Phe
85 90 95
Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys Lys
100 105 110
Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp Gly
115 120 125
Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp Asn
130 135 140
Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr Ser
145 150 155 160
Ala Tyr Thr Cys Ser Lys Cys Arg Asn
165
<210> 54
<211> 1052
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
CAS9 sequence
<400> 54
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 55
<211> 7
<212> PRT
<213> Simian virus 40
<400> 55
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 56
<211> 16
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Nucleoplasmin nuclear localization sequence
<400> 56
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 57
<211> 77
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
I-TevI linker fragment sequence
<400> 57
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn
65 70 75
<210> 58
<211> 93
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
ITev-I nuclease domain sequence
<400> 58
Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys
1 5 10 15
Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His
20 25 30
Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg
35 40 45
Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu
50 55 60
Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile
65 70 75 80
Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala
85 90
<210> 59
<211> 83
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
ITev-I linker domain sequence
<400> 59
Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu
1 5 10 15
Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu
20 25 30
Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn
35 40 45
Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg
50 55 60
Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser
65 70 75 80
Gly Gly Ser
<210> 60
<211> 1709
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
ttagcgaggg ggcagggcct gcatgtgaag ggcgtcgtag gtgtccttgg tggctgtact 60
gagaccctgg taaaggccat cgtgcccctt gcccctccgg cgctcgcctt tcatcccaat 120
ctcactgtag gcctccgcca tcttatcttt ctgcagttca ttgtacaggc cttcctgagg 180
gttcttcctt ctcggctttc cccccatctc agggtcccgg ccacgtctct tgtccaaaac 240
atcgtactcc tctcttcgtc ctagattgag ctcgttatag agctggttct ggccctgctg 300
gtacgcgggg gcgtctgcgc tcctgctgaa cttcactctg gagcgatagg ctgcgaagtc 360
gcgtggtggg gcatagggct ggtaatgctt gcgggtgggc ccggggcggc ggggagtcat 420
gttcatgtag tcactgtgca ggagcctgct cctcttactc ctcacccaga aaataataaa 480
ggccactgtt actagcaagc tatagcaagc caggactccc ccaaccacca ccagcaccca 540
aaagggctta gaaggtccgg gaaatagggg acttggacaa aggtgtttcc ctttcacatg 600
gataatggtt ccattgctct tctcattgtc taggtaagga ggaggataca taacttcaat 660
tgcggccgct gaggagacgg tgactgaggt tccttgaccc cagtagtcca tagcatagct 720
accaccgtag taataatgtt tggcacagta gtaaatggct gtgtcatcag tttgcagact 780
gttcattttt aagaaaactt ggctcttgga gttgtccttg atgatggtca gtctggattt 840
gagagctgaa ttatagtatg tggtttcact accccatatt actcccagcc actccagacc 900
ctttcgtgga ggctggcgaa tccagcttac accatagtcg ggtaatgaga cccctgagac 960
agtgcatgtg acggacaggc tctgtgaggg cgccaccagg ccaggtcctg actcctgcag 1020
tttcacctcg cccttggtgg atccctcgcc agatccgggc ttgccggatc cagaggtgga 1080
gcctgttatt tccaacttag tcccccctcc gaacgtgtac ggaagcgtat taccctgttg 1140
gcaaaagtaa gtggcaatat cttcttgctc caggttgcta atggtgagag aataatctgt 1200
tccagaccca ctgccactga accttgatgg gactcctgag tgtaatcttg atgtatggta 1260
gatcaggagt ttaacagttc catctggttt ctgctgatac caatttaaat atttactaat 1320
gtcctgactt gccctgcaac tgatggtgac tctgtctccc agagaggcag acagggagga 1380
tgtagtctgt gtcatctgga tgtctgggat caggaggaat gctgggtgtg gtaactcaca 1440
gagcagaagg cttgtcacca ggagaagcat ggtggcggat cccgcgtcac gacacctgtg 1500
ttctggcggc aaacccgttg cgaaaaagaa cgttcacggc gactactgca cttatatacg 1560
gttctccccc accctcggga aaaaggcgga gccagtacac gacatcactt tcccagttta 1620
ccccgcgcca ccttctctag gcaccggttc aattgccgac ccctcccccc aacttctcgg 1680
ggactgtggg cgatgtgcgc tctgccccc 1709
<210> 61
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 61
agacgaatat aacttcgtat aatgtatgct atacgaagtt atagagaagg gaaagcaaag 60
atcttaagac c 71
<210> 62
<211> 46
<212> DNA
<213> Homo sapiens
<400> 62
agagcagggt cccgcttccc taaggccctg ctctgggctt ctgggt 46
<210> 63
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 63
accacatcat atcttggttg caagggcctg ggctgggctt ctgggt 46
<210> 64
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 64
cccaggaacc atgcttccca ggctcccttg cccttggctt ctgggt 46
<210> 65
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 65
actgggagct ggtgctgtat catgcccctg ctctgagatt ctgggt 46
<210> 66
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 66
tgattgagct ttgcagcaaa tgttttcctt ctcttgactt ctgggt 46
<210> 67
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 67
ataacatgta gcaattataa aaattacctt ctctgaactt ctgggt 46
Claims (105)
- 변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 생체외 세포 집단에 투여하는 단계를 포함하는, 유전적으로 조작된 세포 조성물을 제조하는 방법.
- 제1항에 있어서, 세포 집단이 면역 세포 및 다분화능 세포 중 하나 이상을 포함하는 것인 방법.
- 제1항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 K26R 치환을 포함하는 것인 방법.
- 제1항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8을 포함하는 것인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 T95S, V117F, K135R, N140S 또는 Q158R로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 서열번호 9 내지 14, 또는 59로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함하는 것인 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
- 제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 D10A, D10E, H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
- 제12항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 D10E 치환을 포함하는 것인 방법.
- 제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 D10E, 및 H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
- 제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 D10A, 및 H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
- 제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 H557A, 및 N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8을 포함하고, 링커가 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함하는 것인 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인이 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 키메라 뉴클레아제가 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 것인 방법.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA로 전달되는 것인 방법.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 세포 집단이 면역 세포를 포함하는 것인 방법.
- 제22항에 있어서, 면역 세포가 T 세포인 방법.
- 제22항에 있어서, 면역 세포가 천연 킬러(NK) 세포인 방법.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 세포 집단이 다분화능 세포를 포함하는 것인 방법.
- 제25항에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.
- 제25항에 있어서, 다분화능 세포가 조혈 줄기 세포 또는 이의 전구체를 포함하는 것인 방법.
- 제25항에 있어서, 다분화능 세포가 중간엽 줄기 세포 또는 이의 전구체를 포함하는 것인 방법.
- 제25항에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.
- 제1항 내지 제29항 중 어느 한 항에 있어서, DNA 발현 카세트를 사용하여 상기 키메라 뉴클레아제를 표적 세포의 게놈 DNA로 전달하는 것인 방법.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 바이러스 벡터를 사용하지 않는 방법.
- 제1항 내지 제31항 중 어느 한 항에 있어서, 전기천공을 이용하여 상기 키메라 뉴클레아제를 상기 생체외 세포 집단에 투여하는 것인 방법.
- 제32항에 있어서, 전기천공을 1000 내지 2500 V의 전류에서 인가하는 것인 방법.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 공여자 DNA를 세포 집단에 투여하는 단계를 추가로 포함하는 방법.
- 제34항에 있어서, 상기 공여자 DNA가 관심 있는 외생성(exogenous) 유전자를 포함하는 것인 방법.
- 제34항 또는 제35항에 있어서, 공여자 DNA가 블런트 말단 및 2개의 뉴클레오타이드 3' 오버행 말단을 포함하는 것인 방법.
- 제34항 또는 제35항에 있어서, 공여자 DNA가 관심 있는 외생성 유전자를 플랭킹하는 5' 및 3' 상동성을 포함하는 것인 방법.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 키메라 뉴클레아제를 공여자 DNA의 부재 하에 투여하는 것인 방법.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 키메라 뉴클레아제가 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 규정된 길이의 게놈 DNA를 결실시키는 것인 방법.
- 제36항 또는 제37항에 있어서, 상기 외생성 유전자가 키메라 항원 수용체를 발현하는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제가 B2M 유전자, TRAC1 유전자, TRCB1 유전자, HLA-A 유전자 또는 HLA-B 유전자를 표적으로 하고 절단하는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 17 또는 서열번호 18, 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 B2M 유전자를 표적으로 하고 절단하는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 20 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 TRCB1 유전자를 표적으로 하는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 21 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 HLA-A 유전자를 표적으로 하고 절단하는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 22 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 AAVS1 유전자를 표적으로 하는 것인 방법.
- 제45항에 있어서, AAVS1 유전자가 외생성 공여자 DNA의 존재 하에 표적화되는 것인 방법.
- 제45항 또는 제46항에 있어서, 키메라 뉴클레아제가 AAVS1 유전자의 2개의 부위를 표적으로 하는 것인 방법.
- 제47항에 있어서, 외생성 공여자 DNA가 AAVS1 유전자의 2개의 표적화 부위 사이에 통합되는 것인 방법.
- 제1항 내지 제48항 중 어느 한 항에 있어서, 가이드 RNA가 비천연 뉴클레오사이드간 결합, 핵산 모방체(mimetic), 변형된 당 모이어티(moiety) 및 변형된 핵염기 중 하나 이상을 포함하는 것인 방법.
- 제49항에 있어서, 비천연 뉴클레오사이드간 결합이 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함하는 것인 방법.
- 제49항에 있어서, 핵산 모방체가 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제49항에 있어서, 변형된 당 모이어티가 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제49항에 있어서, 변형된 핵염기가 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 CasX 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
- 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 Cas12 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
- 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 Cas9 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
- 제54항 또는 제55항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 V117에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 V117F에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커가 서열번호 53의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커가 서열번호 53의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K135R 및 N140S에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커가 서열번호 53의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제64항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 53의 잔기 1 내지 92, 및 임의로 T11V, V16I, N14G, E25D, K26R, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I에 상응하는 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제56항 중 어느 한 항에 있어서, I-TevI 링커 도메인이 서열번호 53의 잔기 93 내지 169, 및 임의로 T95S, S101Y, V117F, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 및 S165G로 구성된 군으로부터 선택된 적어도 하나의 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제56항 중 어느 한 항에 있어서, (a) 변형된 I-TevI 뉴클레아제 도메인이 서열번호 53의 잔기 1 내지 92, 및 임의로 T11V, V16I, N14G, E25D, K26R, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I에 상응하는 변형을 포함하고; (b) I-TevI 링커 도메인이 서열번호 53의 잔기 93 내지 169, 및 임의로 T95S, S101Y, V117F, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 및 S165G로 구성된 군으로부터 선택된 적어도 하나의 변형을 포함하는 것인 키메라 뉴클레아제.
- 제54항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, CasX 폴리펩티드가 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제54항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, CasX 폴리펩티드가 델타프로테오박테리아(Deltaproteobacteria)로부터 유래한 것인 키메라 뉴클레아제.
- 제55항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, Cas12 폴리펩티드가 아시다미노코커스(Acidaminococcus) 종 BV3L6으로부터 유래한 것인 키메라 뉴클레아제.
- 제55항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, Cas12 폴리펩티드가 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 서열번호 15와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스타필로코커스 아우레우스로부터 유래한 것인 키메라 뉴클레아제.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 도메인이 D10A, D10E, H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 서열번호 27 또는 28과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터 유래한 것인 키메라 뉴클레아제.
- 제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 도메인이 D10A, D10E, D1135E, R1335Q, T1337R 및 H840A로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 야생형 스트렙토코커스 피오게네스 Cas9 서열을 포함하는 것인 방법.
- 제55항 내지 제64항 중 어느 한 항에 있어서, 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 키메라 뉴클레아제.
- 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드, 및 임의적 가이드 RNA를 포함하는 키메라 뉴클레아제로서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K26R, T95S 및 Q158R에 상응하는 적어도 하나의 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드가 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
- 제81항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제81항 또는 제82항에 있어서, 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
- 제81항 내지 제83항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스타필로코커스 아우레우스로부터 유래한 것인 키메라 뉴클레아제.
- 제54항 내지 제84항 중 어느 한 항에 있어서, 핵 국소화 신호가 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제84항 중 어느 한 항에 있어서, 핵 국소화 신호가 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민(Nucleoplasmin) 핵 국소화 신호를 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제86항 중 어느 한 항에 있어서, 변형된 I-TevI 링커 도메인이 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제54항 내지 제87항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
- 제49항 내지 제82항 중 어느 한 항에 있어서, 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 키메라 뉴클레아제.
- 제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 포유동물 세포에서 게놈 표적을 표적으로 하는 것인 키메라 뉴클레아제.
- 제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 포유동물 세포에서 발암성 돌연변이를 표적으로 하는 것인 키메라 뉴클레아제.
- 제91항에 있어서, 포유동물 세포가 인간 세포인 키메라 뉴클레아제.
- 제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 박테리아 또는 바이러스 서열을 표적으로 하는 것인 키메라 뉴클레아제.
- 제49항 내지 제93항 중 어느 한 항에 있어서, 가이드 RNA가 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제94항에 있어서, 비천연 뉴클레오사이드간 결합이 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제94항에 있어서, 핵산 모방체가 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제94항에 있어서, 변형된 당 모이어티가 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제94항에 있어서, 변형된 핵염기가 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
- 제49항 내지 제93항 중 어느 한 항의 키메라 뉴클레아제 및/또는 가이드 RNA를 코딩하는 핵산 또는 복수의 핵산.
- 제99항에 있어서, 키메라 뉴클레아제 및/또는 가이드 RNA가 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된 것인 핵산.
- 제99항 또는 제100항에 있어서, 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터인 핵산.
- 제49항 내지 제98항 중 어느 한 항에 있어서, 개체에게 투여되도록 제제화된 키메라 뉴클레아제.
- 제49항 내지 제98항 중 어느 한 항의 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물.
- 지질 나노입자에 캡슐화된 제49항 내지 제98항 중 어느 한 항의 키메라 뉴클레아제를 포함하는 조성물.
- 제104항에 있어서, 지질 나노입자가 양이온성 지질 및/또는 중성 지질을 포함하는 것인 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063109396P | 2020-11-04 | 2020-11-04 | |
US63/109,396 | 2020-11-04 | ||
PCT/IB2021/060236 WO2022097070A1 (en) | 2020-11-04 | 2021-11-04 | Gene editing with a modified endonuclease |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230131178A true KR20230131178A (ko) | 2023-09-12 |
Family
ID=81457007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237018690A KR20230131178A (ko) | 2020-11-04 | 2021-11-04 | 변형된 엔도뉴클레아제를 사용한 유전자 편집 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240150796A1 (ko) |
EP (1) | EP4240839A4 (ko) |
JP (1) | JP2023548391A (ko) |
KR (1) | KR20230131178A (ko) |
CN (1) | CN116669775A (ko) |
AU (1) | AU2021373368A1 (ko) |
CA (1) | CA3197414A1 (ko) |
IL (1) | IL302583A (ko) |
WO (1) | WO2022097070A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2600568B (en) * | 2019-05-03 | 2024-07-31 | Specific Biologics Inc | Lipid-encapsulated dual-cleaving endonuclease for DNA and gene editing |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014121222A1 (en) * | 2013-02-01 | 2014-08-07 | The University Of Western Ontario | Endonuclease for genome editing |
WO2020118435A1 (en) * | 2018-12-11 | 2020-06-18 | University Of Western Ontario | Cis conjugative plasmid system |
GB2600568B (en) * | 2019-05-03 | 2024-07-31 | Specific Biologics Inc | Lipid-encapsulated dual-cleaving endonuclease for DNA and gene editing |
IL307206A (en) * | 2021-03-26 | 2023-11-01 | Specific Biologics Inc | Targeting oncogenetic mutations with a double-cutting endonuclease |
-
2021
- 2021-11-04 KR KR1020237018690A patent/KR20230131178A/ko unknown
- 2021-11-04 EP EP21888799.0A patent/EP4240839A4/en active Pending
- 2021-11-04 WO PCT/IB2021/060236 patent/WO2022097070A1/en active Application Filing
- 2021-11-04 IL IL302583A patent/IL302583A/en unknown
- 2021-11-04 CN CN202180089299.0A patent/CN116669775A/zh active Pending
- 2021-11-04 AU AU2021373368A patent/AU2021373368A1/en active Pending
- 2021-11-04 CA CA3197414A patent/CA3197414A1/en active Pending
- 2021-11-04 JP JP2023527313A patent/JP2023548391A/ja active Pending
-
2023
- 2023-05-02 US US18/310,587 patent/US20240150796A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021373368A9 (en) | 2024-06-13 |
IL302583A (en) | 2023-07-01 |
JP2023548391A (ja) | 2023-11-16 |
EP4240839A4 (en) | 2024-09-18 |
WO2022097070A9 (en) | 2022-12-15 |
EP4240839A1 (en) | 2023-09-13 |
CN116669775A (zh) | 2023-08-29 |
US20240150796A1 (en) | 2024-05-09 |
AU2021373368A1 (en) | 2023-06-22 |
WO2022097070A1 (en) | 2022-05-12 |
CA3197414A1 (en) | 2022-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113383018B (zh) | 同种异体细胞组合物和使用方法 | |
JP7101419B2 (ja) | 内因性t細胞受容体の標的置換 | |
US20180214485A1 (en) | Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases | |
JP2024023294A (ja) | 遺伝子編集のためのcpf1関連方法及び組成物 | |
KR20210075086A (ko) | 범용 공여자 세포 | |
KR20200133218A (ko) | 개선된 면역요법을 위한 유전자-조절 조성물 및 방법 | |
JP2019532644A (ja) | Rna誘導型核酸修飾酵素及びその使用方法 | |
KR20210091160A (ko) | 면역요법을 위한 조성물 및 방법 | |
JP2022519595A (ja) | 免疫療法の改善のための遺伝子標的の組み合わせ | |
KR20200130826A (ko) | 개선된 면역요법을 위한 유전자-조절 조성물 및 방법 | |
KR20170117555A (ko) | 키메라 단백질 | |
AU2018264636B2 (en) | Artificially manipulated immune cell | |
KR20200133219A (ko) | 개선된 면역요법을 위한 유전자-조절 조성물 및 방법 | |
JP2022547505A (ja) | ユニバーサルドナー細胞 | |
KR20220058579A (ko) | 보편적 공여자 세포 | |
KR20230152689A (ko) | 유전자 침묵 | |
KR20210010555A (ko) | 약물 저항성 면역 세포 및 그의 사용 방법 | |
KR20220044266A (ko) | 조정 가능한 조절을 위한 ca2 조성물 및 방법 | |
US20240150796A1 (en) | Gene editing with a modified endonuclease | |
WO2022269393A1 (en) | Engineered cells with improved protection from natural killer cell killing | |
KR20230125806A (ko) | 선천성 근이영양증의 치료를 위한 치료용 lama2 페이로드 | |
CA3196346A1 (en) | Methods and compositions for cellular therapy | |
WO2023233342A2 (en) | Gene-edited natural killer cells | |
WO2022104344A2 (en) | Knock-in of large dna for long-term high genomic expression | |
KR20220022110A (ko) | 개선된 인자 viii 발현을 사용한, a형 혈우병을 위한 유전자 편집 |