KR20200095462A - Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 - Google Patents
Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR20200095462A KR20200095462A KR1020207012240A KR20207012240A KR20200095462A KR 20200095462 A KR20200095462 A KR 20200095462A KR 1020207012240 A KR1020207012240 A KR 1020207012240A KR 20207012240 A KR20207012240 A KR 20207012240A KR 20200095462 A KR20200095462 A KR 20200095462A
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- seq
- capsid protein
- protein corresponding
- gly
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 150
- 101150013707 HBB gene Proteins 0.000 title claims abstract description 144
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 18
- 239000000203 mixture Substances 0.000 title abstract description 20
- 102100021519 Hemoglobin subunit beta Human genes 0.000 claims abstract description 319
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims abstract description 302
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 154
- 230000035772 mutation Effects 0.000 claims abstract description 79
- 238000004806 packaging method and process Methods 0.000 claims abstract description 53
- 108091005904 Hemoglobin subunit beta Proteins 0.000 claims abstract description 24
- 206010064571 Gene mutation Diseases 0.000 claims abstract description 14
- 150000001413 amino acids Chemical class 0.000 claims description 951
- 108090000565 Capsid Proteins Proteins 0.000 claims description 465
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 465
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 433
- 239000002773 nucleotide Substances 0.000 claims description 330
- 125000003729 nucleotide group Chemical group 0.000 claims description 330
- 108091026890 Coding region Proteins 0.000 claims description 263
- 239000013598 vector Substances 0.000 claims description 180
- 210000004027 cell Anatomy 0.000 claims description 135
- 230000010354 integration Effects 0.000 claims description 60
- 210000000234 capsid Anatomy 0.000 claims description 58
- 230000037430 deletion Effects 0.000 claims description 51
- 238000012217 deletion Methods 0.000 claims description 51
- 210000000130 stem cell Anatomy 0.000 claims description 40
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 38
- 102000004169 proteins and genes Human genes 0.000 claims description 38
- 101710163270 Nuclease Proteins 0.000 claims description 36
- 230000008488 polyadenylation Effects 0.000 claims description 36
- 108091081024 Start codon Proteins 0.000 claims description 35
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 33
- 241000700605 Viruses Species 0.000 claims description 32
- 208000007056 sickle cell anemia Diseases 0.000 claims description 32
- 238000010361 transduction Methods 0.000 claims description 32
- 241000282414 Homo sapiens Species 0.000 claims description 31
- 210000003743 erythrocyte Anatomy 0.000 claims description 29
- 108700028369 Alleles Proteins 0.000 claims description 26
- 108020004705 Codon Proteins 0.000 claims description 26
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 claims description 26
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 claims description 26
- 108700024394 Exon Proteins 0.000 claims description 25
- 238000012937 correction Methods 0.000 claims description 25
- 238000003780 insertion Methods 0.000 claims description 25
- 230000026683 transduction Effects 0.000 claims description 25
- 230000037431 insertion Effects 0.000 claims description 23
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 22
- 238000000338 in vitro Methods 0.000 claims description 18
- 201000010099 disease Diseases 0.000 claims description 17
- 208000035475 disorder Diseases 0.000 claims description 16
- 241000700584 Simplexvirus Species 0.000 claims description 14
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 claims description 13
- 239000013612 plasmid Substances 0.000 claims description 13
- 241000701161 unidentified adenovirus Species 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 claims description 11
- 210000003705 ribosome Anatomy 0.000 claims description 11
- 238000001890 transfection Methods 0.000 claims description 11
- 230000004075 alteration Effects 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 241000701022 Cytomegalovirus Species 0.000 claims description 7
- 210000001778 pluripotent stem cell Anatomy 0.000 claims description 7
- 230000002463 transducing effect Effects 0.000 claims description 7
- 239000013603 viral vector Substances 0.000 claims description 7
- 108091008146 restriction endonucleases Proteins 0.000 claims description 6
- 208000002903 Thalassemia Diseases 0.000 claims description 5
- 241000700618 Vaccinia virus Species 0.000 claims description 4
- 241001529453 unidentified herpesvirus Species 0.000 claims description 4
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 claims description 3
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 claims description 3
- 101150027427 ICP4 gene Proteins 0.000 claims description 3
- 101150068034 UL30 gene Proteins 0.000 claims description 3
- 101150099321 UL42 gene Proteins 0.000 claims description 3
- 108010067390 Viral Proteins Proteins 0.000 claims description 3
- 239000008194 pharmaceutical composition Substances 0.000 claims description 3
- 108091027963 non-coding RNA Proteins 0.000 claims description 2
- 102000042567 non-coding RNA Human genes 0.000 claims description 2
- 230000010076 replication Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 19
- 230000001915 proofreading effect Effects 0.000 claims 2
- 230000008485 antagonism Effects 0.000 claims 1
- 229940024606 amino acid Drugs 0.000 description 458
- 235000001014 amino acid Nutrition 0.000 description 458
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 70
- 239000013615 primer Substances 0.000 description 39
- 108090000765 processed proteins & peptides Proteins 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 37
- 108091092195 Intron Proteins 0.000 description 23
- 108010079364 N-glycylalanine Proteins 0.000 description 23
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 23
- 235000018102 proteins Nutrition 0.000 description 19
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 17
- 208000005980 beta thalassemia Diseases 0.000 description 17
- 230000006801 homologous recombination Effects 0.000 description 17
- 238000002744 homologous recombination Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 16
- 108020003175 receptors Proteins 0.000 description 16
- 102000005962 receptors Human genes 0.000 description 16
- 239000000523 sample Substances 0.000 description 16
- 108091006047 fluorescent proteins Proteins 0.000 description 13
- 102000034287 fluorescent proteins Human genes 0.000 description 13
- 101100220044 Homo sapiens CD34 gene Proteins 0.000 description 12
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 11
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 11
- 238000004925 denaturation Methods 0.000 description 11
- 230000036425 denaturation Effects 0.000 description 11
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 108010092854 aspartyllysine Proteins 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 108010015796 prolylisoleucine Proteins 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 10
- 201000011510 cancer Diseases 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 238000007481 next generation sequencing Methods 0.000 description 9
- 101100230565 Homo sapiens HBB gene Proteins 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 210000004369 blood Anatomy 0.000 description 8
- 239000008280 blood Substances 0.000 description 8
- 238000010362 genome editing Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 239000013607 AAV vector Substances 0.000 description 6
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 6
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 6
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 6
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 6
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 6
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 6
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 6
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 6
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 6
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 6
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 6
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 6
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 6
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 6
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 6
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 6
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 6
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 6
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 6
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 6
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 6
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 6
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 6
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 6
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 6
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 6
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 6
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 6
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 6
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 6
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 6
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 6
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 6
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 6
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 6
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 6
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 6
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 6
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 6
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 6
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 6
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 6
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 6
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 6
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 6
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 6
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 6
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 6
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 6
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 6
- 108010054147 Hemoglobins Proteins 0.000 description 6
- 102000001554 Hemoglobins Human genes 0.000 description 6
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 6
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 6
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 6
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 6
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 6
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 6
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 6
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 6
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 6
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 6
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 6
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 6
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 6
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 6
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 6
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 6
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 6
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 6
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 6
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 6
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 6
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 6
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 6
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 6
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 6
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 6
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 6
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 6
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 6
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 6
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 6
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 6
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 6
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 6
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 6
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 6
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 6
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 6
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 6
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 6
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 6
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 6
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- 238000000137 annealing Methods 0.000 description 6
- 210000001185 bone marrow Anatomy 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 108060003196 globin Proteins 0.000 description 6
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 6
- 108010040030 histidinoalanine Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 6
- 239000002953 phosphate buffered saline Substances 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 6
- 108010038745 tryptophylglycine Proteins 0.000 description 6
- 108010045269 tryptophyltryptophan Proteins 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 108020005345 3' Untranslated Regions Proteins 0.000 description 5
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 5
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 5
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 5
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 5
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 5
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 5
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 5
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 5
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 5
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 5
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 5
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 5
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 5
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 5
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 5
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 5
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 5
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 5
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 5
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 5
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 5
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 5
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 5
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 5
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 5
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 5
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 5
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 5
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 5
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 5
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 5
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 5
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 5
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 5
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 5
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 5
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 5
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 5
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 5
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 5
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 5
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 5
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 5
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 5
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 5
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 5
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 5
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 5
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 5
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 5
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 5
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 5
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 5
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 5
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 5
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 5
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 5
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 5
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 5
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 5
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 5
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 5
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 5
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 5
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 5
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 5
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 5
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 5
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 5
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 5
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 5
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 5
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 5
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 5
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 5
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 5
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 5
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 5
- 108010079005 RDV peptide Proteins 0.000 description 5
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 5
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 5
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 5
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 5
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 5
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 5
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 5
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 5
- 208000018020 Sickle cell-beta-thalassemia disease syndrome Diseases 0.000 description 5
- 206010043391 Thalassaemia beta Diseases 0.000 description 5
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 5
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 5
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 5
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 5
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 5
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 5
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 5
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 5
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 5
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 5
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 5
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 5
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 5
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 5
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 5
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 5
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 5
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 5
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 5
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 5
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 5
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 5
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 5
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 230000000735 allogeneic effect Effects 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 238000007847 digital PCR Methods 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 108010012058 leucyltyrosine Proteins 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 108010024607 phenylalanylalanine Proteins 0.000 description 5
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 102100039894 Hemoglobin subunit delta Human genes 0.000 description 4
- 102100030826 Hemoglobin subunit epsilon Human genes 0.000 description 4
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 4
- 239000007760 Iscove's Modified Dulbecco's Medium Substances 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- 229930182816 L-glutamine Natural products 0.000 description 4
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 108020005067 RNA Splice Sites Proteins 0.000 description 4
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 4
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 4
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 239000012894 fetal calf serum Substances 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 3
- 239000012124 Opti-MEM Substances 0.000 description 3
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 3
- 239000007984 Tris EDTA buffer Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- -1 amino acid glutamate Chemical class 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 229960003237 betaine Drugs 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical group P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007860 single-cell PCR Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 2
- 108010082126 Alanine transaminase Proteins 0.000 description 2
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 2
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 2
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- 101710197658 Capsid protein VP1 Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical group NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- 208000009329 Graft vs Host Disease Diseases 0.000 description 2
- 206010018901 Haemoglobinaemia Diseases 0.000 description 2
- 108091005903 Hemoglobin subunit delta Proteins 0.000 description 2
- 108091005879 Hemoglobin subunit epsilon Proteins 0.000 description 2
- 102100038614 Hemoglobin subunit gamma-1 Human genes 0.000 description 2
- 101001031977 Homo sapiens Hemoglobin subunit gamma-1 Proteins 0.000 description 2
- 101001031961 Homo sapiens Hemoglobin subunit gamma-2 Proteins 0.000 description 2
- 101001033279 Homo sapiens Interleukin-3 Proteins 0.000 description 2
- 101000716729 Homo sapiens Kit ligand Proteins 0.000 description 2
- 101100314013 Homo sapiens TMEM158 gene Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 108091036407 Polyadenylation Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 101710108545 Viral protein 1 Proteins 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 238000010322 bone marrow transplantation Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000011260 co-administration Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 210000004700 fetal blood Anatomy 0.000 description 2
- 230000009395 genetic defect Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 208000024908 graft versus host disease Diseases 0.000 description 2
- 102000055276 human IL3 Human genes 0.000 description 2
- 102000055151 human KITLG Human genes 0.000 description 2
- 102000052895 human PPP1R12C Human genes 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- VEVMUSLHHIEHRV-IMWIMMFESA-N (2r)-2-[[(4s)-4-[(2-aminoacetyl)amino]-4-carboxybutanoyl]amino]-3-hydroxy-3-(hydroxymethyl)-4-(4-nitrophenoxy)-2-(sulfanylmethyl)butanoic acid Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(=O)N[C@@](CS)(C(O)=O)C(O)(CO)COC1=CC=C([N+]([O-])=O)C=C1 VEVMUSLHHIEHRV-IMWIMMFESA-N 0.000 description 1
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000214054 Equine rhinitis A virus Species 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 241001663880 Gammaretrovirus Species 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 description 1
- 101000958041 Homo sapiens Musculin Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 206010061216 Infarction Diseases 0.000 description 1
- 206010065973 Iron Overload Diseases 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241001672814 Porcine teschovirus 1 Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- 240000007591 Tilia tomentosa Species 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102100033036 Transmembrane protein 158 Human genes 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 208000025341 autosomal recessive disease Diseases 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 230000036770 blood supply Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000002655 chelation therapy Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 231100000001 growth retardation Toxicity 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000034737 hemoglobinopathy Diseases 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 102000052611 human IL6 Human genes 0.000 description 1
- 102000046949 human MSC Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000007574 infarction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 231100000636 lethal dose Toxicity 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 210000003643 myeloid progenitor cell Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000012053 oil suspension Substances 0.000 description 1
- 230000008816 organ damage Effects 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108010005364 ribosome receptor Proteins 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000003319 supportive effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/761—Adenovirus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0016—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/075—Adenoviridae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/795—Porphyrin- or corrin-ring-containing peptides
- C07K14/805—Haemoglobins; Myoglobins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/12—Animals modified by administration of exogenous cells
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0381—Animal model for diseases of the hematopoietic system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Developmental Biology & Embryology (AREA)
- Immunology (AREA)
- Diabetes (AREA)
- Hematology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
베타 글로빈 유전자(HBB) 유전자에서 돌연변이를 교정하기 위한 아데노-연관 바이러스(AAV: adeno-associated virus) 조성물 및 이를 사용하여 세포에서 HBB 유전자 돌연변이를 교정하는 방법이 본원에 제공된다. 또한 아데노-연관 바이러스 조성물 제조용 패키징 시스템이 제공된다.
Description
관련 출원의 교차 참조
이 출원은 2017년 10월 18일자로 출원된 미국 임시 출원 제62/574,163호; 및 2018년 1월 24일자로 출원된 미국 임시 출원 제62/621, 102호의 이익을 주장하며, 이들 각각은 그 전체 내용이 본원에 인용되어 포함된다.
서열 목록
본 출원은 606107_HMT-023PC_Sequence_Listing_ST25.txt라는 ASCII 형식으로 2018년 10월 12일자로 전자적으로 제출된 서열 목록을 포함하며, 크기는 200,630 바이트이다. 서열 목록은 그 전체 내용이 본원에 인용되어 포함된다.
정부 이익의 진술
본 발명은 국립 보건원(National Institutes of Health)에 의해 수여된 승인 번호 제P30CA033572호 하에서 정부 지원으로 이루어졌다. 정부는 본 발명에서 특정 권리를 갖는다.
혈색소병증은 헤모글로빈 단백질의 생산, 구조 및/또는 기능이 비정상인 유전적 장애의 패밀리(family)를 포함한다. 헤모글로빈 단백질은 적혈구의 건조 중량의 대략 97 %를 구성하며 혈액의 산소 운반 능력을 약 70 배 증가시킨다. 주요 성인 헤모글로빈 단백질은 2개의 알파 글로빈(HBA) 서브유닛, 2개의 베타 글로빈(HBB) 서브유닛, 및 각 서브유닛과 연관된 헴(heme) 그룹으로 구성된다. 염색체 11에 대한 HBB의 유전적 결함은 겸상세포질환(SCD: sickle cell disease) 및 베타 지중해빈혈증과 같은 특정 혈색소병증을 유발할 수 있다.
겸상세포빈혈이라고도 하는 겸상세포질환은 대략 100,000 명의 미국인에게 영향을 미치는 상염색체 열성 질환이다. 이는 아프리카계 미국인들 사이에서 널리 퍼져 있지만 다른 인종 그룹에도 존재한다. 서부 및 중앙 아프리카에서는 모든 아기의 1 내지 2%가 SCD에 걸린 채 태어난다. SCD는 HBB의 코딩 서열에서 뉴클레오티드 20에서 동형 접합 돌연변이에 의해 야기된다. 이 돌연변이는 음으로 하전된 아미노산 글루타메이트(GAG에 의해 코딩됨)를 성숙한 베타 글로빈의 6 번째 아미노산에서 중성, 소수성 잔기 발린(GUG에 의해 인코딩됨)으로 대체한다. SCD 돌연변이를 갖는 베타 글로빈 사슬을 함유하는 헤모글로빈은 적혈구의 모양을 왜곡하는 다가닥 중합체로 응집되는 경향이 있어서, 이들 세포를 부서지기 쉽고 초승달 또는 겸상같은 형상이 되도록 한다. 이러한 비정상적 적혈구는 용혈을 위해 더 많이 배치되며 조직과 기관에 더 적은 산소를 전달한다. 더욱이, 헤모글로빈 응집은 적혈구를 강성이 되도록 하고 작은 혈관에 용이하게 유지시켜 혈류를 감소시키고 혈관 폐색을 야기한다. 그 결과, SCD 환자는 빈혈과 "위기"라고 불리는 통증 단계(episode)를 겪으며, 위기 동안의 기관 손상은 SCD와 연관된 사망률 및 이환율의 주요 원인이다. 특히, 뼈, 비장, 신장 및 폐의 경색(즉, 부족한 혈액 공급으로 인한 조직의 괴사)이 특히 일반적이다. 이에 반하여, 겸상세포 돌연변이에 대해 이형 접합 성인들은 대체로 무증상이다.
베타 지중해빈혈증은 전 세계 10 만 명 중 약 1 명과 유럽 연합의 1 만 명 중 약 1 명에 영향을 미친다. 베타 지중해빈혈증은 HBB에서 베타 글로빈의 발현을 감소시키는 다양한 돌연변이에 의해 유발된 장애 그룹이다. 지금까지, 치환, 삽입 및 결실을 포함한 884 개의 상이한 돌연변이가 베타 지중해빈혈증(HbVar 데이터베이스)에서 확인되었다. 이러한 돌연변이는 HBB의 게놈 유전자좌 전체에 위치된다. 치환, 삽입 및 작은 결실 중에서, 병원성 변이체는 5' UTR의 상류 및 3' UTR로 발견되었다. 이들 공지된 884 개 돌연변이 이외에, 추가의 변이체는 HBB 서열의 특정 변이와 연계할 때만 병원성일 수 있다. 베타 지중해빈혈증 돌연변이는 유전자 전사, RNA 가공, 전사 후 변형, mRNA의 번역 등에 영향을 줄 수 있다. 베타 지중해빈혈증은 중증도에서 매우 가변적이며, 일부 HBB 돌연변이는 베타 글로빈 생산의 완전한 손실을 초래하며 기타 HBB 돌연변이는 베타 글로빈 양의 감소만 초래한다. 두 대립 유전자 모두에서 종종 HBB 돌연변이를 갖는 중증의 베타 지중해빈혈증(즉, 중증성 지중해빈혈증)을 갖는 환자는 빈혈, 성장 지연 및 비정상적인 기관 발달을 겪는다. 경증 내지 중등도의 베타 지중해빈혈증(즉, 경증성 지중해빈혈증 또는 중간성 지중해빈혈증)이 있는 환자는 덜 심각한 증상을 나타낸다.
혈색소병증은 만성 수혈을 필요로 하는 SCD 및 베타 지중해빈혈증으로 수혈 및 지지 치료로 관리될 수 있다. 그러나, 수혈을 반복하면 철분 과부하가 발생하고 합병증의 발생률을 줄이기 위해 철 킬레이션 요법이 필요하다. SCD 및 베타 지중해빈혈증의 이환율 및 사망률은 SCD에 대해 현재까지 FDA 승인된 유일한 약물인 하이드록시우레아에 의해 약화될 수 있다. 그러나, 이 치료는 처방률이 낮고 규정 준수가 좋지 않기 때문에 널리 사용되지 않는다.
SCD 또는 베타 지중해빈혈증을 치료하기 위해, 환자는 적절하게 발현될 수 있는 기능적 베타 헤모글로빈의 적어도 하나의 카피를 보유하는 조혈 줄기 세포를 받을 필요가 있다. 하나의 접근법은 골수 이식을 통해 동종이계 공여체로부터 야생형 조혈 줄기 세포를 얻는 것이다. 그러나, 일치하는 공여체의 이용 가능성은 주요 제한 요소이며, 골수 이식은 종종 5 내지 10%의 사망률을 초래하는 심각한 합병증과 연관이 있다. 보다 최근에, 유전자 요법 접근법은 생체 외(ex vivo)에서 베타 글로빈 발현 폴리 뉴클레오티드를 환자로부터 단리된 돌연변이 조혈 줄기 세포 내로 도입하기 위해 사용되어 왔다.
현재까지, 모든 HBB 유전자 요법 임상 시험은 렌티바이러스 벡터와 같은 레트로바이러스 벡터의 사용을 수반하였다. 그러나, 레트로바이러스-기반 유전자 요법은 많은 안전성 및 효능 우려를 제기한다. 예를 들어, 인간 게놈 내로의 레트로바이러스 벡터의 삽입은 표적화되지 않기 때문에, 벡터가 종양 억제 유전자를 파괴하거나 종양 유전자를 활성화시켜 악성 종양을 유발할 위험이 있다. 실제로, 감마레트로바이러스 벡터로 CD34+ 골수 전구체를 형질도입함으로써 X-연결된 중증 복합 면역 결핍(SCID)을 치료하기 위한 임상 시험에서, 10 명의 환자 중 4 명은 백혈병으로 발전했다(문헌[Hacein-Bey-Abina et al., J Clin Invest. (2008) 118(9):3132-42]). 더욱이, 이러한 안전성 우려로 인해, 렌티바이러스 유전자 요법은 생체 외에서만 수행될 수 있다. 생체 외 치료를 위해 대상체로부터 추출될 수 있는 조혈 줄기 세포의 수는 대상체에 존재하는 것의 작은 분율에 불과하고 생체 외에서 조혈 줄기 세포를 확장시키기 위해 현재 임상적으로 사용되는 신뢰할 수 있는 방법이 없기 때문에, 이러한 생체 외 사용은 요법의 효능을 감소시킨다.
또한 메가뉴클레아제, 징크 핑거 뉴클레아제(ZFN: zinc finger nuclease), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN: transcription activator-like effector nuclease), 및 클러스터된, 규칙적으로 간격을 둔 짧은 회문 반복(CRISPR: short palindromic repeat) 기술과 같은 뉴클레아제 기반 유전자 편집 기술은 SCD 및 베타 지중해빈혈증 환자에서 HBB 유전자의 결함을 교정하는 데 사용된다고 추측되었다. 그러나, 이들 기술의 각각은 의도된 표적 부위와 순차적으로 유사한 인간 게놈에서 부위의 비표적 돌연변이(off-target mutation)에 대한 가능성으로 인해 안전성 우려를 제기한다.
따라서, 당업계에는 SCD 및 베타 지중해빈혈증 환자에서 HBB 유전자 기능을 효율적이고 안전하게 회복할 수 있는 개선된 유전자 요법 조성물 및 방법에 대한 요구가 존재한다.
HBB 유전자에서 돌연변이를 교정하기 위한 아데노-연관 바이러스(AAV: adeno-associated virus) 조성물 및 이를 사용하여 세포에서 HBB 유전자 돌연변이를 교정하는 방법이 본원에 제공된다. 또한 아데노-연관 바이러스 조성물 제조용 패키징(packaging) 시스템이 제공된다.
본원에 개시된 AAV 조성물 및 방법은 외인성 뉴클레아제(예를 들어, 메가뉴클레아제, 징크 핑거 뉴클레아제, 전사 활성화제-유사 뉴클레아제(TALEN: transcriptional activator-like nuclease), 또는 Cas9와 같은 RNA-가이드 뉴클레아제(RNA-guided nuclease))를 사용하여 게놈 DNA를 절단할 필요없이 생체 내 HBB 유전자에서 돌연변이의 매우 효율적인 교정을 허용한다는 점에서 특히 유리하다.
따라서, 일 양태에서, 본 개시내용은 (a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드, 및 (b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소, (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암(arm) 뉴클레오티드 서열 5', 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈을 포함하는 복제-결함 아데노-연관 바이러스(AAV: adeno-associated virus)를 제공한다.
다른 양태에서, 본 개시내용은 세포 내의 베타 글로빈(HBB) 유전자에서 돌연변이의 교정 방법으로서, 상기 방법은 상기 세포를 (a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드, 및 (b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소; (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈을 포함하는 복제-결함 아데노-연관 바이러스(AAV: adeno-associated virus)로 형질도입하는 단계를 포함하며, 상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하거나 공동-투여하지 않고 형질도입되는, 방법을 제공한다.
특정 실시형태에서, 상기 세포는 다능성 줄기 세포이다. 특정 실시형태에서, 상기 세포는 조혈 줄기 세포이다. 특정 실시형태에서, 상기 세포는 CD34+ 조혈 줄기 세포이다. 특정 실시형태에서, 상기 세포는 포유류 대상체 내에 있으며, 상기 AAV는 상기 대상체에서 상기 세포를 형질도입하는 데 유효한 양으로 상기 대상체에게 투여된다.
다른 양태에서, 본 개시내용은 HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법에서, 상기 방법은 (a) 생체 외에서 상기 대상체로부터 적혈구 전구 세포에 AAV Clade F 캡시드 단백질; 및 (i) 표적 유전자에서 표적 좌위 편집용 편집 요소; (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈을 포함하는 복제-결함 AAV로 형질도입하는 단계; 및 (b) 상기 형질도입된 세포를 상기 대상체에게 투여하는 단계를 포함하며, 상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하거나 공동-투여하지 않고 형질도입되는, 방법을 제공한다.
특정 실시형태에서, 상기 적혈구 전구 세포는 다능성 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구 세포는 조혈 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구 세포는 CD34+ 조혈 줄기 세포이다.
다른 양태에서, 본 발명은 HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법에서, 상기 방법은 상기 대상체에게 (a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드, 및 (b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소; (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈을 포함하는 복제-결함 AAV의 유효량을 투여하는 단계를 포함하며, 상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하거나 공동-투여하지 않고 형질도입되는, 방법을 제공한다.
특정 실시형태에서, 상기 질환 또는 장애는 지중해빈혈증 또는 겸상세포질환이다. 특정 실시형태에서, 상기 대상체는 인간 대상체이다.
하기 실시형태는 상기 양태들 각각에 적용된다.
특정 실시형태에서, 상기 표적 유전자는 상기 HBB 유전자이다. 특정 실시형태에서, 상기 표적 좌위는 상기 HBB 유전자에서 뉴클레오티드 점 돌연변이 또는 결실에 있다. 특정 실시형태에서, 상기 HBB 유전자에서 상기 뉴클레오티드 점 돌연변이 또는 결실은 위치 -87에서 G, 위치 -31에서 G, 위치 -30에서 A, 위치 -29에서 G, 위치 -28에서 G, 위치 -10에서 T, 위치 1에서 C, 위치 1에서 A, 위치 2에서 G, 위치 17 및 18에서 C 및 T의 결실, 위치 19에서 A, 위치 20에서 A의 결실, 위치 20에서 T, 위치 25 및 26에서 A 및 A의 결실, 위치 26 이후 G의 추가, 위치 47에서 A, 위치 48에서 A, 위치 51에서 C의 결실, 위치 52에서 A, 위치 58에서 G, 위치 59에서 G, 위치 79에서 A, 위치 82에서 T, 위치 84 이후 C의 추가, 위치 93에서 T, 위치 93에서 A, 위치 97에서 C, 위치 98에서 C, 위치 202에서 G, 위치 208에서 G, 위치 222에서 C, 위치 241 또는 242에서 T의 결실, 위치 254 내지 257에서 T 및 T 및 C 및 T의 결실, 위치 260에서 T, 위치 264 또는 265에서 C의 결실, 위치 343 이후 A의 추가, 위치 399 및 400에서 G 및 T의 결실, 위치 401에서 T, 위치 417 이후 A의 추가, 위치 446에서 A, 위치 1099에서 T, 위치 1293에서 A, 1344에서 T로 이루어진 군으로부터 선택된다. 특정 실시형태에서, 상기 편집 요소는 돌연변이에 상응하는 야생형 HBB 유전자의 일부를 포함한다.
특정 실시형태에서, 상기 편집 요소는 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 유전자의 하나 이상의 엑손의 코딩 영역으로 구성된다.
특정 실시형태에서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함한다. 특정 실시형태에서, 상기 코딩 영역은 상기 야생형 HBB 유전자의 상응하는 엑손에 100%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵(silently) 변경된다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 43 내지 46 및 105 내지 107로 이루어진 군으로부터 선택된 뉴클레오티드 서열 중 적어도 하나를 포함한다.
특정 실시형태에서, 상기 표적 좌위는 AAVS1이다.
특정 실시형태에서, 상기 편집 요소는 상기 HBB 유전자 또는 이의 일부의 코딩 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 48을 인코딩하는 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444로 구성된다. 특정 실시형태에서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444에 70%, 75%, 80%, 85%, 또는 90% 미만으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 47 또는 100의 서열로 구성된다. 특정 실시형태에서, 상기 편집 요소는 상기 HBB 유전자의 스터퍼(stuffer)-삽입된 코딩 서열을 포함한다.
특정 실시형태에서, 상기 표적 좌위는 상기 표적 유전자의 뉴클레오티드 3 및 뉴클레오티드 4 사이의 뉴클레오티드간 결합이며, 이에 의하여 상기 표적 좌위에의 상기 편집 요소의 통합으로 인해 상기 표적 유전자의 시작 코돈으로 시작하는 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 상기 표적 좌위를 생성하게 된다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3' 시작 코돈 및 서열 번호: 48을 인코딩하는 뉴클레오티드 서열로 이루어진 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열, 또는 상기 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 일부를 포함한다. 특정 실시형태에서, 상기 표적 좌위는 상기 표적 유전자의 인트론 내에 있으며, 상기 편집 요소는 5' 내지 3' 스플라이스 수용체 부위, 리보솜 스키핑 요소(ribosomal skipping element), 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함한다. 특정 실시형태에서, 상기 표적 좌위는 상기 HBB 유전자의 인트론 1 내에 있다. 특정 실시형태에서, 상기 표적 좌위는 상기 표적 유전자의 코딩 뉴클레오티드에 인접하여 3'이고, 상기 편집 요소는 5' 내지 3' 리보솜 스키핑 요소 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함한다. 특정 실시형태에서, 상기 표적 좌위는 야생형 표적 유전자(예를 들어, HBB 유전자) 또는 돌연변이체 표적 유전자(예를 들어, HBB 유전자)의 상응하는 뉴클레오티드의 정지 코돈이다. 특정 실시형태에서, 상기 표적 좌위는 야생형 표적 유전자(예를 들어, HBB 유전자) 또는 돌연변이체 표적 유전자(예를 들어, HBB 유전자)의 상응하는 뉴클레오티드의 정지 코돈에 인접하여 5'이다.
특정 실시형태에서, 상기 5' 상동성 암 뉴클레오티드 서열은 상기 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일하다. 특정 실시형태에서, 상기 3' 상동성 암 뉴클레오티드 서열은 상기 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일하다. 특정 실시형태에서, 상기 제1 게놈 영역은 제1 편집창(editing window)에 위치되며, 상기 제2 게놈 영역은 제2 편집창에 위치된다. 특정 실시형태에서, 상기 제1 및 제2 편집창들은 상이하다. 특정 실시형태에서, 상기 제1 및 제2 편집창들은 동일하다. 특정 실시형태에서, 상기 제1 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제2 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제1 게놈 영역은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제2 게놈 영역은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 5' 상동성 암은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 3' 상동성 암은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성된다.
특정 실시형태에서, 상기 편집 요소는 서열 번호: 48을 인코딩하는 뉴클레오티드 서열에 외인성 폴리아데닐화 서열 3'을 더 포함한다. 특정 실시형태에서, 상기 편집 요소는 상기 표적 유전자에 존재하지 않는 제한 엔도뉴클레아제 부위를 더 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다.
특정 실시형태에서, 상기 5' 및 3' 상동성 암 뉴클레오티드 서열의 각각은 독립적으로 약 100 내지 약 2000 뉴클레오티드의 길이를 갖는다.
특정 실시형태에서, 상기 교정 게놈은 상기 5' 상동성 암 뉴클레오티드 서열의 5' 반전된(inverted) 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 3' 상동성 암 뉴클레오티드 서열의 3' 반전된 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 더 포함한다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 18과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 19와 적어도 95% 서열 동일성을 갖는다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 20과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 21과 적어도 95% 서열 동일성을 갖는다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 29 내지 42 및 104 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다.
특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며, 선택적으로: 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다.
특정 실시형태에서, (a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며; (b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며; (c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며; (d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는 (e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다.
특정 실시형태에서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산의 아미노산 서열을 포함한다.
특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며, 선택적으로: 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다.
특정 실시형태에서, (a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며; (b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며; (c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며; (d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는 (e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다.
특정 실시형태에서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며, 선택적으로: 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고; 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 68에 상응하는 캡시드 단백질에서 아미노산은 V이고; 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고; 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다.
특정 실시형태에서, (a) 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고, 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이며; (b) 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 Y이며; (c) 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이며; (d) 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고, 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이며; (e) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며; (f) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며; (g) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며; (h) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는 (i) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다.
특정 실시형태에서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합 효율은 적어도 1%이다. 특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도는 적어도 0.5%이다.
다른 양태에서, 본 개시내용은 본원에 개시된 바와 같이 AAV를 포함하는 약학적 조성물을 제공한다.
다른 양태에서, 본 개시내용은 AAV의 재조합 제조용 패키징 시스템으로서, 상기 패키징 시스템은: (a) 하나 이상의 AAV Rep 단백질을 인코딩하는 Rep 뉴클레오티드 서열, (b) 본원에 기재된 바와 같이 하나 이상의 AAV Clade F 캡시드 단백질을 인코딩하는 Cap 뉴클레오티드 서열, 및 (c) 본원에 개시된 바와 같이 교정 게놈을 포함하며, 상기 패키징 시스템은 상기 캡시드 내에 상기 교정 게놈을 봉입하기 위한 세포 내에서 작용하여 상기 AAV를 형성하는 것인, 패키징 시스템을 제공한다.
특정 실시형태에서, 상기 패키징 시스템은 상기 Rep 뉴클레오티드 서열 및 상기 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 교정 게놈을 포함하는 제2 벡터를 포함한다. 특정 실시형태에서, 상기 Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 인코딩한다. 특정 실시형태에서, 상기 AAV2 Rep 단백질은 78/68 또는 Rep 68/52이다. 특정 실시형태에서, 상기 AAV2 Rep 단백질은 서열 번호: 22의 AAV2 Rep 아미노산 서열과 최소 퍼센트 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 최소 퍼센트 서열 동일성은 상기 AAV2 Rep 단백질을 인코딩하는 아미노산 서열의 길이에 걸쳐 적어도 70%이다.
특정 실시형태에서, 상기 패키징 시스템은 제3 벡터를 더 포함하며, 상기 제3 벡터는 헬퍼(helper) 바이러스 벡터이다. 특정 실시형태에서, 상기 헬퍼 바이러스 벡터는 독립적 제3 벡터이다. 특정 실시형태에서, 상기 헬퍼 바이러스 벡터는 상기 제1 벡터와 통합된다. 특정 실시형태에서, 상기 헬퍼 바이러스 벡터는 상기 제2 벡터와 통합된다. 특정 실시형태에서, 상기 제3 벡터는 헬퍼 바이러스 단백질을 인코딩하는 유전자를 포함한다.
특정 실시형태에서, 상기 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스, 백시니아 바이러스, 및 거대세포바이러스(CMV: cytomegalovirus)로 이루어진 군으로부터 선택된다. 특정 실시형태에서, 상기 헬퍼 바이러스는 아데노바이러스이다. 특정 실시형태에서, 상기 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 특정 실시형태에서, 상기 헬퍼 바이러스는 헤르페스 단순 바이러스(HSV: herpes simplex virus)이다. 특정 실시형태에서, 상기 HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함한다.
특정 실시형태에서, 상기 제1 벡터 및 상기 제3 벡터는 제1 형질감염 플라스미드 내에 함유된다. 특정 실시형태에서, 상기 제2 벡터 및 상기 제3 벡터의 뉴클레오티드는 제2 형질감염 플라스미드 내에 함유된다. 특정 실시형태에서, 상기 제1 벡터 및 상기 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스로 클로닝된다. 특정 실시형태에서, 상기 제2 벡터 및 상기 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스로 클로닝된다.
다른 양태에서, 본 개시내용은 AAV의 재조합 제조방법으로서, 상기 방법은 본원에 기재된 바와 같은 패키징 시스템을 캡시드 내에 교정 게놈을 봉입하기 위해 작용하는 조건 하에서 세포 내로 도입하여 상기 AAV를 형성하는 단계를 포함하는, 방법을 제공한다.
도 1a 및 1b는 AAVS1-FP가 GM16265 세포의 게놈으로 통합된 유세포 분석 결과를 나타내는 그래프이며, AAVS1-FP 벡터는 AAVHSC7, AAVHSC15, 및 AAVHSC17에 패키지되어 있다.
도 1c는 AAVHSC17 캡시드에 패키지된 AAVS1-FP 벡터로 형질도입된 1차 인간 CD34+ 조혈 줄기 세포(HSC: hematopoietic stem cell)에서 FP 코딩 서열의 통합을 갖는 대립 유전자의 백분율을 나타내는 그래프이다.
도 2는 12 bp 링커를 함유하는 HBB 교정 벡터 hHBB-hL-014의 플라스미드 맵을 도시하고 있다. 이 도면에서, HBB의 흑색 영역은 인간 HBB 단백질을 인코딩하는 엑손에서의 뉴클레오티드 서열을 나타내고, 흑색 영역 사이의 점선은 엑손 사이의 인트론을 나타낸다.
도 3a는 AAVHSC15 및 AAVHSC17 캡시드에 패키지된 hHBB-hL-014 벡터로 형질도입된 GM16265 세포의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 나타내는 DNA 전기영동의 이미지이다.
도 3b는 AAVHSC17 캡시드에 패키지된 hHBB-hL-014 벡터로 형질도입된 GM16265, GM16266 및 GM16267 LCL의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 보여주는 DNA 전기영동의 이미지이다.
도 4a, 4b, 4c, 및 4d는 각각 HBB 교정 벡터 hHBB-hL-001, hHBB-h1W-013, hHBB-hL-011 및 hHBB-h1W-012의 2개의 AAV ITR 사이의 유전적 요소를 보여주는 벡터 맵이다. 이들 도면에서, HBB의 흑색 영역은 인간 HBB 단백질을 인코딩하는 엑손에서의 뉴클레오티드 서열을 나타내고, 흑색 영역 사이의 점선은 엑손 사이의 인트론을 나타낸다.
도 5a, 5b 및 5c는 AAVHSC17 캡시드에 패키지된 도면에 표시된 벡터로 형질도입된 1차 인간 CD34+ HSC의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 나타내는 DNA 전기영동의 이미지이다.
도 6은 표시된 바와 같이 샘플에 걸쳐 편집된 CD34+ 세포의 분율을 나타내는 그래프이다.
도 7a, 7b, 7c, 7d, 및 7e는 각각 HBB 교정 벡터 hHBB-hA-009, hHBB-hAW-002, hHBB-h1-010, hHBB-h1W-008, 및 hHBB-hE3C-001의 2개의 AAV ITR 사이의 유전적 요소를 보여주는 벡터 맵이다. 도 7a 내지 7d에서, "HBB 코딩 영역" 또는 "HBB 코딩 영역(66%)"으로 표지된 흑색 영역은 시작 코돈에서 정지 코돈까지(도 7c 및 7d) 또는 제2 코돈에서 정지 코돈까지(도 7 및 7b) 인간 HBB 단백질을 인코딩하는 뉴클레오티드 서열을 나타낸다.
도 8은 AAVHSC7 캡시드에 패키지된 도면에 표시된 벡터로 형질도입된 RKO 및 GM16265 LCL 세포의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기(1,874 bp) 및 비특이적 크기(1,180 bp)를 보여주는 DNA 전기영동의 이미지이다.
도 9는 AAVHSC7 및 AAVHSC17 캡시드에 패키지된 AAVS1-FP 벡터의 투여 후 인간 HSC로 이종 이식된 NSG 마우스로부터의 혈액, 골수("BM"), 및 비장 세포에서 FP 코딩 서열의 통합을 갖는 대립 유전자의 백분율을 나타내는 그래프이다.
도 1c는 AAVHSC17 캡시드에 패키지된 AAVS1-FP 벡터로 형질도입된 1차 인간 CD34+ 조혈 줄기 세포(HSC: hematopoietic stem cell)에서 FP 코딩 서열의 통합을 갖는 대립 유전자의 백분율을 나타내는 그래프이다.
도 2는 12 bp 링커를 함유하는 HBB 교정 벡터 hHBB-hL-014의 플라스미드 맵을 도시하고 있다. 이 도면에서, HBB의 흑색 영역은 인간 HBB 단백질을 인코딩하는 엑손에서의 뉴클레오티드 서열을 나타내고, 흑색 영역 사이의 점선은 엑손 사이의 인트론을 나타낸다.
도 3a는 AAVHSC15 및 AAVHSC17 캡시드에 패키지된 hHBB-hL-014 벡터로 형질도입된 GM16265 세포의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 나타내는 DNA 전기영동의 이미지이다.
도 3b는 AAVHSC17 캡시드에 패키지된 hHBB-hL-014 벡터로 형질도입된 GM16265, GM16266 및 GM16267 LCL의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 보여주는 DNA 전기영동의 이미지이다.
도 4a, 4b, 4c, 및 4d는 각각 HBB 교정 벡터 hHBB-hL-001, hHBB-h1W-013, hHBB-hL-011 및 hHBB-h1W-012의 2개의 AAV ITR 사이의 유전적 요소를 보여주는 벡터 맵이다. 이들 도면에서, HBB의 흑색 영역은 인간 HBB 단백질을 인코딩하는 엑손에서의 뉴클레오티드 서열을 나타내고, 흑색 영역 사이의 점선은 엑손 사이의 인트론을 나타낸다.
도 5a, 5b 및 5c는 AAVHSC17 캡시드에 패키지된 도면에 표시된 벡터로 형질도입된 1차 인간 CD34+ HSC의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기를 나타내는 DNA 전기영동의 이미지이다.
도 6은 표시된 바와 같이 샘플에 걸쳐 편집된 CD34+ 세포의 분율을 나타내는 그래프이다.
도 7a, 7b, 7c, 7d, 및 7e는 각각 HBB 교정 벡터 hHBB-hA-009, hHBB-hAW-002, hHBB-h1-010, hHBB-h1W-008, 및 hHBB-hE3C-001의 2개의 AAV ITR 사이의 유전적 요소를 보여주는 벡터 맵이다. 도 7a 내지 7d에서, "HBB 코딩 영역" 또는 "HBB 코딩 영역(66%)"으로 표지된 흑색 영역은 시작 코돈에서 정지 코돈까지(도 7c 및 7d) 또는 제2 코돈에서 정지 코돈까지(도 7 및 7b) 인간 HBB 단백질을 인코딩하는 뉴클레오티드 서열을 나타낸다.
도 8은 AAVHSC7 캡시드에 패키지된 도면에 표시된 벡터로 형질도입된 RKO 및 GM16265 LCL 세포의 게놈 DNA로부터 증폭된 DNA의 편집-특이적 크기(1,874 bp) 및 비특이적 크기(1,180 bp)를 보여주는 DNA 전기영동의 이미지이다.
도 9는 AAVHSC7 및 AAVHSC17 캡시드에 패키지된 AAVS1-FP 벡터의 투여 후 인간 HSC로 이종 이식된 NSG 마우스로부터의 혈액, 골수("BM"), 및 비장 세포에서 FP 코딩 서열의 통합을 갖는 대립 유전자의 백분율을 나타내는 그래프이다.
본 개시내용은 HBB 유전자에서 돌연변이 교정용 아데노-연관 바이러스(AAV: adeno-associated virus) 조성물 및 이를 사용하여 세포에서 HBB 유전자 돌연변이를 교정하는 방법을 제공한다. 또한 아데노-연관 바이러스 조성물 제조용 패키징 시스템이 제공된다.
I. 정의
본원에 사용된 용어 "복제-결함 아데노-연관 바이러스"는 Rep 및 Cap 유전자가 없는 게놈을 포함하는 AAV를 지칭한다.
본원에 사용된 용어 "HBB 유전자"는 HBB 유전자의 코딩 영역, 엑손, 인트론, 5' UTR, 3' UTR, 및 전사 조절 영역을 포함하지만, 이에 한정되지 않는 야생형 또는 돌연변이 인간 베타 글로빈 유전자를 지칭한다.
본원에 사용된 용어 "HBB 유전자에서 돌연변이를 교정하는 것"은 야생형 HBB 단백질 또는 이의 기능적 등가물을 발현할 수 있는 좌위를 생성하기 위하여 표적 유전자(예를 들어, 돌연변이체 HBB 유전자)의 표적 좌위에서 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 지칭한다. 특정 실시형태에서, "HBB 유전자에서 돌연변이를 교정하는 것"은 HBB 유전자에서 돌연변이를 야생형 서열로 되돌리는 것을 포함한다. 특정 실시형태에서, "HBB 유전자에서 돌연변이를 교정하는 것"은 야생형 베타 글로빈 단백질 또는 이의 기능적 등가물이 선택적으로는 외인성 표적 유전자 프로모터(예를 들어, HBB 유전자 프로모터)의 제어 하에서 표적 유전자의 좌위(예를 들어, 돌연변이체 HBB 유전자 좌위)로부터 발현되도록, 야생형 베타 글로빈 단백질 또는 이의 기능적 등가물의 적어도 일부를 인코딩하는 뉴클레오티드 서열을 표적 유전자(예를 들어, 돌연변이체 HBB 유전자)에 삽입하는 것을 포함한다. 본원에 사용된 "기능적 등가물"은 야생형 베타 글로빈으로서 기능할 수 있는 유전자 또는 이의 단편의 생성물을 지칭한다. 특정 실시형태에서, HBB의 기능적 등가물은 엡실론 글로빈(HBE), 델타 글로빈(HBD), 감마 글로빈 1(HBG1), 감마 글로빈 2(HBG2) 및 HBB 유사 유전자(pseudogene) HBBP와 같은 다른 글로빈 유전자 또는 유사 유전자를 포함할 수 있다. 특정 실시형태에서, HBB의 기능적 등가물은 변형된 베타 글로빈 단백질일 수 있으며, 변형은 야생형 베타 글로빈에서 발견되지 않은 적어도 하나의 특성, 예를 들어 SCD 돌연변이를 보유한 베타 글로빈의 응집을 억제하는 능력을 부여한다.
본원에 사용된 용어 "교정 게놈"은 상동 재조합을 통해 편집 요소(예를 들어, 하나 이상의 뉴클레오티드 또는 뉴클레오티드간 결합)를 표적 좌위에 통합하여 HBB 유전자에서 유전적 결함을 교정할 수 있는 재조합 AAV 게놈을 지칭한다. 특정 실시형태에서, 상기 표적 좌위는 인간 HBB 유전자에 있다. 당업자는 5' 상동성 암, 편집 요소, 및 3' 상동성 암을 포함하는 교정 게놈의 일부가 표적 좌위(예를 들어, 인간 HBB 유전자)에 대해 센스 또는 안티센스 배향일 수 있음을 이해할 것이다.
본원에 사용된 용어 "편집 요소"는 표적 좌위에 통합될 때 표적 좌위를 변형시키는 교정 게놈의 일부를 지칭한다. 편집 요소는 표적 좌위에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 매개할 수 있다.
본원에 사용된 용어 "표적 좌위"는 편집 요소에 의해 변형된 염색체 또는 뉴클레오티드 간 결합의 영역을 지칭한다. 특정 실시형태에서, 상기 표적 좌위는 HBB 유전자에서 영역 또는 뉴클레오티드 간 결합이며, 선택적으로, 상기 표적 좌위는 베타 글로빈 단백질의 발현 또는 기능을 손상시키는 적어도 하나의 유전적 돌연변이를 포함한다. 특정 실시형태에서, 상기 표적 좌위는 AAVS1이다. 상기 AAVS1 좌위는 문헌[Giraud et al., Proc Natl Acad Sci U S A. (1994) 91(21): 10039-43]; 문헌[Linden et al, Proc Natl Acad Sci U S A. (1996) 93(21): 11288-94]; 및 문헌[Linden et al., Proc Natl Acad Sci U S A. (1996) 93(15):7966-72]에 기재된 바와 같이, NCBI 참조 서열 번호 NC_000019.10의 뉴클레오티드 55,090,913 내지 55,117,600인 염색체 19 qter13.3-13.4 상에 있으며, 이들 각각은 그 전체 내용이 본원에 인용되어 포함된다. 특정 실시형태에서, 상기 표적 좌위는 안전한 항구(safe harbor) 좌위이다. 안전한 항구 좌위는 새로 삽입된 유전자 물질이: (1) 예측 가능하게 기능하고; 그리고 (2) 숙주 세포 또는 유기체에 위험을 초래할 수 있는 숙주 게놈의 변경을 유발하지 않아야 하도록 보장하는 방식으로 새로운 유전자 물질의 통합을 수용할 수 있는 게놈의 부위이다. 따라서, 특정 실시형태에서, 표적 좌위는 숙주 게놈과의 원하지 않는 상호 작용의 위험을 최소화하면서 예측 가능한 전이유전자(transgene) 발현을 지원할 수 있는 당업계에 공지된 임의의 안전한 항구 좌위일 수 있다.
본원에 사용된 용어 "표적 유전자"는 표적 좌위 또는 이의 일부가 위치하는 유전자를 지칭한다. 특정 실시형태에서, 상기 표적 좌위는 표적 유전자에 완전히 존재한다. 특정 실시형태에서, 상기 표적 유전자는 HBB이다. 특정 실시형태에서, 상기 표적 유전자는 인간 PPP1R12C이다. 특정 실시형태에서, 상기 표적 유전자는 적혈구 전구세포에서 발현된다.
본원에 사용된 용어 "상동성 암"은 표적 좌위 측면에 있는 게놈과 실질적으로 동일한 편집 요소의 5' 또는 3'에 위치된 교정 게놈의 일부를 지칭한다. 특정 실시형태에서, 상기 표적 좌위는 인간 HBB 유전자에 있고, 상기 상동성 암은 표적 좌위 측면에 있는 게놈과 실질적으로 동일한 서열을 포함한다.
본원에 사용된 용어 "Clade F 캡시드 단백질"은 본원에서 서열 번호: 1의 아미노산 1 내지 736, 138 내지 736, 및 203 내지 736에서 각각 기재된 VP1, VP2, 또는 VP3 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 AAV VP1, VP2, 또는 VP3 캡시드 단백질을 지칭한다. 본원에서 사용된 바와 같이, 2개의 뉴클레오티드 서열 사이 또는 2개의 아미노산 서열 사이의 동일성은 정렬된 동일한 뉴클레오티드 또는 아미노산의 수를 길이가 더 긴 뉴클레오티드 또는 아미노산 서열의 전장으로 나눈 것에 의해 결정된다.
본원에 사용된 용어 "HBB 유전자 돌연변이와 연관된 질환 또는 장애"는 HBB 유전자의 변이에 의해 야기되거나, 악화되거나, 또는 유전적으로 연결된 임의의 질환 또는 장애를 지칭한다. 특정 실시형태에서, 상기 HBB 유전자 돌연변이와 연관된 질환 또는 장애는 겸상세포질환 또는 베타 지중해빈혈증과 같은 혈색소병증이다.
본원에서 사용되는 용어 "침묵 변경된"은 코딩 서열 또는 스태퍼(staffer)-삽입된 코딩 서열에 의해 인코딩된 폴리펩티드의 아미노산 서열을 변경시키지 않고 유전자의 코딩 서열 또는 스태퍼-삽입된 코딩 서열의 변형(예를 들어, 뉴클레오티드 치환에 의한)을 지칭한다. 이러한 침묵(silent) 변경은 표적 유전자와 파라성(paralogous)인 다른 유전자 또는 유사 유전자의 좌위(예를 들어, 다른 글로빈 유전자 좌위 또는 베타 글로빈 유사 유전자 좌위) 내로의 교정 게놈의 통합 가능성을 감소시킨다는 점에서 유리하다. 이러한 침묵 변경은 또한 편집 요소와 표적 유전자 사이의 상동성을 감소시켜, 상동성 암보다는 편집 요소에 의해 매개되는 바람직하지 않은 통합을 감소시킨다.
본원에 사용된 용어 "코딩 서열"은 시작 코돈에서 시작하여 정지 코돈에서 끝나는 폴리펩티드를 인코딩하는 상보적 DNA(cDNA)의 부분 또는 이의 침묵 변경된 서열을 지칭한다. 유전자는 대안적인 스플라이싱 및/또는 대안적인 번역 개시로 인해 하나 이상의 야생형 코딩 서열을 가질 수 있다. 예시적인 야생형 HBB 코딩 서열은 NCBI 참조 서열: NM_000518.4의 뉴클레오티드 51 내지 494에 기재되어 있다.
본원에 사용된 용어 "코딩 뉴클레오티드"는 정지 코돈의 3' 뉴클레오티드를 제외하고 유전자의 코딩 서열에서 뉴클레오티드에 상응하는 유전자의 뉴클레오티드를 지칭한다. 따라서, 특정 실시형태에서, 상기 HBB 유전자의 코딩 뉴클레오티드는 상기 HBB 유전자의 뉴클레오티드 1 내지 443 중 어느 하나이다.
본원에 사용된 유전자의 "스터퍼-삽입된 코딩 서열"이라는 용어는 유전자의 코딩 서열에 삽입된 하나 이상의 인트론을 포함하는 뉴클레오티드 서열을 지칭한다. 특정 실시형태에서, 인트론 중 적어도 하나는 비 천연 인트론, 즉, 유전자의 천연 인트론과 상이한 서열을 갖는 것이다. 특정 실시형태에서, 스터퍼-삽입된 코딩 서열에서 모든 인트론은 비 천연 인트론이다. 비 천연 인트론은 다른 종으로부터의 인트론의 서열 또는 동일한 종과 상이한 유전자에서 인트론의 서열을 가질 수 있다. 대안적으로 또는 추가적으로, 비 천연 인트론 서열의 적어도 일부는 합성일 수 있다. 당업자는 비 천연 인트론 서열이 당업계에 공지된 임의의 컨센서스 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다. 예시적인 컨센서스 스플라이싱 모티프는 문헌[Sibley et al., (2016) Nature Reviews Genetics, 17, 407-21]에 제공되며, 이는 그 전체 내용이 본원에 인용되어 포함된다. 비 천연 인트론의 삽입은 스태퍼 서열이 벡터의 조정이 최적 크기(예를 들어, 4.5 내지 4.8 kb)에 도달할 수 있게 함에 따라 벡터 패키징의 효율성 및 견고성을 촉진시킬 수 있다. 특정 실시형태에서, 인트론 중 적어도 하나는 유전자의 천연 인트론이다. 특정 실시형태에서, 스터퍼-삽입된 코딩 서열에서 모든 인트론은 유전자의 천연 인트론이다. 비 천연 또는 천연 인트론은 코딩 서열에서 임의의 뉴클레오티드 간 결합에서 삽입될 수 있다. 특정 실시형태에서, 효율적인 스플라이싱을 촉진할 것으로 예측되는 뉴클레오티드 간 결합에서 하나 이상의 비 천연 또는 천연 인트론이 삽입된다(예를 들어, 문헌[Zhang (1998) Human Molecular Gentics, 7(5):919-32] 참조, 이는 그 전체 내용이 본원에 인용되어 포함된다). 특정 실시형태에서, 하나 이상의 비 천연 또는 천연 인트론이 2개의 내인성 엑손을 연결하는 뉴클레오티드 간 결합에서 삽입된다.
본원에 사용된 용어 "리보솜 스키핑 요소"는 하나의 mRNA 분자의 번역으로부터 2개의 펩티드 사슬을 생성시킬 수 있는 짧은 펩티드 서열을 인코딩하는 뉴클레오티드 서열을 지칭한다. 본원에 사용된 용어 "리보솜 스키핑 펩티드"는 리보솜 스키핑 요소에 의해 인코딩된 펩티드를 지칭한다. 특정 실시형태에서, 상기 리보솜 스키핑 펩티드는 X1X2EX3NPGP의 컨센서스 모티프를 포함하고, 상기 식에서 X1은 D 또는 G이고, X2는 V 또는 I이며, X3는 임의의 아미노산(서열 번호: 49)이다. 특정 실시형태에서, 상기 리보솜 스키핑 펩티드는 토세아-아사인아(thosea-asigna) 바이러스 2A 펩티드(T2A), 돼지 테스코바이러스(porcine teschovirus)-1 2A 펩티드(P2A), 구제역 바이러스 2A 펩티드(F2A), 말 비염 A 바이러스 2A 펩티드(E2A), 세포질 다각체병 바이러스 2A 펩티드(BmCPV 2A), 및 flacherie virus of B. mori 2A 펩티드의 무름병 바이러스(BmlFV 2A)로 이루어진 군으로부터 선택된다. T2A 펩티드 및 P2A 펩티드의 예시적인 아미노산 서열은 각각 서열 번호: 71 및 73에 기재되어 있다. T2A 요소 및 P2A 요소의 예시적인 뉴클레오티드 서열은 각각 서열 번호: 72 및 74에 기재되어 있다. 특정 실시형태에서, 상기 리보솜 스키핑 요소는 N 말단에서 Gly-Ser-Gly의 서열을 더 포함하는 펩티드를 인코딩하며, 선택적으로 N 말단에서 Gly-Ser-Gly의 서열은 GGCAGCGGA(서열 번호: 75)의 뉴클레오티드 서열에 의해 인코딩된다. 이론에 구속되고 싶지는 않지만, 리보솜 스키핑 요소는 제1 펩티드 사슬의 번역을 종결시키고 제2 펩티드 사슬의 번역을 재개시하고; 또는 인코딩된 펩티드의 고유 프로테아제 활성에 의해 또는 환경(예를 들어, 사이토졸) 내의 다른 프로테아제에 의해 리보솜 스키핑 펩티드에서의 펩티드 결합의 절단에 의해 기능한다고 추측된다.
본원에 사용된 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다.
본 개시내용에서, 유전자 내에서 뉴클레오티드 위치는 시작 코돈의 제1 뉴클레오티드에 대해 특정된다. 시작 코돈의 제1 뉴클레오티드는 위치 1이고, 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 5'는 음수를 가지며, 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 3'은 양수를 갖는다. 예를 들어, 본원에 사용된 HBB 유전자의 뉴클레오티드 1은 NCBI 참조 서열: NG_000007.3의 뉴클레오티드 70,595이다. 시작 코돈에 인접하여 5'인 뉴클레오티드는 뉴클레오티드-1이다.
본 개시내용에서, 유전자 내의 엑손 및 인트론은 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손에 대해 특정된다. 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손은 엑손 1이다. 엑손 3' 내지 엑손 1은 5' 내지 3': 엑손 2, 엑손 3 등이다. 인트론 3' 내지 엑손 1은 5' 내지 3': 인트론 1, 인트론 2 등이다. 따라서, 유전자는 5' 내지 3': 엑손 1, 인트론 1, 엑손 2, 인트론 2, 엑손 3 등을 포함한다. 인간 HBB 유전자의 예시적인 엑손 1은 NCBI 참조 서열: NG_000007.3이의 뉴클레오티드 70,545 내지 70,686이다. 인간 HBB 유전자의 예시적인 인트론 1은 NCBI 참조 서열: Ng_000007.3의 뉴클레오티드 70,687 내지 70,816이다. 당업자는 유전자가 다수의 상이한 mRNA로 전사될 수 있음을 이해할 것이다. 이와 같이, 유전자(예를 들어, HBB)는 다수의 상이한 엑손 및 인트론 세트를 가질 수 있다.
본원에 사용된 용어 "통합"은 교정 게놈과 표적 유전자 사이의 상동 재조합에 의해 편집 요소가 표적 좌위에 도입되는 것을 지칭한다. 편집 요소의 통합은 표적 유전자에서 하나 이상의 뉴클레오티드의 치환, 삽입 및/또는 결실을 초래할 수 있다.
본원에 사용된 용어 "편집 요소의 표적 좌위로의 통합 효율"은 편집 요소의 표적 좌위로의 통합이 발생한 형질도입된 집단에서 세포의 백분율을 지칭한다.
본원에 사용된 용어 "편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도"는 편집 요소의 표적 좌위로의 통합이 발생한 형질도입된 세포의 집단에서 대립 유전자의 백분율을 지칭한다.
본원에 사용된 용어 "표준 AAV 형질도입 조건"은 2 x 105 CD34+ 인간 줄기 세포에 1.5 x 105의 감염 다중도(MOI: multiplicity of infection)에서 AAV의 형질도입을 지칭하며, 상기 세포는 5% 이산화탄소(CO2)의 인큐베이션 환경에서 37℃에서 20% 우태혈청(FCS: Fetal Calf Serum), 100 μg/mL 스트렙토마이신, 100 U/mL 페니실린, 2mmol/L L-글루타민, 10 ng/mL 인간 IL-3, 10 ng/mL 인간 IL-6, 및 1 ng/mL 인간 SCF로 보충된 이스코브 변형된 둘베코 배지(IMDM: Iscove's Modified Dulbecco's Medium)로 배양되고, 상기 AAV는 인산염 완충 식염수(PBS: phosphate buffered saline)에서 제형화되며, 상기 AAV는 배양 배지의 부피의 9분의 1 이하의 부피로 CD34+ 세포를 함유하는 세포 배양 배지에 첨가된다.
본원에 사용된 바와 같이, 대상체에게 AAV의 투여와 관련하여 용어 "유효량"은 원하는 예방 또는 치료 효과를 달성하는 AAV의 양을 지칭한다.
본원에 사용된 용어 "적혈구 전구세포"는 적혈구로 분화될 수 있는 세포를 지칭한다. 특정 실시형태에서, 상기 적혈구 전구세포는 다능성 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 유도된 다능성 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 조혈 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 CD34+ 조혈 줄기 세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 골수성 전구세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 거핵구 적혈구 전구세포이다. 특정 실시형태에서, 상기 적혈구 전구세포는 적혈구 전구체 세포이다.
II. 아데노-연관 바이러스 조성물
일 양태에서, 본 개시내용은 HBB 유전자에서 돌연변이를 교정하는 데 유용한 신규한 복제-결함 AAV 조성물을 제공한다. 본원에 개시된 AAV는 일반적으로 AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드; 및 HBB 유전자에서 표적 좌위 편집용 교정 게놈을 포함한다.
임의의 AAV Clade F 캡시드 단백질 또는 이의 유도체가 본원에 개시된 AAV 조성물에 사용될 수 있다. 예를 들어, 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이며; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이며, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이며, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이며; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이며, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이며, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 1 내지 736의 아미노산 서열과 적어도 90%, 95%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 1 내지 736의 아미노산 서열과 적어도 90%, 95%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고; 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 68에 상응하는 캡시드 단백질에서 아미노산은 V이고; 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고; 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이며; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이며, 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이며, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 Y이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이며, 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이며, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이며, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이다. 특정 실시형태에서, 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이다. 특정 실시형태에서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 둘 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 서열 203 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; (b) 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 서열 138 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질을 포함한다.
특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 하나 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 둘 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 8의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; (b) 서열 번호: 8의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 8의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질을 포함한다.
특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 하나 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 둘 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드: (a) 서열 번호: 13의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; (b) 서열 번호: 13의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 13의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질을 포함한다.
특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 하나 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질; (b) 서열 번호: 16의 아미노산 138 내지 736을 포함하는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 Clade F 캡시드 단백질 중 둘 이상을 포함한다. 특정 실시형태에서, 상기 AAV 캡시드는: (a) 서열 번호: 16의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; (b) 서열 번호: 16의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질; 및 (c) 서열 번호: 16의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 Clade F 캡시드 단백질을 포함한다.
본원에 개시된 AAV 조성물에서 유용한 교정 게놈은: (i) 표적 유전자에서 표적 좌위의 편집용 편집 요소, (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5', 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 상기 5' 상동성 암 뉴클레오티드 서열의 5' 반전된 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 3' 상동성 암 뉴클레오티드 서열의 3' 반전된 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다.
본원에 개시된 교정 게놈에서 유용한 교정 요소는 표적 좌위에서 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 매개할 수 있다. 상기 표적 좌위는 적혈구 전구세포에서 발현된 HBB 유전자 또는 다른 유전자일 수 있는 표적 유전자 내에 완전히 또는 부분적으로 위치할 수 있다.
특정 실시형태에서, 표적 좌위에서 상동 재조합에 의해 정확하게 통합될 때, 편집 요소는 HBB 유전자에서 돌연변이를 야생형 HBB 서열 또는 야생형 HBB 단백질 또는 이의 기능적 등가물을 인코딩하는 침묵 변경된 서열로 되돌려 교정한다. HBB 유전자에서 대부분의 돌연변이는 본원에 개시된 편집 요소에 의해 교정될 수 있다. 특정 실시형태에서, 상기 편집 요소는 HBB 유전자에서 치환 또는 결실 돌연변이를 교정하는 하나 이상의 뉴클레오티드이다. 특정 실시형태에서, 상기 편집 요소는 HBB 유전자에서 삽입 돌연변이를 결실하는 뉴클레오티드 간 결합이다. 특정 실시형태에서, 상기 편집 요소는 HBB 유전자의 하나 이상의 코딩 엑손을 포함한다. 예를 들어, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함할 수 있다. 상기 엑소는 본원에 개시된 바와 같이 야생형일 수 있거나 침묵 변경될 수 있다.
특정 실시형태에서, 상기 편집 요소는 HBB 유전자의 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 유전자의 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 예를 들어, 특정 실시형태에서 상기 편집 요소는 HBB 코딩 서열의 뉴클레오티드 4 내지 444, 또는 뉴클레오티드 4로부터 정지 코돈까지의 HBB 스터퍼-삽입된 코딩 서열의 일부를 포함하고, HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 일부에 외인성 폴리아데닐화 서열 3'을 선택적으로 더 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 48을 인코딩하는 뉴클레오티드 서열을 포함하고, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열에 외인성 폴리아데닐화 서열 3'을 선택적으로 더 포함할 수 있다. 특정 실시형태에서, 이러한 편집 요소는 상동 재조합에 의해 HBB 유전자의 내인성 시작 코돈 직후(예를 들어, HBB 유전자의 뉴클레오티드 3과 뉴클레오티드 4 사이) 엑손 1에 통합될 수 있으며, 이에 의하여 편집 요소의 통합은 내인성 HBB 유전자의 시작 코돈과 프레임 내(in-frame)에서 완전한 HBB 코딩 서열을 생성시킨다. 특정 실시형태에서, 이러한 편집 요소는 상동 재조합에 의해 비-HBB 표적 유전자의 내인성 시작 코돈 직후(예를 들어, 표적 유전자의 뉴클레오티드 3과 뉴클레오티드 4 사이) 엑손 1에 통합될 수 있으며, 이에 의하여 편집 요소의 통합은 내인성 표적 유전자의 시작 코돈과 프레임 내에서 완전한 HBB 코딩 서열을 생성시킨다. 편집 요소에서 HBB 코딩 서열의 일부는 본원에 개시된 바와 같이 야생형이거나 침묵 돌연변이될 수 있다. 편집 요소에 의해 인코딩된 HBB 아미노산 서열의 일부는 야생형 또는 이의 기능적 등가물일 수 있다.
특정 실시형태에서, 상기 편집 요소는 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열(예를 들어, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열)의 적어도 일부, 및 리보솜 스키핑 요소 또는 외인성 폴리아데닐화 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3' 리보솜 스키핑 요소, 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열(예를 들어, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열)의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 리보솜 스키핑 요소; 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함한다. 특정 실시형태에서, 상기 언급된 편집 요소는 상동 재조합에 의해 표적 유전자의 코딩 뉴클레오티드에 인접하게 3'(예를 들어, 천연 HBB 유전자의 정지 코돈에 대해 인접하게 5')에 통합되어 5' 내지 3': 코딩 뉴클레오티드에서 끝나는 표적 유전자의 5' 부분, 리보솜 스키핑 요소, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열, 및 외인성 폴리아데닐화 서열을 포함하는 재조합 표적 유전자를 생성할 수 있으며, 상기 리보솜 스키핑 요소는 표적 유전자의 코딩 영역 및 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열과 프레임 내가 되도록 위치된다. 이 재조합 표적 유전자의 발현은 인코딩된 리보솜 스키핑 펩티드의 제1 부분에 융합된 표적 유전자의 N-말단 부분에 의해 인코딩된 아미노산 서열을 포함하는 제1 폴리펩티드, 및 완전한 HBB 아미노산 서열에 융합된 인코딩된 리보솜 스키핑 펩티드의 제2 부분(예를 들어, 단일 프롤린 잔기)을 포함하는 제2 폴리펩티드를 생성한다. 편집 요소에서 HBB 스터퍼-삽입된 코딩 서열의 HBB 코딩 서열 또는 코딩 영역은 본원에 개시된 바와 같이 야생형이거나 침묵 돌연변이될 수 있다. 편집 요소에 의해 인코딩된 HBB 아미노산 서열은 야생형 또는 이의 기능적 등가물(예를 들어, 제1 메티오닌이 없음)일 수 있다. 상기 표적 좌위는 뉴클레오티드 간 결합 또는 표적 유전자의 코딩 뉴클레오티드에 인접하게 3'인 뉴클레오티드 서열일 수 있다. 특정 실시형태에서, 상기 표적 좌위는 HBB 유전자의 천연 정지 코돈으로 구성된다.
특정 실시형태에서, 상기 편집 요소는 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열(예를 들어, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열)의 적어도 일부, 및 스플라이스 수용체 부위; 스플라이스 공여체 부위; 리보솜 스키핑 요소; 및 외인성 폴리아데닐화 서열 중 하나 이상을 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열(예를 들어, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열)의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함한다. 특정 실시형태에서, 상기 언급된 편집 요소는 상동 재조합에 의해 표적 유전자의 인트론(예를 들어, 내인성 HBB 유전자의 인트론 1)에 통합되어 5' 내지 3': 표적 유전자의 하나 이상의 엑손 5' 내지 인트론; 외인성 스플라이스 공여체 부위를 포함하는 인트론의 5' 부분; 스플라이스 수용체 부위; 리보솜 스키핑 요소, 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하는 재조합 HBB 유전자를 생성할 수 있으며, 리보솜 스키핑 요소는 완전한 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열과 프레임 내에 있도록, 그리고 표적 유전자의 내인성 스플라이스 공여체 부위에 대한 스플라이스 수용체 부위의 스플라이싱은 리보솜 스키핑 요소를 표적 유전자의 코딩 영역과 프레임 내에 놓이도록 위치된다. 이 재조합 표적 유전자의 발현은 인코딩된 리보솜 스키핑 펩티드의 제1 부분에 융합된 삽입 부위에 내인성 엑손(들) 5'에 의해 인코딩된 표적 유전자 아미노산 서열을 포함하는 제1 폴리펩티드, 및 완전한 HBB 아미노산 서열에 융합된 인코딩된 리보솜 스키핑 펩티드(예를 들어, 단일 프롤린 잔기)의 제2 부분을 포함하는 제2 폴리펩티드를 생성한다. 편집 요소에서 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열은 본원에 개시된 바와 같이 야생형이거나 침묵 돌연변이될 수 있다. 편집 요소에 의해 인코딩된 HBB 아미노산 서열은 야생형 또는 이의 기능적 등가물(예를 들어, 제1 메티오닌이 없음)일 수 있다. 상기 표적 좌위는 뉴클레오티드 간 결합 또는 표적 유전자의 인트론에서 뉴클레오티드에 인접하게 3'인 뉴클레오티드 서열일 수 있다.
특정 실시형태에서, 편집 요소 내의 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 하나 이상의 부분은 야생형 HBB 유전자의 상응하는 엑손과 동일하지 않도록 침묵 변경될 수 있다. 이러한 침묵 변경은 다른 글로빈 유전자 또는 유사 유전자의 좌위, 예를 들어, 베타 글로빈 유사 유전자 좌위로 교정 게놈의 통합 가능성을 감소시킨다는 점에서 유리하다. 이러한 침묵 변경은 또한 편집 요소와 표적 유전자 사이의 상동성을 감소시켜, 상동성 암보다는 편집 요소에 의해 매개되는 바람직하지 않은 통합을 감소시킨다.
따라서, 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 유전자의 엑손의 상응하는 코딩 영역에 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 유전자의 엑손의 상응하는 코딩 영역에 70% 미만으로 동일하게 침묵 변경된 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 유전자의 엑손의 상응하는 코딩 영역에 85% 미만으로 동일하게 침묵 변경된 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함한다.
특정 실시형태에서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하며, 엑손 1의 코딩 영역, 전체 엑손 2, 및 엑손 3의 코딩 영역 중 하나 이상은 야생형 HBB 유전자의 엑손의 상응하는 영역에 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하며, 엑손 1의 코딩 영역, 전체 엑손 2, 및 엑손 3의 코딩 영역의 하나 이상은 야생형 HBB 유전자의 엑손의 상응하는 영역에 70% 미만으로 동일하게 침묵 변경된다.
특정 실시형태에서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하며, 엑손 1의 코딩 영역, 전체 엑손 2, 및 엑손 3의 코딩 영역의 각각의 하나는 야생형 HBB 유전자의 엑손의 상응하는 영역에 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하며, 엑손 1의 코딩 영역, 전체 엑손 2, 및 엑손 3의 코딩 영역의 각각의 하나는 야생형 HBB 유전자의 엑손의 상응하는 영역에 70% 미만으로 동일하게 침묵 변경된다.
특정 실시형태에서, 상기 편집 요소는 서열 번호: 43 내지 46 및 105 내지 107로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 하나 이상을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 43 내지 46 및 105 내지 107로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 둘 이상을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 46에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 43, 44, 및 45에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 105, 106, 및 107에 기재된 뉴클레오티드 서열을 포함한다.
특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분에 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된 HBB 코딩 서열의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분에 70% 미만으로 동일하게 침묵 변경된 HBB 코딩 서열의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분에 85% 미만으로 동일하게 침묵 변경된 HBB 코딩 서열의 적어도 일부를 포함한다.
특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부가 야생형 HBB 코딩 서열의 상응하는 부분에 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부가 야생형 HBB 코딩 서열의 상응하는 부분과 70%미만으로 동일한 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부가 야생형 HBB 코딩 서열의 상응하는 부분과 85% 미만으로 동일한 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 적어도 일부를 포함한다.
특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된 HBB 코딩 서열의 뉴클레오티드 4 내지 444를 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분과 70% 미만으로 동일하게 침묵 변경된 HBB 코딩 서열의 뉴클레오티드 4 내지 444를 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 47에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열의 상응하는 부분과 85% 미만으로 동일하게 침묵 변경된 HBB 코딩 서열의 뉴클레오티드 4 내지 444를 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 100에 기재된 뉴클레오티드 서열을 포함한다. 이러한 편집 요소는 HBB 유전자 코딩 서열에 외인성 폴리아데닐화 서열 3'을 더 포함할 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': HBB 코딩 서열의 뉴클레오티드 4 내지 444; 및 외인성 폴리아데닐화 서열을 포함하며, HBB 코딩 서열의 뉴클레오티드 4 내지 444는 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다.
특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 일부가 야생형 HBB 코딩 서열의 상응하는 부분과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 HBB 코딩 서열의 뉴클레오티드 4 내지 444에 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 일부를 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 일부가 야생형 HBB 코딩 서열의 상응하는 부분과 70% 미만으로 동일한 HBB 코딩 서열의 뉴클레오티드 4 내지 444로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 일부를 포함한다. 특정 실시형태에서, HBB 스터퍼-삽입된 코딩 서열의 일부는 서열 번호: 47에 기재된 뉴클레오티드 서열로 전사 및 스플라이싱될 수 있다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열의 일부가 야생형 HBB 코딩 서열의 상응하는 부분과 85% 미만으로 동일한 HBB 코딩 서열의 뉴클레오티드 4 내지 444로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열의 일부를 포함한다. 특정 실시형태에서, HBB 스터퍼-삽입된 코딩 서열의 일부는 서열 번호: 100에 기재된 뉴클레오티드 서열로 전사 및 스플라이싱될 수 있다. 이러한 편집 요소는 HBB 유전자 코딩 서열에 외인성 폴리아데닐화 서열 3'을 더 포함할 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하며, HBB 스터퍼-삽입된 코딩 서열의 일부는 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 HBB 코딩 서열의 뉴클레오티드 4 내지 444로 전사 및 스플라이싱될 수 있다.
특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된 완전한 HBB 코딩 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열과 70% 미만으로 동일하게 침묵 변경된 완전한 HBB 코딩 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3' 시작 코돈 및 서열 번호: 47에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 28에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 야생형 HBB 코딩 서열과 85% 미만으로 동일하게 침묵 변경된 HBB 유전자의 완전한 HBB 코딩 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3' 시작 코돈 및 서열 번호: 100에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 99에 기재된 뉴클레오티드 서열을 포함한다. 이러한 편집 요소는 HBB 유전자 코딩 서열에 스플라이스 수용체 부위; 리보솜 스키핑 요소; 및 외인성 폴리아데닐화 서열 3'의 하나 이상을 더 포함할 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 리보솜 스키핑 요소; 및 선택적으로 시작 코돈이 없는 완전한 HBB 코딩 서열을 포함하며, 상기 완전한 HBB 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 리보솜 스키핑 요소; 선택적으로 시작 코돈이 없는 완전한 HBB 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하며, 상기 HBB 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 및 선택적으로 시작 코돈이 없는 완전한 HBB 코딩 서열을 포함하며, 상기 완전한 HBB 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 선택적으로 시작 코돈이 없는 완전한 HBB 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하며, 상기 완전한 HBB 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵 변경된다.
특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열이 야생형 HBB 코딩 서열과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열이 야생형 HBB 코딩 서열과 70% 미만으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열을 포함한다. 특정 실시형태에서, 상기 완전한 HBB 코딩 서열은 5' 내지 3' 시작 코돈 및 서열 번호: 47에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 완전한 HBB 코딩 서열은 서열 번호: 28에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 HBB 스터퍼-삽입된 코딩 서열은 서열 번호: 43 내지 45에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 HBB 스터퍼-삽입된 코딩 서열이 야생형 HBB 코딩 서열과 85% 미만으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있도록, 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열을 포함한다. 특정 실시형태에서, 상기 HBB 스터퍼-삽입된 코딩 서열은 서열 번호: 105, 106, 및 107에 기재된 5' 내지 3' 뉴클레오티드 서열을 포함한다. 이러한 편집 요소는 HBB 유전자 코딩 서열에 스플라이스 수용체 부위; 리보솜 스키핑 요소; 및 외인성 폴리아데닐화 서열 3'의 하나 이상을 더 포함할 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 리보솜 스키핑 요소; 및 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열을 포함하며, 상기 HBB 스터퍼-삽입된 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 리보솜 스키핑 요소; 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하며, 상기 HBB 스터퍼-삽입된 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 및 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열을 포함하며, 상기 HBB 스터퍼-삽입된 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있다. 특정 실시형태에서, 상기 편집 요소는 5' 내지 3': 스플라이스 수용체 부위; 리보솜 스키핑 요소; 침묵 변경된 HBB 스터퍼-삽입된 코딩 서열; 및 외인성 폴리아데닐화 서열을 포함하며, 상기 HBB 스터퍼-삽입된 코딩 서열은 야생형 HBB 코딩 서열의 상응하는 영역과 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일한 완전한 HBB 코딩 서열로 전사 및 스플라이싱될 수 있다.
본원에 개시된 임의의 및 모든 편집 요소는 표적 유전자에 존재하지 않는 독특한 서열(예를 들어, 야생형 또는 돌연변이체 HBB 유전자, 또는 그의 기능적 등가물을 인코딩하는 유전자)을 더 포함할 수 있고, 따라서 표적 좌위에서 편집 요소의 통합을 갖는 세포의 동정을 허용하도록 한다. 이러한 독특한 서열은 표적 좌위 및 그의 측면 영역 또는 이로부터 증폭된 핵산의 핵산 시퀀싱 분석(예를 들어, PCR 또는 차세대 시퀀싱)에 적합한 서열일 수 있다. 이러한 독특한 서열은 또한 표적 좌위 및 그의 측면 영역 또는 이로부터 증폭된 핵산의 제한 단편 길이 다형성 분석에 기초하여 표적 좌위에서 편집 요소의 통합을 갖는 세포의 동정을 허용하는 제한 엔도뉴클레아제 부위일 수 있다.
본원에 개시된 임의의 및 모든 편집 요소는 표적 좌위에 통합될 때 베타 글로빈 단백질에서 하나 이상의 아미노산 변형(예를 들어, 치환, 삽입 또는 결실)을 야기하는 하나 이상의 뉴클레오티드 변경을 포함할 수 있다. 특정 실시형태에서, 상기 변형된 베타 글로빈 단백질은 야생형 베타 글로빈의 기능적 등가물이며, 즉 야생형 베타 글로빈으로서 기능할 수 있다. 특정 실시형태에서, 기능적으로 등가인 베타 글로빈은 야생형 베타 글로빈에서 발견되지 않은 적어도 하나의 특성, 예를 들어 SCD 돌연변이를 보유한 베타 글로빈의 응집을 억제하는 능력을 더 포함한다.
특정 실시형태에서, 본원에 기재된 바와 같은 편집 요소는 적어도 0, 1, 2, 10, 100, 200, 500, 1000, 1500, 2000, 3000, 4000 또는 5000개의 뉴클레오티드를 포함한다. 특정 실시형태에서, 상기 편집 요소는 1 내지 5000, 1 내지 4500, 1 내지 4000, 1 내지 3000, 1 내지 2000, 1 내지 1000, 1 내지 500, 1 내지 200, 1 내지 100, 1 내지 50, 또는 1 내지 10개의 뉴클레오티드를 포함하거나 이로 구성된다.
특정 실시 형태에서, 본원에 기재된 바와 같은 편집 요소는 엑손, 인트론, 5' 비번역된 영역(UTR), 3' UTR, 프로모터, 스플라이스 공여체, 스플라이스 수용체, 리보솜 스키핑 요소, 비코딩 RNA를 인코딩하는 서열, 인슐레이터(insulator), 유전자, 또는 이들의 조합을 포함하거나 이로 구성된다.
특정 실시형태에서, 상기 편집 요소는 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 편집 요소는 서열 번호: 23 내지 26 중 어느 하나에 기재된 뉴클레오티드 서열로 구성된다.
본원에 개시된 교정 게놈에 사용되는 상동성 암은 표적 유전자(예를 들어, HBB 유전자) 또는 게놈 상 부근의 유전자의 임의의 영역으로 향할 수 있다. 상동성 암의 정확한 동일성 및 위치는 편집 요소 및/또는 표적 좌위의 동일성에 의해 결정된다.
본원에 개시된 교정 게놈에 사용된 상동성 암은 표적 좌위(예를 들어, HBB 유전자에서 표적 좌위) 측면에 있는 게놈과 실질적으로 동일하다. 특정 실시형태에서, 상기 5' 상동성 암은 표적 좌위에 대한 제1 게놈 영역 5'과 적어도 약 90%(예를 들어, 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 99.5%) 뉴클레오티드 서열 동일성을 갖는다. 특정 실시형태에서, 상기 5' 상동성 암은 상기 제1 게놈 영역과 100% 뉴클레오티드 서열 동일성을 갖는다. 특정 실시형태에서, 상기 3' 상동성 암은 표적 좌위에 대한 제2 게놈 영역 3'과 적어도 약 90%(예를 들어, 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 99.5%) 뉴클레오티드 서열 동일성을 갖는다. 특정 실시형태에서, 상기 3' 상동성 암은 상기 제2 게놈 영역과 100% 뉴클레오티드 서열 동일성을 갖는다. 특정 실시형태에서, 상기 5' 및 3' 상동성 암은 표적 좌위에 대한 제1 게놈 영역 5' 및 표적 좌위에 대한 제2 게놈 영역 3' 각각에 각각 적어도 약 90%(예를 들어, 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 99.5%) 동일하다. 특정 실시형태에서, 상기 5' 및 3' 상동성 암은 상기 제1 및 제2 게놈 영역 각각에 각각 100% 동일하다. 특정 실시형태에서, 상기 5' 상동성 암 및 상기 제1 게놈 영역의 뉴클레오티드 서열에서 차이 및/또는 상기 3' 상동성 암 및 상기 제2 게놈 영역의 뉴클레오티드 서열에서 차이는 뉴클레오티드 서열에서 비-코딩 영역 차이를 포함하고, 필수적으로 구성되거나 구성된다.
당업자는 상동성 암이 상동 재조합에 의해 편집 요소의 해당 표적 부위로의 통합을 매개할 수 있도록 표적 좌위 측면에 있는 게놈 서열에 100% 동일할 필요는 없음을 이해할 것이다. 당업자는 상동성 암이 표적 좌위 측면에 있는 게놈 서열과 100% 동일하지 않은 상황에서, 상동성 아암과 게놈 사이의 상동 재조합은 사용된 상동성 암의 서열과 동일하도록 표적 좌위의 측면에 있는 게놈 서열을 변경시킬 수 있다는 것을 더 이해할 것이다.
특정 실시형태에서, 표적 좌위에 대한 상기 제1 게놈 영역 5'는 제1 편집창에 위치하며, 상기 제1 편집창의 뉴클레오티드 서열은 서열 번호: 101 내지 103으로 이루어진 군으로부터 선택된 서열로 구성된다. 특정 실시형태에서, 표적 좌위에 대한 상기 제2 게놈 영역 3'은 제2 편집창에 위치하며, 상기 제2 편집창의 뉴클레오티드 서열은 서열 번호: 101 내지 103으로 이루어진 군으로부터 선택된 서열로 구성된다. 특정 실시형태에서, 표적 좌위에 대한 상기 제1 게놈 영역 5'는 제1 편집창에 위치하며, 상기 제1 편집창의 뉴클레오티드 서열은 서열 번호: 101 내지 103으로 이루어진 군으로부터 선택된 서열로 구성되며; 그리고 표적 좌위에 대한 상기 제2 게놈 영역 3'은 제2 편집창에 위치하며, 상기 제2 편집창의 뉴클레오티드 서열은 서열 번호: 101, 102, 또는 103에 기재된 서열로 구성된다.
특정 실시형태에서, 상기 제1 및 제2 편집창들은 상이하다. 특정 실시형태에서, 상기 제1 편집창은 상기 제2 편집창에 대해 5'에 위치된다. 특정 실시형태에서, 상기 제1 편집창은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제2 편집창은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제1 편집창은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성되며, 상기 제2 편집창은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 제1 게놈 영역은 상기 제1 편집창의 서열보다 더 짧은 서열로 구성된다. 특정 실시형태에서, 상기 제1 게놈 영역은 상기 제1 편집창의 서열로 구성된다. 특정 실시형태에서, 상기 제2 게놈 영역은 상기 제2 편집창의 서열보다 더 짧은 서열로 구성된다. 특정 실시형태에서, 상기 제2 게놈 영역은 상기 제2 편집창의 서열로 구성된다.
특정 실시형태에서, 상기 제1 및 제2 편집창들은 동일하다. 특정 실시형태에서, 상기 좌위는 편집창에서의 뉴클레오티드 간 결합 또는 뉴클레오티드 서열이며, 상기 제1 게놈 좌위는 표적 좌위에 대한 편집창 5'의 제1 부분으로 구성되며, 상기 제2 게놈 좌위는 표적 좌위에 대한 편집창 3'의 제2 부분으로 구성된다. 특정 실시형태에서, 상기 편집창의 제1 부분은 편집창의 5' 말단부터 표적 좌위에 5' 인접한 뉴클레오티드까지의 서열로 구성된다. 특정 실시형태에서, 상기 편집창의 제2 부분은 표적 좌위에 3' 인접한 뉴클레오티드로부터 편집창의 3' 말단까지의 서열로 구성된다. 특정 실시형태에서, 상기 편집창의 제1 부분은 편집창의 5' 말단부터 표적 좌위에 5' 인접한 뉴클레오티드까지의 서열로 구성되며, 그리고 상기 편집창의 제2 부분은 표적 좌위에 3' 인접한 뉴클레오티드로부터 편집창의 3' 말단까지의 서열로 구성된다. 특정 실시형태에서, 상기 편집창은 서열 번호: 103에 기재된 뉴클레오티드 서열로 구성된다. 특정 실시형태에서, 상기 편집차의 제1 및 제2 부분은 실질적으로 동일한 길이를 갖는다(예를 들어, 짧은 부분의 길이 대 긴 부분의 길이의 비가 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 0.96, 0.97, 0.98, 또는 0.99를 초과한다).
특정 실시형태에서, 상기 5' 상동성 암은 약 50 내지 약 4000 뉴클레오티드(예를 들어, 약 100 내지 약 3000, 약 200 내지 약 2000, 약 500 내지 약 1000 뉴클레오티드)의 길이를 갖는다. 특정 실시형태에서, 상기 5' 상동성 암은 약 800 뉴클레오티드의 길이를 갖는다. 특정 실시형태에서, 상기 5' 상동성 암은 약 100 뉴클레오티드의 길이를 갖는다. 특정 실시형태에서, 상기 3' 상동성 암은 약 50 내지 약 4000 뉴클레오티드(예를 들어, 약 100 내지 약 3000, 약 200 내지 약 2000, 약 500 내지 약 1000 뉴클레오티드)의 길이를 갖는다. 특정 실시형태에서, 상기 3' 상동성 암은 약 800 뉴클레오티드의 길이를 갖는다. 특정 실시형태에서, 상기 3' 상동성 암은 약 100 뉴클레오티드의 길이를 갖는다. 특정 실시형태에서, 상기 5' 및 3' 상동성 암의 각각은 독립적으로 약 50 내지 약 4000 뉴클레오티드(예를 들어, 약 100 내지 약 3000, 약 200 내지 약 2000, 약 500 내지 약 1000 뉴클레오티드)의 길이를 갖는다. 특정 실시형태에서, 상기 5' 및 3' 상동성 암은 약 800 뉴클레오티드의 길이를 갖는다.
특정 실시형태에서, 상기 5' 및 3' 상동성 암은 실질적으로 동일한 뉴클레오티드 길이를 갖는다. 특정 실시형태에서, 상기 5' 및 3' 상동성 암은 비대칭 뉴클레오티드 길이를 갖는다. 특정 실시형태에서, 뉴클레오티드의 비대칭성은 길이가 최대 80%, 70%, 60%, 50%, 40%, 30%, 20%, 또는 10% 차이와 같이, 길이가 최대 90%의 5' 및 3' 상동성 암 사이의 차이에 의해 정의된다.
특정 실시형태에서, 상기 교정 게놈은 서열 번호: 29 내지 42 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다.
특정 실시형태에서, 상기 교정 게놈은 5' 내지 3': 서열 번호: 101에 기재된 서열; 리보솜 스키핑 요소; 야생형 HBB 코딩 영역에 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵 변경된 HBB 코딩 서열; 외인성 폴리아데닐화 서열(예를 들어, 서열 번호: 76, 77, 78, 또는 79에 기재된 바와 같이); 및 서열 번호: 102에 기재된 서열을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 5' 내지 3': 서열 번호: 101에 기재된 서열; 리보솜 스키핑 요소; 서열 번호: 99에 기재된 서열; 외인성 폴리아데닐화 서열(예를 들어, 서열 번호: 76, 77, 78, 또는 79에 기재된 바와 같이); 및 서열 번호: 102에 기재된 서열을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 5' 내지 3': 서열 번호: 101에 기재된 서열; 리보솜 스키핑 요소; HBB의 제1 엑손의 야생형 코딩 영역에 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵 변경된 HBB의 제1 엑손의 코딩 영역; 선택적 제1 비천연 인트론; HBB의 야생형 제2 엑손에 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵 변경된 HBB의 제2 엑손; HBB의 제3 엑손의 야생형 코딩 영역에 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵 변경된 HBB의 제3 엑손의 코딩 영역; 외인성 폴리아데닐화 서열(예를 들어, 서열 번호: 76, 77, 78, 또는 79에 기재된 바와 같이); 및 서열 번호: 102에 기재된 서열을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 5' 내지 3': 서열 번호: 101에 기재된 서열; 리보솜 스키핑 요소; 서열 번호: 105에 기재된 서열; 선택적 제1 비천연 인트론; 서열 번호: 106에 기재된 서열; 선택적 제2 인트론; 서열 번호: 107에 기재된 서열; 외인성 폴리아데닐화 서열(예를 들어, 서열 번호: 76, 77, 78, 또는 79에 기재된 바와 같이); 및 서열 번호: 102에 기재된 서열을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 104에 기재된 뉴클레오티드 서열을 포함한다.
특정 실시형태에서, 본원에 개시된 교정 게놈은 상기 5' 상동성 암 뉴클레오티드 서열의 5' 반전된 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 3' 상동성 암 뉴클레오티드 서열의 3' 반전된 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 더 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 교정 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV에서 유래할 수 있다. 본원에 개시된 교정 게놈에 사용하기 위한 예시적인 ITR은 본원의 서열 번호: 18 내지 21에 기재되어 있다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열 및 상기 3' ITR 뉴클레오티드 서열은 실질적으로 서로 상보적이다(예를 들어, 상기 5' 또는 3' ITR에서 1, 2, 3, 4, 또는 5 뉴클레오티드 위치에서 미스매치(mismatch)를 제외하고 서로 상보적이다).
특정 실시형태에서, 상기 5' ITR 또는 3' ITR는 AAV2로부터 유래된다. 특정 실시형태에서, 상기 5' ITR 및 상기 3' ITR 양쪽 모두는 AAV2로부터 유래된다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 18과 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 가지며, 또는 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 19와 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 18과 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 19와 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열, 서열 번호: 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열 번호: 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 갖는 편집 요소를 포함한다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 29 내지 42 중 어느 하나에 기재된 뉴클레오티드 서열, 서열 번호: 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열 번호: 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다. 특정 실시형태에서, 상기 교정 게놈은 5' 내지 3' 서열 번호: 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 서열 번호: 29 내지 42 중 어느 하나에 기재된 뉴클레오티드 서열, 및 서열 번호: 19의 서열을 갖는 3' ITR 뉴클레오티드 서열로 구성된다.
특정 실시형태에서, 상기 5' ITR 또는 3' ITR는 AAV5로부터 유래된다. 특정 실시형태에서, 상기 5' ITR 및 3' ITR 양쪽 모두는 AAV5로부터 유래된다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 20과 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 가지며, 또는 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 21과 적어도 95% 서열 동일성을 갖는다. 특정 실시형태에서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 20과 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 21과 적어도 95%(예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열, 서열 번호: 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열 번호: 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 갖는 편집 요소를 포함한다. 특정 실시형태에서, 상기 교정 게놈은 서열 번호: 29 내지 42 중 어느 하나에 기재된 뉴클레오티드 서열, 서열 번호: 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열 번호: 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 갖는 편집 요소를 포함한다. 특정 실시형태에서, 상기 교정 게놈은 5' 내지 3' 서열 번호: 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 서열 번호: 29 내지 42 중 어느 하나에 기재된 뉴클레오티드 서열, 및 서열 번호: 21의 서열을 갖는 3' ITR 뉴클레오티드 서열로 구성된다.
특정 실시형태에서, 본원에 개시된 교정 게놈은 약 0.5 내지 약 8 kb, 및 이들 사이에 둘러싸인 임의의 범위(예를 들어, 약 1 내지 약 5, 약 2 내지 약 5, 약 3 내지 약 5, 약 4 내지 약 5, 약 4.5 내지 약 4.8 또는 약 4.7 kb)의 길이를 갖는다.
본원에 개시된 교정 게놈은 편집 요소를 HBB 유전자의 임의의 원하는 표적 좌위에 통합시키도록 구성될 수 있다. 특정 실시형태에서, 상기 표적 좌위는 상응하는 야생형 HBB 유전자 서열에 대한 HBB 유전자 서열에서의 돌연변이(예를 들어, 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환)이다. 특정 실시형태에서, 상기 표적 좌위는 상기 HBB 유전자에서 뉴클레오티드 점 돌연변이 또는 결실에 있다. 예시적인 HBB 점 돌연변이 또는 결실은 제한없이, 위치 -87에서 G, 위치 -31에서 G, 위치 -30에서 A, 위치 -29에서 G, 위치 -28에서 G, 위치 -10에서 T, 위치 1에서 C, 위치 1에서 A, 위치 2에서 G, 위치 17 및 18에서 C 및 T의 결실, 위치 19에서 A, 위치 20에서 A의 결실, 위치 20에서 T, 위치 25 및 26에서 A 및 A의 결실, 위치 26 이후 G의 추가, 위치 47에서 A, 위치 48에서 A, 위치 51에서 C의 결실, 위치 52에서 A, 위치 58에서 G, 위치 59에서 G, 위치 79에서 A, 위치 82에서 T, 위치 84 이후 C의 추가, 위치 93에서 T, 위치 93에서 A, 위치 97에서 C, 위치 98에서 C, 위치 202에서 G, 위치 208에서 G, 위치 222에서 C, 위치 241 또는 242에서 T의 결실, 위치 254 내지 257에서 T 및 T 및 C 및 T의 결실, 위치 260에서 T, 위치 264 또는 265에서 C의 결실, 위치 343 이후 A의 추가, 위치 399 및 400에서 G 및 T의 결실, 위치 401에서 T, 위치 417 이후 A의 추가, 446에서 A, 위치 1099에서 T, 위치 1293에서 A, 위치 1344에서 T를 포함한다. 특정 실시형태에서, 상기 표적 좌위는 겸상세포질환 돌연변이이다(즉, HBB 유전자의 위치 20에서 T). 특정 실시형태에서, 상기 표적 좌위는 HBB 유전자의 엑손 1에서 염색체 또는 뉴클레오티드 간 결합의 영역, 예를 들어 내인성 시작 코돈 직후(예를 들어, HBB 유전자의 뉴클레오티드 3과 뉴클레오티드 4 사이의 뉴클레오티드 간 결합)이다. 특정 실시형태에서, 상기 표적 좌위는 HBB 유전자의 인트론 1에서 염색체 또는 뉴클레오티드 간 결합의 영역이다. 특정 실시형태에서, 상기 표적 좌위는 야생형 HBB 유전자의 천연 정지 코돈 또는 돌연변이체 HBB 유전자의 상응하는 뉴클레오티드로 구성된다. 특정 실시형태에서, 상기 표적 좌위는 야생형 HBB 유전자의 정지 코돈에 인접한 5' 뉴클레오티드 간 결합 또는 돌연변이체 HBB 유전자의 상응하는 뉴클레오티드 간 결합으로 구성된다.
본원에 개시된 AAV 조성물은 생체 내 및 시험관 내 모두에서 고효율로 세포에서 HBB 유전자의 돌연변이를 교정할 수 있다는 점에서 특히 유리하다. 특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 조혈 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합 효율은 적어도 0.1%(예를 들어, 적어도 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 1.5%, 2%, 2.5%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다. 특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 조혈 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도는 적어도 0.05%(예를 들어, 적어도 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 1.5%, 2%, 2.5%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다.
유전자 편집의 효율을 결정하는 임의의 방법이 사용될 수 있다. 특정 실시형태에서, 개별 세포는 형질도입된 세포의 집단으로부터 분리되고 표적 좌위에 올바르게 통합된 편집 요소의 존재를 동정할 수 있는 PCR 프라이머를 사용하여 단일 세포 PCR을 받는다. 이러한 방법은 변형되지 않은 표적 좌위를 선택적으로 증폭시키는 PCR 프라이머를 사용하여 동일한 세포의 단일 세포 PCR을 더 포함할 수 있다. 이러한 방식으로, 세포의 유전자형이 결정될 수 있다. 예를 들어, 단일 세포 PCR이 세포가 편집된 표적 좌위 및 변형되지 않은 표적 좌위 양쪽 모두를 가지고 있음을 보이면, 세포는 편집된 HBB 유전자에 대한 이형 접합체로 간주될 것이다.
추가적으로 또는 대안적으로, 특정 실시형태에서, 형질도입된 세포의 집단(예를 들어, 조직 또는 기관)으로부터 추출된 DNA에 대해 선형 증폭 매개 PCR(LAM-PCR), 정량적 PCR(qPCR) 또는 디지털 액적 PCR(ddPCR)을 수행하여 통합의 대립 유전자 빈도를 평가할 수 있다. 특정 실시형태에서, 상기 추출된 DNA는 상이한 서열을 검출하는 적어도 2개의 프라이머 쌍을 사용하여 디지털 액적 PCR(ddPCR)에 의해 분석된다. 예를 들어, ddPCR은 비통합 및 통합된 벡터뿐만 아니라, 비편집 및 편집된 표적 좌위를 검출하는 제1 프라이머 쌍, 비통합 및 통합된 벡터에 존재하는 서열을 검출하는 제2 프라이머 쌍, 및 선택적으로 비편집 및 편집된 표적 좌위에 존재하는 상동성 암에서 서열을 검출하는 제3 프라이머 쌍을 이용할 수 있다. 비편집 게놈 DNA 및 비통합 벡터의 공동-파티셔닝(co-partitioning) 가능성의 교정 후, 제1 및 제2 프라이머 쌍 양쪽 모두에 양성인 액적의 백분율은 통합의 대립 유전자 빈도에 해당한다. 본 방법의 일예는 본원의 실시예 1에 기재되어 있다.
추가적으로 또는 대안적으로, 특정 실시형태에서, 상기 HBB 좌위는 형질도입된 세포의 집단(예를 들어, 조직 또는 기관)으로부터 추출된 DNA로부터 교정 게놈에 의해 포함된 게놈 영역의 측면에 HBB 유전자의 영역과 결합하는 프라이머를 사용하는 PCR 또는 교정 게놈 내의 영역(예를 들어, 좌위에 비천연인 외인성 서열을 포함하는 영역)과 결합하는 프라이머를 사용하는 선형 증폭 매개 PCR(LAM-PCR)에 의해 증폭될 수 있다. 생성된 PCR 앰플리콘은 형질도입된 세포의 집단에 존재하는 편집 및 비편집된 HBB 대립 유전자의 상대적인 수를 결정하기 위해 단일 분자 차세대 시퀀싱(NGS: next generation sequencing) 기법을 사용하여 개별적으로 시퀀싱될 수 있다. 이 숫자는 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도를 결정하는 데 사용될 수 있다.
다른 양태에서, 본 개시내용은 본원에 개시된 바와 같은 AAV를 약학적으로 허용 가능한 부형제, 보조제, 희석제, 운반체 또는 담체, 또는 이들의 조합과 함께 포함하는 약학적 조성물을 제공한다. "약학적으로 허용 가능한 담체"는 조성물의 활성 성분과 조합될 때 성분이 생물학적 활성을 유지하게 하고, 의도하지 않은 면역 반응과 같은 파괴적인 생리학적 반응을 유발하지 않으면서 임의의 물질을 포함한다. 약학적으로 허용 가능한 담체는 물, 인산염 완충 식염수, 오일/물 현탁액과 같은 현탁액 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 문헌[Remington's Pharmaceutical Sciences, current Ed., Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 20th edition, Lippincott, Williams, & Wilkins]; 문헌[Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al, 7th ed., Lippincott, Williams, & Wilkins]; 및 문헌[Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al, 3rd ed. Amer. Pharmaceutical Assoc]에 기재된 것과 같은 주지된 종래 방법에 의해 제형화 된다.
III. 사용법
다른 양태에서, 본 개시내용은 세포 내 HBB 유전자에서 돌연변이를 교정하는 방법을 제공한다. 상기 방법은 일반적으로 세포에 본원에 개시된 바와 같은 복제-결함 AAV를 형질도입하는 단계를 포함한다. 이러한 방법은 HBB 유전자에서 돌연변이를 교정하는 데 매우 효율적이며 그러한 교정을 용이하게 하기 위하여 외인성 뉴클레아제(예를 들어, 거대뉴클레아제, 징크 핑거 뉴클레아제, 전사 활성화제-유사 뉴클레아제(TALEN: transcriptional activator-like nuclease), 또는 Cas9와 같은 RNA-가이드 뉴클레아제)의 작용에 의해 표적 좌위에서 게놈의 절단을 필요로 하지 않는다. 따라서, 특정 실시형태에서, 본원에 개시된 방법은 외인성 뉴 클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 공동-형질도입하거나 공동-투여하지 않고 세포에 본원에 개시된 바와 같은 복제-결함 AAV를 형질도입하는 단계를 포함한다.
본원에 개시된 방법은 HBB 유전자에서 돌연변이를 보유하는 임의의 세포에 적용될 수 있다. 당업자는 적혈구로 분화할 수 있는 세포가 특히 중요하다는 것을 이해할 것이다. 따라서, 특정 실시형태에서, 상기 방법은 다능성 줄기 세포, 유도된 다능성 줄기 세포(iPSC: induced pluripotent stem cell), 및 조혈 줄기 세포(HSC: hematopoietic stem cell)를 포함하나 이에 한정되지 않는 줄기 세포에 적용된다. 상기 방법이 적용될 수 있는 예시적인 HSC는 제한없이 CD34+ HSC를 포함한다.
본원에 개시된 방법은 연구 목적으로 시험 관내에서 수행될 수 있거나 치료 목적으로 생체 외 또는 생체 내에서 수행될 수 있다.
특정 실시형태에서, 형질도입될 세포는 대상체로부터 취해지고 본원에 개시된 방법에 따라 생체 외 HBB 유전자에서 돌연변이를 교정하도록 형질도입되며, 이후, 형질도입된 세포는 대상체에게 다시 투여된다. 따라서, 특정 실시형태에서, 본 개시내용은 HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법에서, 상기 방법은 생체 외 줄기 세포(예를 들어, CD34+ 조혈 줄기 세포)에 본원에 개시된 바와 같은 복제-결함 AAV를 형질도입하여 형질도입된 세포를 수득하는 단계; 및 상기 형질도입된 세포를 대상체에게 투여하는 단계를 포함하는, 방법을 제공한다. 상기 형질도입된 세포는 대상체에게 투여되기 전에 정확한 유전자 통합을 위해 선택되고/되거나 클론 확장을 위해 배양될 수 있다. 특정 실시형태에서, 형질도입될 줄기 세포는 골수, 제대혈, 또는 말초 혈액으로부터 수득되며, 상기 줄기 세포는 하나 이상의 세포 마커(예를 들어, 세포 크기, 세포 밀도, 및 CD34와 같은 표면 마커)에 기반한 방법에 의해 선택적으로 선택된다. 특정 실시형태에서, 상기 줄기 세포는 자가성(autologous), 즉 AAV 형질도입 후 세포가 투여될 대상체로부터 유래된다. 특정 실시형태에서, 상기 줄기 세포는 이를 필요로 하는 대상체와 동종이계적이며, 즉 상기 줄기 세포는 수령자 대상체와 유전적으로 동일하지 않은 공여체로부터 수득된다. 따라서, 특정 실시형태에서, 본 개시내용은 HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법에서, 상기 방법은 생체 외 동종이계 줄기 세포(예를 들어, CD34+ 조혈 줄기 세포)에 본원에 개시된 바와 같은 복제-결함 AAV를 형질도입하여 형질도입된 세포를 수득하는 단계; 및 상기 형질도입된 세포를 대상체에게 투여하는 단계를 포함하는, 방법을 제공한다. 특정 실시형태에서, 상기 동종이계 줄기 세포는 매칭된(matched) 공여체로부터 유래된다. 당업자는 동종이계 적용을 위해, 형질도입된 세포가 투여 전에 추가적인 변형, 예를 들어 이식편 대 숙주 질환(GVHD: graft-versus-host disease)의 발생을 예방 및/또는 감소시키기 위한 유전적 변형을 요구할 수 있음을 인식할 것이다. 상기 대상체는 인간 대상체 또는 인간 적혈구 전구세포를 함유하는 설치류 대상체(예를 들어, 마우스)일 수 있다. 적합한 마우스 대상체는 제한적으로 인간 줄기 세포(예를 들어, 인간 CD34+ HSC)가 이식된 마우스를 포함한다. HBB 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적합한 질환 또는 장애는 제한없이 베타 지중해빈혈증 또는 겸상세포질환을 포함한다. 특정 실시형태에서, 상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하지 않고 형질도입된다.
특정 실시형태에서, 형질도입될 세포는 포유 동물 대상체에 있으며, AAV는 대상체에서 세포를 형질도입시키기에 효과적인 양으로 대상체에게 투여된다. 따라서, 특정 실시형태에서, 본 개시내용은 HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법에서, 상기 방법은 일반적으로 유효량의 본원에 개시된 바와 같은 복제-결함 AAV를 대상체에게 투여하는 단계를 포함하는, 방법을 제공한다. 상기 대상체는 인간 대상체, 비인간 영장류 대상체(예를 들어, 마카카 파시쿨라리스(Macaca fascicularis)), 또는 인간 적혈구 전구세포를 함유하는 설치류 대상체(예를 들어, 마우스)일 수 있다. 적합한 마우스 대상체는 제한없이 인간 줄기 세포(예를 들어, 인간 CD34+ HSC)가 이식된 마우스를 포함한다. HBB 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적합한 질환 또는 장애는 제한없이 베타 지중해빈혈증 또는 겸상세포질환을 포함한다. 특정 실시형태에서, 상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 공동-형질도입하거나 공동-투여하지 않고 형질도입된다.
본원에 개시된 방법은 생체 내 및 시험 관내 양쪽 모두에서 고효율로 세포에서 HBB 유전자를 교정할 수 있다는 점에서 특히 유리하다. 특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합 효율은 적어도 0.1%(예를 들어, 적어도 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 1.5%, 2%, 2.5%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다. 특정 실시형태에서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도는 적어도 0.05%(예를 들어, 적어도 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 1.5%, 2%, 2.5%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다. 유전자 편집의 효율을 결정하는 임의의 방법이 본원에 기재된 것을 제한없이 포함하여 이용될 수 있다.
특정 실시형태에서, 세포에 본원에 개시된 AAV 조성물의 형질도입은 본원에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 특정 실시형태에서, 상기 세포는 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도(MOI: multiplicity of infection)에서 또는 세포의 최적 형질도입을 제공하는 임의의 MOI에서 AAV와 접촉될 수 있다. 특정 실시형태에서, 상기 대상체는 체중 kg 당 약 1011, 1012, 1013, 1014, 또는 1015개의 벡터 게놈의 용량으로 AAV를 투여받을 수 있다.
본원에 개시된 AAV 조성물은 정맥 내, 복강 내, 피하, 근육 내, 비내, 국소 또는 피내 경로를 포함하지만 이에 제한되지 않는 임의의 적절한 경로에 의해 대상체에게 투여될 수 있다. 특정 실시형태에서, 상기 조성물은 정맥 내 주사 또는 피하 주사를 통한 투여를 위해 제형화된다.
IV. AAV 패키징 시스템
다른 양태에서, 본 개시내용은 본원에 개시된 복제-결함 AAV의 재조합 제조용 패키징 시스템을 제공한다. 이러한 패키징 시스템은 일반적으로: 하나 이상의 AAV Rep 단백질을 인코딩하는 Rep 뉴클레오티드 서열; 본원에 개시된 바와 같은 하나 이상의 AAV Clade F 캡시드 단백질을 인코딩하는 Cap 뉴클레오티드 서열; 및 본원에 개시된 바와 같은 HBB 유전자에서 돌연변이의 교정을 위한 교정 게놈을 포함하며, 상기 패키징 시스템은 상기 캡시드 내에 상기 교정 게놈을 봉입하기 위한 세포 내에서 작용하여 상기 AAV를 형성한다.
특정 실시형태에서, 상기 패키징 시스템은 상기 Rep 뉴클레오티드 서열 및 상기 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 교정 게놈을 포함하는 제2 벡터를 포함한다. 본원에 기재된 바와 같은 패키징 시스템과 관련하여 사용된 "벡터"는 핵산을 세포 내로 도입하기 위한 운반체인 핵산 분자(예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등)를 지칭한다.
임의의 AAV Rep 단백질이 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 실시형태에서, 상기 Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 인코딩한다. 적합한 AAV2 Rep 단백질은 제한없이 Rep 78/68 또는 Rep 68/52를 포함한다. 패키징 시스템의 특정 실시형태에서, AAV2 Rep 단백질을 인코딩하는 뉴클레오타이드 서열은 서열 번호: 22의 AAV2 Rep 아미노산 서열과 최소 퍼센트 서열 동일성을 갖는 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하며, 상기 최소 퍼센트 서열 동일성은 상기 AAV2 Rep 단백질의 아미노산 서열의 길이에 걸쳐 적어도 70%(예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 특정 실시형태에서, 상기 AAV2 Rep 단백질은 서열 번호: 22에 기재된 아미노산 서열을 갖는다.
패키징 시스템의 특정 실시형태에서, 상기 패키징 시스템은 제3 벡터, 예를 들어, 헬퍼 바이러스 벡터를 더 포함한다. 상기 제3 벡터는 상기 제1 벡터와 통합되거나, 상기 제2 벡터와 통합된 독립 제3 벡터일 수 있다. 특정 실시형태에서, 상기 제3 벡터는 헬퍼 바이러스 단백질을 인코딩하는 유전자를 포함한다.
패키징 시스템의 특정 실시형태에서, 상기 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스(헤르페스 단순 바이러스(HSV: herpes simplex virus) 포함), 폭스바이러스(예를 들어, 백시니아 바이러스), 거대세포바이러스(CMV: cytomegalovirus), 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 상기 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 실시형태에서, 아데노바이러스 게놈은 E1, E2, E4, 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 상기 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 실시형태에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22, 및 UL30/UL42로 이루어진 군으로부터 선택된 HSV 유전자 중 하나 이상을 포함한다.
패키징 시스템의 특정 실시형태에서, 상기 제1, 제2, 및/또는 제3 벡터는 하나 이상의 형질감염 플라스미드 내에 함유된다. 특정 실시형태에서, 상기 제1 벡터 및 상기 제3 벡터는 제1 형질감염 플라스미드 내에 함유된다. 특정 실시형태에서, 상기 제2 벡터 및 상기 제3 벡터는 제2 형질감염 플라스미드 내에 함유된다.
패키징 시스템의 특정 실시형태에서, 상기 제1, 제2, 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시형태에서, 상기 제1 벡터 및 상기 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시형태에서, 상기 제2 벡터 및 상기 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.
또 다른 양태에서, 본 개시내용은 본원에 기재된 바와 같은 AAV의 재조합 제조방법으로서, 상기 방법은 세포에 캡시드 내에 교정 게놈을 봉입하기 위해 작용하는 조건 하에서 기재된 바와 같은 패키징 시스템으로 형질감염 또는 형질도입하는 단계를 포함하는, 방법을 제공한다. 예시적인 AAV의 재조합 제조 방법은 일시적 형질 감염(예를 들어, 본원에 기재된 바와 같이 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드를 사용함), 바이러스 감염(예를 들어, 본원에 기재된 바와 같이 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는, 아데노바이러스, 폭스바이럿(예를 들어, 백시니아 바이러스), 헤르페스 바이러스(HSV 포함), 거대세포바이러스, 또는 배큘로바이러스와 같은 하나 이상의 재조합 헬퍼 바이러스를 사용함), 및 안정한 생산자 세포주 형질감염 또는 감염(예를 들어, 본원에 기재된 바와 같이 하나 이상의 AAV Rep 단백질을 인코딩하는 Rep 뉴클레오티드 서열 및/또는 하나 이상의 AAV Clade F 캡시드 단백질을 인코딩하는 Cap 뉴클레오티드 서열을 함유하는, 포유 동물 또는 곤충 세포와 같은 안정한 생산자 세포를 사용하며, 형질감염 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본원에 기재된 바와 같이 교정 게놈을 사용함)을 포함한다.
V. 실시예
본원에 개시된 재조합 AAV 벡터는 뉴클레아제가 없는 상동성 의존 복구 기반 메커니즘을 통해 시험 관내 및 생체 내에서 매우 효율적인 유전자 편집을 매개한다. 하기 실시예는 본원에 개시된 바와 같은 AAV-기반 벡터를 사용하여 겸상세포질환(SCD: sickle cell disease) 및 베타 지중해빈혈증과 같은 특정 인간 질환에서 돌연변이된 HBB 유전자의 효율적인 교정을 입증한다. 이들 실시예는 제한이 아니라 예시로서 제공된다.
실시예 1 : HBB-돌연변이체 세포의 유전자 편집을 위한 AAV 캡시드의 선택
본 실시예는 HBB 돌연변이체 세포에서 AAVHSC7, AAVHSC15, 및 AAVHSC17과 같은 clade F AAV 캡시드에 패키지된 유전자 편집 AAV 벡터, AAVS1-FP의 통합 효율을 특징으로 한다. 각각 AAVF7, AAVF15, 및 AAVF17로도 공지된 AAVHSC7, AAVHSC15, 및 AAVHSC17은 WO2016049230A1에 완전히 기재되어 있으며, 이는 그 전체 내용이 본원에 인용되어 포함된다.
본원에 사용된 유전자 편집 벡터인 AAVS1-FP는 WO2016049230A1에 완전히 기재되어 있다. 이는 5' 내지 3': AAV2 5' 반전된 말단 반복(ITR: inverted terminal repeat), 표적 좌위로부터 상류 DNA의 서열을 갖는 800개의 뉴클레오티드로 구성된 5' 상동성 암, 업스트림, 스플라이스 수용체, 2A 요소, 형광 단백질(FP: fluorescent protein)의 코딩 서열, 표적 좌위로부터 하류 DNA의 서열을 갖는 800개의 뉴클레오티드로 구성된 3' 상동성 암, 및 AAV2 3' ITR을 포함하며, 상기 표적 좌위는 염색체 19 상의 AAVS1에서 인간 PPP1R12C의 인트론 1에 존재하며, AAVS1-FP 벡터와 인간 게놈 사이의 상동 재조합 후, PPP1R12C의 엑손 1, 2A 요소, 및 FP 코딩 서열이 프레임 내에 있다. 벡터에서 FP 코딩 서열은 프로모터가 없기 때문에, 이 벡터로 형질도입된 세포는 벡터가 게놈에 통합된 경우에만 FP를 발현할 것이다. AAV2 ITR 및 향상된 녹색 형광 단백질(EGFP: enhanced green fluorescent protein)에 작동 가능하게 연결된 프로모터를 포함하는 자가-상보성 AAV 벡터인 AAVHSC-scEGFP는 형질도입 효율의 제어로서 역할하였다(예를 들어, 그 전체 내용이 본원에 인용되어 포함된 미국 특허 제8,628,966호 참조).
겸상세포질환(SCD: sickle cell disease)의 특징인 HBB의 인트론 1에서 위치 20에서 A에서 T로 돌연변이를 갖는 림프 모세포 세포주(LCL: lymphoblastoid cell line)인 GM16265 세포를 코리엘 의료 연구소(Coriell Institute for Medical Research)(뉴저지 주 캠든 소재)로부터 얻었다. LCL을 15% FCS 및 2 mM L-글루타민이 보충된 RPMI에서 배양하였다. 세포를 ml 당 대략 200,000개의 세포에 시딩(seed)하고 ml 당 500,000 내지 1,000,000개으 세포에 도달할 때 분열시켰다. 세포를 도말하기 전에, 필요한 바이러스 양을 각각의 형질도입에 대해 계산하였다. 바이러스의 형질도입 부피는 웰의 총 부피의 10%를 초과하지 않았다. 형질도입 당일, 로그 상 세포를 계수하고 도말하였다. 1.5 x 105의 감염 다중도(MOI: multiplicity of infection)에서 바이러스로 세포에 형질도입하였다. 패키지된 AAV 입자를 형질도입 전에 얼음 상에서 해동시키고 필요한 경우 얼음 상에서 초음파 처리하고, 각 웰에 개별적으로 첨가하였다. 형질도입 48 시간 후 세포를 수확하였다.
GM16265 세포는 AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드에 패키지된 AAVS1-FP 벡터로 형질도입되었다. 통합 효율은 하기 방법을 사용하여 유세포 분석에 의해 평가되었다: 세포를 FACS 완충액(IX PBS, 2% FCS, 0.1% 나트륨 아지드)을 사용하여 수확하고, 1200 RPM에서 10 분 동안 원심분리하였다. 여분의 상청액을 따라내어 대략 200 μl가 남았다. 4',6-디아미디노-2-페닐리놀레(DAPI)를 유세포 분석 직전에 100 μM 워킹 스톡(working stock)으로부터 3 μM의 최종 농도로 첨가하였다.
도 1a에 도시된 바와 같이, AAVHSC7-AAVS1-FP 및 AAVHSC17-AAVS1-FP에 의해 형질도입된 모든 활물 세포 중 FP-양성 세포의 백분율은 각각 24.3%(34.0% - 배경 레벨 9.7%) 및 7.8%(17.5% - 배경 레벨 9.7%)였다. 도 1b에 도시된 바와 같이, 다른 실험에서, AAVHSC15-AAVS1-FP 및 AAVHSC17-AAVS1-FP에 의해 형질도입된 모든 활물 세포 중 FP-양성 세포의 백분율은 각각 25.1%(29.8 % - 배경 레벨 4.7%) 및 37.6%(42.3% - 배경 레벨 4.7%)였다. 이 데이터는 GM16265 세포가 AAVHSC7, AAVHSC15 및 AAVHSC17 캡시드에 패키지된 AAVS1-FP에 의해 효율적으로 형질도입될 수 있음을 보여준다.
AAVHSC17 캡시드에 패키지된 이 AAVS1-FP 벡터의 통합 효율은 또한 1차 인간 CD34+ 조혈 줄기 세포(HSC)에서 검사되었다. 1차 인간 CD34+ HSC를 Miltenyi CD34 MicroBeads를 2회 농축함으로써 SCD를 갖는 공여체로부터의 인간 말초 혈액 세포로부터 정제하거나, 유사한 이중 농축 절차에 따라 ReachBio Inc.로부터 수득하였다. 세포를 20% 우태혈청(FCS: Fetal Calf Serum), 100 μg/mL 스트렙토마이신, 100 U/mL 페니실린, 2mmol/L L-글루타민, 10 ng/mL 인간 IL-3, 10 ng/mL 인간 IL-6, 및 1 ng/mL 인간 SCF으로 보충된 이스코브 변형된 둘베코 배지(IMDM: Iscove's Modified Dulbecco's Medium)에서 배양하였다. 약 200,000개의 세포를 500 μl 배지에 도말하였다. AAV 입자를 배지에 직접 첨가하였다. 형질도입 48 시간 후 세포를 수확하였다.
BioRad QX200™ Droplet Digital™ PCR 시스템을 사용하는 디지털 액적 PCR에 의해 편집 효율을 측정하였다. 표 1에 나타낸 바와 같이, 두 세트의 프라이머 및 프로브를 ddPCR에 의한 통합을 정량화하도록 설계하였다. AAVS1_Genomic 세트는 게놈의 AAVS1 좌위에 FP 코딩 서열의 표적화된 통합 후 비편집된 게놈 및 편집된 게놈에서 상동성 암 외부에 존재하는 AAVS1 좌위에서 서열을 검출하였다. AAVS1_FP 세트는 게놈의 AAVS1 좌위에 FP 코딩 서열의 표적화된 통합 후 편집된 게놈에서만 존재하는 FP 코딩 영역에서 서열을 검출하였다. 2개의 프로브를 상이한 파장의 형광 모이어티에 접합시켰다.
100 pg/μl의 DNA를 갖는 샘플을 오일 액적으로 분할하였다. 대부분의 오일 액적은 DNA 분자를 함유하지 않거나 단일 DNA 분자-AAVS1_Genomic 세트에만 양성인 비편집된 게놈; AAVS1_FP 세트에만 양성인 비통합된 벡터; 또는 프라이머/프로브 세트 양쪽 모두에 양성인 편집된 게놈을 함유하였다. 공동-파티션의 가능성을 여러 표준 샘플에 의해 결정하였다(그 전체 내용이 본원에 인용되어 포함되어 있는, 문헌[Regan et al, A rapid molecular approach for chromosomal phasing, PLoS One. (2015) 10(3):e0118270] 참조). 표준 샘플은 μl 당 100개의 비편집된 게놈, μl 당 1000개의 에피솜 벡터, 및 각각 μl 당 1, 5, 10, 15, 20, 및 25개의 편집된 대립 유전자에서 클로닝된 양성 대립 유전자의 범위를 함유하였다. 비편집 대 편집된 대립 유전자의 비율에 대한 공동-분할의 표준 곡선을 플롯팅하였다(R2 = 0.972, 피어슨(Pearson) 상관 p <0.001).
각각의 샘플을 적어도 3회의 실험에서 ddPCR로 분석하였고, 각각의 샘플에서 AAVS1_Genomic 양성, AAVS1_FP 양성, 및 이중 양성 액적의 양을 측정하였으며 각각의 샘플에서 비편집 대 편집된 대립 유전자의 알려진 비율에 대해 플롯팅하였다. 도 1c에 도시된 바와 같이, 게놈으로의 FP 코딩 서열의 통합을 1차 인간 CD34+ HSC로부터의 모든 대립 유전자의 약 30%에서 검출하였다. 따라서, AAVHSC17 캡시드에 패키지된 AAVS1-FP는 1차 인간 Cd34+를 효율적으로 형질도입하였다.
실시예 2: HBB 돌연변이의 시험관 내 교정
도 2에 도시된 바와 같이, hHBB-hL-014라는 명칭의 AAV-기반 HBB 교정 벡터를 생성하였다. 이 교정 벡터는 겸상세포질환에서 HBB 유전자의 엑손 1의 코딩 영역(시작 코돈으로부터 시작)에서 뉴클레오티드 20에서 HBB 돌연변이, 예를 들어 A에서 T로의 돌연변이를 교정하도록 설계되었다. hHBB-hL-014 벡터는 HBB의 일부 및 그 주변 게놈 서열 측면의 5' 및 3' AAV2 ITR을 포함하였으며, 엑손 1에서 뉴클레오티드 20에서 A에서 T로의 돌연변이는 역전되었다. HBB 게놈 서열의 일부를 NCBB Primer Blast(www.ncbi.nlm.nih.gov/tools/primer-blast/)를 사용하여 설계된 표 2에 나타낸 바와 같이 증폭 프라이머를 사용하여 야생형 HBB 및 그의 주변 좌위로부터 수득 하였다. PCR 산물은 HBB의 모든 엑손 및 인트론을 커버하였고, HBB 전사 개시 부위로부터 상류에 1678개의 뉴클레오티드 및 HBB 폴리아데닐화 서열로부터 하류에 234개의 뉴클레오티드를 더 포함하였다. 겸상세포질환에서 HBB 돌연변이와 관련하여, 이 벡터는 각각 약 1.7 kb 길이의 상동성 암(돌연변이 역전 부위에 대한 게놈 서열 5' 및 3')을 함유하였다. ITR의 무결성(integrity)을 Bglll, Mscl, 및 Smal을 사용한 제한 다이제스트 스크리닝 및 ITR 특이적 시퀀싱 프로토콜을 사용한 시퀀싱에 의해 확인하였다(문헌[Mroske et al., Hum Gene Ther Methods (2012) 23 (2) : 128-36]). 인서트(insert)는 본원의 표 3에 나타낸 프라이머를 사용한 제한 다이제스트 및 생거(Sanger) 시퀀싱에 의해 확인되었다. 이 벡터는 HBB 엑손 및 인트론에서의 돌연변이뿐만 아니라 베타 지중해빈혈증에서 관찰된 바와 같이 HBB 발현에 영향을 미치는 5' 및 3' 비번역된 영역에서의 돌연변이를 교정할 수 있었다.
교정된 유전자의 검출을 용이하게 하기 위해, ClaI 제한 부위 및 SpeI 제한 부위를 함유하는 ACTAGTATCGAT(서열 번호: 80)의 서열을 갖는 12-bp 링커를 HBB 유전자에 삽입하였다. 이 링커 서열은 시작 코돈으로부터 117 bp 및 돌연변이 역전 부위로부터 97 bp인 인트론 1에 위치하여, 링커(Linker)와 원하는 유전자 교정 사이에 강력한 유전적 연결을 확립하였다. 인트론 1에서 주요 공여체 및 수용체 부위의 파괴를 교정된 HBB의 mRNA 스플라이싱을 유지하기 위해 회피하였다.
hHBB-hL-014 벡터를 그 전체 내용이 본원에 인용되어 포함되어 있는 문헌[Chatterjee et al., (1993) Methods 5:51-59]에 기재된 패키징 방법을 사용하여 AAVHSC15 또는 AAVHSC17 캡시드 단백질로 패키징하였다. 패키지된 바이러스의 역가를 표 4에 나타낸 프라이머 및 프로브를 사용하여 qPCR에 의해 결정하였다.
AAVHSC15-hHBB-hL-014 및 AAVHSC17-hHBB-hL-014 바이러스를 표적된 통합(TI) 분석법을 사용하여 GM16265 세포에서 HBB 유전자를 편집하는 능력에 대해 테스트하였다. 이 분석에서, 세포를 4000 RPM에서 10분 동안 원심분리하고, IX PBS로 세척하였고, 펠릿을 후속 사용을 위해 80℃에서 동결시켰다. 냉동된 세포 펠릿을 100,000개 세포에 대해 200 μl에서 재현탁시켰다. 무 DNase(DNase-free) RNase 1 μl를 첨가하고 37℃에서 1 시간 동안 배양하였다. 10% SDS 10 μl 및 프로테나제 K 1.2 μl를 첨가하고 56℃에서 하룻밤동안 배양하였다. 고 분자량 DNA를 표준 페놀 및 클로로포름 추출에 의해 추출하였다. 높은 DNA 수율을 위해, 0.5X 부피의 Tris-EDTA 완충액(TE: Tris-EDTA buffer) (pH 8.0)으로 역 추출을 수행하고 최종 튜브에 첨가하였다. DNA를 2.5 M의 최종 농도에서 10 M 암모늄 아세테이트로 침전시켰다. 대략 4X 부피의 빙냉 100% 에탄올을 첨가하였다. DNA를 -80℃에서 적어도 1 시간 동안 침전시켰다. DNA를 70% 에탄올로 세척하고, 건조시키고, 대략 30 내지 50 μ의 TE에 재현탁시키고, 나노드롭(Nanodrop)에 의해 정량화하였다. 정량화 후, hHBB-hL-014 벡터와 HBB 유전자 사이의 정확한 재조합을 확인하기 위해 DNA를 적절한 프라이머를 사용하여 PCR 기반의 "표적된 통합"(TI) 분석을 거쳤다.
표 5에 기재된 서열을 갖는 프라이머를 본 실시예에서 TI 검정에 사용하였다. HBB2MTI100 프라이머는 링커 및 그 주변 영역을 표적하였고, HBB350 프라이머는 상동성 암 외부의 게놈 서열을 표적하였다. PCR 반응은 편집된 게놈으로부터 단리된 DNA로부터 2,219 bp 앰플리콘을 생성하지만 형질도입되지 않은 세포 또는 hHBB-hL-014 벡터 단독으로부터 단리된 DNA를 실질적으로 증폭하지 않을 것이다.
PCR 반응을 다음과 같이 설정하였다: 최대 50 μl의 PCR 물; 10 μl의 5X Q5 완충액; 5 μl의 베타인; 1 μl의 10 mM dNTP; 1 μl의 HBB2MTI100 정방향 프라이머(25 μΜ 농도); 1 μl의 HBB 350 역방향 프라이머(25 μM 농도); 100 ng 내지 1 μg의 게놈 DNA; 1 μl의 NEB Q5 고충실도 폴리머라제. PCR 기계를 다음과 같이 설정하였다: 95℃에서 5 분 동안 초기 변성; 95℃에서 10 초 동안 변성 15 사이클, 70℃에서 30 초 동안 어닐링, 사이클마다 0.5 도 감소, 및 72℃에서 2 분 동안의 연장; 95℃에서 10 초 동안 변성 20 사이클; 65℃에서 30 초 동안 어닐링, 및 72℃에서 2 분 동안 연장; 및 72℃에서 5 분 동안의 최종 연장. PCR 산물을 겔 전기영동에 의해 분석하였다.
2.2 kb의 겉보기 크기를 갖는 앰플리콘을 단리하고 무딘 말단(blunt-end)을 pUC18 백본(backbone)에 결찰시켰다. 생성된 플라스미드를 ClaI 또는 SpeI 엔도뉴클레아제를 사용하여 제한 소화에 의해 분석하여 링커의 정확한 삽입으로 클론을 동정하였다. 제한 소화에 의해 동정된 양성 클론을 M13F 및 M13R 올리고뉴클레오티드 프라이머를 사용한 DNA 시퀀싱에 의해 추가로 분석하였다.
도 3a에 도시된 바와 같이, AAVHSC15-hHBB-hL-014 및 AAVHSC17-hHBB-hL-014 바이러스로 형질도입된 GM16265 세포에서 2.2 kb PCR 밴드(hHBB-hL-014 벡터에 의한 정확한 편집을 나타냄)가 TI 검정에서 검출된 반면에, 이 PCR 산물은 형질도입되지 않은 GM16265 세포에서 검출되지 않았다.
GM16265 세포에서 HBB 유전자의 위치 20에서 A에서 T 돌연변이의 교정은 TI 검정에서 동정된 양성 클론의 시퀀싱에 의해 검증되었다. 서열 분석은 AAVHSC15-hHBB-hL-014 또는 AAVHSC17-hHBB-hL-014 바이러스로 형질도입한 후, T 돌연변이가 A로 교정되었고, 근처 무증상 돌연변이도 야생형으로 교정되었다. 반대쪽 PCR 가닥의 시퀀싱은 돌연변이의 교정을 확인하였다. HBB 좌위에 링커의 삽입은 모든 클론에서 검출되었다. 또한, 시험된 클론 중 어느 것도 상동성 암의 말단에 상응하는 게놈 영역에서 바람직하지 않은 돌연변이(예를 들어, 추가 삽입, 결실 또는 역전)를 나타내지 않았다.
HBB 유전자를 편집하는 hHBB-hL-014 벡터의 능력을 더 확인하기 위해, 2개의 추가 LCL인 GM16266 및 GM16267을 사용하였다. 이들 LCL은 또한 코리엘 의료 연구소(Coriell Institute for Medical Research) (뉴저지 주 캠든 소재)로부터 입수하였고, GM16265와 다른 증여체로부터 수집되었다. 두 LCL 양쪽 모두 HBB의 인트론 1에서 위치 20에서 A에서 T로의 돌연변이를 가졌다. GM16265의 배양 및 형질도입을 위한 동일한 방법에 따라, 세포는 AAVHSC17 캡시드에 패키지된 hHBB-hL-014로 형질도입되었다.
도 3b에 도시된 바와 같이, 약 2.2 kb의 PCR 앰플리콘이 AAVHSC17-hHBB-hL-014로 형질도입된 세포로부터는 검출되었지만. 형질도입되지 않은 세포로부터는 검출되지 않았다. 시퀀싱 결과는 SCD 돌연변이가 3 개의 모든 LCL(GM16265 세포 포함)로부터 형질도입된 세포에서 교정되었고, 바람직하지 않은 돌연변이(예를 들어, 추가 삽입, 결실, 또는 역전)는 상동성 암의 말단에 상응하는 게놈 영역에서 검출되지 않았음을 보여주었다. 시퀀싱 결과는 또한 상동성 암으로부터 게놈으로의 적절한 링커 삽입 및 끊김없는(seamless) 전이를 확인하였다.
상기 결과는 hHBB-hL-014 벡터가 돌연변이체 HBB 유전자를 다수의 SCD 세포주에서 야생형 서열로 되돌릴 수 있음을 보여준다. 따라서, 베타 지중해빈혈증과 같은 다른 유전 질환에서 HBB 유전자의 엑손, 인트론 또는 조절 서열에서의 돌연변이는 또한 hHBB-hL-014 벡터를 사용하여 교정할 수 있어야 한다.
실시예 3: HBB의 게놈 서열을 포함하는 HBB 교정 벡터
본 실시예는 HBB 유전자에서 돌연변이를 교정할 수 있는 HBB의 게놈 서열을 포함하는 AAV-기반 HBB 교정 벡터를 제공한다.
a) HBB 교정 벡터 hHBB-hL-001
도 4a에 도시된 바와 같이, HBB 교정 벡터 hHBB-hL-001은 모든 엑손, 모든 인트론 및 폴리아데닐화 서열을 포함하는 HBB 게놈 서열을 함유한다. 이 벡터는 HBB 전사 개시 부위(도 4a에서 "HBB HAL"로 지칭됨)로부터 상류에서 800 bp를 포함하는 5' 영역, 및 HBB 폴리아데닐화 서열(도 4a에서 "HBB HAR")로부터 하류에서 800 bp를 포함하는 3' 영역을 추가로 함유한다. hHBB-hL-001 벡터는 서열 번호: 31(TI RE 링커 포함) 또는 서열 번호: 32 (TI RE 링커 제외)에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다. 이 벡터는 HBB 엑손 및 인트론에서의 돌연변이뿐만 아니라 베타 지중해빈혈증에서 관찰된 바와 같이 HBB 발현에 영향을 미치는 5' 및 3' 비번역된 영역에서의 돌연변이를 교정한다.
b) HBB 교정 벡터 hHBB-h1W-013
도 4b에 도시된 바와 같이, HBB 교정 벡터 hHBB-h1W-013은 엑손 1, 2 및 3의 코딩 영역의 DNA 서열이 상응하는 야생형 서열에 완전히 동일하기 보다는 약 67% 동일하게 침묵 변경되는 것을 제외하고는 HBB 교정 벡터 hHBB-hL-001에서와 동일한 유전적 요소를 함유한다. 감소된 서열 동일성은 코돈 변경에 기인하며, 여기서 변성 코돈은 인코딩된 아미노산을 변화시키지 않고 오리지널(original) 코돈으로 치환된다. 이 침묵 코돈 변경은 HBB의 발현 수준을 크게 변화시킬 것으로 예상되지 않는다. 대신, 엡실론 글로빈(HBE), 델타 글로빈(HBD), 감마 글로빈 1(HBG1), 감마 글로빈 2(HBG2), 및 HBB 유사 유전자 HBBP와 같은 다른 글로빈 유전자 또는 유사 유전자와의 HBB 엑손의 상동성을 감소시켜 다른 게놈 좌위에서 이 벡터의 바람직하지 않은 재조합 가능성을 감소시킨다. 특정 실시예에서, 엑손 1, 엑손 2, 및 엑손 3의 코딩 영역의 침묵 변경된 서열은 각각 서열 번호: 43, 44, 및 45에 기재되어 있다. hHBB-h1W-013 벡터는 서열 번호: 33(TI RE 링커 포함) 또는 서열 번호: 34(TI RE 링커 제외)에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다.
c) HBB 교정 벡터 hHBB-hL-011
도 4c에 도시된 바와 같이, HBB 교정 벡터 hHBB-hL-011은 HBB 폴리아데닐화 서열(도 4c에서 "HBB HAR"로 지칭됨)로부터 하류의 3' 영역이 길이가 약 100 bp인 것을 제외하고는 HBB 교정 벡터 hHBB-hL-001에서와 동일한 유전적 요소를 함유한다. 이러한 변형은 프로모터 서열이 전사 인자 및 보조 인자를 모집할 수 있기 때문에 HBB 폴리아데닐화 서열로부터 약 100 bp 하류에 위치한 다른 유전자(예를 들어, GATA 1, MYC 등)의 전사 프로모터 서열의 포함을 최소화하도록 하여, 이에 의해 상동 재조합의 효율을 감소시킨다. 추가적으로, 전사 프로모터 서열의 포함은 벡터로부터 HBB의 비정상적인 발현을 증가시킬 수 있다. hHBB-hL-011 벡터는 서열 번호: 35(TI RE 링커 포함) 또는 서열 번호: 36(TI RE 링커 제외)에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다.
d) HBB 교정 벡터 hHBB-h1W-012
도 4d에 도시된 바와 같이, HBB 교정 벡터 hHBB-h1W-012는 엑손 1, 2 및 3의 코딩 영역의 DNA 서열이 상응하는 야생형 서열에 67% 동일하게 침묵 변경되는 것을 제외하고는 HBB 교정 벡터 hHBB-hL-011에서와 동일한 유전적 요소를 함유한다. 특정 실시예에서, 엑손 1, 엑손 2, 및 엑손 3의 코딩 영역의 침묵 변경된 서열은 각각 서열 번호: 43, 44, 및 45에 기재되어 있다. hHBB-h1W-012 벡터는 서열 번호: 37(TI RE 링커 포함) 또는 38(TI RE 링커 제외)에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다.
본 실시예에서 4개의 HBB 교정 벡터 각각은 교정 유전자의 검출을 용이하게 하기 위해 독특한 제한 엔도뉴클레아제를 위한 인식 및 절단 부위를 포함하는 링커 서열을 함유한다. 이 링커 서열은 시작 코돈으로부터 117 bp인 인트론 1에 위치한다. 인트론 1에서 주요 공여체 및 수용체 부위의 파괴를 교정된 HBB의 mRNA 스플라이싱을 유지하기 위해 회피하였다.
상기 기재된 4개의 HBB 교정 벡터 각각은 AAVHSC17에서 생성되고 패키지되었다. 1차 인간 CD34+ HSC를 실시예 1에 기재된 방법을 사용하여 바이러스로 형질도입되고, 실시예 2에 기재된 TI 검정에 의해 통합을 평가하였다. 도 5a 및 5b에 도시된 바와 같이, hHBB-hL-001, hHBB-hL-011, 및 hHBB-h1W-012는 모두 HBB 유전자를 편집할 수 있었다.
게놈 편집의 효율은 차세대 시퀀싱(NGS: next generation sequencing)에 의해 정량적으로 측정되었다. 표 6에 나타낸 바와 같이, 상동성 암 외부의 게놈의 영역에 특이적인 프라이머를 사용하여 PCR 반응을 수행하였다. 이들 프라이머는 비편집 및 편집된 대립 유전자로부터 2,342 bp의 산물을 증폭시킬 것이지만, AAV 벡터를 증폭시키지 않을 것이다.
PCR 반응을 다음과 같이 설정하였다: 최대 50 μl의 PCR 물; 10 μl의 5X Q5 완충액; 5 μl의 베타인; 1 μl의 10 mM dNTP; 1 μl의 HBB350 역방향 프라이머(25 μΜ 농도); 1 μl의 HBB L NGS S1 프라이머(25 μM 농도); 200 ng의 게놈 DNA; 및 1 μl의 Q5 고충실도 폴리머라제. PCR 기계를 다음과 같이 설정하였다: 98℃에서 30 분 동안 초기 변성; 95℃에서 10 초 동안 변성 30 사이클, 65℃에서 30 초 동안 어닐링, 및 72℃에서 2 분 동안의 연장; 및 72℃에서 5 분 동안의 최종 연장.
정확한 크기의 PCR 산물을 겔 전기영동에 의해 단리하고, 표준 프로토콜에 따라 Qiagen Qiaquick Gel 추출 키트를 사용하여 추출하였다. 겔 추출된 앰플리콘에서 벡터 게놈의 부재를 벡터 특이적 프라이머 및 공지된 수의 벡터 특이적 게놈 주형을 양성 대조군으로 사용하여 PCR에 의해 확인하였다. 벡터 게놈의 부재를 확인하기 위해, 하기 PCR 조건을 이용하였다: 98℃에서 30 분 동안 초기 변성; 98℃에서 10 초 동안 변성 30 사이클, 66℃에서 30 초 동안 어닐링, 및 72℃에서 1 분 동안의 연장; 및 72℃에서 2 분 동안의 최종 연장. 사용된 정방향 프라이머는 AAAGTCAGGGCAGAGCCATC(서열 번호: 108)이고, 사용된 역방향 프라이머는 AATGATTAACCCGCCATGCT(서열 번호: 109)였으며, 1,797개의 염기쌍의 앰플리콘을 증폭시킬 것이다.
추출된 PCR 산물을 NGS 시퀀싱 및/또는 하기에 기재된 바와 같은 디지털 PCR 정량화에 사용하였다. NGS 시퀀싱의 경우, 추출된 PCR 산물을 표 7에 나타낸 프라이머를 사용하여 중첩된 PCR 라운드에 적용하였다. 각각의 샘플은 순방향 및 역방향 프라이머의 독특한 조합을 가졌으며, 각각의 정확한 PCR 산물의 크기는 약 388 bp였다. PCR 기계를 다음과 같이 설정하였다: 98℃에서 30 분 동안 초기 변성; 98℃에서 10 초 동안 변성 30 사이클, 72℃에서 30 초 동안 어닐링, 및 72℃에서 30 초 동안의 연장; 및 72℃에서 2 분 동안의 최종 연장.
앰플리콘 크기를 겔 전기영동에 의해 확인하고, PCR 산물을 표준 프로토콜에 따라 Qiagen Qiaquick PCR 정제 키트를 사용하여 정제하였다. 모든 시험된 샘플로부터의 앰플리콘을 동일한 몰 농도로 혼합하고, 농도를 Advanced Analytical 생물분석기(bioanalyzer)로 확인하였다. 샘플을 MiSeq V2 300 사이클 키트를 사용하여 시퀀싱하였다.
표 8은 NGS 분석으로부터 결정된 바와 같이, 링커 서열의 존재 또는 부재 하에 수용 가능한 판독 수 뿐만 아니라 HBB 서열을 갖는 판독의 수를 나타낸다. 링커 서열의 존재는 AAV 벡터 통합을 나타내기 때문에, 링커를 갖는 대립 유전자의 백분율은 이들 벡터의 통합의 대립 유전자 빈도를 나타내며, 이는 일반적으로 0.1% 내지 1%이다.
디지털 PCR의 경우, 추출된 PCR 산물에 BioRad QX200™ Droplet Digital™ PCR 시스템을 사용하여 디지털 PCR 분석을 수행하였다. 게놈 표적과 삽입된 벡터 페이로드(링커) 사이의 연결을 계산하여 편집을 결정하고, 변이체 간의 유전적 연결에 사용되는 방법을 이용하는 우연의 일치(coincidence by chance)의 가능성과 관련하여 벡터 및 게놈 양쪽 모두를 함유하는 분할된 액적의 양을 검출함으로써 측정하였다(예를 들어, 그 전체 내용이 본원에 인용되어 포함되어 있는 문헌[Regan et al., A rapid molecular approach for chromosomal phasing, PLoS One. (2015) 10(3):e0118270] 참조). 0.1 ng/ul의 게놈 DNA의 농도를 연결용 샘플 당 최소 3회의 실험에 걸쳐 분석하고, 벡터 특이적 프로브 세트 및 게놈 특이적 프로브 세트를 갖는 다중화된 ddPCR을 사용하여 측정하였다. 프라이머 및 프로브 세트는 다음과 같다:
알려진 양의 편집된 물질에 대해 상기 방법에 따라 게놈 편집/연결을 측정하기 위해, 표준 DNA 시리즈가 생성되었다. 표준은 ul 당 100개의 비편집된 게놈, ul 당 1000개의 에피솜 벡터, 및 각각 ul 당 1, ul 당 5, ul 당 10, ul 당 15, ul 당 20, 및 ul 당 25개의 편집된 대립 유전자에서 클로닝된 양성 대립 유전자의 범위로 구성된다. 각각의 샘플에서 유전적 연결의 양을 측정하고 각각의 샘플에서 비편집 대 편집된 대립 유전자의 알려진 비율에 대해 플롯팅하였다(R2 = 0.972, 피어슨 상관 p<0.001).
1.5 x 105의 MOI에서 다양한 AAVHSC7 HBB 편집 벡터로 형질도입된 1차 CD34+ 혼합 제대혈 세포에서 HBB 좌위의 편집을 디지털 PCR에 의해 측정하였다. 형질도입 후 48 시간에 세포를 수확하고, PCR 산물의 아웃/아웃 PCR 및 디지털 PCR 분석에 의해 편집된 대립 유전자의 백분율에 대해 분석하였다. 도 6은 표시된대로 샘플에서 편집된 좌위의 분율을 도시한다.
실시예 4: HBB 코딩 서열 또는 이의 일부를 포함하는 HBB 교정 벡터
본 실시예는 HBB 코딩 서열 또는 이의 일부를 HBB 유전자 내로 예를 들어, 시작 코돈 이후 또는 인트론 1 내로 삽입할 수 있는 HBB 교정 벡터를 제공한다. 삽입된 서열은 천연 전사 조절 요소의 제어 하에 천연 좌위로부터 전사 및 번역될 수 있고, 이에 의해 기능적 HBB 단백질의 발현을 회복시킨다.
HBB 교정 벡터의 각각은 제2 코돈에서 정지 코돈까지 HBB 코딩 서열 또는 이의 일부를 함유하였다. HBB 코딩 서열 또는 이의 일부는 SV40 폴리아데닐화 서열이 뒤따르는데, 이는 적절한 발현을 지지하고 나머지 내인성 HBB 유전자의 추가 전사를 상당히 감소시키기에 충분히 강하다. 독특한 제한 엔도뉴클레아제에 대한 인식 및 절단 부위를 포함하는 표적화된 통합 제한 카세트("TI RE 카세트")는 폴리아데닐화 서열의 하류에 선택적으로 삽입되어 원하는 상동 재조합의 검출을 용이하게 한다.
a) HBB 교적 벡터 hHBB-hA-009
도 7a에 도시된 바와 같이, HBB 교정 벡터 hHBB-hA-009는 제2 코돈에서 정지 코돈까지의 야생형 HBB 코딩 서열의 일부(서열 번호: 27의 뉴클레오티드 4 내지 444), 이후 상기 기재된 바와 같이 SV40 폴리아데닐화 서열을 포함한다. 벡터는 HBB 시작 코돈으로부터 상류이고 이를 포함하는 야생형 게놈 서열을 포함하는 5' 상동성 암(도 7a에서 "HBB HAL"로 지칭됨), 및 HBB 시작 코돈으로부터 하류이고 이를 포함하지 않는 3' 상동성 암(도 7a에서 "HBB HAR"로 지칭됨)을 더 포함한다. 상기 5' 상동성 암 및 상기 3' 상동성 암은 길이가 약 800 bp이다. hHBB-hA-009 벡터는 서열 번호: 39에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다. 5' 상동성 암은 일부 베타 지중해성빈혈 환자에서 관찰된 바와 같이 HBB 발현에 영향을 주는 시작 코돈 및/또는 5' 비번역된 영역(UTR)에서 돌연변이를 교정하는 능력을 갖는다. 그 결과, HBB 교정 벡터 hHBB-hA-009의 통합은 5' UTR, 코딩 서열 또는 3' UTR에서 돌연변이에 의해 손상된 야생형 HBB의 발현을 회복시킬 수 있다.
b) HBB 교정 벡터 hHBB-hAW-002
도 7b에 도시된 바와 같이, HBB 교정 벡터 hHBB-hAW-002는 HBB 코딩 서열의 부분이 야생형 cDNA 서열의 상응하는 영역에 서열 번호: 47, 67% 동일하게 침묵 변경되는 것을 제외하고는 HBB 교정 벡터 hHBB-hA-009에서와 동일한 유전적 요소를 함유한다. 실시예 3에서 설명된 바와 같이, 이 코돈 변경은 HBB의 발현 수준을 상당히 변경시킬 것으로 예상되지는 않는다. 대신, 다른 글로빈 유전자 및 유사 유전자와 HBB 엑손의 상동성을 감소시켜 다른 게놈 좌위에서 이 벡터의 바람직하지 않은 재조합을 감소시킨다. hHBB-hAW-002 벡터는 서열 번호: 40에 기재된 뉴클레오티드 서열을 포함하고, 5' ITR(예를 들어, 서열 번호: 18의 서열을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19의 서열)을 더 포함한다.
c) HBB 교정 벡터 hHBB-h1-010
도 7c에 도시된 바와 같이, HBB 교정 벡터 hHBB-h1-010은 상동 재조합에 의해 인트론 1에 야생형 HBB 코딩 서열을 삽입하도록 설계된다. 구체적으로, 삽입 부위는 HBB 유전자의 뉴클레오티드 160 및 161 사이에 있으며, 삽입은 인트론 1에서 주요 스플라이스 공여체 부위의 파괴를 회피한다. 이 벡터의 편집 요소(삽입된 영역)는 5' 내지 3' 스플라이스 수용체 부위(도 7c에서 "SA", 예를 들어, 서열 번호: 14), 통합시 HBB 시작 코돈과 프레임 내에 있는 리보솜 스키핑 요소(도 7c에서 "T2A", 예를 들어, 서열 번호: 72), 야생형 HBB 코딩 서열(서열 번호: 27), 및 SV40 폴리아데닐화 서열을 함유한다. 통합시, HBB 좌위로부터 전사된 전-mRNA는 5' 내지 3': 내인성 HBB의 엑손 1; 인트론 1의 5' 말단에 내인성 스플라이스 공여체를 포함하여 인트론 1의 제1 68개 뉴클레오티드; hHBB-h1-010 벡터에 의해 도입된 스플라이스 수용체; 리보솜 스키핑 요소; HBB 코딩 서열; 및 poly(A) 테일을 함유한다. 스플라이싱 후, mRNA는 5' 내지 3': 내인성 HBB의 엑손 1; 인-프레임 리보솜 스키핑 요소; HBB 코딩 서열; 및 poly(A) 테일을 함유한다. 리보솜 스키핑 요소는 2개의 폴리펩티드: 부분 리보솜 스키핑 펩티드와 융합된 엑손 1의 말단에서 종결된 절두된 HBB 펩티드 및 전장 HBB의 N- 말단에 융합된 리보솜 건너 뛰기 펩티드의 프롤린 폴리펩티드를 생성하게 된다.
hHBB-h1-010 벡터는 삽입 부위로부터 상류에 야생형 게놈 서열을 포함하는 5' 상동성 암(도 7c에서 "HBB HAL"로 지칭됨) 및 삽입 부위로부터 하류에 야생형 게놈 서열을 포함하는 3' 상동성 암(도 7c에서 "HBB HAR"로 지칭됨)을 더 포함한다. 상기 5' 상동성 암 및 상기 3' 상동성 암은 길이가 약 800 bp이다. hHBB-h1-010 벡터는 서열 번호: 41에 기재된 뉴클레오티드 서열을 포함하며, 5' ITR(예를 들어, 서열 번호: 18를 가짐) 및 3' ITR(예를 들어, 서열 번호: 19를 가짐)을 더 포함한다. 5' 상동성 암은 일부 베타 지중해성빈혈 환자에서 관찰된 바와 같이 HBB 발현에 영향을 주는 5' UTR에서 돌연변이를 교정하며, 5' UTR, 코딩 서열, 또는 3' UTR에서 돌연변이에 의해 손상된 야생형 HBB의 발현을 회복하는 능력을 갖는다.
d) HBB 교정 벡터 hHBB-h1W-008
도 7d에 도시된 바와 같이, HBB 교정 벡터 hHBB-h1W-008은 HBB 코딩 서열이 야생형 cDNA 서열의 상응하는 영역과 67% 동일하게 침묵 변경되는 것을 제외하고, HBB 교정 벡터 hHBB-h1-010에서와 동일한 유전적 요소를 함유한다. 실시예 3에 기재된 바와 같이, 이 서열 변형은 HBB의 발현 수준을 상당히 변화시킬 것으로 예상되지는 않는다. 대신에, 다른 글로빈 유전자 및 유사 유전자와 HBB 엑손의 상 동성을 감소시켜, 다른 게놈 좌위에서 이 벡터의 바람직하지 않은 재조합을 감소시킨다. 특정 실시예에서, 침묵 변경된 HBB 코딩 서열은 서열 번호: 47에 기재되어 있다. hHBB-h1W-008 벡터는 서열 번호: 42에 기재된 뉴클레오티드 서열을 포함하며, 5' ITR(예를 들어, 서열 번호: 18을 가짐) 및 3' ITR(예를 들어, 서열 번호: 19를 가짐)을 더 포함한다.
e) HBB 교정 벡터 hHBB-hE3C-001
도 7e에 도시된 바와 같이, HBB 교정 벡터 hHBB-hE3C-001은 상동 재조합에 의해 정지 코돈 직후에 HBB 유전자의 엑손 3에 HBB 코딩 서열을 삽입하도록 설계된다. 이 벡터의 편집 요소(삽입된 영역)는 침묵 변경된 HBB 코딩 서열(서열 번호: 99, 야생형 HBB 코딩 서열에 85% 동일)과 프레임 내에 있는 5' 내지 3' 리보솜 스키핑 요소(도 7e에서 "P2A", 예를 들어 서열 번호 74), 및 SV40 폴리아데닐화 서열(서열 번호: 77)을 함유한다. HBB 코딩 서열의 침묵 변경은 코딩 서열로부터 발현된 단백질의 수준을 증가시키고, 바람직하지 않은 게놈 좌위로의 벡터의 오프-타겟팅으로 초래할 수 있는 저-복잡성(low-complexity) 서열을 제거하고/하거나 편집 요소 및 게놈 사이의 상동성을 감소시켜, 상동성 암보다는 편집 요소에 의해 매개되는 바람직하지 않은 통합을 감소시키도록 설계된다.
통합시, HBB 좌위로부터 전사된 mRNA는 5' 내지 3': 정지 코돈에 인접하여 5'의 천연 HBB mRNA의 일부, 리보솜 스키핑 요소, 침묵 변경된 HBB 코딩 서열, 및 SV40 폴리아데닐화 서열을 함유한다. 리보솜 스키핑 요소는 2개의 폴리펩티드: 리보솜 스키핑 펩티드의 N-말단 부분과 융합된 천연 전장 HBB 펩티드, 및 전장 야생형 HBB 폴리펩티드의 N-말단에 융합된 리보솜 스키핑 펩티드로부터의 프롤린 잔기를 생성시킨다.
hHBB-hE3C-001 벡터는 서열 번호: 101을 포함하는 5' 상동성 암(도 7e에서"HAL"로 지칭됨), 서열 부위로부터 상류의 야생형 게놈 서열, 및 삽입 부위로부터 하류의 야생형 게놈서열인 서열 번호: 102의 서열을 포함하는 3' 상동성 암(도 7e에서 "HAR"로 지칭됨)을 더 포함한다.
hHBB-hE3C-001의 뉴클레오티드 서열은 서열 번호: 104에 기재되어 있다. 상기 벡터는 5' ITR(예를 들어, 서열 번호: 18) 및 3' ITR(예를 들어, 서열 번호: 19의 서열을 가짐)을 더 포함한다.
hHBB-h1-010 및 hHBB-h1W-008의 통합 효율을 RKO 및 LCL 세포에서 평가하였다. GM16265 LCL 세포를 실시예 1에 기재된 방법을 사용하여 AAVHSC7에 패키지된 HBB 교정 벡터로 형질도입하였다.
RKO 세포를 ATCC로부터 수득하였다. 세포를 10% FCS 및 2 mM L-글루타민이 보충된 DMEM에서 배양하였다. 세포를 6 웰 플레이트에서 웰당 750,000개의 세포 밀도로 도말하였다. 세포를 하기 방법을 사용하여 형질감염시켰다: 도말 24 시간 후, (a) 250 μl OptiMEM에 희석된 2 μg의 HBB 편집 플라스미드 및 (b) 250 μl OptiMEM에 희석된 5 μl Lipofectamine 2000을 15 분 동안 혼합 및 배양함으로써 세포를 OptiMEM 배지에서 형질감염시켰다. 형질감염 24 시간 후 세포를 수확하였다.
표 9에 기재된 서열을 갖는 프라이머를 사용하여 TI 검정에 의해 통합을 평가하였다. SA-2A-FM1 및 SA-2A-FM2 프라이머는 hHBB-h1-010 또는 hHBB-h1W-008 벡터에 의해 게놈에 삽입된 스플라이스 수용체 및 T2A 요소에 특이적이었으며, HBB-Out-RM2 프라이머는 3' 상동성 암으로부터 하류 게놈의 영역에 특이 적이었다. SA-2A-FM1 또는 SA-2A-FM2과 HBB-Out-RM2의 프라이머 쌍은 형질도입되지 않은 세포에서의 생성물 또는 교정 벡터 단독으로부터의 생성물을 증폭시키지 않는다. SA-2A-FM1 및 HBB-Out-RM2를 사용한 PCR 반응은 hHBB-h1-010 또는 hHBB-h1W-008 벡터가 5' 및 3' 상동성 암을 통한 상동 재조합에 의해 통합되면 1,881 bp 앰플리콘을 생성할 것이며, 상기 벡터가 편집 요소에서 5' 상동성 암 및 엑손 2 서열을 통한 상동 재조합에 의해 통합되면 1,188 bp 앰플리콘을 생성할 것이다. SA-2A-FM2 및 HBB-Out-RM2를 사용한 PCR 반응은 또한 이러한 두 가지 통합 방식에서 다른 크기의 앰플리콘을 생성할 것이다.
PCR 반응을 다음과 같이 설정하였다: 최대 50 μl의 PCR 물; 5 μl의 10X PCR 완충액; 5 μl의 베타인; 1 μl의 10 mM dNTP; 1 μl의 50 mM MgCl2; 10 μl의 5X Q 시약; 2.5 μl의 TI 정방향 프라이머(5 μΜ 농도); 2.5 μl의 TI 역방향 프라이머(5 μΜ 농도); 100 ng 게놈 DNA; 및 0.5 μl의 HotStarTaq 폴리머라제. PCR 기계를 다음과 같이 설정하였다: 95℃에서 15 분 동안 초기 변성; 94℃에서 10 초 동안 변성 40 사이클, 58℃에서 30 초 동안 어닐링, 및 72℃에서 3 분 동안의 연장; 및 68℃에서 10 분 동안의 최종 연장. PCR 산물을 겔 전기영동에 의해 분석하였다.
도 8에 도시된 바와 같이, SA-2A-FM1 및 HBB-Out-RM2 프라이머를 사용하여, 1,874 뉴클레오티드 길이를 갖는 표적화된 통합 PCR 산물이 hHBB-h1W-002로 형질도입된 RKO 세포에서 검출되어 벡터의 성공적인 통합을 원하는 방식으로 나타내었다. 이와 대조적으로, HBB 좌위와 편집 요소(3' 상동성 암에서가 아닌)에서 엑손 2의 재조합에 의해 생성된 단축된 PCR 산물을 hHBB-h1-010으로 형질도입된 RKO 및 LCL 세포에서 검출하였다. SA-2A-FM2 및 HBB-Out-RM2 프라이머를 사용하여 PCR로부터 유사한 결과를 얻었다. 이 결과는 편집 요소에서의 침묵 코돈 변경이 바람직하지 않은 재조합을 감소시키거나 제거함으로써 HBB 유전자의 정확한 편집을 보장한다는 것을 나타낸다.
실시예 5: HBB 돌연변이의 생체 내 교정
본 실시예는 이전 실시예에서 기재된 것과 같은 HBB 교정 벡터를 검사하기 위한 동물 모델을 제공한다. NOD.Cg-Prkdc scid Il2rg tm1Wj1/SzJ의 유전자형을 갖는 NSG 마우스에 치사량에 가깝게 조사하고 1차 인간 야생형 CD34+ HSC를 이식하여 조혈 재구성을 실시하였다. NSG 마우스에서 인간 CD34+ HSC의 생착(engraftment) 수준을 유세포 분석에 의해 인간 및 뮤린 CD45+ 세포의 존재에 대해 말초 혈액을 분석함으로써 이식 12 주 후에 결정하였다. 말초 혈액에서 25% 초과 순환 인간 세포를 갖는 마우스를 사용하여 생체 내에서 1차 인간 CD34+ HSC를 형질도입시키기 위한 특정 AAV 벡터의 통합 효율을 평가하였다.
AAVS1-FP 벡터를 AAVHSC7 및 AAVHSC17에 패키지하고, 바이러스 입자를 kg 당 1.22 x 1013 내지 1.54 x 1013 벡터 게놈의 용량으로 재구성된 NSG 마우스에 정맥 내 투여하였다. 혈액, 골수 및 비장 샘플을 투여 4 주 후 수집하였다. 당업계에 공지된 페놀/클로로포름 추출법에 의해 샘플로부터 DNA를 정제하고, 추출된 DNA를 실시예 1에 기재된 바와 같은 방법을 사용하여 ddPCR에 의해 분석하였다.
AAVHSC7 및 AAVHSC17 그룹으로부터의 데이터를 모았다. 도 9에 도시된 바와 같이, AAVS1-FP 벡터가 투여된 이식된 NSG 마우스에서, 통합의 대립 유전자 빈도는 혈액에서 약 3%, 골수에서 약 1%였다. 이 결과는 AAVHSC7 및 AAVHSC17 캡시드가 AAVS1 좌위에 통합하기 위한 벡터를 효율적으로 전달하고, HBB 편집 치료 벡터를 전달하는데 잠재적으로 사용될 수 있음을 시사하였다.
HBB 결함 1차 인간 CD34+ HSC로 재구성된 변형된 동물 모델은 교정 벡터 또는 상기 실시예에 기재된 바와 같은 교정 벡터를 사용하여 HBB 돌연변이의 교정을 테스트하는 데 유용하다. 예를 들어, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV clade F 캡시드에 패키지된 교정 벡터는 재구성된 동물에게 투여될 수 있다. 통합 효율은 혈액 또는 골수 샘플을 수집하고, 원하는 상동 재조합이 광범위한 집단 또는 적혈구의 전구세포와 같은 특정 유형의 세포에서 발생한 세포의 백분율을 정량함으로써 측정될 수 있다.
HBB 결함 1차 인간 CD34+ HSC로 재구성된 동물은 HBB 유전자의 부족으로 인해 혈색소병증이 나타날 것으로 예상되며, 다양한 AAV 캡시드에 패키지된 HBB 교정 벡터의 효능 및 안전성을 결정하는 데 사용될 수 있다. 효능은 망상 적혈구 수, 완전 혈구 수(CBC), 혈액 도말 및 벡터 서열의 표적된 통합을 측정하여 평가된다. 안전성은 아스파테이트 트랜스아미나제(AST) 및 알라닌 트랜스아미나제(ALT)와 같은 간 트랜스아미나제 수준을 측정함으로써 평가된다.
이 모델은 또한 각각의 투여 후 HBB 교정의 수명을 평가하여 투여 요법을 최적화하는 데 사용될 수 있다.
* * *
본 발명은 본원에 기재된 특정 실시형태에 의해 범위가 제한되지 않아야 한다. 실제로, 설명된 것들에 추가하여 본 발명의 다양한 변형이 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구 범위의 범주 내에 속한다.
본원에 인용된 모든 참고 문헌(예를 들어, 공개 또는 특허 또는 특허 출원)은 각각의 개별 참조(예를 들어, 공개 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체 내용이 본원에 인용되어 포함되도록 구체적이고 개별적으로 지시된 것과 동일한 정도로 그 전체 내용이 본원에 인용되어 그리고 모든 목적을 위해 포함된다. 다른 실시형태는 하기 청구범위 내에 있다.
SEQUENCE LISTING
<110> CITY OF HOPE
HOMOLOGY MEDICINES, INC.
<120> ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR RESTORING HBB GENE
FUNCTION AND METHODS OF USE THEREOF
<130> IPA200361-US
<150> US 62/574,163
<151> 2017-10-18
<150> US 62/621,102
<151> 2018-01-24
<160> 115
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> adeno-associated AAV9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Splice acceptor
<400> 14
ctgacctctt ctcttcctcc cacagg 26
<210> 15
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> novel AAV isolate
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2 5' ITR
<400> 18
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 19
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2 3' ITR
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 20
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV5 5' ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV5 3' ITR
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 1833
<212> DNA
<213> Homo sapiens
<400> 23
cggctgtcat cacttagacc tcaccctgtg gagccacacc ctagggttgg ccaatctact 60
cccaggagca gggagggcag gagccagggc tgggcataaa agtcagggca gagccatcta 120
ttgcttacat ttgcttctga cacaactgtg ttcactagca acctcaaaca gacaccatgg 180
tgcatctgac tcctgaggag aagtctgccg ttactgccct gtggggcaag gtgaacgtgg 240
atgaagttgg tggtgaggcc ctgggcaggt tggtatcaag gttacaagac aggtttaagg 300
agaccaatag aaactgggca tgtggagaca gagaagactc ttgggtttct gataggcact 360
gactctctct gcctattggt ctattttccc acccttaggc tgctggtggt ctacccttgg 420
acccagaggt tctttgagtc ctttggggat ctgtccactc ctgatgctgt tatgggcaac 480
cctaaggtga aggctcatgg caagaaagtg ctcggtgcct ttagtgatgg cctggctcac 540
ctggacaacc tcaagggcac ctttgccaca ctgagtgagc tgcactgtga caagctgcac 600
gtggatcctg agaacttcag ggtgagtcta tgggacgctt gatgttttct ttccccttct 660
tttctatggt taagttcatg tcataggaag gggataagta acagggtaca gtttagaatg 720
ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag tttcttttat 780
ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt ttttcttctc 840
cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag gaaatatctc 900
tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta cattactatt 960
tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt tcttttattt 1020
ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt ttaatatgtg 1080
tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa tgctttcttc 1140
ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc tttctttcag 1200
ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata acagtgataa 1260
tttctgggtt aaggcaatag caatatctct gcatataaat atttctgcat ataaattgta 1320
actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc attctgcttt 1380
tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat 1440
catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct 1500
ggcccatcac tttggcaaag aattcacccc accagtgcag gctgcctatc agaaagtggt 1560
ggctggtgtg gctaatgccc tggcccacaa gtatcactaa gctcgctttc ttgctgtcca 1620
atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg gatattatga 1680
agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt gcaatgatgt 1740
atttaaatta tttctgaata ttttactaaa aagggaatgt gggaggtcag tgcatttaaa 1800
acataaagaa atgaagagct agttcaaacc ttg 1833
<210> 24
<211> 1833
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB sequence from 5' mutation to 3' mutation with silent codon
alterations
<400> 24
cggctgtcat cacttagacc tcaccctgtg gagccacacc ctagggttgg ccaatctact 60
cccaggagca gggagggcag gagccagggc tgggcataaa agtcagggca gagccatcta 120
ttgcttacat ttgcttctga cacaactgtg ttcactagca acctcaaaca gacaccatgg 180
tccacctcac accagaagaa aaaagtgctg taacagctct ctggggaaaa gtcaatgtcg 240
acgaggtagg gggggaagct ctcggaaggt tggtatcaag gttacaagac aggtttaagg 300
agaccaatag aaactgggca tgtggagaca gagaagactc ttgggtttct gataggcact 360
gactctctct gcctattggt ctattttccc acccttagac tcctcgtcgt gtatccatgg 420
acacaaagat ttttcgaaag cttcggagac ctcagcacac cagacgcagt aatgggaaat 480
ccaaaagtca aagcacacgg aaaaaaggtc ctgggggctt tctctgacgg actcgcacat 540
ctcgataatc tgaaaggaac attcgctacc ctctctgaac tccattgcga taaactccat 600
gtcgacccag aaaattttag agtgagtcta tgggacgctt gatgttttct ttccccttct 660
tttctatggt taagttcatg tcataggaag gggataagta acagggtaca gtttagaatg 720
ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag tttcttttat 780
ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt ttttcttctc 840
cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag gaaatatctc 900
tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta cattactatt 960
tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt tcttttattt 1020
ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt ttaatatgtg 1080
tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa tgctttcttc 1140
ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc tttctttcag 1200
ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata acagtgataa 1260
tttctgggtt aaggcaatag caatatctct gcatataaat atttctgcat ataaattgta 1320
actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc attctgcttt 1380
tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat 1440
catgttcata cctcttatct tcctcccaca gctgctcgga aatgtcctcg tgtgcgtcct 1500
cgctcaccat ttcggaaagg agtttacacc tcctgtccaa gcagcttacc aaaaggtcgt 1560
cgcaggggtc gcaaacgctc tcgctcataa ataccattag gctcgctttc ttgctgtcca 1620
atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg gatattatga 1680
agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt gcaatgatgt 1740
atttaaatta tttctgaata ttttactaaa aagggaatgt gggaggtcag tgcatttaaa 1800
acataaagaa atgaagagct agttcaaacc ttg 1833
<210> 25
<211> 1845
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB sequence from 5' mutation to 3' mutation with Linker
<400> 25
cggctgtcat cacttagacc tcaccctgtg gagccacacc ctagggttgg ccaatctact 60
cccaggagca gggagggcag gagccagggc tgggcataaa agtcagggca gagccatcta 120
ttgcttacat ttgcttctga cacaactgtg ttcactagca acctcaaaca gacaccatgg 180
tgcatctgac tcctgaggag aagtctgccg ttactgccct gtggggcaag gtgaacgtgg 240
atgaagttgg tggtgaggcc ctgggcaggt tggtatcaag gttacaagac aggactagta 300
tcgattttaa ggagaccaat agaaactggg catgtggaga cagagaagac tcttgggttt 360
ctgataggca ctgactctct ctgcctattg gtctattttc ccacccttag gctgctggtg 420
gtctaccctt ggacccagag gttctttgag tcctttgggg atctgtccac tcctgatgct 480
gttatgggca accctaaggt gaaggctcat ggcaagaaag tgctcggtgc ctttagtgat 540
ggcctggctc acctggacaa cctcaagggc acctttgcca cactgagtga gctgcactgt 600
gacaagctgc acgtggatcc tgagaacttc agggtgagtc tatgggacgc ttgatgtttt 660
ctttcccctt cttttctatg gttaagttca tgtcatagga aggggataag taacagggta 720
cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt 780
agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt 840
ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa 900
aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag 960
tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat 1020
tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg 1080
ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa 1140
aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc 1200
tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa 1260
taacagtgat aatttctggg ttaaggcaat agcaatatct ctgcatataa atatttctgc 1320
atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1380
ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1440
ccttttgcta atcatgttca tacctcttat cttcctccca cagctcctgg gcaacgtgct 1500
ggtctgtgtg ctggcccatc actttggcaa agaattcacc ccaccagtgc aggctgccta 1560
tcagaaagtg gtggctggtg tggctaatgc cctggcccac aagtatcact aagctcgctt 1620
tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg 1680
gggatattat gaagggcctt gagcatctgg attctgccta ataaaaaaca tttattttca 1740
ttgcaatgat gtatttaaat tatttctgaa tattttacta aaaagggaat gtgggaggtc 1800
agtgcattta aaacataaag aaatgaagag ctagttcaaa ccttg 1845
<210> 26
<211> 1845
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB sequence from 5' mutation to 3' mutation with silent codon
alterations, with Linker
<400> 26
cggctgtcat cacttagacc tcaccctgtg gagccacacc ctagggttgg ccaatctact 60
cccaggagca gggagggcag gagccagggc tgggcataaa agtcagggca gagccatcta 120
ttgcttacat ttgcttctga cacaactgtg ttcactagca acctcaaaca gacaccatgg 180
tccacctcac accagaagaa aaaagtgctg taacagctct ctggggaaaa gtcaatgtcg 240
acgaggtagg gggggaagct ctcggaaggt tggtatcaag gttacaagac aggactagta 300
tcgattttaa ggagaccaat agaaactggg catgtggaga cagagaagac tcttgggttt 360
ctgataggca ctgactctct ctgcctattg gtctattttc ccacccttag actcctcgtc 420
gtgtatccat ggacacaaag atttttcgaa agcttcggag acctcagcac accagacgca 480
gtaatgggaa atccaaaagt caaagcacac ggaaaaaagg tcctgggggc tttctctgac 540
ggactcgcac atctcgataa tctgaaagga acattcgcta ccctctctga actccattgc 600
gataaactcc atgtcgaccc agaaaatttt agagtgagtc tatgggacgc ttgatgtttt 660
ctttcccctt cttttctatg gttaagttca tgtcatagga aggggataag taacagggta 720
cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt 780
agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt 840
ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa 900
aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag 960
tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat 1020
tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg 1080
ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa 1140
aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc 1200
tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa 1260
taacagtgat aatttctggg ttaaggcaat agcaatatct ctgcatataa atatttctgc 1320
atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1380
ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1440
ccttttgcta atcatgttca tacctcttat cttcctccca cagctgctcg gaaatgtcct 1500
cgtgtgcgtc ctcgctcacc atttcggaaa ggagtttaca cctcctgtcc aagcagctta 1560
ccaaaaggtc gtcgcagggg tcgcaaacgc tctcgctcat aaataccatt aggctcgctt 1620
tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg 1680
gggatattat gaagggcctt gagcatctgg attctgccta ataaaaaaca tttattttca 1740
ttgcaatgat gtatttaaat tatttctgaa tattttacta aaaagggaat gtgggaggtc 1800
agtgcattta aaacataaag aaatgaagag ctagttcaaa ccttg 1845
<210> 27
<211> 444
<212> DNA
<213> Homo sapiens
<400> 27
atggtgcatc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60
gtggatgaag ttggtggtga ggccctgggc aggctgctgg tggtctaccc ttggacccag 120
aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 180
gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 240
aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 300
cctgagaact tcaggctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 360
aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat 420
gccctggccc acaagtatca ctaa 444
<210> 28
<211> 444
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA sequences with silent codon alterations
<400> 28
atggtccacc tcacaccaga agaaaaaagt gctgtaacag ctctctgggg aaaagtcaat 60
gtcgacgagg taggggggga agctctcgga agactcctcg tcgtgtatcc atggacacaa 120
agatttttcg aaagcttcgg agacctcagc acaccagacg cagtaatggg aaatccaaaa 180
gtcaaagcac acggaaaaaa ggtcctgggg gctttctctg acggactcgc acatctcgat 240
aatctgaaag gaacattcgc taccctctct gaactccatt gcgataaact ccatgtcgac 300
ccagaaaatt ttagactgct cggaaatgtc ctcgtgtgcg tcctcgctca ccatttcgga 360
aaggagttta cacctcctgt ccaagcagct taccaaaagg tcgtcgcagg ggtcgcaaac 420
gctctcgctc ataaatacca ttag 444
<210> 29
<211> 3533
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-014 vector, ITRs not included
<400> 29
atcaacctag gctccagata gccatagaag aaccaaacac tttctgcgtg tgtgagaata 60
atcagagtga gattttttca caagtacctg atgagggttg agacaggtag aaaaagtgag 120
agatctctat ttatttagca ataatagaga aagcatttaa gagaataaag caatggaaat 180
aagaaatttg taaatttcct tctgataact agaaatagag gatccagttt cttttggtta 240
acctaaattt tatttcattt tattgtttta ttttatttta ttttatttta ttttgtgtaa 300
tcgtagtttc agagtgttag agctgaaagg aagaagtagg agaaacatgc aaagtaaaag 360
tataacactt tccttactaa accgacatgg gtttccaggt aggggcagga ttcaggatga 420
ctgacagggc ccttagggaa cactgagacc ctacgctgac ctcataaatg cttgctacct 480
ttgctgtttt aattacatct tttaatagca ggaagcagaa ctctgcactt caaaagtttt 540
tcctcacctg aggagttaat ttagtacaag gggaaaaagt acagggggat gggagaaagg 600
cgatcacgtt gggaagctat agagaaagaa gagtaaattt tagtaaagga ggtttaaaca 660
aacaaaatat aaagagaaat aggaacttga atcaaggaaa tgattttaaa acgcagtatt 720
cttagtggac tagaggaaaa aaataatctg agccaagtag aagacctttt cccctcctac 780
ccctactttc taagtcacag aggctttttg ttcccccaga cactcttgca gattagtcca 840
ggcagaaaca gttagatgtc cccagttaac ctcctatttg acaccactga ttaccccatt 900
gatagtcaca ctttgggttg taagtgactt tttatttatt tgtatttttg actgcattaa 960
gaggtctcta gttttttatc tcttgtttcc caaaacctaa taagtaacta atgcacagag 1020
cacattgatt tgtatttatt ctatttttag acataattta ttagcatgca tgagcaaatt 1080
aagaaaaaca acaacaaatg aatgcatata tatgtatatg tatgtgtgta tatatacaca 1140
catatatata tatatttttt cttttcttac cagaaggttt taatccaaat aaggagaaga 1200
tatgcttaga accgaggtag agttttcatc cattctgtcc tgtaagtatt ttgcatattc 1260
tggagacgca ggaagagatc catctacata tcccaaagct gaattatggt agacaaaact 1320
cttccacttt tagtgcatca acttcttatt tgtgtaataa gaaaattggg aaaacgatct 1380
tcaatatgct taccaagctg tgattccaaa tattacgtaa atacacttgc aaaggaggat 1440
gtttttagta gcaatttgta ctgatggtat ggggccaaga gatatatctt agagggaggg 1500
ctgagggttt gaagtccaac tcctaagcca gtgccagaag agccaaggac aggtacggct 1560
gtcatcactt agacctcacc ctgtggagcc acaccctagg gttggccaat ctactcccag 1620
gagcagggag ggcaggagcc agggctgggc ataaaagtca gggcagagcc atctattgct 1680
tacatttgct tctgacacaa ctgtgttcac tagcaacctc aaacagacac catggtgcat 1740
ctgactcctg aggagaagtc tgccgttact gccctgtggg gcaaggtgaa cgtggatgaa 1800
gttggtggtg aggccctggg caggttggta tcaaggttac aagacaggac tagtatcgat 1860
tttaaggaga ccaatagaaa ctgggcatgt ggagacagag aagactcttg ggtttctgat 1920
aggcactgac tctctctgcc tattggtcta ttttcccacc cttaggctgc tggtggtcta 1980
cccttggacc cagaggttct ttgagtcctt tggggatctg tccactcctg atgctgttat 2040
gggcaaccct aaggtgaagg ctcatggcaa gaaagtgctc ggtgccttta gtgatggcct 2100
ggctcacctg gacaacctca agggcacctt tgccacactg agtgagctgc actgtgacaa 2160
gctgcacgtg gatcctgaga acttcagggt gagtctatgg gacgcttgat gttttctttc 2220
cccttctttt ctatggttaa gttcatgtca taggaagggg ataagtaaca gggtacagtt 2280
tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt 2340
cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt 2400
tcttctccgc aatttttact attatactta atgccttaac attgtgtata acaaaaggaa 2460
atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat 2520
tactatttgg aatatatgtg tgcttatttg catattcata atctccctac tttattttct 2580
tttattttta attgatacat aatcattata catatttatg ggttaaagtg taatgtttta 2640
atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc 2700
tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 2760
ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 2820
gtgataattt ctgggttaag gcaatagcaa tatctctgca tataaatatt tctgcatata 2880
aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 2940
ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt 3000
tgctaatcat gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 3060
gtgtgctggc ccatcacttt ggcaaagaat tcaccccacc agtgcaggct gcctatcaga 3120
aagtggtggc tggtgtggct aatgccctgg cccacaagta tcactaagct cgctttcttg 3180
ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 3240
attatgaagg gccttgagca tctggattct gcctaataaa aaacatttat tttcattgca 3300
atgatgtatt taaattattt ctgaatattt tactaaaaag ggaatgtggg aggtcagtgc 3360
atttaaaaca taaagaaatg aagagctagt tcaaaccttg ggaaaataca ctatatctta 3420
aactccatga aagaaggtga ggctgcaaac agctaatgca cattggcaac agcccctgat 3480
gcatatgcct tattcatccc tcagaaaagg attcaagtag aggcttgatt tgg 3533
<210> 30
<211> 3521
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-014 vector, ITRs not included, Linker removed
<400> 30
atcaacctag gctccagata gccatagaag aaccaaacac tttctgcgtg tgtgagaata 60
atcagagtga gattttttca caagtacctg atgagggttg agacaggtag aaaaagtgag 120
agatctctat ttatttagca ataatagaga aagcatttaa gagaataaag caatggaaat 180
aagaaatttg taaatttcct tctgataact agaaatagag gatccagttt cttttggtta 240
acctaaattt tatttcattt tattgtttta ttttatttta ttttatttta ttttgtgtaa 300
tcgtagtttc agagtgttag agctgaaagg aagaagtagg agaaacatgc aaagtaaaag 360
tataacactt tccttactaa accgacatgg gtttccaggt aggggcagga ttcaggatga 420
ctgacagggc ccttagggaa cactgagacc ctacgctgac ctcataaatg cttgctacct 480
ttgctgtttt aattacatct tttaatagca ggaagcagaa ctctgcactt caaaagtttt 540
tcctcacctg aggagttaat ttagtacaag gggaaaaagt acagggggat gggagaaagg 600
cgatcacgtt gggaagctat agagaaagaa gagtaaattt tagtaaagga ggtttaaaca 660
aacaaaatat aaagagaaat aggaacttga atcaaggaaa tgattttaaa acgcagtatt 720
cttagtggac tagaggaaaa aaataatctg agccaagtag aagacctttt cccctcctac 780
ccctactttc taagtcacag aggctttttg ttcccccaga cactcttgca gattagtcca 840
ggcagaaaca gttagatgtc cccagttaac ctcctatttg acaccactga ttaccccatt 900
gatagtcaca ctttgggttg taagtgactt tttatttatt tgtatttttg actgcattaa 960
gaggtctcta gttttttatc tcttgtttcc caaaacctaa taagtaacta atgcacagag 1020
cacattgatt tgtatttatt ctatttttag acataattta ttagcatgca tgagcaaatt 1080
aagaaaaaca acaacaaatg aatgcatata tatgtatatg tatgtgtgta tatatacaca 1140
catatatata tatatttttt cttttcttac cagaaggttt taatccaaat aaggagaaga 1200
tatgcttaga accgaggtag agttttcatc cattctgtcc tgtaagtatt ttgcatattc 1260
tggagacgca ggaagagatc catctacata tcccaaagct gaattatggt agacaaaact 1320
cttccacttt tagtgcatca acttcttatt tgtgtaataa gaaaattggg aaaacgatct 1380
tcaatatgct taccaagctg tgattccaaa tattacgtaa atacacttgc aaaggaggat 1440
gtttttagta gcaatttgta ctgatggtat ggggccaaga gatatatctt agagggaggg 1500
ctgagggttt gaagtccaac tcctaagcca gtgccagaag agccaaggac aggtacggct 1560
gtcatcactt agacctcacc ctgtggagcc acaccctagg gttggccaat ctactcccag 1620
gagcagggag ggcaggagcc agggctgggc ataaaagtca gggcagagcc atctattgct 1680
tacatttgct tctgacacaa ctgtgttcac tagcaacctc aaacagacac catggtgcat 1740
ctgactcctg aggagaagtc tgccgttact gccctgtggg gcaaggtgaa cgtggatgaa 1800
gttggtggtg aggccctggg caggttggta tcaaggttac aagacaggtt taaggagacc 1860
aatagaaact gggcatgtgg agacagagaa gactcttggg tttctgatag gcactgactc 1920
tctctgccta ttggtctatt ttcccaccct taggctgctg gtggtctacc cttggaccca 1980
gaggttcttt gagtcctttg gggatctgtc cactcctgat gctgttatgg gcaaccctaa 2040
ggtgaaggct catggcaaga aagtgctcgg tgcctttagt gatggcctgg ctcacctgga 2100
caacctcaag ggcacctttg ccacactgag tgagctgcac tgtgacaagc tgcacgtgga 2160
tcctgagaac ttcagggtga gtctatggga cgcttgatgt tttctttccc cttcttttct 2220
atggttaagt tcatgtcata ggaaggggat aagtaacagg gtacagttta gaatgggaaa 2280
cagacgaatg attgcatcag tgtggaagtc tcaggatcgt tttagtttct tttatttgct 2340
gttcataaca attgttttct tttgtttaat tcttgctttc tttttttttc ttctccgcaa 2400
tttttactat tatacttaat gccttaacat tgtgtataac aaaaggaaat atctctgaga 2460
tacattaagt aacttaaaaa aaaactttac acagtctgcc tagtacatta ctatttggaa 2520
tatatgtgtg cttatttgca tattcataat ctccctactt tattttcttt tatttttaat 2580
tgatacataa tcattataca tatttatggg ttaaagtgta atgttttaat atgtgtacac 2640
atattgacca aatcagggta attttgcatt tgtaatttta aaaaatgctt tcttctttta 2700
atatactttt ttgtttatct tatttctaat actttcccta atctctttct ttcagggcaa 2760
taatgataca atgtatcatg cctctttgca ccattctaaa gaataacagt gataatttct 2820
gggttaaggc aatagcaata tctctgcata taaatatttc tgcatataaa ttgtaactga 2880
tgtaagaggt ttcatattgc taatagcagc tacaatccag ctaccattct gcttttattt 2940
tatggttggg ataaggctgg attattctga gtccaagcta ggcccttttg ctaatcatgt 3000
tcatacctct tatcttcctc ccacagctcc tgggcaacgt gctggtctgt gtgctggccc 3060
atcactttgg caaagaattc accccaccag tgcaggctgc ctatcagaaa gtggtggctg 3120
gtgtggctaa tgccctggcc cacaagtatc actaagctcg ctttcttgct gtccaatttc 3180
tattaaaggt tcctttgttc cctaagtcca actactaaac tgggggatat tatgaagggc 3240
cttgagcatc tggattctgc ctaataaaaa acatttattt tcattgcaat gatgtattta 3300
aattatttct gaatatttta ctaaaaaggg aatgtgggag gtcagtgcat ttaaaacata 3360
aagaaatgaa gagctagttc aaaccttggg aaaatacact atatcttaaa ctccatgaaa 3420
gaaggtgagg ctgcaaacag ctaatgcaca ttggcaacag cccctgatgc atatgcctta 3480
ttcatccctc agaaaaggat tcaagtagag gcttgatttg g 3521
<210> 31
<211> 3168
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-001 vector, ITRs not included
<400> 31
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtgcatc tgactcctga ggagaagtct gccgttactg 840
ccctgtgggg caaggtgaac gtggatgaag ttggtggtga ggccctgggc aggttggtat 900
caaggttaca agacaggact agtatcgatt ttaaggagac caatagaaac tgggcatgtg 960
gagacagaga agactcttgg gtttctgata ggcactgact ctctctgcct attggtctat 1020
tttcccaccc ttaggctgct ggtggtctac ccttggaccc agaggttctt tgagtccttt 1080
ggggatctgt ccactcctga tgctgttatg ggcaacccta aggtgaaggc tcatggcaag 1140
aaagtgctcg gtgcctttag tgatggcctg gctcacctgg acaacctcaa gggcaccttt 1200
gccacactga gtgagctgca ctgtgacaag ctgcacgtgg atcctgagaa cttcagggtg 1260
agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1320
aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1380
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1440
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 1500
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 1560
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 1620
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 1680
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 1740
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 1800
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 1860
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg caatagcaat 1920
atctctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 1980
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2040
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2100
cccacagctc ctgggcaacg tgctggtctg tgtgctggcc catcactttg gcaaagaatt 2160
caccccacca gtgcaggctg cctatcagaa agtggtggct ggtgtggcta atgccctggc 2220
ccacaagtat cactaagctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt 2280
ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg 2340
cctaataaaa aacatttatt ttcattgcaa tgatgtattt aaattatttc tgaatatttt 2400
actaaaaagg gaatgtggga ggtcagtgca tttaaaacat aaagaaatga agagctagtt 2460
caaaccttgg gaaaatacac tatatcttaa actccatgaa agaaggtgag gctgcaaaca 2520
gctaatgcac attggcaaca gcccctgatg catatgcctt attcatccct cagaaaagga 2580
ttcaagtaga ggcttgattt ggaggttaaa gttttgctat gctgtatttt acattactta 2640
ttgttttagc tgtcctcatg aatgtctttt cactacccat ttgcttatcc tgcatctctc 2700
agccttgact ccactcagtt ctcttgctta gagataccac ctttcccctg aagtgttcct 2760
tccatgtttt acggcgagat ggtttctcct cgcctggcca ctcagcctta gttgtctctg 2820
ttgtcttata gaggtctact tgaagaagga aaaacagggg tcatggtttg actgtcctgt 2880
gagcccttct tccctgcctc ccccactcac agtgacccgg aatctgcagt gctagtctcc 2940
cggaactatc actctttcac agtctgcttt ggaaggactg ggcttagtat gaaaagttag 3000
gactgagaag aatttgaaag gcggcttttt gtagcttgat attcactact gtcttattac 3060
cctgtcatag gcccacccca aatggaagtc ccattcttcc tcaggatgtt taagattagc 3120
attcaggaag agatcagagg tctgctggct cccttatcat gtccctta 3168
<210> 32
<211> 3156
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-001 vector, ITRs not included, Linker removed
<400> 32
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtgcatc tgactcctga ggagaagtct gccgttactg 840
ccctgtgggg caaggtgaac gtggatgaag ttggtggtga ggccctgggc aggttggtat 900
caaggttaca agacaggttt aaggagacca atagaaactg ggcatgtgga gacagagaag 960
actcttgggt ttctgatagg cactgactct ctctgcctat tggtctattt tcccaccctt 1020
aggctgctgg tggtctaccc ttggacccag aggttctttg agtcctttgg ggatctgtcc 1080
actcctgatg ctgttatggg caaccctaag gtgaaggctc atggcaagaa agtgctcggt 1140
gcctttagtg atggcctggc tcacctggac aacctcaagg gcacctttgc cacactgagt 1200
gagctgcact gtgacaagct gcacgtggat cctgagaact tcagggtgag tctatgggac 1260
gcttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggata 1320
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 1380
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 1440
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 1500
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 1560
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 1620
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 1680
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 1740
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 1800
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 1860
cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat ctctgcatat 1920
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 1980
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 2040
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctcct 2100
gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattca ccccaccagt 2160
gcaggctgcc tatcagaaag tggtggctgg tgtggctaat gccctggccc acaagtatca 2220
ctaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2280
ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2340
catttatttt cattgcaatg atgtatttaa attatttctg aatattttac taaaaaggga 2400
atgtgggagg tcagtgcatt taaaacataa agaaatgaag agctagttca aaccttggga 2460
aaatacacta tatcttaaac tccatgaaag aaggtgaggc tgcaaacagc taatgcacat 2520
tggcaacagc ccctgatgca tatgccttat tcatccctca gaaaaggatt caagtagagg 2580
cttgatttgg aggttaaagt tttgctatgc tgtattttac attacttatt gttttagctg 2640
tcctcatgaa tgtcttttca ctacccattt gcttatcctg catctctcag ccttgactcc 2700
actcagttct cttgcttaga gataccacct ttcccctgaa gtgttccttc catgttttac 2760
ggcgagatgg tttctcctcg cctggccact cagccttagt tgtctctgtt gtcttataga 2820
ggtctacttg aagaaggaaa aacaggggtc atggtttgac tgtcctgtga gcccttcttc 2880
cctgcctccc ccactcacag tgacccggaa tctgcagtgc tagtctcccg gaactatcac 2940
tctttcacag tctgctttgg aaggactggg cttagtatga aaagttagga ctgagaagaa 3000
tttgaaaggc ggctttttgt agcttgatat tcactactgt cttattaccc tgtcataggc 3060
ccaccccaaa tggaagtccc attcttcctc aggatgttta agattagcat tcaggaagag 3120
atcagaggtc tgctggctcc cttatcatgt ccctta 3156
<210> 33
<211> 3168
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hLW-013 vector, ITRs not included
<400> 33
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtccacc tcacaccaga agaaaaaagt gctgtaacag 840
ctctctgggg aaaagtcaat gtcgacgagg taggggggga agctctcgga aggttggtat 900
caaggttaca agacaggact agtatcgatt ttaaggagac caatagaaac tgggcatgtg 960
gagacagaga agactcttgg gtttctgata ggcactgact ctctctgcct attggtctat 1020
tttcccaccc ttagactcct cgtcgtgtat ccatggacac aaagattttt cgaaagcttc 1080
ggagacctca gcacaccaga cgcagtaatg ggaaatccaa aagtcaaagc acacggaaaa 1140
aaggtcctgg gggctttctc tgacggactc gcacatctcg ataatctgaa aggaacattc 1200
gctaccctct ctgaactcca ttgcgataaa ctccatgtcg acccagaaaa ttttagagtg 1260
agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1320
aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1380
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1440
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 1500
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 1560
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 1620
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 1680
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 1740
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 1800
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 1860
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg caatagcaat 1920
atctctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 1980
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2040
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2100
cccacagctg ctcggaaatg tcctcgtgtg cgtcctcgct caccatttcg gaaaggagtt 2160
tacacctcct gtccaagcag cttaccaaaa ggtcgtcgca ggggtcgcaa acgctctcgc 2220
tcataaatac cattaggctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt 2280
ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg 2340
cctaataaaa aacatttatt ttcattgcaa tgatgtattt aaattatttc tgaatatttt 2400
actaaaaagg gaatgtggga ggtcagtgca tttaaaacat aaagaaatga agagctagtt 2460
caaaccttgg gaaaatacac tatatcttaa actccatgaa agaaggtgag gctgcaaaca 2520
gctaatgcac attggcaaca gcccctgatg catatgcctt attcatccct cagaaaagga 2580
ttcaagtaga ggcttgattt ggaggttaaa gttttgctat gctgtatttt acattactta 2640
ttgttttagc tgtcctcatg aatgtctttt cactacccat ttgcttatcc tgcatctctc 2700
agccttgact ccactcagtt ctcttgctta gagataccac ctttcccctg aagtgttcct 2760
tccatgtttt acggcgagat ggtttctcct cgcctggcca ctcagcctta gttgtctctg 2820
ttgtcttata gaggtctact tgaagaagga aaaacagggg tcatggtttg actgtcctgt 2880
gagcccttct tccctgcctc ccccactcac agtgacccgg aatctgcagt gctagtctcc 2940
cggaactatc actctttcac agtctgcttt ggaaggactg ggcttagtat gaaaagttag 3000
gactgagaag aatttgaaag gcggcttttt gtagcttgat attcactact gtcttattac 3060
cctgtcatag gcccacccca aatggaagtc ccattcttcc tcaggatgtt taagattagc 3120
attcaggaag agatcagagg tctgctggct cccttatcat gtccctta 3168
<210> 34
<211> 3156
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hLW-013 vector, ITRs not included, Linker removed
<400> 34
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtccacc tcacaccaga agaaaaaagt gctgtaacag 840
ctctctgggg aaaagtcaat gtcgacgagg taggggggga agctctcgga aggttggtat 900
caaggttaca agacaggttt aaggagacca atagaaactg ggcatgtgga gacagagaag 960
actcttgggt ttctgatagg cactgactct ctctgcctat tggtctattt tcccaccctt 1020
agactcctcg tcgtgtatcc atggacacaa agatttttcg aaagcttcgg agacctcagc 1080
acaccagacg cagtaatggg aaatccaaaa gtcaaagcac acggaaaaaa ggtcctgggg 1140
gctttctctg acggactcgc acatctcgat aatctgaaag gaacattcgc taccctctct 1200
gaactccatt gcgataaact ccatgtcgac ccagaaaatt ttagagtgag tctatgggac 1260
gcttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggata 1320
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 1380
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 1440
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 1500
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 1560
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 1620
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 1680
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 1740
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 1800
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 1860
cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat ctctgcatat 1920
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 1980
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 2040
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctgct 2100
cggaaatgtc ctcgtgtgcg tcctcgctca ccatttcgga aaggagttta cacctcctgt 2160
ccaagcagct taccaaaagg tcgtcgcagg ggtcgcaaac gctctcgctc ataaatacca 2220
ttaggctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2280
ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2340
catttatttt cattgcaatg atgtatttaa attatttctg aatattttac taaaaaggga 2400
atgtgggagg tcagtgcatt taaaacataa agaaatgaag agctagttca aaccttggga 2460
aaatacacta tatcttaaac tccatgaaag aaggtgaggc tgcaaacagc taatgcacat 2520
tggcaacagc ccctgatgca tatgccttat tcatccctca gaaaaggatt caagtagagg 2580
cttgatttgg aggttaaagt tttgctatgc tgtattttac attacttatt gttttagctg 2640
tcctcatgaa tgtcttttca ctacccattt gcttatcctg catctctcag ccttgactcc 2700
actcagttct cttgcttaga gataccacct ttcccctgaa gtgttccttc catgttttac 2760
ggcgagatgg tttctcctcg cctggccact cagccttagt tgtctctgtt gtcttataga 2820
ggtctacttg aagaaggaaa aacaggggtc atggtttgac tgtcctgtga gcccttcttc 2880
cctgcctccc ccactcacag tgacccggaa tctgcagtgc tagtctcccg gaactatcac 2940
tctttcacag tctgctttgg aaggactggg cttagtatga aaagttagga ctgagaagaa 3000
tttgaaaggc ggctttttgt agcttgatat tcactactgt cttattaccc tgtcataggc 3060
ccaccccaaa tggaagtccc attcttcctc aggatgttta agattagcat tcaggaagag 3120
atcagaggtc tgctggctcc cttatcatgt ccctta 3156
<210> 35
<211> 2468
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-011 vector, ITRs not included
<400> 35
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtgcatc tgactcctga ggagaagtct gccgttactg 840
ccctgtgggg caaggtgaac gtggatgaag ttggtggtga ggccctgggc aggttggtat 900
caaggttaca agacaggact agtatcgatt ttaaggagac caatagaaac tgggcatgtg 960
gagacagaga agactcttgg gtttctgata ggcactgact ctctctgcct attggtctat 1020
tttcccaccc ttaggctgct ggtggtctac ccttggaccc agaggttctt tgagtccttt 1080
ggggatctgt ccactcctga tgctgttatg ggcaacccta aggtgaaggc tcatggcaag 1140
aaagtgctcg gtgcctttag tgatggcctg gctcacctgg acaacctcaa gggcaccttt 1200
gccacactga gtgagctgca ctgtgacaag ctgcacgtgg atcctgagaa cttcagggtg 1260
agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1320
aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1380
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1440
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 1500
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 1560
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 1620
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 1680
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 1740
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 1800
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 1860
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg caatagcaat 1920
atctctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 1980
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2040
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2100
cccacagctc ctgggcaacg tgctggtctg tgtgctggcc catcactttg gcaaagaatt 2160
caccccacca gtgcaggctg cctatcagaa agtggtggct ggtgtggcta atgccctggc 2220
ccacaagtat cactaagctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt 2280
ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg 2340
cctaataaaa aacatttatt ttcattgcaa tgatgtattt aaattatttc tgaatatttt 2400
actaaaaagg gaatgtggga ggtcagtgca tttaaaacat aaagaaatga agagctagtt 2460
caaacctt 2468
<210> 36
<211> 2456
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hL-011 vector, ITRs not included, Linker removed
<400> 36
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtgcatc tgactcctga ggagaagtct gccgttactg 840
ccctgtgggg caaggtgaac gtggatgaag ttggtggtga ggccctgggc aggttggtat 900
caaggttaca agacaggttt aaggagacca atagaaactg ggcatgtgga gacagagaag 960
actcttgggt ttctgatagg cactgactct ctctgcctat tggtctattt tcccaccctt 1020
aggctgctgg tggtctaccc ttggacccag aggttctttg agtcctttgg ggatctgtcc 1080
actcctgatg ctgttatggg caaccctaag gtgaaggctc atggcaagaa agtgctcggt 1140
gcctttagtg atggcctggc tcacctggac aacctcaagg gcacctttgc cacactgagt 1200
gagctgcact gtgacaagct gcacgtggat cctgagaact tcagggtgag tctatgggac 1260
gcttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggata 1320
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 1380
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 1440
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 1500
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 1560
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 1620
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 1680
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 1740
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 1800
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 1860
cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat ctctgcatat 1920
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 1980
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 2040
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctcct 2100
gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattca ccccaccagt 2160
gcaggctgcc tatcagaaag tggtggctgg tgtggctaat gccctggccc acaagtatca 2220
ctaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2280
ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2340
catttatttt cattgcaatg atgtatttaa attatttctg aatattttac taaaaaggga 2400
atgtgggagg tcagtgcatt taaaacataa agaaatgaag agctagttca aacctt 2456
<210> 37
<211> 2468
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hLW-012 vector, ITRs not included
<400> 37
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtccacc tcacaccaga agaaaaaagt gctgtaacag 840
ctctctgggg aaaagtcaat gtcgacgagg taggggggga agctctcgga aggttggtat 900
caaggttaca agacaggact agtatcgatt ttaaggagac caatagaaac tgggcatgtg 960
gagacagaga agactcttgg gtttctgata ggcactgact ctctctgcct attggtctat 1020
tttcccaccc ttagactcct cgtcgtgtat ccatggacac aaagattttt cgaaagcttc 1080
ggagacctca gcacaccaga cgcagtaatg ggaaatccaa aagtcaaagc acacggaaaa 1140
aaggtcctgg gggctttctc tgacggactc gcacatctcg ataatctgaa aggaacattc 1200
gctaccctct ctgaactcca ttgcgataaa ctccatgtcg acccagaaaa ttttagagtg 1260
agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1320
aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1380
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1440
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 1500
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 1560
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 1620
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 1680
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 1740
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 1800
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 1860
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg caatagcaat 1920
atctctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 1980
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2040
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2100
cccacagctg ctcggaaatg tcctcgtgtg cgtcctcgct caccatttcg gaaaggagtt 2160
tacacctcct gtccaagcag cttaccaaaa ggtcgtcgca ggggtcgcaa acgctctcgc 2220
tcataaatac cattaggctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt 2280
ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg 2340
cctaataaaa aacatttatt ttcattgcaa tgatgtattt aaattatttc tgaatatttt 2400
actaaaaagg gaatgtggga ggtcagtgca tttaaaacat aaagaaatga agagctagtt 2460
caaacctt 2468
<210> 38
<211> 2456
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hLW-012 vector, ITRs not included, Linker removed
<400> 38
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtccacc tcacaccaga agaaaaaagt gctgtaacag 840
ctctctgggg aaaagtcaat gtcgacgagg taggggggga agctctcgga aggttggtat 900
caaggttaca agacaggttt aaggagacca atagaaactg ggcatgtgga gacagagaag 960
actcttgggt ttctgatagg cactgactct ctctgcctat tggtctattt tcccaccctt 1020
agactcctcg tcgtgtatcc atggacacaa agatttttcg aaagcttcgg agacctcagc 1080
acaccagacg cagtaatggg aaatccaaaa gtcaaagcac acggaaaaaa ggtcctgggg 1140
gctttctctg acggactcgc acatctcgat aatctgaaag gaacattcgc taccctctct 1200
gaactccatt gcgataaact ccatgtcgac ccagaaaatt ttagagtgag tctatgggac 1260
gcttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggata 1320
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 1380
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 1440
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 1500
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 1560
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 1620
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 1680
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 1740
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 1800
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 1860
cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat ctctgcatat 1920
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 1980
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 2040
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctgct 2100
cggaaatgtc ctcgtgtgcg tcctcgctca ccatttcgga aaggagttta cacctcctgt 2160
ccaagcagct taccaaaagg tcgtcgcagg ggtcgcaaac gctctcgctc ataaatacca 2220
ttaggctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2280
ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2340
catttatttt cattgcaatg atgtatttaa attatttctg aatattttac taaaaaggga 2400
atgtgggagg tcagtgcatt taaaacataa agaaatgaag agctagttca aacctt 2456
<210> 39
<211> 2321
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hA-009 vector, ITRs not included
<400> 39
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtgcatc tgactcctga ggagaagtct gccgttactg 840
ccctgtgggg caaggtgaac gtggatgaag ttggtggtga ggccctgggc aggctgctgg 900
tggtctaccc ttggacccag aggttctttg agtcctttgg ggatctgtcc actcctgatg 960
ctgttatggg caaccctaag gtgaaggctc atggcaagaa agtgctcggt gcctttagtg 1020
atggcctggc tcacctggac aacctcaagg gcacctttgc cacactgagt gagctgcact 1080
gtgacaagct gcacgtggat cctgagaact tcaggctcct gggcaacgtg ctggtctgtg 1140
tgctggccca tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag 1200
tggtggctgg tgtggctaat gccctggccc acaagtatca ctaagaattc aaggcctctc 1260
gagcctctag aactatagtg agtcgtatta cgtagatcca gacatgataa gatacattga 1320
tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 1380
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 1440
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aagcttcagc 1500
tgtgatcata acgttgagct cgtgcatctg actcctgagg agaagtctgc cgttactgcc 1560
ctgtggggca aggtgaacgt ggatgaagtt ggtggtgagg ccctgggcag gttggtatca 1620
aggttacaag acaggtttaa ggagaccaat agaaactggg catgtggaga cagagaagac 1680
tcttgggttt ctgataggca ctgactctct ctgcctattg gtctattttc ccacccttag 1740
gctgctggtg gtctaccctt ggacccagag gttctttgag tcctttgggg atctgtccac 1800
tcctgatgct gttatgggca accctaaggt gaaggctcat ggcaagaaag tgctcggtgc 1860
ctttagtgat ggcctggctc acctggacaa cctcaagggc acctttgcca cactgagtga 1920
gctgcactgt gacaagctgc acgtggatcc tgagaacttc agggtgagtc tatgggacgc 1980
ttgatgtttt ctttcccctt cttttctatg gttaagttca tgtcatagga aggggataag 2040
taacagggta cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca 2100
ggatcgtttt agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct 2160
tgctttcttt ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt 2220
gtataacaaa aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca 2280
gtctgcctag tacattacta tttggaatat atgtgtgctt a 2321
<210> 40
<211> 2321
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-hAW-002 vector, ITRs not included
<400> 40
ttatttattt gtatttttga ctgcattaag aggtctctag ttttttatct cttgtttccc 60
aaaacctaat aagtaactaa tgcacagagc acattgattt gtatttattc tatttttaga 120
cataatttat tagcatgcat gagcaaatta agaaaaacaa caacaaatga atgcatatat 180
atgtatatgt atgtgtgtat atatacacac atatatatat atattttttc ttttcttacc 240
agaaggtttt aatccaaata aggagaagat atgcttagaa ccgaggtaga gttttcatcc 300
attctgtcct gtaagtattt tgcatattct ggagacgcag gaagagatcc atctacatat 360
cccaaagctg aattatggta gacaaaactc ttccactttt agtgcatcaa cttcttattt 420
gtgtaataag aaaattggga aaacgatctt caatatgctt accaagctgt gattccaaat 480
attacgtaaa tacacttgca aaggaggatg tttttagtag caatttgtac tgatggtatg 540
gggccaagag atatatctta gagggagggc tgagggtttg aagtccaact cctaagccag 600
tgccagaaga gccaaggaca ggtacggctg tcatcactta gacctcaccc tgtggagcca 660
caccctaggg ttggccaatc tactcccagg agcagggagg gcaggagcca gggctgggca 720
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgacacaac tgtgttcact 780
agcaacctca aacagacacc atggtccacc tcacaccaga agaaaaaagt gctgtaacag 840
ctctctgggg aaaagtcaat gtcgacgagg taggggggga agctctcgga agactcctcg 900
tcgtgtatcc atggacacaa agatttttcg aaagcttcgg agacctcagc acaccagacg 960
cagtaatggg aaatccaaaa gtcaaagcac acggaaaaaa ggtcctgggg gctttctctg 1020
acggactcgc acatctcgat aatctgaaag gaacattcgc taccctctct gaactccatt 1080
gcgataaact ccatgtcgac ccagaaaatt ttagactgct cggaaatgtc ctcgtgtgcg 1140
tcctcgctca ccatttcgga aaggagttta cacctcctgt ccaagcagct taccaaaagg 1200
tcgtcgcagg ggtcgcaaac gctctcgctc ataaatacca ttaggaattc aaggcctctc 1260
gagcctctag aactatagtg agtcgtatta cgtagatcca gacatgataa gatacattga 1320
tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 1380
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 1440
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aagcttcagc 1500
tgtgatcata acgttgagct cgtgcatctg actcctgagg agaagtctgc cgttactgcc 1560
ctgtggggca aggtgaacgt ggatgaagtt ggtggtgagg ccctgggcag gttggtatca 1620
aggttacaag acaggtttaa ggagaccaat agaaactggg catgtggaga cagagaagac 1680
tcttgggttt ctgataggca ctgactctct ctgcctattg gtctattttc ccacccttag 1740
gctgctggtg gtctaccctt ggacccagag gttctttgag tcctttgggg atctgtccac 1800
tcctgatgct gttatgggca accctaaggt gaaggctcat ggcaagaaag tgctcggtgc 1860
ctttagtgat ggcctggctc acctggacaa cctcaagggc acctttgcca cactgagtga 1920
gctgcactgt gacaagctgc acgtggatcc tgagaacttc agggtgagtc tatgggacgc 1980
ttgatgtttt ctttcccctt cttttctatg gttaagttca tgtcatagga aggggataag 2040
taacagggta cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca 2100
ggatcgtttt agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct 2160
tgctttcttt ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt 2220
gtataacaaa aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca 2280
gtctgcctag tacattacta tttggaatat atgtgtgctt a 2321
<210> 41
<211> 2439
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-h1-010 vector, ITRs not included
<400> 41
caacaacaaa tgaatgcata tatatgtata tgtatgtgtg tatatataca cacatatata 60
tatatatttt ttcttttctt accagaaggt tttaatccaa ataaggagaa gatatgctta 120
gaaccgaggt agagttttca tccattctgt cctgtaagta ttttgcatat tctggagacg 180
caggaagaga tccatctaca tatcccaaag ctgaattatg gtagacaaaa ctcttccact 240
tttagtgcat caacttctta tttgtgtaat aagaaaattg ggaaaacgat cttcaatatg 300
cttaccaagc tgtgattcca aatattacgt aaatacactt gcaaaggagg atgtttttag 360
tagcaatttg tactgatggt atggggccaa gagatatatc ttagagggag ggctgagggt 420
ttgaagtcca actcctaagc cagtgccaga agagccaagg acaggtacgg ctgtcatcac 480
ttagacctca ccctgtggag ccacacccta gggttggcca atctactccc aggagcaggg 540
agggcaggag ccagggctgg gcataaaagt cagggcagag ccatctattg cttacatttg 600
cttctgacac aactgtgttc actagcaacc tcaaacagac accatggtgc atctgactcc 660
tgaggagaag tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg 720
tgaggccctg ggcaggttgg tatcaaggtt acaagacagg tttaaggaga ccaatagaaa 780
ctgggcatgt ggagacagag aagcttctga cctcttctct tcctcccaca gggcggtacc 840
agatctggca gcggagaggg cagaggaagt cttctaacat gcggtgacgt ggaggagaat 900
cccggcccta ggggtaccat ggtgcatctg actcctgagg agaagtctgc cgttactgcc 960
ctgtggggca aggtgaacgt ggatgaagtt ggtggtgagg ccctgggcag gctgctggtg 1020
gtctaccctt ggacccagag gttctttgag tcctttgggg atctgtccac tcctgatgct 1080
gttatgggca accctaaggt gaaggctcat ggcaagaaag tgctcggtgc ctttagtgat 1140
ggcctggctc acctggacaa cctcaagggc acctttgcca cactgagtga gctgcactgt 1200
gacaagctgc acgtggatcc tgagaacttc aggctcctgg gcaacgtgct ggtctgtgtg 1260
ctggcccatc actttggcaa agaattcacc ccaccagtgc aggctgccta tcagaaagtg 1320
gtggctggtg tggctaatgc cctggcccac aagtatcact aagaattcaa ggcctctcga 1380
gcctctagaa ctatagtgag tcgtattacg tagatccaga catgataaga tacattgatg 1440
agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 1500
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 1560
gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa gcttcagctg 1620
tgatcataac gttgagctca agactcttgg gtttctgata ggcactgact ctctctgcct 1680
attggtctat tttcccaccc ttaggctgct ggtggtctac ccttggaccc agaggttctt 1740
tgagtccttt ggggatctgt ccactcctga tgctgttatg ggcaacccta aggtgaaggc 1800
tcatggcaag aaagtgctcg gtgcctttag tgatggcctg gctcacctgg acaacctcaa 1860
gggcaccttt gccacactga gtgagctgca ctgtgacaag ctgcacgtgg atcctgagaa 1920
cttcagggtg agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag 1980
ttcatgtcat aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat 2040
gattgcatca gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac 2100
aattgttttc ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta 2160
ttatacttaa tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag 2220
taacttaaaa aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt 2280
gcttatttgc atattcataa tctccctact ttattttctt ttatttttaa ttgatacata 2340
atcattatac atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc 2400
aaatcagggt aattttgcat ttgtaatttt aaaaaatgc 2439
<210> 42
<211> 2439
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB-h1W-008 vector, ITRs not included
<400> 42
caacaacaaa tgaatgcata tatatgtata tgtatgtgtg tatatataca cacatatata 60
tatatatttt ttcttttctt accagaaggt tttaatccaa ataaggagaa gatatgctta 120
gaaccgaggt agagttttca tccattctgt cctgtaagta ttttgcatat tctggagacg 180
caggaagaga tccatctaca tatcccaaag ctgaattatg gtagacaaaa ctcttccact 240
tttagtgcat caacttctta tttgtgtaat aagaaaattg ggaaaacgat cttcaatatg 300
cttaccaagc tgtgattcca aatattacgt aaatacactt gcaaaggagg atgtttttag 360
tagcaatttg tactgatggt atggggccaa gagatatatc ttagagggag ggctgagggt 420
ttgaagtcca actcctaagc cagtgccaga agagccaagg acaggtacgg ctgtcatcac 480
ttagacctca ccctgtggag ccacacccta gggttggcca atctactccc aggagcaggg 540
agggcaggag ccagggctgg gcataaaagt cagggcagag ccatctattg cttacatttg 600
cttctgacac aactgtgttc actagcaacc tcaaacagac accatggtgc atctgactcc 660
tgaggagaag tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg 720
tgaggccctg ggcaggttgg tatcaaggtt acaagacagg tttaaggaga ccaatagaaa 780
ctgggcatgt ggagacagag aagcttctga cctcttctct tcctcccaca gggcggtacc 840
agatctggca gcggagaggg cagaggaagt cttctaacat gcggtgacgt ggaggagaat 900
cccggcccta ggggtaccat ggtccacctc acaccagaag aaaaaagtgc tgtaacagct 960
ctctggggaa aagtcaatgt cgacgaggta gggggggaag ctctcggaag actcctcgtc 1020
gtgtatccat ggacacaaag atttttcgaa agcttcggag acctcagcac accagacgca 1080
gtaatgggaa atccaaaagt caaagcacac ggaaaaaagg tcctgggggc tttctctgac 1140
ggactcgcac atctcgataa tctgaaagga acattcgcta ccctctctga actccattgc 1200
gataaactcc atgtcgaccc agaaaatttt agactgctcg gaaatgtcct cgtgtgcgtc 1260
ctcgctcacc atttcggaaa ggagtttaca cctcctgtcc aagcagctta ccaaaaggtc 1320
gtcgcagggg tcgcaaacgc tctcgctcat aaataccatt aggaattcaa ggcctctcga 1380
gcctctagaa ctatagtgag tcgtattacg tagatccaga catgataaga tacattgatg 1440
agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 1500
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 1560
gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa gcttcagctg 1620
tgatcataac gttgagctca agactcttgg gtttctgata ggcactgact ctctctgcct 1680
attggtctat tttcccaccc ttaggctgct ggtggtctac ccttggaccc agaggttctt 1740
tgagtccttt ggggatctgt ccactcctga tgctgttatg ggcaacccta aggtgaaggc 1800
tcatggcaag aaagtgctcg gtgcctttag tgatggcctg gctcacctgg acaacctcaa 1860
gggcaccttt gccacactga gtgagctgca ctgtgacaag ctgcacgtgg atcctgagaa 1920
cttcagggtg agtctatggg acgcttgatg ttttctttcc ccttcttttc tatggttaag 1980
ttcatgtcat aggaagggga taagtaacag ggtacagttt agaatgggaa acagacgaat 2040
gattgcatca gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac 2100
aattgttttc ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta 2160
ttatacttaa tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag 2220
taacttaaaa aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt 2280
gcttatttgc atattcataa tctccctact ttattttctt ttatttttaa ttgatacata 2340
atcattatac atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc 2400
aaatcagggt aattttgcat ttgtaatttt aaaaaatgc 2439
<210> 43
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB coding sequence in exon 1 with silent codon alterations
<400> 43
atggtccacc tcacaccaga agaaaaaagt gctgtaacag ctctctgggg aaaagtcaat 60
gtcgacgagg taggggggga agctctcgga ag 92
<210> 44
<211> 223
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB coding sequence in exon 2 with silent codon alterations
<400> 44
actcctcgtc gtgtatccat ggacacaaag atttttcgaa agcttcggag acctcagcac 60
accagacgca gtaatgggaa atccaaaagt caaagcacac ggaaaaaagg tcctgggggc 120
tttctctgac ggactcgcac atctcgataa tctgaaagga acattcgcta ccctctctga 180
actccattgc gataaactcc atgtcgaccc agaaaatttt aga 223
<210> 45
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB coding sequence in exon 3 with silent codon alterations
<400> 45
ctgctcggaa atgtcctcgt gtgcgtcctc gctcaccatt tcggaaagga gtttacacct 60
cctgtccaag cagcttacca aaaggtcgtc gcaggggtcg caaacgctct cgctcataaa 120
taccattag 129
<210> 46
<211> 352
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB coding sequence from second codon to stop codon, with silent
codon alterations
<400> 46
actcctcgtc gtgtatccat ggacacaaag atttttcgaa agcttcggag acctcagcac 60
accagacgca gtaatgggaa atccaaaagt caaagcacac ggaaaaaagg tcctgggggc 120
tttctctgac ggactcgcac atctcgataa tctgaaagga acattcgcta ccctctctga 180
actccattgc gataaactcc atgtcgaccc agaaaatttt agactgctcg gaaatgtcct 240
cgtgtgcgtc ctcgctcacc atttcggaaa ggagtttaca cctcctgtcc aagcagctta 300
ccaaaaggtc gtcgcagggg tcgcaaacgc tctcgctcat aaataccatt ag 352
<210> 47
<211> 441
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB coding sequence from start codon to stop codon, with silent
codon alterations
<400> 47
gtccacctca caccagaaga aaaaagtgct gtaacagctc tctggggaaa agtcaatgtc 60
gacgaggtag ggggggaagc tctcggaaga ctcctcgtcg tgtatccatg gacacaaaga 120
tttttcgaaa gcttcggaga cctcagcaca ccagacgcag taatgggaaa tccaaaagtc 180
aaagcacacg gaaaaaaggt cctgggggct ttctctgacg gactcgcaca tctcgataat 240
ctgaaaggaa cattcgctac cctctctgaa ctccattgcg ataaactcca tgtcgaccca 300
gaaaatttta gactgctcgg aaatgtcctc gtgtgcgtcc tcgctcacca tttcggaaag 360
gagtttacac ctcctgtcca agcagcttac caaaaggtcg tcgcaggggt cgcaaacgct 420
ctcgctcata aataccatta g 441
<210> 48
<211> 146
<212> PRT
<213> Homo sapiens
<400> 48
Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp Gly
1 5 10 15
Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu Leu
20 25 30
Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp Leu
35 40 45
Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His Gly
50 55 60
Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp Asn
65 70 75 80
Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys Leu
85 90 95
His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val Cys
100 105 110
Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln Ala
115 120 125
Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His Lys
130 135 140
Tyr His
145
<210> 49
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> 2A peptide consensus motif
<220>
<221> VARIANT
<222> (1)..(1)
<223> X is Asp or Gly.
<220>
<221> VARIANT
<222> (2)..(2)
<223> X is Val or Ile.
<220>
<221> VARIANT
<222> (4)..(4)
<223> X is any amino acid.
<400> 49
Xaa Xaa Glu Xaa Asn Pro Gly Pro
1 5
<210> 50
<211> 45
<212> DNA
<213> Homo sapiens
<400> 50
aggggtggag tcgtgacgtg ccaaatcaag cctctacttg aatcc 45
<210> 51
<211> 54
<212> DNA
<213> Homo sapiens
<400> 51
aatgattaac ccgccatgct acttatctac gtaaacctag gctccagata gcca 54
<210> 52
<211> 18
<212> DNA
<213> Homo sapiens
<400> 52
ggaagcagaa ctctgcac 18
<210> 53
<211> 27
<212> DNA
<213> Homo sapiens
<400> 53
gcattaagag gtctctagtt ttttatc 27
<210> 54
<211> 26
<212> DNA
<213> Homo sapiens
<400> 54
gatggtatgg ggccaagaga tatatc 26
<210> 55
<211> 20
<212> DNA
<213> Homo sapiens
<400> 55
gtctaccctt ggacccagag 20
<210> 56
<211> 26
<212> DNA
<213> Homo sapiens
<400> 56
cagtctgcct agtacattac tatttg 26
<210> 57
<211> 23
<212> DNA
<213> Homo sapiens
<400> 57
catgttcata cctcttatct tcc 23
<210> 58
<211> 22
<212> DNA
<213> Homo sapiens
<400> 58
gcaaacagct aatgcacatt gg 22
<210> 59
<211> 22
<212> DNA
<213> Homo sapiens
<400> 59
cagaatccag atgctcaagg cc 22
<210> 60
<211> 20
<212> DNA
<213> Homo sapiens
<400> 60
ccctgatttg gtcaatatgt 20
<210> 61
<211> 23
<212> DNA
<213> Homo sapiens
<400> 61
catcaagcgt cccatagact cac 23
<210> 62
<211> 21
<212> DNA
<213> Homo sapiens
<400> 62
gcagacttct cctcaggagt c 21
<210> 63
<211> 25
<212> DNA
<213> Homo sapiens
<400> 63
cttacaggac agaatggatg aaaac 25
<210> 64
<211> 22
<212> DNA
<213> Homo sapiens
<400> 64
gaaaaggtct tctacttggc tc 22
<210> 65
<211> 20
<212> DNA
<213> Homo sapiens
<400> 65
ggttaaccaa aagaaactgg 20
<210> 66
<211> 22
<212> DNA
<213> Homo sapiens
<400> 66
tgcagattag tccaggcaga aa 22
<210> 67
<211> 25
<212> DNA
<213> Homo sapiens
<400> 67
gggtaatcag tggtgtcaaa tagga 25
<210> 68
<211> 20
<212> DNA
<213> Homo sapiens
<400> 68
agttagatgt ccccagttaa 20
<210> 69
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB2MTI100 Forward Primer
<400> 69
ctattggtct ccttaaaatc gatactagt 29
<210> 70
<211> 24
<212> DNA
<213> Homo sapiens
<400> 70
atattcaaac ttccgcagaa cact 24
<210> 71
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> T2A peptide
<400> 71
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 72
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> T2A element
<400> 72
gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54
<210> 73
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> P2A peptide
<400> 73
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 74
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> P2A element
<400> 74
gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57
<210> 75
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> GSG coding sequence
<400> 75
ggcagcgga 9
<210> 76
<211> 198
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 polyA signal
<400> 76
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 60
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 120
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 180
tcttatcatg tctggatc 198
<210> 77
<211> 198
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 polyA signal
<400> 77
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 78
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 polyA signal
<400> 78
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 79
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 polyA signal
<400> 79
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120
tt 122
<210> 80
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> TI RE Linker
<400> 80
actagtatcg at 12
<210> 81
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB L NGS S1
<400> 81
cctctgggtc caagggtaga 20
<210> 82
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Forward Adapter 1
<400> 82
aatgatacgg cgaccaccga gatctacaca agtagagtct ttccctacac gacgctcttc 60
cgatctgggc ataaaagtca gggcaga 87
<210> 83
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Forward Adapter 2
<400> 83
aatgatacgg cgaccaccga gatctacacc atgcttatct ttccctacac gacgctcttc 60
cgatcttggg cataaaagtc agggcaga 88
<210> 84
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Forward Adapter 3
<400> 84
aatgatacgg cgaccaccga gatctacacg cacatcttct ttccctacac gacgctcttc 60
cgatctatgg gcataaaagt cagggcaga 89
<210> 85
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Forward Adapter 4
<400> 85
aatgatacgg cgaccaccga gatctacact gctcgactct ttccctacac gacgctcttc 60
cgatctgatg ggcataaaag tcagggcaga 90
<210> 86
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Reverse Adapter 1
<400> 86
caagcagaag acggcatacg agatcatgat cggtgactgg agttcagacg tgtgctcttc 60
cgatctgtct ccacatgccc agtttcta 88
<210> 87
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Reverse Adapter 2
<400> 87
caagcagaag acggcatacg agataggatc tagtgactgg agttcagacg tgtgctcttc 60
cgatcttgtc tccacatgcc cagtttcta 89
<210> 88
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Reverse Adapter 3
<400> 88
caagcagaag acggcatacg agatgacagt aagtgactgg agttcagacg tgtgctcttc 60
cgatctatgt ctccacatgc ccagtttcta 90
<210> 89
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB NGS Nest 5 Reverse Adapter 4
<400> 89
caagcagaag acggcatacg agatcctatg ccgtgactgg agttcagacg tgtgctcttc 60
cgatctgagt ctccacatgc ccagtttcta 90
<210> 90
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_Genomic, forward primer
<400> 90
gcgttagagg gcagagttc 19
<210> 91
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_Genomic, reverse primer
<400> 91
agctcccata gctcagtct 19
<210> 92
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_Genomic, probe
<400> 92
cattgtcact ttgcgctgcc ctc 23
<210> 93
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_FP forward primer
<400> 93
gcaatagcat cacaaatttc ac 22
<210> 94
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_FP, reverse primer
<400> 94
gatccagaca tgataagata cattg 25
<210> 95
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> AAVS1_FP, probe
<400> 95
tcactgcatt ctagttgtgg tttgtcca 28
<210> 96
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> SA-2A-FM1
<400> 96
gcttctgacc tcttctcttc ctccc 25
<210> 97
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SA-2A-FM2
<400> 97
gcggtgacgt ggaggagaat c 21
<210> 98
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB-Out-RM2
<400> 98
gcagaatggt agctggattg tagc 24
<210> 99
<211> 444
<212> DNA
<213> Artificial Sequence
<220>
<223> silently altered HBB coding sequence
<400> 99
atggtgcacc tcaccccaga agagaagtct gctgtgacag ctctctgggg aaaagtaaat 60
gtggatgagg tgggagggga ggccctagga aggcttcttg ttgtctaccc ctggacacag 120
agattctttg aatcctttgg ggacctgagc actcctgatg cagtgatggg caaccccaaa 180
gtcaaagctc atgggaagaa ggttttggga gccttctcag atggcctggc tcacctggac 240
aacctgaagg gcacctttgc caccctgtct gagctgcact gtgacaagct gcatgtggac 300
cctgagaact tcaggctcct gggcaatgtt ctggtatgtg tgttagcaca ccattttggc 360
aaggaattca cccctccagt gcaggctgcc taccagaaag tggtggcagg tgtggccaat 420
gccctggccc acaaatatca ctga 444
<210> 100
<211> 441
<212> DNA
<213> Artificial Sequence
<220>
<223> silently altered HBB coding sequence without start codon
<400> 100
gtgcacctca ccccagaaga gaagtctgct gtgacagctc tctggggaaa agtaaatgtg 60
gatgaggtgg gaggggaggc cctaggaagg cttcttgttg tctacccctg gacacagaga 120
ttctttgaat cctttgggga cctgagcact cctgatgcag tgatgggcaa ccccaaagtc 180
aaagctcatg ggaagaaggt tttgggagcc ttctcagatg gcctggctca cctggacaac 240
ctgaagggca cctttgccac cctgtctgag ctgcactgtg acaagctgca tgtggaccct 300
gagaacttca ggctcctggg caatgttctg gtatgtgtgt tagcacacca ttttggcaag 360
gaattcaccc ctccagtgca ggctgcctac cagaaagtgg tggcaggtgt ggccaatgcc 420
ctggcccaca aatatcactg a 441
<210> 101
<211> 489
<212> DNA
<213> Homo sapiens
<400> 101
ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 60
ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct 120
ctttgcacca ttctaaagaa taacagtgat aatttctggg ttaaggcaat agcaatatct 180
ctgcatataa atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa 240
tagcagctac aatccagcta ccattctgct tttattttat ggttgggata aggctggatt 300
attctgagtc caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca 360
cagctcctgg gcaacgtgct ggtctgtgtg ctggcccatc actttggcaa agaattcacc 420
ccaccagtgc aggctgccta tcagaaagtg gtggctggtg tggctaatgc cctggcccac 480
aagtatcac 489
<210> 102
<211> 1134
<212> DNA
<213> Homo sapiens
<400> 102
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt 180
gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat 240
acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc 300
aacagcccct gatgcatatg ccttattcat ccctcagaaa aggattcaag tagaggcttg 360
atttggaggt taaagttttg ctatgctgta ttttacatta cttattgttt tagctgtcct 420
catgaatgtc ttttcactac ccatttgctt atcctgcatc tctcagcctt gactccactc 480
agttctcttg cttagagata ccacctttcc cctgaagtgt tccttccatg ttttacggcg 540
agatggtttc tcctcgcctg gccactcagc cttagttgtc tctgttgtct tatagaggtc 600
tacttgaaga aggaaaaaca ggggtcatgg tttgactgtc ctgtgagccc ttcttccctg 660
cctcccccac tcacagtgac ccggaatctg cagtgctagt ctcccggaac tatcactctt 720
tcacagtctg ctttggaagg actgggctta gtatgaaaag ttaggactga gaagaatttg 780
aaaggcggct ttttgtagct tgatattcac tactgtctta ttaccctgtc ataggcccac 840
cccaaatgga agtcccattc ttcctcagga tgtttaagat tagcattcag gaagagatca 900
gaggtctgct ggctccctta tcatgtccct tatggtgctt ctggctctgc agttattagc 960
atagtgttac catcaaccac cttaacttca tttttcttat tcaataccta ggtaggtaga 1020
tgctagattc tggaaataaa atatgagtct caagtggtcc ttgtcctctc tcccagtcaa 1080
attctgaatc tagttggcaa gattctgaaa tcaaggcata taatcagtaa taag 1134
<210> 103
<211> 1626
<212> DNA
<213> Homo sapiens
<400> 103
ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 60
ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct 120
ctttgcacca ttctaaagaa taacagtgat aatttctggg ttaaggcaat agcaatatct 180
ctgcatataa atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa 240
tagcagctac aatccagcta ccattctgct tttattttat ggttgggata aggctggatt 300
attctgagtc caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca 360
cagctcctgg gcaacgtgct ggtctgtgtg ctggcccatc actttggcaa agaattcacc 420
ccaccagtgc aggctgccta tcagaaagtg gtggctggtg tggctaatgc cctggcccac 480
aagtatcact aagctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct 540
aagtccaact actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta 600
ataaaaaaca tttattttca ttgcaatgat gtatttaaat tatttctgaa tattttacta 660
aaaagggaat gtgggaggtc agtgcattta aaacataaag aaatgaagag ctagttcaaa 720
ccttgggaaa atacactata tcttaaactc catgaaagaa ggtgaggctg caaacagcta 780
atgcacattg gcaacagccc ctgatgcata tgccttattc atccctcaga aaaggattca 840
agtagaggct tgatttggag gttaaagttt tgctatgctg tattttacat tacttattgt 900
tttagctgtc ctcatgaatg tcttttcact acccatttgc ttatcctgca tctctcagcc 960
ttgactccac tcagttctct tgcttagaga taccaccttt cccctgaagt gttccttcca 1020
tgttttacgg cgagatggtt tctcctcgcc tggccactca gccttagttg tctctgttgt 1080
cttatagagg tctacttgaa gaaggaaaaa caggggtcat ggtttgactg tcctgtgagc 1140
ccttcttccc tgcctccccc actcacagtg acccggaatc tgcagtgcta gtctcccgga 1200
actatcactc tttcacagtc tgctttggaa ggactgggct tagtatgaaa agttaggact 1260
gagaagaatt tgaaaggcgg ctttttgtag cttgatattc actactgtct tattaccctg 1320
tcataggccc accccaaatg gaagtcccat tcttcctcag gatgtttaag attagcattc 1380
aggaagagat cagaggtctg ctggctccct tatcatgtcc cttatggtgc ttctggctct 1440
gcagttatta gcatagtgtt accatcaacc accttaactt catttttctt attcaatacc 1500
taggtaggta gatgctagat tctggaaata aaatatgagt ctcaagtggt ccttgtcctc 1560
tctcccagtc aaattctgaa tctagttggc aagattctga aatcaaggca tataatcagt 1620
aataag 1626
<210> 104
<211> 2332
<212> DNA
<213> Artificial Sequence
<220>
<223> hHBB vector
<400> 104
ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 60
ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct 120
ctttgcacca ttctaaagaa taacagtgat aatttctggg ttaaggcaat agcaatatct 180
ctgcatataa atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa 240
tagcagctac aatccagcta ccattctgct tttattttat ggttgggata aggctggatt 300
attctgagtc caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca 360
cagctcctgg gcaacgtgct ggtctgtgtg ctggcccatc actttggcaa agaattcacc 420
ccaccagtgc aggctgccta tcagaaagtg gtggctggtg tggctaatgc cctggcccac 480
aagtatcacg gcagcggagc tactaacttc agcctgctga agcaggctgg agacgtggag 540
gagaaccctg gacctatggt gcacctcacc ccagaagaga agtctgctgt gacagctctc 600
tggggaaaag taaatgtgga tgaggtggga ggggaggccc taggaaggct tcttgttgtc 660
tacccctgga cacagagatt ctttgaatcc tttggggacc tgagcactcc tgatgcagtg 720
atgggcaacc ccaaagtcaa agctcatggg aagaaggttt tgggagcctt ctcagatggc 780
ctggctcacc tggacaacct gaagggcacc tttgccaccc tgtctgagct gcactgtgac 840
aagctgcatg tggaccctga gaacttcagg ctcctgggca atgttctggt atgtgtgtta 900
gcacaccatt ttggcaagga attcacccct ccagtgcagg ctgcctacca gaaagtggtg 960
gcaggtgtgg ccaatgccct ggcccacaaa tatcactgag atccagacat gataagatac 1020
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 1080
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 1140
aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 1200
tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 1260
aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 1320
ttttcattgc aatgatgtat ttaaattatt tctgaatatt ttactaaaaa gggaatgtgg 1380
gaggtcagtg catttaaaac ataaagaaat gaagagctag ttcaaacctt gggaaaatac 1440
actatatctt aaactccatg aaagaaggtg aggctgcaaa cagctaatgc acattggcaa 1500
cagcccctga tgcatatgcc ttattcatcc ctcagaaaag gattcaagta gaggcttgat 1560
ttggaggtta aagttttgct atgctgtatt ttacattact tattgtttta gctgtcctca 1620
tgaatgtctt ttcactaccc atttgcttat cctgcatctc tcagccttga ctccactcag 1680
ttctcttgct tagagatacc acctttcccc tgaagtgttc cttccatgtt ttacggcgag 1740
atggtttctc ctcgcctggc cactcagcct tagttgtctc tgttgtctta tagaggtcta 1800
cttgaagaag gaaaaacagg ggtcatggtt tgactgtcct gtgagccctt cttccctgcc 1860
tcccccactc acagtgaccc ggaatctgca gtgctagtct cccggaacta tcactctttc 1920
acagtctgct ttggaaggac tgggcttagt atgaaaagtt aggactgaga agaatttgaa 1980
aggcggcttt ttgtagcttg atattcacta ctgtcttatt accctgtcat aggcccaccc 2040
caaatggaag tcccattctt cctcaggatg tttaagatta gcattcagga agagatcaga 2100
ggtctgctgg ctcccttatc atgtccctta tggtgcttct ggctctgcag ttattagcat 2160
agtgttacca tcaaccacct taacttcatt tttcttattc aatacctagg taggtagatg 2220
ctagattctg gaaataaaat atgagtctca agtggtcctt gtcctctctc ccagtcaaat 2280
tctgaatcta gttggcaaga ttctgaaatc aaggcatata atcagtaata ag 2332
<210> 105
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Silently altered HBB coding sequence corresponding to HBB exon 1
<400> 105
atggtgcacc tcaccccaga agagaagtct gctgtgacag ctctctgggg aaaagtaaat 60
gtggatgagg tgggagggga ggccctagga ag 92
<210> 106
<211> 223
<212> DNA
<213> Artificial Sequence
<220>
<223> Silently altered HBB coding sequence corresponding to HBB exon 2
<400> 106
gcttcttgtt gtctacccct ggacacagag attctttgaa tcctttgggg acctgagcac 60
tcctgatgca gtgatgggca accccaaagt caaagctcat gggaagaagg ttttgggagc 120
cttctcagat ggcctggctc acctggacaa cctgaagggc acctttgcca ccctgtctga 180
gctgcactgt gacaagctgc atgtggaccc tgagaacttc agg 223
<210> 107
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Silently altered HBB coding sequence corresponding to HBB exon 3
<400> 107
ctcctgggca atgttctggt atgtgtgtta gcacaccatt ttggcaagga attcacccct 60
ccagtgcagg ctgcctacca gaaagtggtg gcaggtgtgg ccaatgccct ggcccacaaa 120
tatcactga 129
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 108
aaagtcaggg cagagccatc 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 109
aatgattaac ccgccatgct 20
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 110
aactgggcat gtggagacag agaa 24
<210> 111
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 111
gttacaagac aggactagta tcgat 25
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 112
tagaccaata ggcagagaga gt 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 113
ctgagccaag tagaagacct tt 22
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 114
ctgtttctgc ctggactaat ct 22
<210> 115
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 115
ccctactttc taagtcacag aggct 25
Claims (134)
- 세포 내의 베타 글로빈(HBB) 유전자에서 돌연변이의 교정 방법으로서, 상기 방법은 상기 세포에 하기를 포함하는 복제-결함 아데노-연관 바이러스(AAV: adeno-associated virus)로 형질도입하는 단계를 포함하며:
a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드; 및
b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소; (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈,
상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하거나 공동-투여하지 않고 형질도입되는, 방법. - 제1항에 있어서, 상기 세포는 다능성 줄기 세포인 방법.
- 제1항에 있어서, 상기 세포는 조혈 줄기 세포인 방법.
- 제1항에 있어서, 상기 세포는 CD34+ 조혈 줄기 세포인 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 세포는 포유류 대상체 내에 있으며, 상기 AAV는 상기 대상체에서 상기 세포를 형질도입하는 데 유효한 양으로 상기 대상체에게 투여되는, 방법.
- HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법으로서, 상기 방법은:
a) 생체 외에서 상기 대상체로부터 적혈구 전구 세포에 하기를 포함하는 복제-결합 AAV로 형질도입하여, 정확한 HBB 유전자를 갖는 형질도입된 세포를 수득하는 단계
(i) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드; 및
(ii) 하기를 포함하는 교정 게놈: (A) 표적 유전자에서 표적 좌위 편집용 편집 요소; (B) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (C) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3', 및;
b) 상기 형질도입된 세포를 상기 대상체에게 투여하는 단계를 포함하며,
상기 세포는 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-형질도입하지 않고 형질도입되는, 방법. - 제6항에 있어서, 상기 적혈구 전구세포는 다능성 줄기 세포인 방법.
- 제6항에 있어서, 상기 적혈구 전구 세포는 다능성 줄기 세포인 방법.
- 제6항에 있어서, 상기 적혈구 전구 세포는 CD34+ 조혈 줄기 세포인 방법.
- HBB 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체의 치료 방법으로서, 상기 방법은 외인성 뉴클레아제 또는 외인성 뉴클레아제를 인코딩하는 뉴클레오티드 서열을 공동-투여하지 않고, 하기를 포함하는 복제-결함 AAV의 유효량을 대상체에게 투여하는 단계를 포함하는, 방법
a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드; 및
b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소; (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5'; 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈. - 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 질환 또는 장애는 지중해빈혈증 또는 겸상세포질환인 방법.
- 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 대상체는 인간 대상체인 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 표적 유전자는 상기 HBB 유전자인 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 표적 좌위는 상기 HBB 유전자에서 뉴클레오티드 점 돌연변이, 삽입, 또는 결실에 있는 방법.
- 제14항에 있어서, 상기 HBB 유전자에서 상기 뉴클레오티드 점 돌연변이 또는 결실은 위치 -87에서 G, 위치 -31에서 G, 위치 -30에서 A, 위치 -29에서 G, 위치 -28에서 G, 위치 -10에서 T, 위치 1에서 C, 위치 1에서 A, 위치 2에서 G, 위치 17 및 18에서 C 및 T의 결실, 위치 19에서 A, 위치 20에서 A의 결실, 위치 20에서 T, 위치 25 및 26에서 A 및 A의 결실, 위치 26 이후 G의 추가, 위치 47에서 A, 위치 48에서 A, 위치 51에서 C의 결실, 위치 52에서 A, 위치 58에서 G, 위치 59에서 G, 위치 79에서 A, 위치 82에서 T, 위치 84 이후 C의 추가, 위치 93에서 T, 위치 93에서 A, 위치 97에서 C, 위치 98에서 C, 위치 202에서 G, 위치 208에서 G, 위치 222에서 C, 위치 241 또는 242에서 T의 결실, 위치 254 내지 257에서 T 및 T 및 C 및 T의 결실, 위치 260에서 T, 위치 264 또는 265에서 C의 결실, 위치 343 이후 A의 추가, 위치 399 및 400에서 G 및 T의 결실, 위치 401에서 T, 위치 417 이후 A의 추가, 위치 446에서 A, 위치 1099에서 T, 위치 1293에서 A, 1344에서 T로 이루어진 군으로부터 선택되는 방법.
- 제14항 또는 제15항에 있어서, 상기 편집 요소는 돌연변이에 상응하는 야생형 HBB 유전자의 일부를 포함하는 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 편집 요소는 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함하는 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하는 방법.
- 제17항 또는 제18항에 있어서, 상기 코딩 영역은 상기 코딩 영역은 상기 야생형 HBB 유전자의 상응하는 엑손에 100%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵(silently) 변경되는 방법.
- 제19항에 있어서, 상기 편집 요소는 서열 번호: 43 내지 46 및 105 내지 107로 이루어진 군으로부터 선택된 뉴클레오티드 서열 중 적어도 하나를 포함하는 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 표적 좌위는 AAVS1인 방법.
- 제1항 내지 제16항 및 제21항 중 어느 한 항에 있어서, 상기 편집 요소는 서열 번호: 48 또는 이의 일부를 인코딩하는 뉴클레오티드 서열을 포함하는 방법.
- 제22항에 있어서, 상기 서열 번호: 48을 인코딩하는 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444로 구성되는 방법.
- 제22항에 있어서, 상기 서열 번호: 48을 인코딩하는 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444에 70%, 75%, 80%, 85%, 또는 90% 미만으로 동일하게 침묵 변경되는 방법.
- 제24항에 있어서, 상기 서열 번호: 48을 인코딩하는 서열은 서열 번호: 47 또는 100의 서열로 구성되는 방법.
- 제22항에 있어서, 상기 서열 번호: 48을 인코딩하는 서열은 상기 HBB 유전자의 스터퍼(stuffer)-삽입된 코딩 서열로 구성되는 방법.
- 제22항 내지 제26항 중 어느 한 항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 뉴클레오티드 3 및 뉴클레오티드 4 사이의 뉴클레오티드간 결합이며, 이에 의하여 상기 표적 좌위에의 상기 편집 요소의 통합으로 인해 상기 표적 유전자의 시작 코돈으로 시작하는 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 상기 표적 좌위를 생성하게 하는 방법.
- 제22항 내지 제26항 중 어느 한 항에 있어서, 상기 편집 요소는 5' 내지 3' 시작 코돈 및 서열 번호: 48을 인코딩하는 뉴클레오티드 서열로 이루어진 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열, 또는 상기 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 일부를 포함하는 방법.
- 제28항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 인트론 내에 있으며, 상기 편집 요소는 5' 내지 3' 스플라이스 수용체 부위, 리보솜 스키핑 요소(ribosomal skipping element), 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 방법.
- 제29항에 있어서, 상기 표적 좌위는 상기 HBB 유전자의 인트론 1 내에 있는 방법.
- 제28항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 코딩 뉴클레오티드에 인접하여 3'이고, 상기 편집 요소는 5' 내지 3' 리보솜 스키핑 요소 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 방법.
- 제31항에 있어서, 상기 표적 좌위는 야생형 표적 유전자 또는 돌연변이체 표적 유전자의 상응하는 뉴클레오티드의 정지 코돈인 방법.
- 제22항 내지 제32항 중 어느 한 항에 있어서, 상기 편집 요소는 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열에 외인성 폴리아데닐화 서열 3'을 더 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 편집 요소는 상기 표적 유전자에 존재하지 않는 제한 엔도뉴클레아제 부위를 더 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 편집 요소는 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 5' 상동성 암(arm) 뉴클레오티드 서열은 상기 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 3' 상동성 암 뉴클레오티드 서열은 상기 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 제1 게놈 영역은 제1 편집창(editing window)에 위치되며, 상기 제2 게놈 영역은 제2 편집창에 위치되는 방법.
- 제38항에 있어서, 상기 제1 및 제2 편집창들은 상이한 방법.
- 제38항에 있어서, 상기 제1 및 제2 편집창들은 동일한 방법.
- 제38항 내지 제40항 중 어느 한 항에 있어서, 상기 제1 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 제38항 내지 제41항 중 어느 한 항에 있어서, 상기 제2 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 제38항 내지 제42항 중 어느 한 항에 있어서, 상기 제1 게놈 영역은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 제38항 내지 제43항 중 어느 한 항에 있어서, 상기 제2 게놈 영역은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 5' 상동성 암은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 3' 상동성 암은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성되는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 5' 및 3' 상동성 암 뉴클레오티드 서열의 각각은 독립적으로 약 100 내지 약 2000 뉴클레오티드의 길이를 갖는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 교정 게놈은 상기 5' 상동성 암 뉴클레오티드 서열의 5' 반전된(inverted) 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 3' 상동성 암 뉴클레오티드 서열의 3' 반전된 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 더 포함하는 방법.
- 제48항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 18과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 19와 적어도 95% 서열 동일성을 갖는 방법.
- 제48항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 20과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 21과 적어도 95% 서열 동일성을 갖는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 교정 게놈은 서열 번호: 29 내지 42 및 104 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며: 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 방법.
- 제52항에 있어서,
(a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 방법. - 제52항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며: 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 방법.
- 제55항에 있어서,
(a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 방법. - 제55항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고; 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 68에 상응하는 캡시드 단백질에서 아미노산은 V이고; 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고; 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 방법.
- 제58항에 있어서,
(a) 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고, 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이며;
(b) 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 Y이며;
(c) 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이며;
(d) 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고, 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이며;
(e) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(f) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(g) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(h) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(i) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 방법. - 제58항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 방법.
- 선행하는 항들 중 어느 한 항에 있어서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합 효율은 적어도 1%인 방법.
- 선행하는 항들 중 어느 한 항에 있어서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도는 적어도 0.5%인 방법.
- 하기를 포함하는 복제-결함 아데노-연관 바이러스(AAV: adeno-associated virus):
a) AAV Clade F 캡시드 단백질을 포함하는 AAV 캡시드; 및
b) (i) 표적 유전자에서 표적 좌위 편집용 편집 요소, (ii) 상기 표적 좌위에 대한 제1 게놈 영역 5'과 상동성을 갖는 상기 편집 요소의 5' 상동성 암 뉴클레오티드 서열 5', 및 (iii) 상기 표적 좌위에 대한 제2 게놈 영역 3'과 상동성을 갖는 상기 편집 요소의 3' 상동성 암 뉴클레오티드 서열 3'을 포함하는 교정 게놈. - 제63항에 있어서, 상기 표적 유전자는 상기 HBB 유전자인 AAV.
- 제63항 또는 제64항에 있어서, 상기 표적 좌위는 상기 HBB 유전자에서 뉴클레오티드 점 돌연변이 또는 결실에 있는 AAV.
- 제65항에 있어서, 상기 HBB 유전자에서 상기 뉴클레오티드 점 돌연변이 또는 결실은 위치 -87에서 G, 위치 -31에서 G, 위치 -30에서 A, 위치 -29에서 G, 위치 -28에서 G, 위치 -10에서 T, 위치 1에서 C, 위치 1에서 A, 위치 2에서 G, 위치 17 및 18에서 C 및 T의 결실, 위치 19에서 A, 위치 20에서 A의 결실, 위치 20에서 T, 위치 25 및 26에서 A 및 A의 결실, 위치 26 이후 G의 추가, 위치 47에서 A, 위치 48에서 A, 위치 51에서 C의 결실, 위치 52에서 A, 위치 58에서 G, 위치 59에서 G, 위치 79에서 A, 위치 82에서 T, 위치 84 이후 C의 추가, 위치 93에서 T, 위치 93에서 A, 위치 97에서 C, 위치 98에서 C, 위치 202에서 G, 위치 208에서 G, 위치 222에서 C, 위치 241 또는 242에서 T의 결실, 위치 254 내지 257에서 T 및 T 및 C 및 T의 결실, 위치 260에서 T, 위치 264 또는 265에서 C의 결실, 위치 343 이후 A의 추가, 위치 399 및 400에서 G 및 T의 결실, 위치 401에서 T, 위치 417 이후 A의 추가, 위치 446에서 A, 위치 1099에서 T, 위치 1293에서 A, 1344에서 T로 이루어진 군으로부터 선택되는 AAV.
- 제65항 또는 제66항에 있어서, 상기 편집 요소는 돌연변이에 상응하는 야생형 HBB 유전자의 일부를 포함하는 AAV.
- 제63항 내지 제67항 중 어느 한 항에 있어서, 상기 편집 요소는 HBB 유전자의 하나 이상의 엑손의 코딩 영역을 포함하는 AAV.
- 제63항 내지 제68항 중 어느 한 항에 있어서, 상기 편집 요소는 엑손 1의 코딩 영역, 전체 인트론 1, 전체 엑손 2, 전체 인트론 2, 및 엑손 3의 코딩 영역을 포함하는 HBB 유전자의 일부를 포함하는 AAV.
- 제68항 또는 제69항에 있어서, 상기 코딩 영역은 상기 야생형 HBB 유전자의 상응하는 엑손에 100%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만으로 동일하게 침묵 변경되는 AAV.
- 제70항에 있어서, 상기 편집 요소는 서열 번호: 43 내지 46 및 105 내지 107로 이루어진 군으로부터 선택된 뉴클레오티드 서열 중 적어도 하나를 포함하는 AAV.
- 제63항에 있어서, 상기 표적 좌위는 AAVS1인 AAV.
- 제63항 내지 제66 및 제72항 중 어느 한 항에 있어서, 상기 편집 요소는 서열 번호: 48 또는 이의 일부를 인코딩하는 뉴클레오티드 서열을 포함하는 AAV.
- 제73항에 있어서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444로 구성되는 AAV.
- 제73항에 있어서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 27의 뉴클레오티드 4 내지 444에 70%, 75%, 80%, 85%, 또는 90% 미만으로 동일하게 침묵 변경되는 AAV.
- 제75항에 있어서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 서열 번호: 47 또는 100의 서열로 구성되는 AAV.
- 제73항에 있어서, 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열은 상기 HBB 유전자의 스터퍼-삽입된 코딩 서열로 구성되는 AAV.
- 제73항 내지 제77항 중 어느 한 항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 뉴클레오티드 3 및 뉴클레오티드 4 사이의 뉴클레오티드간 결합이며, 이에 의하여 상기 표적 좌위에의 상기 편집 요소의 통합으로 인해 상기 표적 유전자의 시작 코돈으로 시작하는 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 상기 표적 좌위를 생성하게 하는 AAV.
- 제73항 내지 제77항 중 어느 한 항에 있어서, 상기 편집 요소는 5' 내지 3' 시작 코돈 및 서열 번호: 48을 인코딩하는 뉴클레오티드 서열로 이루어진 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열, 또는 상기 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 일부를 포함하는 AAV.
- 제79항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 인트론 내에 있으며, 상기 편집 요소는 5' 내지 3' 스플라이스 수용체 부위, 리보솜 스키핑 요소, 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 AAV.
- 제80항에 있어서, 상기 표적 좌위는 상기 HBB 유전자의 인트론 1 내에 있는 AAV.
- 제79항에 있어서, 상기 표적 좌위는 상기 표적 유전자의 코딩 뉴클레오티드에 인접하여 3'이고, 상기 편집 요소는 5' 내지 3' 리보솜 스키핑 요소 및 HBB 코딩 서열 또는 스터퍼-삽입된 코딩 서열을 포함하는 AAV.
- 제82항에 있어서, 상기 표적 좌위는 야생형 표적 유전자 또는 돌연변이체 표적 유전자의 상응하는 뉴클레오티드의 정지 코돈인 AAV.
- 제73항 내지 제83항 중 어느 한 항에 있어서, 상기 편집 요소는 상기 서열 번호: 48을 인코딩하는 뉴클레오티드 서열에 외인성 폴리아데닐화 서열 3'을 더 포함하는 AAV.
- 제63항 내지 제84항 중 어느 한 항에 있어서, 상기 편집 요소는 상기 표적 유전자에 존재하지 않는 제한 엔도뉴클레아제 부위를 더 포함하는 AAV.
- 제63항 내지 제85항 중 어느 한 항에 있어서, 상기 편집 요소는 서열 번호: 23 내지 28 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 방법.
- 제63항 내지 제86항 중 어느 한 항에 있어서, 상기 5' 상동성 암 뉴클레오티드 서열은 상기 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 AAV.
- 제63항 내지 제87항 중 어느 한 항에 있어서, 상기 3' 상동성 암 뉴클레오티드 서열은 상기 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 AAV.
- 제62항 내지 제88항 중 어느 한 항에 있어서, 상기 제1 게놈 영역은 제1 편집창에 위치되며, 상기 제2 게놈 영역은 제2 편집창에 위치되는 AAV.
- 제89항에 있어서, 상기 제1 및 제2 편집창들은 상이한 AAV.
- 제89항에 있어서, 상기 제1 및 제2 편집창들은 동일한 AAV.
- 제89항 내지 제91항 중 어느 한 항에 있어서, 상기 제1 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제89항 내지 제92항 중 어느 한 항에 있어서, 상기 제2 편집창은 서열 번호: 101, 102, 또는 103에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제89항 내지 제93항 중 어느 한 항에 있어서, 상기 제1 게놈 영역은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제89항 내지 제94항 중 어느 한 항에 있어서, 상기 제2 게놈 영역은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제63항 내지 제95항 중 어느 한 항에 있어서, 상기 5' 상동성 암은 서열 번호: 101에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제63항 내지 제96항 중 어느 한 항에 있어서, 상기 3' 상동성 암은 서열 번호: 102에 기재된 뉴클레오티드 서열로 구성되는 AAV.
- 제63항 내지 제97항 중 어느 한 항에 있어서, 상기 5' 및 3' 상동성 암 뉴클레오티드 서열의 각각은 독립적으로 약 100 내지 약 2000 뉴클레오티드의 길이를 갖는 AAV.
- 제63항 내지 제98항 중 어느 한 항에 있어서, 상기 교정 게놈은 상기 5' 상동성 암 뉴클레오티드 서열의 5' 반전된 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 3' 상동성 암 뉴클레오티드 서열의 3' 반전된 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 더 포함하는 AAV.
- 제99항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 18과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 19와 적어도 95% 서열 동일성을 갖는 AAV.
- 제99항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열 번호: 20과 적어도 95% 서열 동일성을 가지며, 상기 3' ITR 뉴클레오티드 서열은 서열 번호: 21과 적어도 95% 서열 동일성을 갖는 AAV.
- 제63항 내지 제101항 중 어느 한 항에 있어서, 상기 교정 게놈은 서열 번호: 29 내지 42 및 104 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 AAV.
- 제63항 내지 제102항 중 어느 한 항에 있어서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며: 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 AAV.
- 제103항에 있어서,
(a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 AAV. - 제103항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV.
- 제63항 내지 제105항 중 어느 한 항에 있어서, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며: 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 AAV.
- 제106항에 있어서,
(a) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(b) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(c) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(d) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(e) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 AAV. - 제106항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV.
- 제63항 내지 제108항 중 어느 한 항에 있어서T, 상기 AAV Clade F 캡시드 단백질은 서열 번호: 2의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고; 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 68에 상응하는 캡시드 단백질에서 아미노산은 V이고; 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고; 서열 번호: 2의 아미노산 151에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 160에 상응하는 캡시드 단백질에서 아미노산은 D이고; 서열 번호: 2의 아미노산 206에 상응하는 캡시드 단백질에서 아미노산은 C이고; 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고; 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이고; 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고; 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고; 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이고; 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고; 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 590에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G 또는 Y이고; 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이고; 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이고; 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이고; 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C이고; 또는 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G인 AAV.
- 제109항에 있어서,
(a) 서열 번호: 2의 아미노산 2에 상응하는 캡시드 단백질에서 아미노산은 T이고, 서열 번호: 2의 아미노산 312에 상응하는 캡시드 단백질에서 아미노산은 Q이며;
(b) 서열 번호: 2의 아미노산 65에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 Y이며;
(c) 서열 번호: 2의 아미노산 77에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 690에 상응하는 캡시드 단백질에서 아미노산은 K이며;
(d) 서열 번호: 2의 아미노산 119에 상응하는 캡시드 단백질에서 아미노산은 L이고, 서열 번호: 2의 아미노산 468에 상응하는 캡시드 단백질에서 아미노산은 S이며;
(e) 서열 번호: 2의 아미노산 626에 상응하는 캡시드 단백질에서 아미노산은 G이고, 서열 번호: 2의 아미노산 718에 상응하는 캡시드 단백질에서 아미노산은 G이며;
(f) 서열 번호: 2의 아미노산 296에 상응하는 캡시드 단백질에서 아미노산은 H이고, 서열 번호: 2의 아미노산 464에 상응하는 캡시드 단백질에서 아미노산은 N이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 681에 상응하는 캡시드 단백질에서 아미노산은 M이며;
(g) 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 687에 상응하는 캡시드 단백질에서 아미노산은 R이며;
(h) 서열 번호: 2의 아미노산 346에 상응하는 캡시드 단백질에서 아미노산은 A이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이며; 또는
(i) 서열 번호: 2의 아미노산 501에 상응하는 캡시드 단백질에서 아미노산은 I이고, 서열 번호: 2의 아미노산 505에 상응하는 캡시드 단백질에서 아미노산은 R이고, 서열 번호: 2의 아미노산 706에 상응하는 캡시드 단백질에서 아미노산은 C인 AAV. - 제109항에 있어서, 상기 캡시드 단백질은 서열 번호: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 AAV.
- 제63항 내지 제111항 중 어느 한 항에 있어서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합 효율은 적어도 1%인 AAV.
- 제63항 내지 제112항 중 어느 한 항에 있어서, AAV가 표준 AAV 형질도입 조건 하에서 CD34+ 인간 줄기 세포의 집단과 외인성 뉴클레아제의 부재 하에 시험관 내에서 접촉될 때, 편집 요소의 표적 좌위로의 통합의 대립 유전자 빈도는 적어도 0.5%인 AAV.
- 제62항 내지 제111항 중 어느 한 항의 AAV를 포함하는 약학적 조성물.
- AAV의 재조합 제조용 패키징 시스템으로서, 상기 패키징 시스템은
a) 하나 이상의 AAV Rep 단백질을 인코딩하는 Rep 뉴클레오티드 서열;
b) 제103항 내지 제111항 중 어느 하나에 기재된 바와 같이 하나 이상의 AAV Clade F 캡시드 단백질을 인코딩하는 Cap 뉴클레오티드 서열; 및
c) 제63항 내지 제102항 중 어느 하나에 기재된 바와 같이 교정 게놈을 포함하며, 상기 패키징 시스템은 상기 캡시드 내에 상기 교정 게놈을 봉입하기 위한 세포 내에서 작용하여 상기 AAV를 형성하는 것인, 패키징 시스템. - 제115항에 있어서, 상기 패키징 시스템은 상기 Rep 뉴클레오티드 서열 및 상기 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 교정 게놈을 포함하는 제2 벡터를 포함하는 패키징 시스템.
- 제115항 또는 제116항에 있어서, 상기 Rep 뉴클레오티드 서열은AAV2 Rep 단백질을 인코딩하는 패키징 시스템.
- 제117항에 있어서, 상기 AAV2 Rep 단백질은 78/68 또는 Rep 68/52인 패키징 시스템.
- 제117항 또는 제118항에 있어서, 상기 AAV2 Rep 단백질은 서열 번호: 22의 AAV2 Rep 아미노산 서열과 최소 퍼센트 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 최소 퍼센트 서열 동일성은 상기 AAV2 Rep 단백질을 인코딩하는 아미노산 서열의 길이에 걸쳐 적어도 70%인 패키징 시스템.
- 제115항 내지 제119항 중 어느 한 항에 있어서, 제3 벡터를 더 포함하며, 상기 제3 벡터는 헬퍼 바이러스 벡터인 패키징 시스템.
- 제120항에 있어서, 상기 헬퍼 바이러스 벡터는 독립적 제3 벡터인 패키징 시스템.
- 제120항에 있어서, 상기 헬퍼 바이러스 벡터는 상기 제1 벡터와 통합되는 패키징 시스템.
- 제120항에 있어서, 상기 헬퍼 바이러스 벡터는 상기 제2 벡터와 통합되는 패키징 시스템.
- 제120항 내지 제123항 중 어느 한 항에 있어서, 상기 제3 벡터는 헬퍼 바이러스 단백질을 인코딩하는 유전자를 포함하는 패키징 시스템.
- 제120항 내지 제124항 중 어느 한 항에 있어서, 상기 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스, 백시니아 바이러스, 및 거대세포바이러스(CMV: cytomegalovirus)로 이루어진 군으로부터 선택되는 패키징 시스템.
- 제125항에 있어서, 상기 헬퍼 바이러스는 아데노바이러스인 패키징 시스템.
- 제126항에 있어서, 상기 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함하는 패키징 시스템.
- 제125항에 있어서, 상기 헬퍼 바이러스는 헤르페스 단순 바이러스(HSV: herpes simplex virus)인 패키징 시스템.
- 제128항에 있어서, 상기 HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함하는 패키징 시스템.
- 제120항 내지 제129항 중 어느 한 항에 있어서, 상기 제1 벡터 및 상기 제3 벡터는 제1 형질감염 플라스미드 내에 함유되는 패키징 시스템.
- 제120항 내지 제129항 중 어느 한 항에 있어서, 상기 제2 벡터 및 상기 제3 벡터의 뉴클레오티드는 제2 형질감염 플라스미드 내에 함유되는 패키징 시스템.
- 제120항 내지 제129항 중 어느 한 항에 있어서, 상기 제1 벡터 및 상기 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스로 클로닝되는 패키징 시스템.
- 제120항 내지 제129항 중 어느 한 항에 있어서, 상기 제2 벡터 및 상기 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스로 클로닝되는 패키징 시스템.
- AAV의 재조합 제조방법으로서, 상기 방법은 본원에 제115항 내지 제133항 중 어느 한 항의 패키징 시스템을 캡시드 내에 교정 게놈을 봉입하기 위해 작용하는 조건 하에서 세포 내로 도입하여 상기 AAV를 형성하는 단계를 포함하는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762574163P | 2017-10-18 | 2017-10-18 | |
US62/574,163 | 2017-10-18 | ||
US201862621102P | 2018-01-24 | 2018-01-24 | |
US62/621,102 | 2018-01-24 | ||
PCT/US2018/056271 WO2019079437A1 (en) | 2017-10-18 | 2018-10-17 | ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR RESTORING THE FUNCTION OF THE HBB GENE AND METHODS OF USE |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200095462A true KR20200095462A (ko) | 2020-08-10 |
Family
ID=64332161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207012240A KR20200095462A (ko) | 2017-10-18 | 2018-10-17 | Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20190134118A1 (ko) |
EP (1) | EP3697450A1 (ko) |
JP (1) | JP2021500070A (ko) |
KR (1) | KR20200095462A (ko) |
CN (1) | CN111447954A (ko) |
AU (1) | AU2018352855B2 (ko) |
BR (1) | BR112020007765A2 (ko) |
CA (1) | CA3079437A1 (ko) |
IL (1) | IL273877A (ko) |
MX (1) | MX2020004092A (ko) |
SG (1) | SG11202002737PA (ko) |
WO (1) | WO2019079437A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109536494A (zh) * | 2017-10-31 | 2019-03-29 | 广东赤萌医疗科技有限公司 | 一种用于修复HBB1基因点突变的gRNA、基因编辑系统、表达载体和基因编辑试剂盒 |
CN116096904A (zh) * | 2019-12-31 | 2023-05-09 | 天鹅生物疗法有限公司 | 改进的aav-abcd1构建体和用于治疗或预防肾上腺脑白质营养不良(ald)和/或肾上腺脊髓神经病(amn)的用途 |
CN111363756B (zh) * | 2020-04-02 | 2023-01-17 | 中国医学科学院血液病医院(中国医学科学院血液学研究所) | 一种珠蛋白基因双表达慢病毒载体及其应用 |
AU2021252515A1 (en) * | 2020-04-06 | 2022-10-27 | Homology Medicines, Inc. | Adeno-associated virus compositions for IDS gene transfer and methods of use thereof |
CN117561331A (zh) * | 2021-04-12 | 2024-02-13 | 格拉菲特生物公司 | 用于产生经基因修饰的原代细胞的方法和组合物 |
EP4384191A1 (en) * | 2021-08-10 | 2024-06-19 | Gentibio, Inc. | Compositions and methods for engineering stable tregs |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5449759A (en) * | 1987-05-16 | 1995-09-12 | Somatogen, Inc. | Hemoglobins with intersubunit desulfide bonds |
US5252479A (en) * | 1991-11-08 | 1993-10-12 | Research Corporation Technologies, Inc. | Safe vector for gene therapy |
AU5070298A (en) * | 1996-12-05 | 1998-06-29 | Introgene B.V. | Genetic modification of primate hemopoietic repopulating stem cells |
US9725485B2 (en) * | 2012-05-15 | 2017-08-08 | University Of Florida Research Foundation, Inc. | AAV vectors with high transduction efficiency and uses thereof for gene therapy |
CN101348786B (zh) * | 2007-07-20 | 2011-05-11 | 谭孟群 | 一种人β珠蛋白基因及其重组腺相关病毒载体 |
WO2009013559A1 (en) * | 2007-07-23 | 2009-01-29 | Cellectis | Meganuclease variants cleaving a dna target sequence from the human hemoglobin beta gene and uses thereof |
US8628966B2 (en) | 2010-04-30 | 2014-01-14 | City Of Hope | CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer |
EP3981876A1 (en) * | 2014-03-26 | 2022-04-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
KR102526711B1 (ko) * | 2014-09-24 | 2023-04-27 | 시티 오브 호프 | 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법 |
US20180135074A1 (en) * | 2015-02-19 | 2018-05-17 | University Of Florida Research Foundation, Incorporated | Recombinant aav vectors for gene therapy of human hematopoietic disorders |
JP2019508037A (ja) * | 2016-02-16 | 2019-03-28 | イェール ユニバーシティーYale Universit | 標的化遺伝子編集を増強するための組成物およびその使用方法 |
-
2018
- 2018-10-17 JP JP2020542536A patent/JP2021500070A/ja active Pending
- 2018-10-17 KR KR1020207012240A patent/KR20200095462A/ko not_active Application Discontinuation
- 2018-10-17 CA CA3079437A patent/CA3079437A1/en active Pending
- 2018-10-17 BR BR112020007765-8A patent/BR112020007765A2/pt unknown
- 2018-10-17 US US16/163,061 patent/US20190134118A1/en active Pending
- 2018-10-17 AU AU2018352855A patent/AU2018352855B2/en active Active
- 2018-10-17 MX MX2020004092A patent/MX2020004092A/es unknown
- 2018-10-17 SG SG11202002737PA patent/SG11202002737PA/en unknown
- 2018-10-17 WO PCT/US2018/056271 patent/WO2019079437A1/en unknown
- 2018-10-17 CN CN201880079840.8A patent/CN111447954A/zh active Pending
- 2018-10-17 EP EP18804159.4A patent/EP3697450A1/en not_active Withdrawn
-
2020
- 2020-04-07 IL IL273877A patent/IL273877A/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA3079437A1 (en) | 2019-04-25 |
SG11202002737PA (en) | 2020-05-28 |
AU2018352855B2 (en) | 2022-07-14 |
US20190134118A1 (en) | 2019-05-09 |
AU2018352855A1 (en) | 2020-04-02 |
CN111447954A (zh) | 2020-07-24 |
EP3697450A1 (en) | 2020-08-26 |
JP2021500070A (ja) | 2021-01-07 |
WO2019079437A1 (en) | 2019-04-25 |
BR112020007765A2 (pt) | 2020-10-20 |
IL273877A (en) | 2020-05-31 |
MX2020004092A (es) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
KR20200095462A (ko) | Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
KR20230053735A (ko) | 게놈의 조정을 위한 개선된 방법 및 조성물 | |
KR20210030965A (ko) | 다논병을 치료하기 위한 유전자 요법 벡터 | |
KR20220038362A (ko) | 재조합 ad35 벡터 및 관련 유전자 요법 개선 | |
KR20210092755A (ko) | 신경원성 세로이드 리포푸신증에 대한 유전자 요법 | |
KR20210005889A (ko) | Cns 퇴행에 대한 유전자 요법 | |
CN111235158B (zh) | 用于表达重组人β-珠蛋白的病毒载体及其应用 | |
KR20220139924A (ko) | 큰 유전자 벡터 및 그의 전달 및 용도 | |
CN113508130A (zh) | 用于治疗达农病的基因治疗载体 | |
KR20210082193A (ko) | 소형화 디스트로핀 및 그의 용도 | |
CN111718420B (zh) | 一种用于基因治疗的融合蛋白及其应用 | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
KR20200127170A (ko) | Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
KR20230069157A (ko) | GJB2를 코딩하는 재조합 아데노 연관 바이러스 (rAAV) 및 그의 용도 | |
CN115768901A (zh) | 腺病毒的大负载整合 | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
US11891619B2 (en) | Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof | |
CN110904046A (zh) | Islr基因在制备治疗肥胖及改善胰岛素抵抗的药物中的应用 | |
RU2808459C2 (ru) | Геннотерапевтические векторы для лечения болезни данона | |
WO2020187272A1 (zh) | 一种用于基因治疗的融合蛋白及其应用 | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 | |
JP2024150588A (ja) | ダノン病治療用遺伝子療法ベクター | |
CN116997657A (zh) | 编码GJB2的重组腺相关病毒(rAAV)及其用途 | |
WO2024069144A1 (en) | Rna editing vector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |