KR20200014319A

KR20200014319A - 글리코겐 축적 질환 유형 iii에 대한 치료제

Info

Publication number: KR20200014319A
Application number: KR1020197036416A
Authority: KR
Inventors: 기요시 다치카와; 카를로스 구스타보 페레즈-가르시아; 파드마나브 치부쿨라; 하리 프라카시 바스카란; 크리스티안 더블유. 코보; 숀 크리스토퍼 도허티
Original assignee: 울트라제닉스 파마수티컬 인코포레이티드
Priority date: 2017-05-31
Filing date: 2018-05-31
Publication date: 2020-02-10
Also published as: TWI794237B; AU2018278315A1; JP7284101B2; WO2018222926A1; EP3630964A1; AU2018278315B2; US20220340886A1; CN110719954B; JP2020522244A; BR112019025224A2; AR112706A1; EP3630964A4; CO2019013332A2; CN110719954A; CA3063907A1; KR102636537B1; US20200149017A1; US11377643B2; JP2023075248A; MX2019014412A

Abstract

본 발명은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 다양한 번역가능 폴리뉴클레오타이드 및 올리고머 분자를 제공한다. 본 폴리뉴클레오타이드 및 올리고머 분자는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능하다. 본 분자는 세포 또는 대상체에서 활성 폴리펩타이드 또는 단백질을 발현하는 활성제로서 사용될 수 있다. 본 제제는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 병태를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 방법에 사용될 수 있다.

Description

글리코겐 축적 질환 유형 III에 대한 치료제

관련 출원에 대한 교차 참조

본원은 2017년 5월 31일 출원된 미국 가출원 일련 번호 62/513,350에 대한 우선권을 주장하며, 이것은 모든 목적을 위해 본 명세서에 전체적으로 참고로 포함된다.

기술분야

본 발명은 분자 생물학 및 유전학뿐만 아니라 번역가능 분자로부터 생성된 생물약제 및 치료제의 분야에 관한 것이다. 더 상세하게는, 본 발명은 생체내에서 및 치료제로서 사용하기 위해 활성 폴리펩타이드 또는 단백질로 번역되는 능력을 갖는 분자에 대한 방법, 구조 및 조성물에 관한 것이다.

전자적으로 제출된 텍스트 파일의 설명

이와 함께 전자적으로 제출된 텍스트 파일의 내용은 전체적으로 참고로 본 명세서에 포함된다: 서열목록의 컴퓨터 판독가능한 형식 카피 (파일명: ULPI_041_01WO_SeqList_ST25.txt, 기록된 날자: 2018년 5월 30일, 파일 크기: 226 킬로바이트).

글리코겐 축적 질환 유형 III (GSD III 또는 Cori 질환으로도 알려져 있음)은 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)로 알려진 글리코겐 탈분지화 효소의 결핍에 의해 야기된 글리코겐 대사의 드문 (발병률 1:100,000) 선천성 이상이다. 이 상염색체 열성 대사 장애는 가변성 간, 심장 근육, 및 골격 근육 관여를 특징으로 한다.

결핍된 효소, AGL의 조직 발현에서의 차이에 기초하여 4가지 아형 GSD III이 있다. GSD IIIa는 모든 GSD III의 약 85 %를 차지하며 간과 근육 둘 모두에서의 효소 결핍으로 유래되는 간과 근육 관여를 나타낸다. GSDIIIb는 대략 15%를 차지하고 일반적으로 단지 간에서의 효소 결핍으로 유래되는 간 관여만을 나타낸다. 한편, GSDIIIc 및 GSDIIId 둘 모두는 매우 빠르며, GSDIIIc는 글루코시다제 탈분지화 활성의 결핍으로 인한 것으로 여겨지고 GSDIIId는 전달효소 탈분지화 활성의 결핍으로 인한 것으로 여겨진다.

유아기 및 초기 소아기에서, 간 관여는 케토틱 저혈당증, 간비대, 고지혈증, 및 상승된 간 아미노전이효소로 나타난다. 청소년기 및 성인기에서, 간 질환은 덜 두드러진다. 비대성 심근병증은 일반적으로 소아기 동안 GSD IIIa를 갖는 이들의 대다수에서 발생한다. 그것의 임상적 유의성은 대부분에서의 무증상에서부터 중증 심장 기능이상, 울혈성 심장기능상실, 그리고 드물게는, 갑작스러운 사망에 이르기까지 다양하다. 약화로 명확한 골격 근병증은 소아기에는 일반적으로 분명하지 않지만, 느리게 진행되어, 전형적으로 성인에서 두드러진다.

영향받은 기관과 일치하여, 향상된 알라닌 아미노전이효소 (ALT), 아스파르테이트 아미노전이효소 (AST), 알칼리성 포스파타제 (ALP), 및/또는 크레아틴 포스포키나제 (CPK) 활성은 GSD III 환자의 혈청에서 빈번하게 존재한다.

전술한 바와 같이, GSD III은 AGL에서의 결핍에 의해 야기된다. 이 결핍은 일반적으로 GSD III에 시달리는 대상체에서 AGL 효소 활성의 부분적인 또는 전체적인 폐지를 초래하는 AGL 유전자의 선천적 돌연변이(들)에 기인한다. GSD III 환자에서의 AGL 단백질의 분자 분석이 여러 민족 집단에서 수행되었으며, 100가지 이상의 상이한 AGL 돌연변이가 기재되었다. Goldstein et al., 2010, Genet. Med. 12: 424-430 참조. 또한 Sentner et al., 2013, JIMD Rep. 7: 19-26 참조.

GSD III의 효과적인 치료는 현재로는 없다. 종종 야행성 위 점적액 공급 또는 옥수수전분 보충제의 사용을 통한 탄수화물이 높은 식사를 자주하여 저혈당증을 조절하려는 시도가 있었다. 한편, 근병증이 있는 환자는 낮 동안 단백질이 높은 식이에 더하여 밤새 장내 주입하는 것으로 치료받았다. 소수의 환자에서 증상의 일시적인 개선이 문헌에 기록되었지만 고단백 식이가 진행성 근병증을 예방하거나 치료한다는 것을 입증하는 장기적인 자료는 없다. Chen YT, Burchell A, Glycogen storage disease. In: Scriver CR, Beaudet AL, Sly WS, Valle D, The metabolic and molecular basis of inherited disease. New York: McGraw Hill, 1995: 935-65 참조. 진행성 근병증 및/또는 심근병증은 성인에서의 이환율의 주요 원인이며, 진행성 간경변증 및 간암종을 나타내는 환자가 보고되었다. 따라서, 이 질환의 근본 원인, 즉 AGL 효소 활성의 결핍을 해결할 수 있는 치료법에 대한 시급한 필요성이 있다.

현재까지, 효소 대체가 GSD III의 AGL과 같은 세포질에 결함있는 효소가 존재하는 질환에서 연구되지는 않았는데, 이는 아마도 외인성 효소를 세포질 안으로 원형질 막을 가로 질러 전달하는 효율적이고 특이적인 세포의 흡수 메커니즘의 결여때문일 것이다.

본 발명은 GSD III과 같은 AGL 결핍과 관련된 질환 또는 병태를 개선, 예방 또는 치료할 수 있는 활성 AGL을 제공하기 위해 세포질에서 번역되는 능력을 가진 분자, 구조 및 조성물을 제공함에 의해 상기 언급된 요구를 해결한다.

본 발명은 하나 이상의 활성 폴리펩타이드 및 단백질, 또는 이의 단편을 제공하기 위해 사용될 수 있는, 번역되는 능력을 가진 신규한 분자를 포함하는 조성물을 제공한다. 본 발명은 다양한 장애의 예방 또는 치료를 위한 신규한 분자를 포함하는 이들 조성물을 사용하는 방법을 추가로 제공한다. 더 구체적으로, 본 발명의 구현예는 활성 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 제공하는 번역가능 분자를 포함하는 조성물 및 GSD III의 치료를 위해 상기 조성물을 사용하는 방법을 제공한다.

본 발명의 번역가능 분자는 AGL 폴리펩타이드 또는 단백질을 생산하는 기능적 세포질 활성을 가질 수 있다. 펩타이드 및 단백질은 치료적 양식에 대해 활성일 수 있다.

본 발명의 번역가능 분자는, 특히 세포의 세포질에서 긴 반감기를 가질 수 있다. 번역가능 분자는 AGL 결핍과 연관된 질환 또는 병태를 개선, 예방 또는 치료하는 데 활성인 생성물을 제공하도록 발현가능할 수 있다.

본 개시내용은 AGL 폴리펩타이드 또는 단백질을 생산하는 번역가능 분자에 대한 다양한 구조를 제공한다. 일부 구현예에서, 번역가능 분자는 천연 mRNA에 비하여 증가된 번역 능력 및/또는 연장된 반감기를 가질 수 있다.

본 발명의 번역가능 분자는 의약, 및 활성 폴리펩타이드 및 단백질을 생산하고 전달하기 위한 방법 및 조성물에 사용될 수 있다. 본 발명의 번역가능 분자는 시험관내, 생체외, 또는 생체내에서 폴리펩타이드 또는 단백질을 제공하기 위해 사용될 수 있다.

본 개시내용의 구현예는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 다양한 신규한 폴리뉴클레오타이드를 제공한다. 본 폴리뉴클레오타이드는 천연 뉴클레오타이드 및 화학적으로 변형된 뉴클레오타이드를 포함할 수 있다. 본 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능할 수 있다.

추가 양태에서, 본 발명은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 하나 이상의 비잠금 핵산 (UNA) 단량체를 포함하는 다양한 신규한 번역가능한 올리고머를 제공한다. 번역가능한 올리고머는 천연 뉴클레오타이드 및 화학적으로 변형된 뉴클레오타이드와 함께 하나 이상의 UNA 단량체를 함유할 수 있다. 하나 이상의 UNA 단량체를 포함하는 번역가능한 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 제공하도록 발현가능할 수 있다.

특정 양태에서, 본 발명의 번역가능 분자는 폴리펩타이드 또는 단백질, 또는 이의 단편의 고-효율 발현을 제공할 수 있다. 발현은 시험관내, 생체외, 또는 생체내에서 될 수 있다.

일부 구현예에서, 본 발명의 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연, 성숙한 mRNA에 비하여 증가된 세포질 반감기를 가질 수 있다. 본 발명의 분자 및 조성물은 천연, 성숙한 mRNA에 관하여 증가된 기능 세포 활성을 제공할 수 있다.

추가 양태에서, 본 발명의 번역가능 분자는 천연, 성숙한 mRNA와 비교되는 것과 같은, 펩타이드 또는 단백질 생성물을 제공하는 약물 제제로서 증가된 활성을 제공할 수 있다. 본 발명의 번역가능 분자는 유효한 요법에 필요한 용량 수준을 감소시킬 수 있다.

본 발명의 구현예는 하기를 포함한다.

도 1은 본 발명의 번역가능 분자를 사용하여 시험관내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 1은 참조 분자534에 대해 정규화된 AML12 및 C2C12 세포에서 AGL의 상대적인 발현을 도시한다. 수직축은 참조에 대한 배수-증가를 반영하며, 예를 들어, 10은 참조보다 10-배수 증가이다. 참조 분자를 포함하는 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 N^l-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 N^l-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 2개의 세포주 (AML12, C2C12)로 형질감염되었다. 세포는 용해되고 형질감염 후 6시간에서 수확되었다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 2는 본 발명의 번역가능 분자를 사용하여 시험관내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 2는 참조 분자534에 대해 정규화된 AML12 및 C2C12 세포에서 AGL의 상대적인 발현을 도시한다. 수직축은 참조에 대한 배수-증가를 반영하며, 예를 들어, 10은 참조보다 10-배수 증가이다. 참조 분자를 포함하는 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 N^l-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 N^l-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 2개의 세포주 (AML12, C2C12)로 형질감염되었다. 세포는 용해되고 형질감염 후 24시간에서 수확되었다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 3은 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 3은 24시간 및 48시간 시점에서 번역가능 분자528 및 534 (참조)에 대한 WT 마우스에서 AGL의 상대적인 발현을 도시한다. 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 N^l-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 N^l-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 지질 나노입자 형성으로 제조되었고 10 mg/kg으로 WT 마우스 안으로 정맥내로 주입되었다. 마우스 간은 24시간 및 48시간에서 수확되었고, 그리고 AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 4는 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 4는 기준선 PBS (100)와 비교하여, 번역가능 분자 525, 527, 528, 529 및 546의 복용 후 WT 마우스에서 AGL의 상대적인 간 발현을 도시한다. AGL을 인코딩하는 합성된 번역가능 분자 525, 527, 528, 529 및 546은 지질 나노입자 형성으로 제조되었고 WT 마우스에 IP를 통해 주입되었다. 주입된 용량은 10 mpk이고, 추가 분석을 위해 6시간에 간을 수집하였다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 5는 3개의 번역가능 분자: 546, 1783 및 1784로부터 인간 AGL을 발현한 결과를 도시한다. 인간 1차 간세포는 코돈-최적화된 mRNA로 형질감염되었고, AGL 단백질 발현은 형질 감염 후 6, 24, 48 및 72시간에서 In-Cell Western^TM에 의해 측정되었다. mRNA 서열의 발현을 미처리된 대조군 ("unt")과 비교되었다.
도 6은 야생형 C57BL/6 마우스에서 지질 나노입자로 제형화된 다양한 mRNA 분자로부터 인간 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 mRNA 분자로부터 발현된 외인성 인간 AGL의 단백질 농도 (ng/mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N¹-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 7은 지질 나노입자로 제형화된 다양한 mRNA 분자로 처리된 야생형 C57BL/6 마우스에서 내인성 마우스 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 발현된 내인성 마우스 AGL의 단백질 농도 (ng / mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N¹-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 8은 비히클 ("VEH")로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. 비히클로 처리된 간세포 내에서 간세포의 현저한 내지 심각한 공포형성과 글리코겐 축적에서의 중간 내지 현저한 증가가 관찰되었다.
도 9는 ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. ATX2 지질 나노 입자로 제형화된 번역가능 분자 546으로 처리된 간세포 내에서 단지 간세포의 온화한 내지 중간정도의 공포형성과 간세포 내에서 글리코겐 축적에서의 단지 온화한 내지 중간정도의 증가가 관찰되었다.

본 발명은 치료적 적용에 사용되는 다양한 신규한 제제 및 조성물을 제공한다. 본 발명의 분자 및 조성물은 대상체에서 GSD III 및/또는 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 존재 또는 기능에 연관된 질환을 개선, 예방 또는 치료하는 데 사용될 수 있다.

일부 구현예에서, 본 발명은 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소를 발현하는 합성, 정제된, 번역가능 폴리뉴클레오타이드 분자를 포괄한다. 본 분자는 천연 및 화학적으로 변형된 뉴클레오타이드를 함유할 수 있고, AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 인코딩한다.

특정 구현예에서, 본 개시내용은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 하나 이상의 UNA 단량체를 포함하는 합성, 정제된, 번역가능한 올리고머 분자를 포함한다. 번역가능한 올리고머는 하나 이상의 UNA 단량체뿐만 아니라 천연 및 화학적으로-변형된 뉴클레오타이드를 함유할 수 있다. 하나 이상의 UNA 단량체를 포함하는 번역가능한 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 제공하도록 발현가능할 수 있다.

본 명세서에서 사용된 바와 같이, 용어 "번역가능한"은 용어 "발현가능한"과 교환가능하게 사용될 수 있고, 숙주세포에 의해 폴리뉴클레오타이드, 또는 이들의 부분이 폴리펩타이드로 전환되도록 하는 능력을 지칭한다. 당업계에서 이해되는 바와 같이, 번역은 세포의 세포질 내 리보솜이 폴리펩타이드를 생성하는 과정이다. 번역에서, 메신저 RNA (mRNA)는 특이적 아미노산 사슬, 또는 폴리펩타이드를 생성하기 위해 리보솜 복합체에서 tRNA에 의해 디코딩된다. 게다가, 올리고머와 관련하여 본 명세서에서 사용될 때 용어 "번역가능"은 올리고머의 적어도 일부분, 예를 들어, 올리고머 서열의 코딩 영역 (코딩 서열 또는 CDS로도 알려져 있음)이 단백질 또는 이의 단편으로 전환될 수 있다는 것을 의미한다.

본 명세서에서 사용된 바와 같이, 용어 "단량체"는 올리고머를 형성하도록 동일 또는 상이한 유형의 또 다른 분자와 연결될 수 있는 단일 단위, 예를 들어, 단일 핵산을 지칭한다. 일부 구현예에서, 단량체는 비잠금 핵산, 즉, UNA 단량체일 수 있다.

한편, 용어 "올리고머"는 "폴리뉴클레오타이드"와 교환가능하게 사용될 수 있고 적어도 2개의 단량체를 포함하는 분자를 지칭하고 올리고뉴클레오타이드 예컨대 DNA 및 RNA를 포함한다. RNA 단량체 및/또는 비잠금 핵산 (UNA) 단량체를 함유하는 올리고머의 경우, 본 발명의 올리고머는 코딩 서열 (CDS)에 부가하여 서열을 함유할 수 있다. 이들 추가의 서열은 미번역된 서열, 즉, 숙주세포에 의해 단백질로 전환되지 않은 서열일 수 있다. 이들 미번역된 서열은 5' cap, 5' 미번역된 영역 (5' UTR), 3' 미번역된 영역 (3' UTR), 및 꼬리 영역, 예를 들어, polyA 꼬리 영역을 포함할 수 있다. 본 명세서에서 더욱 상세하게 기재된 바와 같이, 임의의 이들 미번역된 서열은 하나 이상의 UNA 단량체를 함유할 수 있고 - 이들 UNA 단량체는 숙주세포의 기계장치에 의해 번역될 수 없다. 본 발명의 맥락에서, "번역가능한 올리고머", "번역가능 분자", "번역가능 폴리뉴클레오타이드", 또는 "번역가능 화합물"은 단백질 또는 이의 단편, 예를 들어, 인간 AGL 단백질 또는 이의 단편으로 전환될 수 있는 RNA의 영역, 예를 들어, 코딩 영역을 포함하는 서열 (예를 들어, 인간 AGL의 코딩 서열 또는 이들의 코돈-최적화된 버전)을 지칭한다.

본 명세서에서 사용된 바와 같이, 용어 "코돈-최적화된"은 단백질 발현 수준을 증가시키는 인코딩된 단백질 아미노산 서열을 변형함이 없이 상이한 코돈을 선택함에 의해 재설계된 천연 (또는 목적을 가지고 설계된 천연의 변이체) 코딩 서열을 의미한다 (Gustafsson et al., Codon bias and heterologous protein expression. 2004, Trends Biotechnol 22: 346-53). 변수 예컨대 높은 코돈 적응 지수 (CAI), LowU 방법, mRNA 이차 구조, 시스-조절 서열, GC 함량 및 많은 다른 유사한 변수가 단백질 발현 수준과 어느 정도 상호관련한다는 것이 밝혀졌다 (Villalobos et al., Gene Designer: a synthetic biology tool for constructing artificial DNA segments. 2006, BMC Bioinformatics 7:285). 높은 CAI (코돈 적응 지수) 방법은 전체 단백질 코딩 서열에 대해 가장 빈번하게 사용된 동의어 코돈을 선정한다. 각각의 아미노산에 대해 가장 빈번하게 사용된 코돈은 인간 게놈으로부터 74218 단백질-코딩 유전자로부터 추론된다. LowU 방법은 보다 적은 U 모이어티를 갖는 동의어 코돈으로 대체될 수 있는 U-함유 코돈만을 표적으로 한다. 대체에 대한 선택이 거의 없는 경우, 더 자주 사용된 코돈이 선택될 수 있다. 서열에서 나머지 코돈은 LowU 방법에 의해 변화되지 않는다. 이 방법은 5-메톡시우리딘으로 합성되어지는 코딩 서열을 디자인하기 위해 개시된 mRNA와 공조하여 사용될 수 있다.

본 개시내용으로 숙지된 숙련가에 의해 인정되는 바와 같이, 본 발명의 번역가능 분자는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재, 및/또는 기능으로부터 유래됨)과 연관된 임의의 질환 또는 장애를 개선시키고, 예방하고, 또는 치료하기 위해 사용될 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자는 GSD IIIa, GSD IIIb, GSDIIIc, 및 GSDIIId (집합적으로 또는 개별적으로 본 명세서에서 일명 "GSD III" 또는 "글리코겐 축적 질환 유형 III") 중 하나 이상을 개선시키고, 예방하고, 또는 치료하기 위한 방법에 사용될 수 있다. 본원에서 치료되는 질환 또는 장애 (예를 들어, GSD IIIa, GSD IIIb, GSDIIIc, 또는 GSDIIId)는 낮은 혈당 (저혈당증), 간의 확장 (간비대), 혈액에서 과도한 지방의 양 (고지혈증), 간 효소의 상승된 혈중 농도, 만성 간 질환 (간경변), 간부전, 느린 성장, 단간, 양성 종양 (샘종), 비대성 심근병증, 심장 기능이상, 울혈성 심장기능상실, 골격 근병증, 및/또는 불량한 근육 톤 (긴장저하)과 연관될 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자는 이들 상기 언급된 증상 중 어느 하나 또는 전부를 개선시키고, 예방하고, 또는 치료하기 위해 사용될 수 있다.

숙련가에 의해 이해되는 바와 같이, GSD III은 비제한적으로, AGL 결핍, 코리 질환, 코리병, 탈분포자 결핍, 포브스 질환, 글리코겐 탈분포자 결핍, GSD3, 또는 한계 덱스트린증 (사이토졸에서 한계 덱스트린-유사 구조에 기인함)을 포함하여, 당업계에서 임의의 수의 대체 명칭으로 언급될 수 있다. 따라서, GSD III은 명세서, 실시예, 도면 및 청구범위에서 이들 대체 명칭 중 임의의 것과 상호교환적으로 사용될 수 있다.

기능적 AGL 모이어티를 인코딩하는 본 발명의 번역가능 분자는 이를 필요로 하는 환자 (예를 들어, GSD III 환자)의 간, 특히 간세포로 전달될 수 있고, 환자의 활성 AGL 수준을 상승시킬 수 있다. 번역가능 분자는 환자에서 GSD III의 임의의 증상을 예방, 치료, 개선 또는 역전시키기 위해 사용될 수 있다.

추가 양태에서, 본 발명의 번역가능 분자는 또한 질환을 제어하기 위한 특정 식이에 대한 GSD III 환자의 의존성을 감소시키기 위해 사용될 수 있다. 예를 들어, 본 발명의 번역가능 분자는 단백질이 비정상적으로 높은 빈번한 탄수화물 식사 및/또는 식이에 대한 GSD III 환자의 의존성을 감소시키기 위해 사용될 수 있다.

본 발명의 구현예는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현하는 번역가능 분자를 제조하는 방법을 추가로 포함한다. 상기 방법은 천연 및 화학적으로-변형된 뉴클레오사이드 삼인산의 존재 하에 AGL DNA 주형을 시험관내에서 전사하여 생성물 혼합물을 형성하고, 생성물 혼합물을 정제하여 번역가능 분자를 단리하는 것을 포함한다. 번역가능 분자는 또한 당해 기술에 공지되어 있는 바와 같은 방법에 의해 제조될 수 있다.

본 발명의 분자는 RNA 및/또는 UNA 단량체를 함유하는 번역가능 분자일 수 있다. 이들 번역가능 분자는 특히 세포질에서 긴 반감기를 가질 수 있다. 장기간 번역가능 분자는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 질환 또는 장애를 개선, 예방 또는 치료하는 데 사용될 수 있다.

본 발명의 번역가능 분자의 특성은 그것의 분자 구조에 따라 발생하고, 전체적으로 분자의 구조는, 이들 특성에 기초한 상당한 이점을 전체적으로 제공할 수 있다. 본 발명의 구현예는 유익하게는 향상된 단백질 농도 또는 증가된 단백질 활성을 제공하는 하나 이상의 특성을 갖는 번역가능 분자를 제공할 수 있다. 본 발명의 분자 및 조성물은 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 임의의 질환 또는 장애를 개선, 예방 또는 치료하는 치료제를 포함하는 제형을 제공할 수 있다.

본 발명은 시험관내, 생체외, 및 생체내에서 활성 폴리펩타이드 또는 단백질을 제공하기 위해 놀랍게도 번역가능한 다양한 번역가능 분자를 제공한다.

본 발명의 번역가능 분자는 하나 이상의 활성 폴리펩타이드 또는 단백질, 또는 이의 단편을 제공하도록 발현가능하다.

번역가능 구조 및 조성물은 증가된 번역 활성 또는 세포질 반감기를 가질 수 있다. 이들 구현예에서, 번역가능 구조 및 조성물은 천연 mRNA와 비교할 때 포유동물 세포의 세포질에서 증가된 기능적 반감기를 제공할 수 있다.

본 명세서에서 사용된 바와 같이, 용어 "반감기"는 핵산 또는 단백질 농도 또는 활성과 같은 양이 기간의 시작에서 측정될 때의 그 값의 절반으로 떨어지기 위해 필요한 시간이다.

하나 이상의 UNA 단량체를 함유하는 올리고머를 포함하여, 본 발명의 번역가능 분자에 대한 다양한 구조가 본 명세서에 제공되어 있다. 하나 이상의 UNA 단량체를 함유하는 올리고머는 특화된 링커 그룹을 포함할 수 있다. 링커 그룹은 번역가능 분자에서의 사슬에 부착될 수 있다. 각각의 링커 그룹은 또한 핵염기에 부착될 수 있다.

일부 양태에서, 링커 그룹은 단량체일 수 있다. 단량체는 사슬 분자를 형성하도록 부착될 수 있다. 본 발명의 사슬 분자에서, 링커 그룹 단량체는 사슬 내 임의의 지점에 부착될 수 있다.

특정 양태에서, 링커 그룹 단량체는 링커 그룹 단량체가 사슬의 단부 근처 또는 사슬 내 임의의 위치에 있도록 본 발명의 사슬 분자 내에 부착될 수 있다.

추가 양태에서, 사슬 분자의 링커 그룹 각각은 핵염기에 부착될 수 있다. 사슬 분자 내 핵염기의 존재는 사슬 분자 내 핵염기의 서열을 제공할 수 있다.

특정 구현예에서, 본 발명은 특정 천연 뉴클레오타이드, 또는 비-천연 뉴클레오타이드, 또는 변형된 뉴클레오타이드, 또는 화학적으로 변형된 뉴클레오타이드와 함께, 링커 그룹 단량체의 신규한 조합을 포함하는 사슬 구조를 갖는 번역가능한 올리고머 분자를 제공한다.

본 발명의 올리고머 분자는 핵염기의 서열을 나타낼 수 있고, 시험관내, 생체외, 또는 생체내에서 폴리펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 발현된 폴리펩타이드 또는 단백질은 천연, 천연 또는 야생형 mRNA로부터 발현된 단백질에 상응하는 활성, 또는 음성 또는 우세한 음성 단백질에 상응하는 활성을 포함하여, 다양한 형태의 활성을 가질 수 있다.

일부 양태에서, 본 발명은 적어도 세포의 천연 핵산 분자의 단편과 동일한 염기 서열을 갖는, 활성인 번역가능한 올리고머 분자를 제공할 수 있다.

일부 구현예에서, 세포는 진핵 세포, 포유동물 세포, 또는 인간 세포일 수 있다.

본 발명은 링커 그룹 단량체를 포함하는 번역가능한 올리고머성 제제에 대한 구조, 방법 및 조성물을 제공한다. 본 발명의 올리고머성 분자는 치료제용 제형에서 활성제로서 사용될 수 있다.

본 발명은 대상체 내 세포에서 폴리펩타이드 또는 단백질로 발현되는 그것의 능력때문에 치료적 효과를 제공하는 데 유용한 다양한 번역가능 분자를 제공한다.

특정 구현예에서, 번역가능 분자는 단량체를 포함한 올리고머로 구조화될 수 있다. 본 발명의 올리고머성 구조는 특정 뉴클레오타이드와 함께 하나 이상의 링커 그룹 단량체를 함유할 수 있다.

특정 구현예에서, 번역가능 분자는 핵염기의 서열을 함유할 수 있고, 부분적으로, 천연 폴리뉴클레오타이드 서열과 충분한 상동성을 가짐에 의해, 임의의 동형체의 펩타이드 또는 단백질을 발현하도록 설계될 수 있다.

일부 구현예에서, 번역가능 분자는 길이가 약 200 내지 약 12,000 단량체, 또는 그 초과일 수 있다. 특정 구현예에서, 번역가능 분자는 길이가 1,000 내지 9,000 단량체, 3,000 내지 7,000 단량체, 또는 4,000 내지 6,000 단량체일 수 있다. 예시적인 구현예에서, 번역가능 분자는 길이가 4,500 내지 5,500 단량체이다. 추가 예시적인 구현예에서, 번역가능 분자는 길이가 약 5,000 단량체이다.

일부 구현예에서, 번역가능 분자는 1 내지 약 800 UNA 단량체를 함유할 수 있다. 특정 구현예에서, 번역가능 분자는 1 내지 600 UNA 단량체, 또는 1 내지 100 UNA 단량체, 또는 1 내지 12 UNA 단량체를 함유할 수 있다.

일부 구현예에서, 번역가능 분자는 1 내지 약 800 잠금 핵산 (LNA) 단량체를 함유할 수 있다. 특정 구현예에서, 번역가능 분자는 1 내지 600 LNA 단량체, 또는 1 내지 100 LNA 단량체, 또는 1 내지 12 LNA 단량체를 함유할 수 있다.

본 발명의 번역가능 분자는 5' cap, 단량체의 5' 미번역된 영역, 단량체의 코딩 영역, 단량체의 3' 미번역된 영역, 및 단량체의 꼬리 영역을 포함할 수 있다.

본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 포함하는 단량체의 3' 미번역된 영역을 포함할 수 있다.

본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 포함하는 단량체의 꼬리 영역을 포함할 수 있다.

본 발명의 번역가능 분자는 세포에서 번역을 위해 동작가능하거나, 또는, 예를 들어, 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 polyA 꼬리를 포함하여 mRNA의 영역의 기능성을 갖는 서열 또는 구조의 영역을 포함할 수 있다.

본 발명은 세포에 하나 이상의 번역가능 분자를 포함하는 하나 이상의 벡터를 전달하는 방법을 추가로 고려한다. 추가 구현예에서, 본 발명은 또한 세포에 전달하거나 또는 하나 이상의 번역가능 분자를 고려한다.

일부 구현예에서, 하나 이상의 번역가능 분자는 시험관내, 생체외, 또는 생체내에서 세포에 전달될 수 있다. 포유동물 세포에 번역가능 분자를 도입하기 위해 당해 기술에 공지되어 있는 바와 같은 바이러스 및 비-바이러스 전달 방법이 사용될 수 있다. 번역가능 분자는 약제학적으로 허용가능한 비히클, 또는 예를 들어, 나노입자 또는 리포좀으로 전달될 수 있다.

일부 구현예에서, 본 발명의 번역가능 구조 및 조성물은 천연 조성물을 이용하는 것에 비교할 때 배양에서 세포-운명 조작에 필요한 형질감염의 횟수 및 빈도를 감소시킬 수 있다.

추가 양태에서, 본 발명은 천연 mRNA를 이용하는 것과 비교할 때 활성제로서 번역가능 분자에 대한 증가된 활성을 제공한다.

일부 양태에서, 본 발명은 천연 핵산, 폴리펩타이드 또는 단백질에 의해 유도된 것과 비교하여 세포의 선천성 면역 반응을 감소시킬 수 있는 번역가능 분자를 제공할 수 있다.

본 발명은 천연 분자에 비교하여 탈아데닐화에 대해 불응성인 합성 번역가능 분자를 제공할 수 있다.

특정 구현예에서, 본 발명은 천연 분자에 비교하여 증가된 특이 활성 및 더 긴 기능적 반감기를 갖는 합성 번역가능 분자를 제공할 수 있다. 본 발명의 합성 번역가능 분자는 이소성 단백질 발현의 증가된 수준을 제공할 수 있다. 벡터를 사용하여 번역가능 분자를 발현할 때, 세포-전달은 증가된 수준일 수 있고, 세포 독성 선천성 면역 반응이 억제되어 더 높은 수준의 이소성 단백질 발현이 달성될 수 있도록 변형될 수 있다. 본 발명의 번역가능 분자는 천연 mRNA보다 증가된 특이적 활성 및 더 긴 기능적 반감기를 가질 수 있다.

특정 양태에서, 번역가능 분자는 천연 mRNA에 비하여 수많은 돌연변이를 가질 수 있다.

추가 구현예에서, 본 발명은 절단가능 전달 및 3' 말단 및/또는 5' 말단에 부착된 표적화 모이어티를 갖는 번역가능 분자를 제공할 수 있다.

일반적으로, 형질감염에 의해 전달된 합성 번역가능 분자에 대한 특이 활성은 단위 시간당 전달된 전사체당 발현된 단백질 분자의 수로 관찰될 수 있다.

본 명세서에서 사용된 바와 같이, 번역 효율은 시험관내 또는 생체내에서 번역가능 분자의 번역에 의한 단백질 또는 폴리펩타이드의 생산의 척도를 지칭한다.

본 발명은 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유할 수 있는 다양한 번역가능한 올리고머 분자를 제공하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.

일부 구현예에서, 본 발명은 하나 이상의 미번역된 영역에 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유할 수 있는 다양한 번역가능한 올리고머 분자를 포함하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.

일부 구현예에서, 본 발명은 꼬리 영역에 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유하는 다양한 번역가능한 올리고머 분자를 포함하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.

일부 구현예에서, 번역가능 분자는 변형된 5' cap을 함유할 수 있다.

추가 구현예에서, 번역가능 분자는 단량체의 번역 향상시키는 5' 미번역된 영역을 함유할 수 있다.

추가 구현예에서, 번역가능 분자는 단량체의 번역 향상시키는 3' 미번역된 영역을 함유할 수 있다.

추가 구현예에서, 번역가능 분자는 단량체의3' 미번역된 영역에 하나 이상의 UNA 단량체를 함유할 수 있다.

추가 구현예에서, 번역가능 분자는 단량체의 꼬리 영역에 하나 이상의 UNA 단량체를 함유할 수 있다.

추가 구현예에서, 번역가능 분자는 polyA 꼬리에 하나 이상의 UNA 단량체를 함유할 수 있다.

일부 구현예에서, 번역가능 분자는 단량체의 3' 미번역된 영역에 또는 단량체의 꼬리 영역, 예를 들어, polyA 꼬리에 하나 이상의 LNA 단량체를 함유할 수 있다.

또 다른 양태에서, 본 발명의 번역가능 분자는 동일한 번역 생성물을 인코딩하는 천연 mRNA와 비교하여 생체내에서 적어도 2-배, 3-배, 5-배, 또는 10-배수 증가된 번역 효율을 나타낼 수 있다.

추가 양태에서, 번역가능 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연 mRNA와 비교하여 생체내에서 적어도 2-배, 3-배, 5-배, 또는 10-배수 증가된 폴리펩타이드 또는 단백질 수준을 생산할 수 있다.

특정 구현예에서, 번역가능 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연 mRNA와 비교하여 생체내에서 증가된 수준의 폴리펩타이드 또는 단백질을 제공할 수 있다. 예를 들어, 폴리펩타이드 또는 단백질의 수준은 10%, 또는 20%, 또는 30%, 또는 40%, 또는 50%, 또는 그 초과로 증가될 수 있다.

추가 구현예에서, 본 발명은 본 발명의 번역가능 분자를 함유하는 조성물을 대상체에게 투여함에 의해 대상체에서 질환 또는 병태를 치료하는 방법을 제공한다.

본 발명의 번역가능 분자는 질환 또는 장애, 예를 들어, 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 질환 또는 장애를 개선, 예방 또는 치료하는 데 사용될 수 있다. 이들 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물은 대상체에서 AGL 효소의 농도 또는 유효성을 제어, 조절 또는 증가시키기 위해 투여될 수 있다. 일부 양태에서, 효소는 환자가 비정상 양을 갖는 (예를 들어, AGL 활성을 부분적으로 또는 전적으로 폐기하는 AGL의 돌연변이된 버전을 갖는 환자) 비변형된, 천연 효소일 수 있다. 일부 양태에서, 효소는 AGL의 돌연변이된 버전을 갖는 환자를 치료하기 위해 사용될 수 있는 비변형된, 천연 AGL 효소일 수 있다. 예시적인 구현예에서, 본 발명의 번역가능 분자는 GSD III을 개선, 예방 또는 치료하는 데 사용될 수 있다.

일부 구현예에서, 번역가능 분자는 세포 또는 대상체에서 AGL 수준을 증가시키기 위해 세포 또는 대상체에 전달될 수 있고, 번역될 수 있다.

본 명세서에서 사용된 바와 같이, 용어 "대상체"는 인간 또는 임의의 비-인간 동물 (예를 들어, 마우스, 랫트, 토끼, 개, 고양이, 소, 돼지, 양, 말 또는 영장류)을 지칭한다. 인간은 전- 및 후-태생의 형태를 포함한다. 많은 구현예에서, 대상체는 인간이다. 대상체는 환자일 수 있으며, 이는 질환의 진단 또는 치료를 위해 의료 제공자에게 제시하는 인간을 지칭한다. 용어 "대상체"는 본 명세서에 "개체" 또는 "환자"와 상호 교환가능하게 사용된다. 대상체는 질환 또는 장애에 걸리거나 그에 걸리기 쉽지만 질환 또는 장애의 증상을 나타내거나 나타내지 않을 수 있다.

예시적인 구현예에서, 본 발명의 대상체는 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)을 갖는 대상체이다. 추가 예시적인 구현예에서, 상기 대상체는 인간이다.

일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료된 대상체에서 증가된 간 AGL 단백질 수준을 초래할 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서의 기준선 AGL 단백질 수준에 비하여 간 AGL 단백질 수준에서 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95% 증가율을 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서의 기준선 간 AGL 수준에 비하여 간 AGL 수준에서 증가를 초래한다. 일부 구현예에서, 간 AGL 수준에서의 증가는 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 100%, 200%, 또는 그 초과일 수 있다.

일부 구현예에서, 본 발명의 번역가능 분자로부터 발현되는 AGL 단백질은 간, 혈청, 혈장, 신장, 심장, 근육, 뇌, 뇌척수액, 또는 림프절에서 검출가능하다. 예시적인 구현예에서, AGL 단백질은 간 세포, 예를 들어, 치료된 대상체의 간세포에서 발현된다.

일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료된 대상체의 간에서 약 10 ng/mg, 약 20 ng/mg, 약 50 ng/mg, 약 100 ng/mg, 약 150 ng/mg, 약 200 ng/mg, 약 250 ng/mg, 약 300 ng/mg, 약 350 ng/mg, 약 400 ng/mg, 약 450 ng/mg, 약 500 ng/mg, 약 600 ng/mg, 약 700 ng/mg, 약 800 ng/mg, 약 900 ng/mg, 약 1000 ng/mg, 약 1200 ng/mg 또는 약 1500 ng/mg의 총 단백질 또는 그 이상으로 천연, 비-돌연변이된 인간 AGL (즉, 비정상 또는 돌연변이된 AGL과 대조적으로 정상 또는 야생형 AGL) 단백질 수준의 발현을 초래한다.

본 명세서에서 사용된 바와 같이, 하나 이상의 관심 있는 값에 적용될 때 용어 "약" 또는 "대략"은 언급된 기준값에 유사한 값을 지칭한다. 특정 구현예에서, 용어 "대략" 또는 "약"은 달리 언급되지 않는 한 또는 달리 문맥으로부터 분명하지 않는 한 언급된 기준값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 내로 어느 하나의 방향 (초과 또는 미만)으로 되는 다양한 값을 지칭한다(그러한 수가 가능한 값의 100%를 초과하는 경우 제외).

일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 6, 12, 18, 24, 30, 36, 48, 60, 및/또는 72 시간에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 1 일, 2 일, 3 일, 4 일, 5 일, 6 일, 및/또는 7 일에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 투여 후 1 주, 2 주, 3 주, 및/또는 4 주에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 검출가능하다.일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 간, 예를 들어, 간세포에서 검출가능하다.

번역가능 분자를 제조하기 위한 변이체 템플레이트

본 명세서에 기재된 다양한 구현예에서, 번역가능한 올리고머는 AGL을 인코딩하는 mRNA를 포함할 수 있고, 여기서 상기 AGL을 인코딩하는 mRNA는 코돈-최적화된다. 일부 구현예에서, AGL은 인간 AGL (즉, hAGL)이다. 일부 구현예에서, 인간 AGL은 서열번호 2의 아미노산 서열을 포함한다. 일부 구현예에서, 인간 AGL은 서열번호 2의 아미노산 서열로 구성된다.

일부 구현예에서, 변이체 DNA 템플레이트는 AGL을 인코딩할 수 있는 번역가능 분자를 제작하기 위해 이용될 수 있다. 본 개시내용의 변이체 DNA 템플레이트는 번역가능 분자를 제작하는 과정과 번역가능 분자의 효율에서 이점을 나타낼 수 있다. 본 발명의 번역가능 분자에 변형된 뉴클레오타이드 또는 단량체의 편입을 증진시키기 위해 템플레이트의 변동이 이용될 수 있다. 특정 양태에서, 번역가능 분자의 구조 특징을 증진시키기 위해 템플레이트의 변동이 이용될 수 있다. 번역가능 분자의 향상된 구조 특징은 폴리펩타이드 또는 단백질 생성물을 제공하기 위한 번역 효율을 포함하여, 예상외로 유리한 특성을 제공할 수 있다.

본 발명의 일부 양태에서, 템플레이트의 변동은 템플레이트 가닥에서 특정 뉴클레오타이드의 발생 또는 발현의 빈도를 감소시키는 것을 포함할 수 있다. 특정 뉴클레오타이드의 발생을 감소시키는 것은 AGL을 인코딩하는 번역가능 RNA 생성물의 놀랍게도 개선된 특성을 달성하는, 비-자연 형태를 제공하기 위해 본 개시내용의 구조 및 방법을 변경할 수 있다.

본 발명의 양태는 번역가능 분자를 제작하는 방법에서 변이체 DNA 템플레이트를 요할 수 있다. DNA 분자는 AGL을 인코딩하는 표적 번역가능 분자를 제공하기 위해 전사될 수 있는 뉴클레오타이드의 비-코딩 템플레이트 가닥을 가질 수 있다.

표적 번역가능 분자는 천연 또는 변형된, 합성이거나 또는 천연 공급원으로부터 유래되든 간에 임의의 RNA일 수 있다.

일부 구현예에서, 코돈 배정을 보전하면서 템플레이트 가닥의 열린 해독틀이 대안적인 형태로 전환된 변이체 DNA 템플레이트가 사용될 수 있다.

특정 구현예에서, 대안적인 뉴클레오타이드가 대안적인 코돈 최적화 및/또는 서열 축퇴에 기반하여 사용된 DNA 템플레이트가 사용될 수 있다.

추가 구현예에서, DNA 템플레이트는 코돈 배정을 보전하면서 대안적인 뉴클레오타이드로 대체된 특정 뉴클레오타이드를 가질 수 있다.

본 발명의 구현예는 유익하게는 AGL을 인코딩하는 번역가능 분자를 제작하는 방법에서 사용된 본 발명의 DNA 템플레이트에 대안적인 코돈을 이용한다. 본 발명의 DNA 템플레이트에서 달성될 수 있는 변동은 많은 과정에서 바람직한 코돈을 요할 수 있는, 세포 및 유기체에 대한 것보다 범위가 휠씬 더 클 수 있다. 본 발명에서, 광범위한 대안적인 코돈 및 위치가 번역가능 분자를 전사하기 위해 DNA 템플레이트에서 사용될 수 있다.

본 발명의 추가 양태에서, 템플레이트의 변동은 템플레이트 가닥에서 특정 뉴클레오타이드의 발생 또는 발현의 빈도를 감소시키는 것을 포함할 수 있다. 예를 들어, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 25% 아래의 수준으로 감소될 수 있다. 추가 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 20% 아래의 수준으로 감소될 수 있다. 일부 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 16% 아래의 수준으로 감소될 수 있다. 특정 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 12% 아래의 수준으로 감소될 수 있다.

인간 AGL

인간 AGL 유전자는 대략 174.8 kDa의 분자량을 갖는 1532 아미노산 단백질을 인코딩한다. AGL은 글리코겐 열화에서 1,4-알파-D-글루칸:1,4-알파-D-글루칸-4-알파-D-글리코실전달효소 및 아밀로-1,6-글루코시다제로 작용하는 다작용성 효소이다. 전술한 바와 같이, 정상 AGL 활성의 유전적 결핍은 글리코겐 축적 질환 III을 야기한다.

공통 인간 AGL 코딩 서열은 서열번호 1에 도시된 4,599 핵염기의 RNA 서열을 갖는다.

공통 인간 AGL 코딩 서열 ?? NCBI 수탁 번호 NP_000019.2에서 발견됨 ?? 은 서열번호 2로 번역된다.

일부 구현예에서, hAGL의 천연 mRNA와 비교하여 유익하게 상승된 번역의 효능을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (hAGL)를 발현하기 위해 번역가능 분자가 제작되고 사용될 수 있다. hAGL을 발현하는 번역가능 분자는 질환을 개선, 예방 또는 치료하는 방법에 사용하기에 적합한 활성을 나타낼 수 있다. 일부 구현예에서, 번역가능 분자는 하나 이상의 UNA 단량체를 포함할 수 있다.

일부 구현예에서, 번역가능 분자는 5' cap, 5' UTR, 번역 개시 서열, 예를 들어, 코작 서열, 인간 AGL CDS, 3'UTR, 및/또는 꼬리 영역을 포함할 수 있다. 예시적인 구현예에서, 번역가능 분자는 5' cap (m7GpppGm), 담배 식각 바이러스 (TEV)의 5' UTR, 코작 서열, 인간 AGL CDS, 제노푸스 베타-글로빈의 3' UTR, 및 꼬리 영역을 포함할 수 있다. 추가의 예시적인 구현예에서, 인간 AGL CDS는 아래에 더욱 상세하게 기재된 서열번호 7-32 또는 서열번호 41-45의 코돈-최적화된 서열을 포함할 수 있다. 본 명세서에 기재된 이들 및 다른 구현예 중 어느 하나에서, 번역가능 분자는 하나 이상의 UNA 단량체를 포함할 수 있다. 본 명세서에 기재된 이들 및 다른 구현예 중 어느 하나에서, 번역가능 분자는 하나 이상의 LNA 단량체를 포함할 수 있다.

분자의 번역 효율은 AGL의 천연 mRNA와 비교하여 증가될 수 있다. 특히, 48 시간 후, 분자의 번역 효율은 AGL의 천연 mRNA와 비교하여 2배 이상으로 될 수 있다.

일부 구현예에서, 본 발명에 대해 적합한 mRNA 서열은 인간 AGL 단백질을 인코딩하는 mRNA 서열을 포함한다. 자연 발생 인간 AGL 단백질의 서열은 서열번호 2에 도시되어 있다.

일부 구현예에서, 적합한 mRNA 서열은 인간 AGL의 동족체 또는 변이체를 인코딩하는 mRNA 서열일 수 있다. 본 명세서에서 사용된 바와 같이, 인간 AGL 단백질의 동족체 또는 변이체는 실질적인 AGL 단백질 활성을 보유하면서 야생형 또는 자연 발생 인간 AGL 단백질에 비교하여 하나 이상의 아미노산 치환, 결실, 및/또는 삽입을 함유하는 변형된 인간 AGL 단백질일 수 있다. 일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질에 실질적으로 동일한 단백질을 인코딩한다. 일부 구현예에서, 본 발명에 적합한 mRNA는 서열번호 2에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 아미노산 서열을 인코딩한다. 일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질의 단편 또는 부분을 인코딩한다.

일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질의 단편 또는 부분을 인코딩하고, 여기서 상기 단백질의 단편 또는 부분은 야생형 단백질의 것에 유사한 AGL 활성을 여전히 유지한다.

일부 구현예에서, 본 발명에 적합한 mRNA는 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 서열을 포함한다.

일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 코딩 서열을 포함한다. 일부 구현예에서, 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 코딩 서열을 포함하는 번역가능한 올리고머성 분자는 5' cap, 5' UTR, 번역 개시 서열, 3' UTR, 및 꼬리 영역으로부터 선택된 하나 이상의 서열을 더 포함한다.

일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현한다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현한다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일하다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도 95% 동일하다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 19, 서열번호 31, 또는 서열번호 45로부터 선택된 서열에 적어도 95% 동일하다. 따라서, 일부 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하거나 이로 구성된 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일하다. 예시적인 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하거나 이로 구성된 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 19, 서열번호 31, 또는 서열번호 45로부터 선택된 서열에 적어도 95% 동일하다. 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 19에 적어도 95% 동일하다. 또 다른 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 31에 적어도 95% 동일하다. 또 다른 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 45에 적어도 95% 동일하다.

일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 또 다른 서열에 융합된(예를 들어, N 또는 C 말단 융합) AGL 단백질의 전장, 단편 또는 일부분을 포함하는 융합 단백질을 인코딩한다. 일부 구현예에서, N 또는 C 말단 서열은 신호 서열 또는 세포 표적화 서열이다.

UNA 단량체 및 올리고머

일부 구현예에서, 링커 그룹 단량체는 아래에서 나타낸 바와 같이 프로판-1,2,3-tri-일-트리스옥시 구조에 기초한 작은 유기 분자인 잠기지 않은 핵단량체 (UNA 단량체)일 수 있다:

여기서 R¹ 및 R²는 H이고, 그리고 R¹ 및 R²는 포스포디에스테르 결합일 수 있고, 염기는 핵염기일 수 있고, 그리고 R³은 아래에 기재된 작용기이다.

또 다른 관점에서, UNA 단량체 주요 원자는 아래와 같이 IUPAC 표기법으로 도시될 수 있다:

여기서 올리고머 사슬의 진행 방향은 프로판 잔기의 1-말단으로부터 3-말단으로 된다.

핵염기의 예는 우라실, 티민, 시토신, 5-메틸시토신, 아데닌, 구아닌, 이노신, 및 천연 및 비-천연 핵염기 유사체를 포함한다.

핵염기의 예는 슈도우라실, 1-메틸슈도우라실 (m1Ψ), 즉, N¹-메틸슈도우라실, 및 5-메톡시우라실을 포함한다.

일반적으로, 뉴클레오타이드가 아닌 UNA 단량체는 올리고머에서 내부 링커 단량체일 수 있다. 올리고머에서 내부 UNA 단량체는 양면 상에서 다른 단량체에 의해 측접된다.

UNA 단량체는 올리고머가 예를 들어 복합체 또는 듀플렉스를 형성하고, 복합체 또는 듀플렉스에 핵염기를 갖는 다른 단량체가 있는 경우 염기 짝짓기에 참여할 수 있다.

R³이 -OH인, 프로판-1-일 위치 및 프로판-3-일 위치 둘 모두에서 측접된 내부 단량체와 같은 UNA 단량체의 예는 아래에 도시되어 있다.

UNA 단량체는 올리고머의 말단 단량체일 수 있고, 여기서 UNA 단량체는 프로판-1-일 위치 또는 프로판-3-일 위치 중 어느 하나에서 단 하나의 단량체에 부착된다. 뉴클레오타이드와 달리, UNA 단량체는 가요성 유기 구조이기 때문에, 말단 UNA 단량체는 올리고머에 대해 가요성 종결자일 수 있다.

프로판-3-일 위치에서 부착된 말단 단량체와 같은 UNA 단량체의 예는 아래에 도시되어 있다.

UNA 단량체는 가요성 분자일 수 있기 때문에, 말단 단량체와 같은 UNA 단량체는 매우 상이한 형태를 취할 수 있다. 프로판-3-일 위치에 부착된 말단 단량체와 같은 에너지 최소화된 UNA 단량체 형태의 예는 아래에 도시되어 있다.

다른 것들 중에서, UNA 단량체의 구조는 자연 발생 뉴클레오타이드에 부착되도록 한다.

UNA 올리고머는 UNA 단량체뿐만 아니라 자연 발생 뉴클레오사이드에 기초할 수 있는 다양한 뉴클레오타이드를 포함한 사슬일 수 있다.

일부 구현예에서, UNA 단량체의 작용기 R³은 -OR⁴, -SR⁴, -NR⁴ ₂, -NH(C=O)R⁴, 모폴리노, 모폴린-1-일, 피페라진-1-일, 또는 4-알카노일-피페라진-1-일일 수 있고, 여기서 R⁴는 각 경우에 대해 동일 또는 상이할 수 있고, 그리고 H, 알킬, 콜레스테롤, 지질 분자, 폴리아민, 아미노산, 또는 폴리펩타이드일 수 있다.

UNA 단량체는 유기 분자이다. UNA 단량체는 핵산 단량체 또는 뉴클레오타이드가 아니거나, 또는 이들은 자연 발생 뉴클레오사이드 또는 변형된 자연 발생 뉴클레오사이드가 아니다.

본 발명의 UNA 올리고머는 합성 사슬 분자이다.

일부 구현예에서, 상기에서 나타낸 바와 같이, UNA 단량체는 UNA-A (지정된

), UNA-U (지정된

), UNA-C (지정된

), 및 UNA-G (지정된

)일 수 있다.

본 명세서에 사용될 수 있는 지정은 mA, mG, mC, 및 mU를 포함하고, 이것은 2'-O-메틸 변형된 리보뉴클레오타이드를 지칭한다.

본 명세서에 사용될 수 있는 지정은 dT를 포함하고, 이것은 2'-데옥시 T 뉴클레오타이드를 지칭한다.

본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 N은 임의의 천연 뉴클레오타이드 단량체, 또는 임의의 변형된 뉴클레오타이드 단량체를 나타낼 수 있다.

본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 Q는 비-천연, 변형된, 또는 화학적으로-변형된 뉴클레오타이드 단량체를 나타낸다.

본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 X는 UNA 단량체를 나타내기 위해 사용될 수 있다.

변형된 및 화학적으로-변형된 뉴클레오타이드

본 명세서에서 변형된 또는 화학적으로-변형된 뉴클레오타이드의 예에 있어서, 알킬, 사이클로알킬, 또는 페닐 치환체는 비치환될 수 있거나, 또는 하나 이상의 알킬, 할로, 할로알킬, 아미노, 또는 니트로 치환체로 추가로 치환될 수 있다.

핵산 단량체의 예는 당업계에서 알려진 임의의 이러한 뉴클레오타이드를 포함하여, 비-천연, 변형된, 및 화학적으로-변형된 뉴클레오타이드를 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시시티딘, 5-알킬시티딘, 5-하이드록시알킬시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-알콕시시티딘, 5-알키닐시티딘, 5-할로시티딘, 2-티오시티딘, N⁴-알킬시티딘, N⁴-아미노시티딘, N⁴-아세틸시티딘, 및 N⁴,N⁴-디알킬시티딘을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 5-브로모시티딘, 5-아이오도시티딘, 2-티오시티딘; N⁴-메틸시티딘, N⁴-아미노시티딘, N⁴-아세틸시티딘, 및 N⁴,N⁴-디메틸시티딘을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시우리딘, 5-알킬우리딘, 5-하이드록시알킬우리딘, 5-카복시우리딘, 5-카복시알킬에스테르우리딘, 5-포르밀우리딘, 5-알콕시우리딘, 5-알키닐우리딘, 5-할로우리딘, 2-티오우리딘, 및 6-알킬우리딘을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시우리딘, 5-메틸우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-플루오로우리딘, 5-아이오도우리딘, 2-티오우리딘, 및 6-메틸우리딘을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-메톡시카보닐메틸-2-티오우리딘, 5-메틸아미노메틸-2-티오우리딘, 5-카바모일메틸우리딘, 5-카바모일메틸-2'-O-메틸우리딘, 1-메틸-3-(3-아미노-3-카복시프로피)슈도우리딘, 5-메틸아미노메틸-2-셀레노우리딘, 5-카복시메틸우리딘, 5-메틸디하이드로우리딘, 5-타우리노메틸우리딘, 5-타우리노메틸-2-티오우리딘, 5-(이소펜테닐아미노메틸)우리딘, 2'-O-메틸슈도우리딘, 2-티오-2'O-메틸우리딘, 및 3,2'-O-디메틸우리딘을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N⁶-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 8-아자아데노신, 7-데아자아데노신, 8-옥소아데노신, 8-브로모아데노신, 2-메틸티오-N⁶-메틸아데노신, N⁶-이소펜테닐아데노신, 2-메틸티오-N⁶-이소펜테닐아데노신, N⁶-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N⁶-(시스-하이드록시이소펜테닐)아데노신, N⁶-글라이시닐카바모일아데노신, N6-트레오닐카바모일-아데노신, N⁶-메틸-N⁶-트레오닐카바모일-아데노신, 2-메틸티오-N⁶-트레오닐카바모일-아데노신, N⁶,N⁶-디메틸아데노신, N6-하이드록시노르발릴카바모일아데노신, 2-메틸티오-N⁶-하이드록시노르발릴카바모일-아데노신, N⁶-아세틸-아데노신, 7-메틸-아데닌, 2-메틸티오-아데닌, 2-메톡시-아데닌, 알파-티오-아데노신, 2'-O-메틸-아데노신, N⁶,2'-O-디메틸-아데노신, N⁶,N⁶,2'-O-트리메틸-아데노신, 1,2'-O-디메틸-아데노신, 2'-O-리보실아데노신, 2-아미노-N⁶-메틸-퓨린, 1-티오-아데노신, 2'-F-ara-아데노신, 2'-F-아데노신, 2'-OH-ara-아데노신, 및 N⁶-(19-아미노-펜타옥사노나데실)-아데노신을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N¹-알킬구아노신, N²-알킬구아노신, 티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 8-브로모구아노신, O⁶-알킬구아노신, 크산토신, 이노신, 및 N¹-알킬이노신을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N¹-메틸구아노신, N²-메틸구아노신, 티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 8-브로모구아노신, O⁶-메틸구아노신, 크산토신, 이노신, 및 N^l-메틸이노신을 포함한다.

변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 슈도우리딘을 포함한다. 슈도우리딘의 예는 N^l-알킬슈도우리딘, N^l-사이클로알킬슈도우리딘, N¹-하이드록시슈도우리딘, N¹-하이드록시알킬슈도우리딘, N¹-페닐슈도우리딘, N¹-페닐알킬슈도우리딘, N¹-아미노알킬슈도우리딘, N³-알킬슈도우리딘, N⁶-알킬슈도우리딘, N⁶-알콕시슈도우리딘, N⁶-하이드록시슈도우리딘, N⁶-하이드록시알킬슈도우리딘, N⁶-모폴리노슈도우리딘, N⁶-페닐슈도우리딘, 및 N⁶-할로슈도우리딘을 포함한다. 슈도우리딘의 예는 N¹-알킬-N⁶-알킬슈도우리딘, N¹-알킬-N⁶-알콕시슈도우리딘, N¹-알킬-N⁶-하이드록시슈도우리딘, N¹-알킬-N⁶-하이드록시알킬슈도우리딘, N¹-알킬-N⁶-모폴리노슈도우리딘, N¹-알킬-N⁶-페닐슈도우리딘, 및 N¹-알킬-N⁶-halo슈도우리딘을 포함한다. 이들 예에서, 알킬, 사이클로알킬, 및 페닐 치환체는 비치환될 수 있거나, 또는 알킬, 할로, 할로알킬, 아미노, 또는 니트로 치환체로 추가로 치환될 수 있다.

슈도우리딘의 예는 N¹-메틸슈도우리딘, N¹-에틸슈도우리딘, N¹-프로필슈도우리딘, N¹-사이클로프로필슈도우리딘, N¹-페닐슈도우리딘, N¹-아미노메틸슈도우리딘, N³-메틸슈도우리딘, N¹-하이드록시슈도우리딘, 및 N¹-하이드록시메틸슈도우리딘을 포함한다.

핵산 단량체의 예는 당업계에서 알려진 임의의 그와 같은 뉴클레오타이드를 포함한, 변형된 및 화학적으로-변형된 뉴클레오타이드를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 당업계에서 알려진 임의의 그와 같은 뉴클레오타이드, 예를 들어, 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸 퓨린 뉴클레오타이드, 2'-데옥시-2'-플루오로 리보뉴클레오타이드, 2'-데옥시-2'-플루오로 피리미딘 뉴클레오타이드, 2'-데옥시 리보뉴클레오타이드, 2'-데옥시 퓨린 뉴클레오타이드, 보편적인 염기 뉴클레오타이드, 5-C-메틸-뉴클레오타이드, 및 역전된 데옥시어베이직 단량체 잔기를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 3'-말단 안정화된 뉴클레오타이드, 3'-글리세릴 뉴클레오타이드, 3'-역전된 무염기성 뉴클레오타이드, 및 3'-역전된 티미딘을 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 잠금 핵산 뉴클레오타이드 (LNA), 2'-O,4'-C-메틸렌-(D-리보푸라노실) 뉴클레오타이드, 2'-메톡시에톡시 (MOE) 뉴클레오타이드, 2'-메틸-티오-에틸, 2'-데옥시-2'-플루오로 뉴클레오타이드, 및 2'-O-메틸 뉴클레오타이드를 포함한다. 예시적인 구현예에서, 변형된 단량체는 잠금 핵산 뉴클레오타이드 (LNA)이다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2′,4′-구속된 2′-O-메톡시에틸 (cMOE) 및 2′-O-에틸 (cEt) 변형된 DNA를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-아미노 뉴클레오타이드, 2'-O-아미노 뉴클레오타이드, 2'-C-알릴 뉴클레오타이드, 및 2'-O-알릴 뉴클레오타이드를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 N⁶-메틸아데노신 뉴클레오타이드를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 변형된 염기 5-(3-아미노)프로필우리딘, 5-(2-머캅토)에틸우리딘, 5-브로모우리딘; 8-브로모구아노신, 또는 7-데아자아데노신을 갖는 뉴클레오타이드 단량체를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-O-아미노프로필 치환된 뉴클레오타이드를 포함한다.

변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-R, 2'-OR, 2'-할로겐, 2'-SR, 또는 2'-아미노로 뉴클레오타이드의 2'-OH 그룹을 대체하는 것을 포함하고, 여기서 R은 H, 알킬, 알케닐, 또는 알키닐일 수 있다.

변형된 뉴클레오타이드의 일부 예는 Saenger, Principles of Nucleic Acid Structure, Springer-Verlag, 1984에서 주어진다.

상기에 기재된 염기 변형의 예는 당 변형 및 연결 변형을 포함한, 뉴클레오사이드 또는 뉴클레오타이드 구조의 추가의 변형과 조합될 수 있다.

특정 변형된 또는 화학적으로-변형된 뉴클레오타이드 단량체는 자연에서 발견될 수 있다.

하나 이상의 UNA 단량체를 함유하는 번역가능 분자

본 발명의 양태는 하나 이상의 UNA 단량체를 함유하는 올리고머성 화합물인 번역가능 분자에 대한 구조 및 조성물을 제공한다. 번역가능한 올리고머는 약제학적 조성물에 대한 활성제일 수 있다. 일부 구현예에서, 번역가능한 올리고머는 인간 AGL 또는 그의 변이체를 인코딩한다.

올리고머성인 본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 함유할 수 있다. 분자 본 발명의 올리고머성은 펩타이드 및 단백질 치료제를 공급하기 위해 제형에서 활성제로서 사용될 수 있다. 일부 구현예에서, 번역가능한 올리고머는 인간 AGL 또는 그것의 변이체를 인코딩한다.

일부 구현예에서, 본 발명은 특정 천연 뉴클레오타이드, 비-천연 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 화학적으로-변형된 뉴클레오타이드와 UNA 단량체의 신규한 조합을 포함하는 구조를 갖는 올리고머성, 번역가능 화합물을 제공한다.

본 발명의 번역가능한 올리고머성 화합물은 길이가 약 200 내지 약 12,000 염기인 길이를 가질 수 있다. 본 발명의 번역가능한 올리고머성 화합물은 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 또는 약 9000 염기의 길이를 가질 수 있다. 일부 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 약 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900, 5000, 5100, 5200, 5300, 5400, 또는 약 5500 염기의 길이를 가질 수 있다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 약 5000 염기의 길이를 가진다.

추가 양태에서, 하나 이상의 UNA 단량체를 포함하는 본 발명의 올리고머성, 번역가능 화합물은 약리적으로 활성 분자일 수 있다. 번역가능한 올리고머성 분자는 시험관내, 생체내, 또는 생체외에서 펩타이드 또는 단백질 활성제를 발생하기 위한 활성 약제학적 성분으로서 사용될 수 있다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 인간 AGL 또는 그것의 변이체를 인코딩한다.

본 발명의 번역가능한 올리고머성 분자는 식 I의 구조를 가질 수 있다:

여기서 L¹은 연결기이고, n은 200 내지 12,000이고, 그리고 각 경우에 대해 L²는 식 -C¹-C²-C³-를 갖는 UNA 링커 그룹이고, 여기서 R은 C²에 부착되고 식 -OCH(CH₂R³)R⁵를 가지고, 여기서 R³은 -OR⁴, -SR⁴, -NR⁴ ₂, -NH(C=O)R⁴, 모폴리노, 모폴린-1-일, 피페라진-1-일, 또는 4-알카노일-피페라진-1-일이고, 여기서 R⁴는 각 경우에 대해 동일 또는 상이하고 H, 알킬, 콜레스테롤, 지질 분자, 폴리아민, 아미노산, 또는 폴리펩타이드이고, 여기서 R⁵는 핵염기이거나, 또는 L²(R)은 당 예컨대 리보오스이고 R은 핵염기이거나, 또는 L²는 변형된 당 예컨대 변형된 리보오스이고 R은 핵염기이다. 특정 구현예에서, 핵염기는 변형된 핵염기일 수 있다. L¹은 포스포디에스테르 결합일 수 있다.

번역가능한 올리고머성 분자의 염기 서열은 임의의 핵염기의 서열일 수 있다.

일부 양태에서, 본 발명의 번역가능한 올리고머성 분자는 임의의 단량체간 위치에 임의의 수의 포스포로티오에이트 단량체간 연결기를 가질 수 있다.

일부 구현예에서, 번역가능한 올리고머성 분자의 단량체간 연결기 중 임의의 하나 이상은 디티오에이트, 키랄 포스포로티오에이트, 및 다른 화학적으로 변형된 형태를 포함한 포스포디에스테르, 포스포로티오에이트일 수 있다.

번역가능한 올리고머성 분자가 UNA 단량체에서 종결할 때, 말단 위치는 상기에서 나타낸 위치상 넘버링에 따라 1-말단을 가지거나, 또는 말단 위치는 3-말단을 가진다.

향상된 번역

본 발명의 번역가능 분자는 분자의 번역 효율을 향상시키는 영역을 포함할 수 있다.

일반적으로, 당해 분야에서 알려진 바와 같이 번역 향상제 영역은 펩타이드 또는 단백질 수율을 증가시키기 위해 번역가능 분자의 구조 안으로 편입될 수 있다.

번역 향상제 영역을 함유하는 번역가능 분자는 펩타이드 또는 단백질의 증가된 생산을 제공할 수 있다.

일부 구현예에서, 번역 향상제 영역은 번역가능 분자의 5′ 또는 3′ 미번역된 영역을 포함할 수 있거나, 또는 그 안에 위치할 수 있다.

번역 향상제 영역의 예는 TEV 5'UTR 및 제노푸스 베타-글로빈 3'UTR로부터 자연 발생 향상제 영역을 포함한다.

분자 구조 및 서열

번역가능 분자는 표적 펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 일부 구현예에서, 상기 표적 펩타이드 또는 단백질은 대상체에서 병태 또는 질환과 연관될 수 있다.

일부 양태에서, 번역가능 분자의 염기 서열은 mRNA의 염기 서열의 적어도 효과적인 부분 또는 도메인과 동일한 부분을 포함할 수 있고, 여기서 효과적인 부분은 번역가능 분자의 번역 생성물에 치료적 활성을 부여하기에 충분하다.

일부 양태에서, 본 발명은 적어도 세포의 천연 핵산 분자의 단편에 동일한 염기 서열을 갖는 활성인 번역가능 분자를 제공한다.

특정 구현예에서, 번역가능 분자의 염기 서열은 하나 이상의 염기 돌연변이를 제외하고 mRNA의 염기 서열과 동일한 부분을 포함할 수 있다. 번역가능 분자에 대한 돌연변이의 수는 mRNA보다 실질적으로 낮은 활성을 갖는 번역가능 분자의 번역 생성물을 생성하는 양을 초과하지 않아야 한다.

본 발명의 올리고머성, 번역가능 UNA 분자는 핵염기의 서열을 나타낼 수 있고, 시험관내, 생체외, 또는 생체내에서 펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 발현된 펩타이드 또는 단백질은 천연 또는 자연 mRNA로부터 발현된 단백질에 상응하는 활성을 포함하여 다양한 형태의 활성을 가질 수 있다.

일부 구현예에서, 본 발명의 번역가능 분자는 약 400 내지 15,000 단량체의 사슬 길이를 가질 수 있고, 여기서 UNA 단량체가 아닌 임의의 단량체는 N 또는 Q 단량체일 수 있다.

분자 캡 구조

본 발명의 번역가능 분자는 당해 기술에 공지되어 있는 바와 같은 다양한 기 및 그것의 유사체로 캡핑된 5'-말단을 가질 수 있다. 예시적인 구현예에서, 5' cap은 m7GpppGm cap일 수 있다. 추가 구현예에서, 5' cap은 m7GpppA, m7GpppC; 비메틸화된 cap 유사체 (예를 들어, GpppG); 디메틸화된 cap 유사체 (예를 들어, m2,7GpppG), 트리메틸화된 cap 유사체 (예를 들어, m2,2,7GpppG), 디메틸화된 대칭 cap 유사체 (예를 들어, m7Gpppm7G), 또는 항 가역적 cap 유사체 (예를 들어, ARCA; m7, 2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG 및 그것의 테트라포스페이트 유도체) (예를 들어, Jemielity, J. et al., RNA 9: 1108-1122 (2003) 참고)로부터 선택될 수 있다. 다른 구현예에서, 5' cap은 ARCA cap (3'-OMe-m7G(5')pppG)일 수 있다. 5' cap은 mCAP (m7G(5')ppp(5')G, N⁷-메틸-구아노신-5'-삼인산-5'-구아노신)일 수 있다. 5' cap은 가수분해에 대해 내성일 수 있다.

5' cap 구조의 일부 예는 WO2015/051169A2, WO/2015/061491, 및 미국 특허 번호 8,093,367 및 8,304,529에 주어져 있다.

꼬리 영역

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 엑소뉴클레아제 열화로부터 mRNA를 보호하는 역할을 할 수 있는 꼬리 영역을 포함한다. 일부 구현예에서, 꼬리 영역은 polyA 꼬리일 수 있다.

PolyA 꼬리는 당해 분야에서 알려진 다양한 방법을 사용하여, 예를 들어, 합성 또는 시험관내 전사된 RNA에 꼬리를 부가하는 poly A 중합효소를 사용하여 첨가될 수 있다. 다른 방법은 poly A 꼬리를 인코딩하는 전사 벡터의 사용 또는 리가제 (예를 들어, T4 RNA 리가제 및/또는 T4 DNA 리가제를 사용한 스프린트 결찰을 통함)의 사용을 포함하고, 여기서 polyA는 센스 RNA의 3' 말단에 결찰될 수 있다. 일부 구현예에서, 임의의 상기 방법의 조합이 이용된다.

일부 구현예에서, 번역가능한 올리고머는 3' polyA 꼬리 구조를 포함한다. 일부 구현예에서, polyA 꼬리의 길이는 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 또는 300 뉴클레오타이드일 수 있다. 일부 구현예에서, 3' polyA 꼬리는 약 5 내지 300 아데노신 뉴클레오타이드 (예를 들어, 약 30 내지 250 아데노신 뉴클레오타이드, 약 60 내지 220 아데노신 뉴클레오타이드, 약 80 내지 200 아데노신 뉴클레오타이드, 약 90 내지 약 150 아데노신 뉴클레오타이드, 또는 약 100 내지 약 120 아데노신 뉴클레오타이드)을 함유한다. 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 100 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 115 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 250 개의 뉴클레오타이드이다.

일부 구현예에서, 3' polyA 꼬리는 하나 이상의 UNA 단량체를 포함한다. 일부 구현예에서, 3' polyA 꼬리는 2, 3, 4, 5, 10, 15, 20, 또는 그 초과 UNA 단량체를 함유한다. 예시적인 구현예에서, 3' polyA 꼬리는 2 UNA 단량체를 함유한다. 추가 예시적인 구현예에서, 3' polyA 꼬리는 3' polyA 꼬리에서 서로에 대해서 연속적으로 즉, 인접하여 발견된 2 UNA 단량체를 함유한다.

예시적인 구현예에서, 3' polyA 꼬리는 서열번호 6에서 도시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 서열번호 38에서 도시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 서열번호 39에서 도시된 서열을 포함하거나 이들로 구성된다.

일부 구현예에서, 번역가능한 올리고머는 3' polyC 꼬리 구조를 포함한다. 일부 구현예에서, polyC 꼬리의 길이는 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 또는 300 뉴클레오타이드일 수 있다. 일부 구현예에서, 3' polyC 꼬리는 약 5 내지 300 시토신 뉴클레오타이드 (예를 들어, 약 30 내지 250 시토신 뉴클레오타이드, 약 60 내지 220 시토신 뉴클레오타이드, 약 80 내지 약 200 시토신 뉴클레오타이드, 약 90 내지 150 시토신 뉴클레오타이드, 또는 약 100 내지 약 120 시토신 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 3' polyC 꼬리는 길이가 약 100 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyC 꼬리는 길이가 약 115 개의 뉴클레오타이드이다. polyC 꼬리는 polyA 꼬리에 첨가될 수 있거나 또는 polyA 꼬리로 치환될 수 있다. polyC 꼬리는 polyA 꼬리의 5' 말단 또는 polyA 꼬리의3' 말단에 첨가될 수 있다.

일부 구현예에서, poly A 및/또는 poly C 꼬리의 길이는 본 발명의 변형된 번역가능한 올리고머성 분자의 안정성 및, 따라서, 단백질의 전사를 조절하도록 조정된다. 예를 들어, polyA 꼬리의 길이는 번역가능 분자의 반감기에 영향을 줄 수 있기 때문에, polyA 꼬리의 길이는 뉴클레아제에 대한 mRNA의 저항 수준을 변경하여 그에 의해 표적 세포에서 폴리뉴클레오타이드 발현 및/또는 폴리펩타이드 생산의 시간 경과를 제어하도록 조정될 수 있다.

5' 및 3' 미번역된 영역 (UTRs)

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 5' 미번역된 영역 및/또는 3' 미번역된 영역을 포함할 수 있다. 당업계에서 이해되는 바와 같이, 5' 및/또는 3' UTR은 mRNA의 번역의 안정성 또는 번역 효율에 영향을 미칠 수 있다. 예시적인 구현예에서, 번역가능한 올리고머는 5' UTR 및 3' UTR을 포함한다.

일부 구현예에서, 번역가능한 올리고머는 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 300, 400, 또는 500 뉴클레오타이드인 5' UTR을 포함할 수 있다. 일부 구현예에서, 5' UTR은 약 50 내지 300 뉴클레오타이드 (예를 들어, 약 75 내지 250 뉴클레오타이드, 약 100 내지 200 뉴클레오타이드, 약 120 내지 150 뉴클레오타이드, 또는 약 135 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 5' UTR은 길이가 약 135 개의 뉴클레오타이드이다.

일부 구현예에서, 5' UTR은 번역가능한 올리고머의 안정성을 증가시키는 데 상대적으로 안정한 것으로 당업계에서 알려진 mRNA 분자(예를 들어, 히스톤, 튜불린, 글로빈, GAPDH, 액틴, 또는 시트르산 사이클 효소)로부터 유래된다. 다른 구현예에서, 5' UTR 서열은 CMV 급초기 1 (IE1) 유전자의 부분 서열을 포함할 수 있다. 5' UTR 서열의 예는 미국 특허 번호 9,149,506에서 발견될 수 있다. 일부 구현예에서, 5' UTR은 인간 IL-6, 알라닌 아미노기전달효소 1, 인간 아포지질단백질 E, 인간 피브리노겐 알파 사슬, 인간 트랜스티레틴, 인간 합토글로빈, 인간 알파-1-항키모트립신, 인간 항트롬빈, 인간 알파-1-항트립신, 인간 알부민, 인간 베타 글로빈, 인간 보체 C3, 인간 보체 C5, SynK, AT1G58420, 마우스 베타 글로빈, 마우스 알부민, 및 담배 식각 바이러스, 또는 전술한 것 중 임의의 것의 단편의 5' UTR으로부터 선택된 서열을 포함한다. 예시적인 구현예에서, 5' UTR은 담배 식각 바이러스 (TEV)로부터 유래된다. 추가 예시적인 구현예에서, 5' UTR은 서열번호 3에 제시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 5' UTR은 서열번호 3에 제시된 서열의 단편, 예컨대 서열번호 3의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 또는 125 인접 뉴클레오타이드의 단편이다.

일부 구현예에서, 번역가능한 올리고머성 분자는 내부 리보솜 유입 부위 (IRES)를 포함한다. 당업계에서 이해되는 바와 같이, IRES는 말단-독립 방식으로 번역 개시를 허용하는 RNA 요소이다. 예시적인 구현예에서, IRES는 5' UTR 내에 있다. 다른 구현예에서, IRES는 5' UTR 외측에 있을 수 있다.

일부 구현예에서, 번역가능한 올리고머는 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 300, 400, 또는 500 뉴클레오타이드인 3' UTR을 포함할 수 있다. 일부 구현예에서, 3' UTR은 약 50 내지 300 뉴클레오타이드 (예를 들어, 약 75 내지 250 뉴클레오타이드, 약 100 내지 200 뉴클레오타이드, 약 140 내지 175 뉴클레오타이드, 또는 약 160 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 3' UTR은 길이가 약 160 개의 뉴클레오타이드이다.

일부 구현예에서, 3' UTR은 하나 이상의 UNA 단량체를 포함한다. 일부 구현예에서, 3' UTR은 2, 3, 4, 5, 10, 15, 20, 또는 그 초과 UNA 단량체를 함유한다.

3' UTR 서열의 예는 미국 특허 번호 9,149,506에서 발견될 수 있다. 일부 구현예에서, 3' UTR은 알라닌 아미노기전달효소 1, 인간 아포지질단백질 E, 인간 피브리노겐 알파 사슬, 인간 합토글로빈, 인간 항트롬빈, 인간 알파 글로빈, 인간 베타 글로빈, 인간 보체 C3, 인간 성장 인자, 인간 헵시딘, MALAT-1, 마우스 베타 글로빈, 마우스 알부민, 및 제노푸스 베타 글로빈, 또는 전술한 것 중 임의의 것의 단편의 3' UTR으로부터 선택된 서열을 포함한다. 예시적인 구현예에서, 3' UTR은 제노푸스 베타 글로빈으로부터 유래된다. 예시적인 구현예에서, 3' UTR은 제노푸스 베타 글로빈으로부터 유래되고 하나 이상의 UNA 단량체를 함유한다. 추가 예시적인 구현예에서, 3' UTR은 서열번호 5 및 33-37에 제시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' UTR은 서열번호 5 및 33-37에 제시된 서열의 단편, 예컨대 서열번호 5 및 33-37의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150 인접 뉴클레오타이드의 단편이다.

특정 예시적인 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 3의 5' UTR 서열 및 서열번호 5 및 33-37로부터 선택된 3' UTR 서열을 포함한다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 6, 서열번호 38, 또는 서열번호 39에 도시된 polyA 꼬리를 추가로 포함한다. 일부 구현예에서, AGL의 mRNA 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열을 포함한다.

삼중 정지 코돈

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 삼중 정지 코돈을 창출하는 CDS의 즉시 다운스트림 서열을 포함할 수 있다. 삼중 정지 코돈은 번역의 효율성을 향상시키기 위해 편입될 수 있다. 일부 구현예에서, 번역가능한 올리고머는 서열번호 7-32 또는 서열번호 41-45에서 예시된 바와 같이 본 명세서에 기재된 PAH CDS의 즉시 다운스트림 서열 AUAAGUGAA (서열번호 40)를 포함할 수 있다.

번역 시작 부위

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 번역 시작 부위를 포함할 수 있다. 그와 같은 서열은 당해 기술에 공지되어 있고 코작 서열을 포함한다. 예를 들어, Kozak, Marilyn (1988) Mol. and Cell Biol., 8:2737-2744; Kozak, Marilyn (1991) J. Biol. Chem., 266:19867-19870; Kozak, Marilyn (1990) Proc Natl. Acad. Sci. USA, 87:8301-8305; 및 Kozak, Marilyn (1989) J. Cell Biol., 108:229-241; 및 본 명세서에서 인용된 참조문헌을 참고한다. 당업계에서 이해되는 바와 같이, 코작 서열은 mRNA의 번역의 효율적인 개시를 허용하는 진핵 mRNA의 번역 시작 부위 주위에 중심이 있는 짧은 공통 서열이다. 리보솜 번역 기계장치는 코작 서열의 맥락에서 AUG 개시 코돈을 인식한다.

일부 구현예에서, 번역 시작 부위, 예를 들어, 코작 서열은 AGL에 대한 코딩 서열의 업스트림으로 삽입된다. 일부 구현예에서, 번역 시작 부위는 5' UTR의 다운스트림으로 삽입된다. 특정 예시적인 구현예에서, 번역 시작 부위는 AGL에 대한 코딩 서열의 업스트림 및 5' UTR의 다운스트림으로 삽입된다.

당업계에서 이해되는 바와 같이, 코작 서열의 길이는 변할 수 있다. 일반적으로, 선도 서열의 길이가 증가하면 번역이 향상된다.

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 4의 서열을 갖는 코작 서열을 포함한다. 특정 예시적인 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 4의 서열을 갖는 코작 서열을 포함하고, 여기서 상기 코작 서열은 5' UTR의 즉시 다운스트림 및 AGL에 대한 코딩 서열의 즉시 업스트림이다.

합성 방법

다양한 양태에서, 본 발명은 번역가능 메신저 분자의 합성 방법을 제공한다.

본 발명의 번역가능 분자는 본 명세서에 개시된 방법뿐만 아니라 당업계에서 알려진 임의의 적절한 기술을 사용하여 합성되고 단리될 수 있다.

핵산을 제조하는 일부 방법은, 예를 들어, Merino, Chemical Synthesis of Nucleoside Analogues, (2013); Gait, Oligonucleotide synthesis: a practical approach (1984); Herdewijn, Oligonucleotide Synthesis, Methods in Molecular Biology, Vol. 288 (2005)에서 주어진다.

일부 구현예에서, 번역가능 분자는 시험관내 전사 (IVT) 반응에 의해 제작될 수 있다. 뉴클레오사이드 삼인산 (NTP)의 혼합은 T7 시약을 사용하여, 예를 들어, DNA 템플레이트로부터 RNA를 생성하기 위해 중합될 수 있다. DNA 템플레이트는 RNase-유리 DNase로 분해될 수 있고, RNA 칼럼-분리될 수 있다.

일부 구현예에서, 리가제가 사용되어 RNA 분자의 3' 말단 또는 RNA 전사체에 합성 올리고머를 연결하여 번역가능 분자를 형성할 수 있다. 3' 말단에 결찰되는 합성 올리고머는 polyA 꼬리의 기능성을 제공할 수 있고 유익하게는 3'-엑소리보뉴클레아제에 의한 그것의 제거에 대해 저항을 제공한다. 결찰된 생성물 번역가능 분자는 증가된 특이 활성을 가질 수 있고 증가된 수준의 이소성 단백질 발현을 제공한다.

특정 구현예에서, 본 발명의 번역가능 분자의 결찰된 생성물은 천연 특이성을 갖는 RNA 전사체로 제작될 수 있다. 결찰된 생성물은 천연 특이성과의 혼용성을 보장하도록 5' 말단에 RNA 전사체의 구조를 보유하는 합성 분자일 수 있다.

추가 구현예에서, 본 발명의 번역가능 분자의 결찰된 생성물은 외인성 RNA 전사체 또는 비-천연 RNA로 제작될 수 있다. 결찰된 생성물은 RNA의 구조를 보유하는 합성 분자일 수 있다.

이론에 의해 구속되기를 바라지 않으면서, 세포에서 정식 mRNA 열화 경로는 하기 단계를 포함한다: (i) polyA 꼬리가 3' 엑소뉴클레아제에 의해 스터브로 다시 서서히 절단되어, 효율적인 번역에 필요한 고리화 상호작용을 중단시키고 cap을 공격에 대해 공개하는 단계; (ii) 탈캡핑 복합체가 5' cap을 이탈하는 단계; (iii) 전사체의 비보호되고 번역적으로 무력한 잔류물이 5' 및 3' 엑소뉴클레아제 활성에 의해 분해되는 단계.

본 발명의 구현예는 천연 전사체에 비하여 증가된 번역 활성을 가질 수 있는 신규한 번역가능 구조를 포함한다. 다른 것들 중에서, 본 명세서에 번역가능 분자는 엑소뉴클레아제가 탈-아데닐화의 과정에서 polyA 꼬리를 다시 트리밍하는 것을 방지한다.

본 발명의 구현예는 번역가능 분자에 대한 구조, 조성물 및 방법을 제공한다. 본 발명의 구현예는 하나 이상의 UNA 단량체를 함유하고 증가된 기능적 반감기를 갖는 번역가능 분자를 제공할 수 있다.

mRNA 전사체의 3' 말단에 합성 올리고머의 결찰은 mRNA 전사체의 결찰 생성물로의 높은 전환이 놀랍게도 달성될 수 있음이 밝혀졌다.

본 명세서에서 사용된 바와 같이, 용어들 polyA 꼬리 및 polyA 올리고머는 단량체의 올리고머를 지칭하고, 여기서 상기 단량체는 아데닌, UNA 단량체, 자연 발생 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 뉴클레오타이드 유사체에 기초한 뉴클레오타이드를 포함할 수 있다.

RNA의 3' 말단에 결찰하기 위한 올리고머는 2 내지 120 단량체 길이, 또는 3 내지 120 단량체 길이, 또는 4 내지 120 단량체 길이, 또는 5 내지 120 단량체 길이, 또는 더 길 수 있다. 예시적인 구현예에서, 결찰을 위한 올리고머는 길이가 약 30 단량체이다.

지질-계 제형

지질-계 제형은 그것의 생체적합성 및 대규모 생산의 용이성으로 인해 RNA에 대한 가장 유망한 전달 시스템 중 하나로 점점 더 인식되고 있다. 양이온성 지질은 RNA의 전달을 위한 합성 물질로서 널리 연구되어 왔다. 함께 혼합한 후, 핵산은 양이온성 지질에 의해 응축되어 리포플렉스로 알려진 지질/핵산 복합체를 형성한다. 이들 지질 복합체는 뉴클레아제의 작용으로부터 유전 물질을 보호하고 음으로 하전된 세포막과 상호작용함으로써 이를 세포 내로 전달할 수 있다. 리포플렉스는 생리적으로 pH에서 양으로 하전된 지질을 음으로 하전된 핵산과 직접적으로 혼합함에 의해 제조될 수 있다.

통상적인 리포좀은 수성 코어를 둘러싸는, 양이온성, 음이온성 또는 중성 (포스포) 지질 및 콜레스테롤로 구성될 수 있는 지질 이중층으로 구성된다. 지질 이중층 및 수성 공간 둘 모두는 각각 소수성 또는 친수성 화합물을 포함할 수 있다. 생체내 리포좀 특성 및 거동은 친수성 중합체 코팅물, 예를 들어 리포좀 표면에 폴리에틸렌 글리콜 (PEG)의 첨가에 의해 입체 안정화를 부여하도록 변형될 수 있다. 또한, 리포좀은 리간드 (예를 들어, 항체, 펩타이드 및 탄수화물)를 부착된 PEG 사슬의 표면 또는 말단에 부착함에 의해 특정 표적화에 사용될 수 있다 (Front Pharmacol. 2015 Dec 1;6:286).

리포좀은 수성 구획을 둘러싸는 인지질 이중층으로 구성된 콜로이드성 지질-계 및 계면활성제-계 전달 시스템이다. 그것들은 구형 소포로 존재할 수 있으며, 크기는 20 nm 내지 수 미크론의 범위일 수 있다. 양이온성 지질-계 리포좀은 정전기적 상호작용을 통해 음으로 하전된 핵산과 복합체를 형성할 수 있어 생체적합성, 낮은 독성 및 생체내 임상 적용에 필요한 대규모 생산의 가능성을 부여하는 복합체를 생성한다. 리포좀은 흡수를 위해 원형질막과 융합될 수 있다; 세포 내부로 들어가면, 리포좀은 세포내이입 경로를 통해 처리되고 유전 물질은 엔도좀/담체에서 세포질로 방출된다. 리포좀은 기본적으로 생물학적 막의 유사체이고 천연 및 합성 인지질 둘 모두로부터 제조될 수 있다는 점에서 리포좀은 그것의 우수한 생체적합성으로 인해 약물 전달 비히클로 오랫동안 인식되어 왔다 (Int J Nanomedicine. 2014; 9: 1833-1843).

양이온성 리포좀은 플라스미드 DNA, 안티센스 올리고 및 siRNA/소형 헤어핀 RA-shRNA를 포함하는 올리고뉴클레오타이드에 가장 일반적으로 사용되는 비-바이러스 전달 시스템이었다. 양이온성 지질, 예컨대 DOTAP, (1,2-디올레오일-3-트리메틸암모늄-프로판) 및 DOTMA (N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄 메틸 설페이트)는 음의 하전된 핵산으로 복합체 또는 리포플렉스를 형성하여 정전기적 상호작용에 의해 나노입자를 형성하여, 높은 시험관내 형질감염 효율을 제공한다. 또한, 예를 들어 중성 1,2-디올레오일-sn-글리세로-3-포스파티딜콜린 (DOPC)-계 나노리포좀과 같이 RNA 전달을 위한 중성 지질-계 나노 리포좀이 개발되었다. (Adv Drug Deliv Rev. 2014 Feb; 66: 110-116.)

일부 구현예에 따르면, 본 명세서에 기재된 발현가능한 폴리뉴클레오타이드 및 이종성 mRNA 작제물은 지질 제형화된다. 지질 제형은 바람직하게는, 비제한적으로, 리포좀, 리포플렉스, 공중합체, 예컨대 PLGA, 및 지질 나노입자로부터 선택된다. 하나의 바람직한 구현예에서, 지질 나노입자 (LNP)는 하기를 포함한다:

(a) 핵산,

(b) 양이온성 지질,

(c) 응집 환원제 (예컨대 폴리에틸렌 글리콜 (PEG) 지질 또는 PEG-변형된 지질),

(d) 선택적으로 비-양이온성 지질 (예컨대 중성 지질), 및

(e) 선택적으로, 스테롤.

일 구현예에서, 지질 나노입자 제형은 (i) 적어도 하나의 양이온성 지질; (ii) 중성 지질; (iii) 스테롤, 예를 들어, 콜레스테롤; 및 (iv) PEG-지질이 약 20-60% 양이온성 지질: 5-25% 중성 지질: 25-55% 스테롤; 0.5-15% PEG-지질의 몰비로 구성된다.

티오카바메이트 및 카바메이트-함유 지질 제형

본 발명의 활성 분자의 전달을 위한 지질 및 지질 조성물의 일부 예는 WO/2015/074085 및 USSN 15/387,067에 주어져 있고, 이들 각각은 전체적으로 본 명세서에 참고로 통합된다. 특정 구현예에서, 지질은 하기 식의 화합물이다:

여기서

R₁ 및 R₂ 둘 모두는 1 내지 14개의 탄소로 구성된 선형 알킬, 또는 2 내지 14개의 탄소로 구성된 알케닐 또는 알키닐로 구성되고;

L₁ 및 L₂ 둘 모두는 5 내지 18개의 탄소로 구성되거나, 또는 N와 복소환을 형성하는, 선형 알킬렌 또는 알케닐렌으로 구성되고;

X는 S이고;

L₃은 1 내지 6개의 탄소로 구성되거나, 또는 N와 복소환을 형성하는, 결합 또는 선형 알킬렌으로 구성되고;

R₃은 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬렌으로 구성되고; 그리고

R₄ 및 R₅는 동일 또는 상이하고, 각각은 수소 또는 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬로 구성됨;

또는 이의 약제학적으로 허용가능한 염.

지질 제형은 하기 중에서 선택된 하나 이상의 이온화가능한 양이온성 지질을 함유할 수 있다:

양이온성 지질

지질 나노입자는 바람직하게는 지질 나노입자를 형성하기에 적합한 양이온성 지질을 포함한다. 바람직하게는, 양이온성 지질은 약 생리적 pH에서 순 양전하를 수반한다.

양이온성 지질은, 예를 들어, N,N-디올레일-N,N-디메틸염화암모늄 (DODAC), N,N-디스테아릴-N,N-디메틸암모늄 브로마이드 (DDAB), 1,2-디올레오일트리메틸암모늄프로판 염화물 (DOTAP) (N-(2,3-디올레오일옥시)프로필)-N,N,N-트리메틸염화암모늄 및 1,2-디올레일옥시-3-트리메틸아미노프로판 염화물 염으로도 알려져 있음), N-(1-(2,3-디올레일옥시)프로필)-N,N,N-트리메틸염화암모늄 (DOTMA), N,N-디메틸-2,3-디올레일옥시)프로필아민 (DODMA), 1,2-디리놀레일옥시-N,N-디메틸아미노프로판 (DLinDMA), 1,2-디리놀레닐옥시-N,N-디메틸아미노프로판 (DLenDMA), 1,2-디-y-리놀레닐옥시-N,N-디메틸아미노프로판 (γ-DLenDMA), 1,2-디리놀레일카바모일옥시-3-디메틸아미노프로판 (DLin-C-DAP), 1,2-딜리놀레이옥시-3-(디메틸아미노)아세톡시프로판 (DLin-DAC), 1,2-디리놀레이옥시-3-모폴리노프로판 (DLin-MA), 1,2-디리놀레오일-3-디메틸아미노프로판 (DLinDAP), 1,2-디리놀레일티오-3-디메틸아미노프로판 (DLin-S- DMA), 1-리놀레오일-2-리놀레일옥시-3-디메틸아미노프로판 (DLin-2-DMAP), 1,2-디리놀레일옥시-3-트리메틸아미노프로판 염화물 염 (DLin-TMA.CI), 1,2-디리놀레오일-3-트리메틸아미노프로판 염화물 염 (DLin-TAP.CI), 1,2-디리놀레일옥시-3-(N-메틸피페라지노)프로판 (DLin-MPZ), 또는 3-(N,N-디리놀레일아미노)-1,2-프로판디올 (DLinAP), 3-(N,N-디올레일아미노)-1,2-프로판디오 (DOAP), 1,2-디리놀레일옥소-3-(2-N,N- 디메틸아미노)에톡시프로판 (DLin-EG-DM A), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA) 또는 그의 유사체, (3aR,5s,6aS)-N,N-디메틸-2,2-디((9Z,12Z)-옥타데카-9,12-디에닐)테트라하이드로-3aH-사이클로펜타[d][1,3]디옥솔-5-아민, (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일4-(디메틸아미노)부타노에이트 (MC3), 1,1'-(2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸)(2-하이드록시도데실)아미노)에틸)피페라진-1-일)에틸아잔디일)디도데칸-2-올 (C12-200), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란 (DLin-K-C2-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA), (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28 31-테트라엔-19-일 4-(디메틸아미노) 부타노에이트 (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,3 1-테트라엔-19-일옥시)-N,N-디메틸프로판-1-아민 (MC3 에테르), 4-((6Z,9Z,28Z,31 Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸부탄-1-아민 (MC4 에테르), 또는 전술한 것 중 임의의 것의 임의의 조합일 수 있다. 다른 양이온성 지질은, 비제한적으로, N,N-디스테아릴-N,N-디메틸암모늄 브로마이드 (DDAB), 3P-(N-(N',N'-디메틸아미노에탄)- 카바모일)콜레스테롤 (DC-Choi), N-(1-(2,3-디올레일옥시)프로필)-N-2-(스페르민카복사미도)에틸)-N,N-디메틸암모늄 트리플루오르아세테이트 (DOSPA), 디옥타데실아미도글라이실 카복시스페르민 (DOGS), 1,2-디레오일-sn-3-포스포에탄올아민 (DOPE), 1,2-디올레오일-3-디메틸암모늄 프로판 (DODAP), N-(1,2-디미리스틸록시프로프-3-일)-N,N-디메틸-N-하이드록시에틸 암모늄 브로마이드 (DMRIE), 및 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란 (XTC)을 포함한다. 추가로, 양이온성 지질의 상업적 제제, 예컨대, 예를 들어, 리포펙틴 (GIBCO/BRL로부터 이용가능한 DOTMA 및 DOPE를 포함함), 및 리포펙타민 (GIBCO/BRL로부터 이용가능한 DOSPA 및 DOPE를 포함함)이 사용될 수 있다.

다른 적합한 양이온성 지질은 아래에서 개시되어 있다: 국제공개 번호 WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709, 및 WO 2011/153493; 미국 특허 공보 번호 2011/0256175, 2012/0128760, 및 2012/0027803; 미국 특허 번호 8,158,601; 및 Love et al, PNAS, 107(5), 1864-69, 2010. 다른 적합한 아미노 지질은 알킬 치환체가 상이한 (예를 들어, N-에틸- N-메틸아미노-, 및 N-프로필-N-에틸아미노-) 것들을 포함하여, 대안적인 지방산 기 및 다른 디알킬아미노 기를 갖는 것들을 포함한다. 일반적으로, 덜 포화된 아실 사슬을 갖는 아미노 지질은 특히 필터 멸균을 위해 복합체가 약 0.3 미크론 미만으로 크기로 되어야 할 때 더 쉽게 크기가 결정된다. C14 내지 C22 범위의 탄소 사슬 길이를 갖는 불포화된 지방산을 함유하는 아미노 지질이 사용될 수 있다. 다른 스캐폴드는 또한 아미노 기 및 아미노 지질의 지방산 또는 지방 알킬 부분을 분리하기 위해 사용될 수 있다.

추가의 바람직한 구현예에서, LNP는 특허 출원 PCT/EP2017/064066에 따른 식 (III)을 갖는 양이온성 지질을 포함한다. 이와 관련하여, PCT/EP2017/064066의 개시내용은 또한 본 명세서에 참고로 포함된다.

특정 구현예에서, 본 발명의 아미노 또는 양이온성 지질은 적어도 하나의 양성자화성 또는 탈양성자화성 그룹을 가지므로, 지질은 생리적 pH 이하의 pH (예를 들어, pH 7.4)에서 양으로 하전되고, 제2 pH에서, 바람직하게는 생리적 pH 이상에서 중성이다. 물론, pH의 기능으로서 양성자의 첨가 또는 제거는 평형 과정이며, 하전 또는 중성 지질에 대한 언급은 우세한 종의 성질을 나타내며 모든 지질이 하전 또는 중성 형태에서 존재할 것을 요구하지는 않는다는 것이 이해될 것이다. 하나 초과의 양성자화성 또는 탈양성자화성 그룹을 갖거나, 또는 쯔비터이온성인 지질은 본 발명에서의 사용에서 배제되지 않는다. 특정 구현예에서, 양성자화성 지질은 약 4 내지 약 11의 범위인 양성자화성 그룹의 pKa, 예를 들어, 약 5 내지 약 7의 pKa를 갖는다.

양이온성 지질은 입자에 존재하는 총 지질의 약 20 mol % 내지 약 70 또는 75 mol % 또는 약 45 내지 약 65 mol % 또는 약 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 또는 약 70 mol %를 포함할 수 있다. 또 다른 구현예에서, 지질 나노입자는 양이온성 지질의 몰 기준으로 약 25% 내지 약 75%, 예를 들어, (지질 나노입자에서의 지질의 100% 총 몰에 기초하여) 몰 기준으로 약 20 내지 약 70%, 약 35 내지 약 65%, 약 45 내지 약 65%, 약 60%, 약 57.5%, 약 57.1%, 약 50% 또는 약 40%를 포함한다. 일 구현예에서, 양이온성 지질 대 핵산의 비는 약 3 대 약 15, 예컨대 약 5 대 약 13 또는 약 7 대 약 11이다.

약제학적 조성물

일부 양태에서, 본 발명은 번역가능 화합물 및 약제학적으로 허용가능한 담체를 함유하는 약제학적 조성물을 제공한다.

약제학적 조성물은 국소 또는 전신 투여가 가능할 수 있다. 일부 양태에서, 약제학적 조성물은 임의의 양식의 투여가 가능할 수 있다. 특정 양태에서, 투여는 정맥내, 피하, 폐, 근육내, 복강내, 진피, 경구, 흡입 또는 비강 투여를 포함한, 임의의 경로일 수 있다.

본 발명의 구현예는 지질 제형 내에 번역가능 화합물을 함유하는 약제학적 조성물을 포함한다.

일부 구현예에서, 약제학적 조성물은 양이온성 지질, 음이온성 지질, 스테롤, 페길화된 지질, 및 전술한 것의 임의의 조합으로부터 선택된 하나 이상의 지질을 포함할 수 있다. 일부 구현예에서, 번역가능 화합물을 함유하는 약제학적 조성물은 양이온성 지질, 인지질, 콜레스테롤, 및 페길화된 지질을 포함한다.

특정 구현예에서, 약제학적 조성물은 리포좀이 실질적으로 없을 수 있다.

추가 구현예에서, 약제학적 조성물은 나노입자를 포함할 수 있다.

본 발명의 활성 분자의 전달을 위한 지질 및 지질 조성물의 일부 예는, 전체적으로 본 명세서에 참고로 통합되는, WO/2015/074085에 주어져 있다. 특정 구현예에서, 지질은 양이온성 지질이다. 일부 구현예에서, 양이온성 지질은 식 II의 화합물을 포함한다:

여기서 R₁ 및 R₂는 동일 또는 상이한, 각각 선형 또는 분지형 알킬, 알케닐, 또는 알키닐이고, L₁ 및 L₂는 동일 또는 상이한, 각각 적어도 5개의 탄소 원자를 갖는 선형 알킬이거나, 또는 N과 복소환을 형성하고, X₁은 결합이거나, 또는 --CO--O--로 그것에 의하여 L₂-CO--O--R₂가 형성되고 X₂는 S 또는 O이고, L₃은 결합 또는 저급 알킬이고, R₃은 저급 알킬이고, R₄ 및 R₅는 동일 또는 상이한, 각각 저급 알킬이다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 부재이고, R₁ 및 R₂ 각각은 적어도 7개의 탄소 원자로 구성되고, R₃은 에틸렌 또는 n-프로필렌이고, R₄ 및 R₅는 메틸 또는 에틸이고, 그리고 L₁ 및 L₂ 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 부재이고, R₁ 및 R₂ 각각은 적어도 7개의 탄소 원자로 구성되고, R₃은 에틸렌 또는 n-프로필렌이고, R₄ 및 R₅는 메틸 또는 에틸이고, 그리고 L₁ 및 L₂ 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 부재이고, R₁ 및 R₂ 각각은 적어도 9개의 탄소 원자의 알케닐로 구성되고, R₃은 에틸렌 또는 n-프로필렌이고, R₄ 및 R₅는 메틸 또는 에틸이고, 그리고 L₁ 및 L₂ 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 메틸렌이고, R₁ 및 R₂ 각각은 적어도 7개의 탄소 원자로 구성되고, R₃은 에틸렌 또는 n-프로필렌이고, R₄ 및 R₅는 메틸 또는 에틸이고, 그리고 L₁ 및 L₂ 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 메틸렌이고, R₁ 및 R₂ 각각은 적어도 9개의 탄소 원자로 구성되고, R₃은 에틸렌 또는 n-프로필렌이고, R₄ 및 R₅ 각각은 메틸이고, L₁ 및 L₂ 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 메틸렌이고, R₁은 적어도 9개의 탄소 원자를 갖는 알케닐로 구성되고 그리고 R₂는 적어도 7개의 탄소 원자를 갖는 알케닐로 구성되고, R₃은 n-프로필렌이고, R₄ 및 R₅ 각각은 메틸이고, L₁ 및 L₂ 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L₃은 메틸렌이고, R₁ 및 R₂ 각각은 적어도 9개의 탄소 원자를 갖는 알케닐로 구성되고, R₃은 에틸렌이고, R₄ 및 R₅ 각각은 메틸이고, L₁ 및 L₂ 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.

예시적인 구현예에서, 양이온성 지질은 ATX-001, ATX-002, ATX-003, ATX-004, ATX-005, ATX-006, ATX-007, ATX-008, ATX-009, ATX-010, ATX-011, ATX-012, ATX-013, ATX-014, ATX-015, ATX-016, ATX-017, ATX-018, ATX-019, ATX-020, ATX-021, ATX-022, ATX-023, ATX-024, ATX-025, ATX-026, ATX-027, ATX-028, ATX-029, ATX-030, ATX-031, ATX-032, ATX-081, ATX-095, 및 ATX-126, 또는 이의 약제학적으로 허용가능한 염으로 구성된 군으로부터 선택된 화합물을 포함한다.

특정 예시적인 구현예에서, 양이온성 지질은 ATX-002, ATX-081, ATX-095, 또는 ATX-126을 포함한다.

일부 구현예에서, 양이온성 지질 또는 이의 약제학적으로 허용가능한 염은 지질 분자의 나노입자 또는 이중층을 포함하는 지질 조성물에 제시될 수 있다. 지질 이중층은 바람직하게는 중성 지질 또는 폴리머를 더 포함한다. 지질 조성물은 바람직하게는 액체 배지를 포함한다. 조성물은 바람직하게는 본 발명의 번역가능 화합물을 추가로 캡슐화한다. 지질 조성물은 바람직하게는 본 발명의 번역가능 화합물 및 중성 지질 또는 폴리머를 추가로 포함한다. 지질 조성물은 바람직하게는 번역가능 화합물을 캡슐화한다.

추가 구현예에서, 양이온성 지질은 식 III의 화합물을 포함한다:

여기서 R₁ 및 R₂는 동일 또는 상이한, 각각 1 내지 9개의 탄소로 구성된 선형 또는 분지형 알킬, 2 내지 11개의 탄소로 구성된 알케닐 또는 알키닐, 또는 콜레스테릴이고, L₁ 및 L₂는 동일 또는 상이한, 각각 5 내지 18개의 탄소로 구성된 선형 알킬렌 또는 알케닐렌이고, X₁은 --CO--O--로 그것에 의하여 -L₂-CO--O--R₂가 형성되고, X₂는 S 또는 O이고, X₃은 --CO--O-- 로 그것에 의하여 -L₁-CO--O--R₁이 형성되고, L₃은 결합이고, R₃은 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬렌이고, 그리고 R₄ 및 R₅는 동일 또는 상이한, 각각 수소 또는 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬임; 또는 이의 약제학적으로 허용가능한 염이다. 일 구현예에서, X₂는 S이다. 또 다른 구현예에서, R₃은 에틸렌, n-프로필렌, 또는 이소부틸렌으로부터 선택된다. 또 다른 구현예에서, R₄ 및 R₅는 별도로 메틸, 에틸, 또는 이소프로필이다. 또 다른 구현예에서, L₁ 및 L₂는 동일하다. 또 다른 구현예에서, L₁ 및 L₂는 상이하다. 또 다른 구현예에서, L₁ 또는 L₂는 7개의 탄소를 갖는 선형 알킬렌으로 구성된다.또 다른 구현예에서, L₁ 또는 L₂는 9개의 탄소를 갖는 선형 알킬렌으로 구성된다.또 다른 구현예에서, R₁ 및 R₂는 동일하다.또 다른 구현예에서, R₁ 및 R₂는 상이하다.또 다른 구현예에서, R₁ 및 R₂ 각각은 알케닐로 구성된다.또 다른 구현예에서, R₁ 및 R₂ 각각은 알킬로 구성된다.또 다른 구현예에서, 알케닐은 단일 이중 결합으로 구성된다.또 다른 구현예에서, R₁ 또는 R₂는 9개의 탄소로 구성된다.또 다른 구현예에서, R₁ 또는 R₂는 11개의 탄소로 구성된다.또 다른 구현예에서, R₁ 또는 R₂는 7개의 탄소로 구성된다.또 다른 구현예에서, L₃은 결합이고, R₃은 에틸렌이고, X₂는 S이고, 그리고 R₄ 및 R₅ 각각은 메틸이다.또 다른 구현예에서, L₃은 결합이고, R₃은 n-프로필렌이고, X₂는 S이고, R₄ 및 R₅ 각각은 메틸이다.또 다른 구현예에서, L₃은 결합이고, R₃은 에틸렌이고, X₂는 S이고, 그리고 R₄ 및 R₅ 각각은 에틸이다.

숙련가에 의해 인정된 바와 같이, 식 II 및 III의 화합물은 또한 본 개시내용의 범주 내에 있는 염을 형성한다. 본 명세서에서의 식 II 및 III의 화합물에 대한 언급은 달리 나타내지 않는 한 그의 염에 대한 언급을 포함하는 것으로 이해된다. 본 명세서에서 이용된 바와 같은 용어 "염(들)"은 무기 및/또는 유기 산으로 형성된 산성 염뿐만 아니라 무기 및/또는 유기 염기로 형성된 염기성 염을 의미한다. 또한, 식 II 또는 III의 화합물이 염기성 모이어티, 예컨대, 비제한적으로, 피리딘 또는 이미다졸, 및 산성 모이어티, 예컨대, 비제한적으로, 카복실산을 함유하는 경우, 쯔비터이온 ("분자내 염")이 형성될 수 있고 본 명세서에서 사용된 바와 같은 용어 "염(들)"에 포함된다. 다른 염이 또한 유용하지만, 염은 약제학적으로 허용되는 (즉, 무독성, 생리적으로 허용되는) 염일 수 있다. 식 II 또는 III의 화합물의 염은 예를 들어 식 II 또는 III의 화합물을 염이 침전하는 것과 같은 매질에서 또는 수성 매질에서 산 또는 염기의 양, 예컨대 동등량과 반응시키고 이어 동결 건조시킴에 의해 형성될 수 있다.

예시적인 산 부가 염은 아세테이트, 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤조에이트, 벤젠설포네이트, 바이설페이트, 보레이트, 부티레이트, 시트레이트, 캄포레이트, 캄포르설포네이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 푸마레이트, 글루코헵타노에이트, 글리세로포스페이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로클로라이드, 하이드로브로마이드, 하이드로아이오다이드, 2-하이드록시에탄설포네이트, 락테이트, 말레에이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 옥살레이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 살리실레이트, 석시네이트, 설페이트, 설포네이트 (예컨대 본 명세서에서 언급된 것들), 타르타레이트, 티오시아네이트, 톨루엔설포네이트 (토실레이트로도 알려져 있음) 운데카노에이트, 및 기타 동종의 것을 포함한다. 추가로, 염기성 약제학적 화합물로부터 약제학적으로 유용한 염의 형성에 적합한 것으로 일반적으로 간주되는 산은, 예를 들어, S. Berge et al, J. Pharmaceutical Sciences (1977) 66(1)1-19; P. Gould, International J. Pharmaceutics (1986) 33 201-217; Anderson et al, The Practice of Medicinal Chemistry (1996), Academic Press, New York; 및 The Orange Book (그것의 웹사이트 상의 Food & Drug Administration, Washington, D.C.)에 논의되어 있다. 이들 개시내용은 본 명세서에 참고로 편입된다.

예시적인 염기성 염은 암모늄 염, 알칼리 금속 염 예컨대 나트륨, 리튬, 및 칼륨 염, 알칼리 토금속 염 예컨대 칼슘 및 마그네슘 염, 유기 염기를 갖는 염 (예를 들어, 유기 아민) 예컨대 벤자틴, 디사이클로헥실아민, 하이드라바민 (N,N-비스(데하이드로아비에틸)에틸렌디아민으로 형성됨), N-메틸-D-글루카민, N-메틸-D-글루카미드, t-부틸 아민, 및 아미노산 예컨대 아르기닌, 라이신을 갖는 염, 및 기타 동종의 것을 포함한다. 염기성 질소-함유 기는 저급 알킬 할라이드 (예를 들어, 메틸, 에틸, 프로필, 및 부틸 염화물, 브로마이드, 및 아이오다이드), 디알킬 설페이트 (예들 들어, 디메틸, 디에틸, 디부틸, 및 디아밀 설페이트), 장쇄 할라이드 (예를 들어, 데실, 라우릴, 미리스틸, 및 스테아릴 염화물, 브로마이드, 및 아이오다이드), 아릴알킬 할라이드 (예를 들어, 벤질 및 펜에틸 브로마이드), 및 기타와 같은 제제로 사차화될 수 있다.

모든 그와 같은 산 및 염기 염은 본 개시내용의 범위 내의 약제학적으로 허용가능한 염인 것으로 의도되고 모든 산 및 염기 염은 본 개시내용의 목적에 상응하는 화합물의 유리 형태에 동등한 것으로 간주된다. 식 II 또는 III의 화합물은 수화된 형태를 포함하여 불용매화된 및 용매화된 형태로 존재할 수 있다. 일반적으로, 약제학적으로 허용가능한 용매 예컨대 물, 에탄올, 및 동종의 것으로 용매화된 형태는 본 개시내용의 목적에 대해 불용매화된 형태에 동등하다. 식 II 또는 III의 화합물 및 이들의 염, 용매화물은 그것의 호변이성질체 형태로 (예를 들어, 아미드 또는 이미노 에테르로) 존재할 수 있다. 모든 그와 같은 호변이성질체 형태는 본 개시내용의 일부로 본 명세서에서 고려된다.

본 명세서에 기재된 양이온성 지질 화합물은 본 발명의 번역가능 화합물과 조합되어 극미립자, 나노입자, 리포좀, 또는 교질입자를 형성할 수 있다. 입자, 리포좀, 또는 교질입자에 의해 전달되는 본 발명의 번역가능 화합물은 가스, 액체, 또는 고체의 형태로 될 수 있다. 양이온성 지질 화합물 및 번역가능 화합물은 다른 양이온성 지질 화합물, 폴리머 (합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질, 등과 조합되어 입자를 형성할 수 있다. 이들 입자는 그런 다음 선택적으로 약제학적 부형제와 조합되어 약제학적 조성물을 형성할 수 있다.

특정 구현예에서, 양이온성 지질 화합물은 상대적으로 비-세포독성이다. 양이온성 지질 화합물은 생체적합성 및 생분해성일 수 있다. 양이온성 지질은 대략 5.5 내지 대략 7.5, 더 바람직하게는 대략 6.0과 대략 7.0 사이의 범위인 pKa를 가질 수 있다. 대략 3.0 내지 대략 9.0 사이, 또는 대략 5.0 내지 대략 8.0 사이의 원하는 pKa를 가지도록 설계될 수 있다.

양이온성 지질 화합물을 함유하는 조성물은 30-70% 양이온성 지질 화합물, 0-60% 콜레스테롤, 0-30% 인지질 및 1-10% 폴리에틸렌 글리콜 (PEG)일 수 있다. 바람직하게는, 본 조성물은 30-40% 양이온성 지질 화합물, 40-50% 콜레스테롤, 및 10-20% PEG이다. 다른 바람직한 구현예에서, 본 조성물은 50-75% 양이온성 지질 화합물, 20-40% 콜레스테롤, 및 5 내지 10% 인지질, 및 1-10% PEG이다. 본 조성물은 60-70% 양이온성 지질 화합물, 25-35% 콜레스테롤, 및 5-10% PEG를 함유할 수 있다. 본 조성물은 최대 90% 양이온성 지질 화합물 및 2 내지 15% 헬퍼 지질을 함유할 수 있다. 본 제형은, 예를 들어 8-30% 화합물, 5-30% 헬퍼 지질, 및 0-20% 콜레스테롤; 4-25% 양이온성 지질, 4-25% 헬퍼 지질, 2 내지 25% 콜레스테롤, 10 내지 35% 콜레스테롤-PEG, 및 5% 콜레스테롤-아민; 또는 2-30% 양이온성 지질, 2-30% 헬퍼 지질, 1 내지 15% 콜레스테롤, 2 내지 35% 콜레스테롤-PEG, 및 1-20% 콜레스테롤-아민; 또는 최대 90% 양이온성 지질 및 2-10% 헬퍼 지질, 또는 더욱이는 100% 양이온성 지질을 함유하는 지질 입자 제형일 수 있다.

일부 구현예에서, 하나 이상의 콜레스테롤-계 지질은 콜레스테롤, 페길화된 콜레스테롤 및 DC-Chol (N,N-디메틸-N-에틸카복사미도콜레스테롤), 및 1,4-비스(3-N-올레일아미노-프로필)피페라진으로부터 선택된다. 예시적인 구현예에서, 콜레스테롤-계 지질은 콜레스테롤이다.

일부 구현예에서, 하나 이상의 페길화된 지질, 즉, PEG-변형된 지질. 일부 구현예에서, 하나 이상의 PEG-변형된 지질은 C₆-C₂₀ 길이의 알킬 사슬(들)을 갖는 지질에 공유결합된 최대 5 kDa 길이의 폴리(에틸렌) 글리콜 사슬을 포함한다. 일부 구현예에서, PEG-변형된 지질은 유도된 세라미드 예컨대 N-옥타노일-스핑고신-1-[석시닐(메톡시 폴리에틸렌 글리콜)-2000]이다. 일부 구현예에서, PEG-변형된 또는 페길화된 지질은 페길화된 콜레스테롤 또는 디미리스토일글리세롤 (DMG)-PEG-2K이다. 예시적인 구현예에서, PEG-변형된 지질은 페길화된 콜레스테롤이다.

추가 구현예에서, 약제학적 조성물은 바이러스 또는 박테리아 벡터 내에 올리고머성 화합물을 함유할 수 있다.

본 개시내용의 약제학적 조성물은 당해 기술에 공지되어 있는 바와 같은 캐리어, 희석제 또는 부형제를 포함할 수 있다. 약제학적 조성물 및 방법의 예는, 예를 들어, Remington's Pharmaceutical Sciences, Mack Publishing Co. (A.R. Gennaro ed. 1985), 및 Remington, The Science and Practice of Pharmacy, 21st Edition (2005)에 기재되어 있다.

약제학적 조성물에 대한 부형제의 예는 산화방지제, 현탁화제, 분산제, 보존제, 완충제, 긴장제, 및 계면활성제를 포함한다.

본 발명의 제제 또는 약제학적 제형의 효과적인 용량은 세포에서 번역가능 분자의 번역을 야기하기에 충분한 양일 수 있다.

치료적으로 효과적인 용량은 치료적 효과를 야기하기에 충분한 제제 또는 제형의 양일 수 있다. 치료적으로 효과적인 용량은 하나 이상의 개별 투여 및 상이한 경로로 투여될 수 있다. 당업계에서 이해되는 바와 같이, 치료적으로 효과적인 용량 또는 치료 유효량은 본 발명의 약제학적 조성물에 함유된 치료제의 총량을 기준으로 대부분 결정된다. 일반적으로, 치료 유효량은 대상체에게 의미있는 이익 (예를 들어, GSD III를 치료, 조절, 치유, 예방 및/또는 개선하는 것)을 달성하기에 충분하다. 예를 들어, 치료 유효량은 원하는 치료적 및/또는 예방적 효과를 달성하기에 충분한 양일 수 있다. 일반적으로, 그것을 필요로 하는 대상체에게 투여되는 치료제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 양은 대상체의 특성에 따라 달라질 것이다. 그와 같은 특성은 대상체의 상태, 질환 중증도, 일반적인 건강상태, 연령, 성별 및 체중을 포함한다. 당해 분야의 숙련가는 이들 및 다른 관련 인자에 따라 적절한 투약량을 쉽게 결정할 수 있을 것이다. 또한, 최적의 투약 범위를 확인하기 위해 객관적 및 주관적 분석 둘 모두가 사용될 수 있다.

본 명세서에 제공된 방법은 본 명세서에 기재된 치료 유효량의 번역가능 화합물 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 단일뿐만 아니라 다중 투여를 고려한다. AGL을 인코딩하는 번역가능 화합물을 포함하는 약제학적 조성물은 대상체 상태의 본질, 심각성 및 정도 (예를 들어, 대상체의 GSD III 질환 상태의 심각성 및 GSD III의 관련 증상, 및/또는 대상체의 AGL 활성 수준)에 따라 규칙적인 간격으로 투여될 수 있다. 일부 구현예에서, 본 발명의 번역가능 화합물 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 치료 유효량은 규칙적 간격으로 주기적으로 (예를 들어, 매년 1회, 6 개월마다 1회, 4개월마다 1회, 3개월마다 1회, 2 개월마다 1회, 월 1회), 격주로, 매주, 매일, 1일 2회, 1일 3회, 1일 4회, 1일 5회, 1일 6회, 또는 계속해서 투여될 수 있다.

일부 구현예에서, 본 발명의 약제학적 조성물은 이들이 함유된 AGL을 인코딩하는 번역가능 화합물의 서방형 방출에 적합하도록 제형화된다. 이러한 서방형 방출 조성물은 연장된 투약 간격으로 대상체에게 편리하게 투여될 수 있다. 예를 들어, 일 구현예에서, 본 발명의 약제학적 조성물은 1일 2회, 매일 또는 격일로 대상체에게 투여된다. 일부 구현예에서, 본 발명의 약제학적 조성물은 일주일에 2회, 일주일에 1회, 10일마다, 2주마다, 28일마다, 매달, 6주마다, 8주마다, 격월마다, 3개월마다, 4개월마다, 6개월마다, 9개월마다 또는 1년에 1회 대상에게 투여된다. 또한, 장기간에 걸쳐 AGL을 인코딩하는 번역가능 화합물을 전달 또는 방출하기 위해 데포 투여 (예를 들어, 피하로, 근육내로)로 제형화된 약제학적 조성물이 본 명세서에서 고려된다. 바람직하게는, 이용된 서방형 방출 수단은 안정성을 향상시키기 위해 AGL을 인코딩하는 번역가능 화합물에 대해 이루어진 변형과 조합된다.

일부 구현예에서, 치료적으로 효과적인 용량은 투여 시 1-1000 pg/ml, 또는 1-1000 ng/ml, 또는 1-1000 ㎍/ml, 또는 그 초과의 AGL의 혈청 또는 혈장 수준을 초래할 수 있다.

일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료된 대상체에서 증가된 간 AGL 단백질 수준을 초래할 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서 기준선 AGL 단백질 수준에 비하여 간 AGL 단백질 수준에서 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95% 증가율을 초래한다. 특정 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 이전의 대상체에서 기준선 간 AGL 수준에 비하여 간 AGL 수준에서 증가를 초래할 것이다. 일부 구현예에서, 기준선 간 AGL 수준에 비한 간 AGL 수준에서의 증가는 적어도 5%, 10%, 20%, 30%, 40%, 50%, 100%, 200%, 또는 그 초과일 것이다.

일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료 이전 기준선 수준에 비교할 때 간에서 AGL의 증가된 발현을 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료된 대상체의 간에서 총 단백질의 약 10 ng/mg, 약 20 ng/mg, 약 50 ng/mg, 약 100 ng/mg, 약 150 ng/mg, 약 200 ng/mg, 약 250 ng/mg, 약 300 ng/mg, 약 350 ng/mg, 약 400 ng/mg, 약 450 ng/mg, 약 500 ng/mg, 약 600 ng/mg, 약 700 ng/mg, 약 800 ng/mg, 약 900 ng/mg, 약 1000 ng/mg, 약 1200 ng/mg 또는 약 1500 ng/mg 또는 그 이상의 AGL 단백질 수준의 발현을 초래한다.

일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 알라닌 아미노전이효소 (ALT), 아스파르테이트 아미노전이효소 (AST), 알칼리성 포스파타제 (ALP), 크레아틴 포스포키나제 (CPK), 글리코겐, 및 제한 덱스트린 (즉, 글리코겐의 가수분해에 의해 생산된 저-분자 탄수화물)으로부터 선택된 마커 중 하나 이상의 감소된 수준을 초래할 것이다.

일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 ALT, AST, ALP, 및/또는 CPK 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT, AST, ALP, 및/또는 CPK 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT, AST, ALP, 및/또는 CPK 수준의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 혈장, 혈청, 전혈, 소변, 또는 뇌척수액으로부터 선택된다.

특정 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 혈청 또는 혈장 샘플에서, 예를 들어, ALT 활성/리터 (U/l)의 단위로 측정될 때, ALT 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT 수준의 감소를 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT 수준에 비교할 때 적어도 약 50%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT 수준의 감소를 초래한다. 추가 예시적인 구현예에서, ALT 수준은 공복 후, 예를 들어, 6, 8, 10, 12, 18, 또는 24 시간 공복 후에 측정된다.

다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 혈청 또는 혈장 샘플에서, 예를 들어, AST 활성/리터 (U/l)의 단위로 측정될 때, AST 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 AST 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 AST 수준의 감소를 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 AST 수준에 비교할 때 적어도 약 50%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 AST 수준의 감소를 초래한다. 추가 예시적인 구현예에서, AST 수준은 공복 후, 예를 들어, 6, 8, 10, 12, 18, 또는 24 시간 공복 후에 측정된다.

ALT, AST, ALP, 및/또는 CPK 수준의 측정은 당해 분야에 알려진 임의의 방법을 사용하여, 예를 들어, Liu et al., 2014, Mol Genet and Metabolism 111: 467-76에 설명된 Fuji Dri-Chem Clinical Chemistry Analyzer FDC 3500을 사용하여 이루어질 수 있다.

다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 글리코겐 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 글리코겐 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 간 샘플)에서 글리코겐 축적의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 간, 심장, 횡격막, 사두근, 및 비복근으로부터 선택된 장기의 부분이다. 예시적인 구현예에서, 생물학적 샘플은 간 분절, 예를 들어, 간세포의 영역이다.

다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 한계 덱스트린 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 한계 덱스트린 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 간 샘플)에서 한계 덱스트린 축적의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 간, 심장, 횡격막, 사두근, 및 비복근으로부터 선택된 장기의 부분이다. 예시적인 구현예에서, 생물학적 샘플은 간 분절, 예를 들어, 간세포의 영역이다. 추가 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료 전 기준선 한계 덱스트린 수준에 비교할 때 간 샘플에서 한계 덱스트린 수준의 적어도 50%, 60%, 70%, 또는 80% 감소를 초래한다.

추가 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료된 대상체에서 간 섬유증의 발병을 지연시킨다. 일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 간 섬유증의 전개를 늦추거나 또는 GSD III에 시달리는 대상체에서 간 섬유증의 양을 감소시킨다.

활성제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 생체내 치료적으로 효과적인 용량은 약 0.001 내지 약 500 mg/kg 체중의 용량일 수 있다. 예를 들어, 치료적으로 효과적인 용량은 약 0.001-0.01 mg/kg 체중, 또는 0.01-0.1 mg/kg, 또는 0.1-1 mg/kg, 또는 1-10 mg/kg, 또는 10-100 mg/kg일 수 있다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 약 0.1 내지 약 10 mg/kg 체중, 예를 들어, 약 0.5 내지 약 5 mg/kg, 약 1 내지 약 4.5 mg/kg, 또는 약 2 내지 약 4 mg/kg의 범위인 용량 제공된다

활성제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 생체내 치료적으로 효과적인 용량은 적어도 약 0.001 mg/kg 체중, 또는 적어도 약 0.01 mg/kg, 또는 적어도 약 0.1 mg/kg, 또는 적어도 약 1 mg/kg, 또는 적어도 약 2 mg/kg, 또는 적어도 약 3 mg/kg, 또는 적어도 약 4 mg/kg, 또는 적어도 약 5 mg/kg, 적어도 약 10 mg/kg, 적어도 약 20 mg/kg, 적어도 약 50 mg/kg, 또는 그 초과의 용량일 수 있다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 약 0.1 mg/kg, 약 0.5 mg/kg, 약 1 mg/kg, 약 1.5 mg/kg, 약 2 mg/kg, 약 2.5 mg/kg, 약 3 mg/kg, 약 3.5 mg/kg, 약 4 mg/kg, 약 5 mg/kg, 또는 약 6, 7, 8, 9, 10, 15, 20, 25, 50, 75, 또는 100 mg/kg의 용량으로 제공된다.

본 명세서에서 도시된 핵염기 서열은 달리 언급되지 않는 한 좌측에서 우측으로 5'에서 3'이다.

형질감염

일부 실험에서, 번역가능 메신저 분자는 96웰 플레이트에서 Hepa1-6 또는 AML12 세포 안으로 형질감염된다. MessengerMAX 형질감염 시약 (Thermo Fisher Scientific)이 모든 형질감염에 대해 제조자의 지침에 의해 사용되었다. 다른 적합한 세포주는 HEK293 및 Hep3B 세포를 포함한다.

시험관내 형질감염 프로토콜의 예는 아래와 같다:

형질감염 적어도 8 시간 전에 96웰 플레이트에 웰당 간세포 Hepa1-6 세포 5000 세포를 도말한다.

형질감염 실험을 개시하기 직전 96웰 플레이트의 각 웰에 90 μL를 부가하여 10% FBS 및 비-필수 아미노산)을 함유하는 90 μL DMEM 배지를 교체한다.

제조자의 지침에 따라 MessengerMAX 형질감염 시약 (Thermo Fisher Scientific) 번역가능 분자 복합체를 제조한다.

10 μL의 복합체를 96-웰 플레이트에 세포를 함유하는 웰 안으로 옮긴다.

원하는 시점 후 배지를 수집하고 각 웰에 100 μL 신선한 배지를 부가한다. 배지는 표준 제조자 프로토콜을 사용하여 AGL에 대한 ELISA 검정을 수행할 때까지 -80℃로 유지될 것이다.

생체내 형질감염 프로토콜의 예는 아래와 같다:

번역가능 분자는 나노입자로 제형화된다.

측면 꼬리 정맥에 표준 i.v. 주사를 통해 나노입자-제형화된 번역가능 분자 (1 mg/kg)를 BL57BL/c 마우스 (4-6 주령)에 주입한다.

주사 후 적합한 시간에 헤파린-코팅된 마이크로원심관에 대략 50 ㅅL의 혈액을 수집한다.

3,000 X g에서 10 분 동안 4℃에서 원심분리한다.

상청액 (혈장)은 신선한 마이크로원심관 안으로 옮긴다. 혈장은 표준 제조자 프로토콜을 사용하여 AGL에 대한 ELISA 검정을 수행할 때까지 -80℃로 유지될 것이다.

나노입자 제형

지질 나노입자는 mRNA를 함유하는 에탄올/수성 완충액에서 적절한 용적의 지질을 사용하여 mRNA를 함유하여 제조될 수 있다. Nanossemblr 미세유체 디바이스는 이러한 목적을 위해 사용될 수 있고, 이어서 다운스트림 처리가 이어진다. 예를 들어, 나노입자를 제조하기 위해, 원하는 양의 표적화된 mRNA를 5mM 시트르산 완충액 (pH 3.5)에 용해시킬 수 있다. 지질은 에탄올에 적절한 몰비로 용해될 수 있다. 구성성분 지질에 대한 몰 백분율 비는, 예를 들어, 50% 이온화가능 지질, 7% DSPC (1,2-디스테아로일-sn-글리세로-3-포스포콜린; 아반티 극성 지질), 40% 콜레스테롤 (아반티 극성 지질), 및 3% DMG-PEG (1,2-디미리스토일-sn-글리세롤, 메톡시폴리에틸렌 글리콜, PEG 사슬 분자량: 2000; NOF America Corporation)일 수 있다. 다음으로, 지질 및 mRNA 용액은 1:3 (에탄올:수성상)의 유량비로 미세유체 장치 (Precision NanoSystems)에 조합될 수 있다. 총 조합된 유량은 12 mL/분일 수 있다. 지질 나노입자가 형성되고 투석 장치 (Float-a-lyzer, Spectrum Labs)에서 인산염 완충액을 사용하여 밤새 투석하고, 이어서 Amicon Ultra-15 원심 필터 (Merck Millipore)를 사용하여 농축함에 의해 후속적으로 정제될 수 있다. 입자 크기는 동적 광 산란 (ZEN3600, Malvern Instruments)에 의해 결정될 수 있다. "캡슐화" 효율은 RiboGreen (Molecular Probes)을 LNP 슬러리 (Fi)에 첨가할 때 형광에 의해 측정된 캡슐화되지 않은 mRNA 함량을 결정함에 의해 계산될 수 있고; 이어서, 값을 1% Triton X-100 (Ft)에 의해 LNP의 용해시 수득된 총 mRNA 함량과 비교하였으며, 여기서 "캡슐화"의 백분율 = (Ft-Fi)/Ft x 100이다. 캡슐화는 형태에 무관하게 나노 입자에 mRNA의 봉입을 지칭할 수 있다.

세포내 웨스턴

96-웰 콜라겐 플레이트를 사용하여 DMEM/FBS 배양 배지에서 세포를 적절한 밀도로 시딩하였다. 최적의 합류점에서, 세포를 형질감염 시약 혼합물 (MessengerMax 및 Opti-MEM)에 희석된 표적화된 mRNA로 형질감염시켰다. 세포를 CO2 인큐베이터에 배치하고 성장시켰다. 원하는 시점에, 배지를 제거하고 세포를 20분 동안 4% 신선한 PFA에 고정시켰다. 그 후, 고정제를 제거하고 세포를 TBST에서 5분 동안 여러 번 투과시켰다. 투과화 세정이 완료되면, 세포를 차단 완충액과 함께 45분 동안 인큐베이션하였다. 이어서 일차 항체를 첨가하고 실온에서 1시간 동안 인큐베이션하였다. 그 후, 세포를 TBST로 수회 세정하고, 그 다음 차단 완충액에 희석되고 CellTag 700 염색을 함유하는 이차 항체와 함께 1시간 동안 인큐베이션하였다. 최종적으로 하기 위해, 세포를 TBST에서 수회 세정하고 그 다음 TBS에서 마지막 세정하였다. 그런 다음, Licor 검출 시스템을 사용하여 플레이트를 이미지화하고, CellTag 700으로 라벨링된 총 세포의 수로 데이터를 표준화하였다.

꼬리 PCR 생성물 생성

각각의 mRNA 발현 작제물을 함유하는 플라스미드 DNA (10 ng)가 제조자의 지침에 따라 2X KAPA HiFi PCR 믹스 (KR0370)와의 50 μl PCR 반응에서 polyA 꼬리 120 PCR 생성물을 생성하는 데 사용될 수 있다. 그런 다음 Thermo Fisher Scientific으로부터의 2% 겔 상에서 생성물이 검사될 수 있고 저분자량 사다리 (Thermo Fisher Scientific, 10068-013)의 강도를 기준으로 대략 정량화되고 Qiagen PCR 정제 키트로 세정되고 50ul 물에서 재현탁될 수 있다.

합성을 위한 시험관내 전사 (IVT)

하기 프로토콜은 약 1 mg의 RNA를 생성해야 하는 NEB HiScribe T7 RNA 중합효소 시약을 사용한 200 μl IVT 반응에 대한 것이다. 2.5X NTP 믹스는 필요에 따라 개별 100mM NTP 스톡 (ATP, GTP, CTP 및 UTP 뉴클레오타이드 또는 화학적으로 변형된 대응물)을 해동하고 함께 모아서 제조되었다. IVT 반응의 경우, 약 2-4 μg의 템플레이트가 200 μl 반응에 사용되었다. 10X IVT 반응 완충제, 2.5X dNTP 믹스, 템플레이트 DNA 및 T7 RNA 중합효소는 피펫팅에 의해 잘 혼합되고 37℃에서 4시간 동안 인큐베이션된다. DNA 템플레이트를 분해하기 위해, IVT 반응을 700ul의 뉴클레아제가 없는 물에 희석하고 그 다음 10X DNase I 완충액 및 20ul의 RNase가 없는 DNase I을 IVT 믹스에 첨가하고 15분 동안 37℃에서 인큐베이션한다. 그런 다음 희석된 (1ml까지) DNase 처리된 반응은 제조자의 지침에 따라 RNase가 없는 물에서 최종 용출로 Qiagen RNeasy Maxi 컬럼으로 정제된다. 정제된 RNA는 그 다음 사용된 재현탁 완충액에 따라, A260/A280이 약 1.8-2.2이어야 하는 UV 흡광도에 의해 정량화된다.

IVT RNA의 효소적 캡핑

효소적 캡핑을 위해, 50X 확장된 버전의 NEB의 1-단계 캡핑 및 2'O-메틸화 반응이 사용될 수 있으며, 이는 최대 1mg의 IVT 전사체를 처리하는 데 적합하다. 전사체 길이가 100 nt 정도로 짧다는 가정하에 20 μl 반응에서 10 μg RNA가 권장된다. 그러나, 전사체에 대해 더 높은 기질-대-반응 용적이 허용가능하며, 이는 일반적으로 길이가 더 길다 (약 300-600nt). 캡핑 반응을 개시하기 전에, RNA는 65℃에서 5분 동안 변성되고, 그 다음 스냅 냉각되어 임의의 이차 형태를 완화시킨다. 총 1 ml 캡핑 반응을 위해, 700 μl의 뉴클레아제가 없는 물에 변성된 RNA 1 mg가 100 μl (10X) 캡핑 완충액, 50 μl (10 mM) GTP, 50 μl (4 mM) SAM, 50 μl의 (10 U/μl) 백시니아 캡핑 효소 및 50 μl의 mRNA cap 2'-O-메틸전달효소와 함께 (50 U/μl)에서 사용되고 조합되고 37℃에서 1시간 동안 인큐베이션되었다. 수득한 캡핑된 mRNA를 RNase 유리수를 사용하여 용리시키고, RNeasy 컬럼에서 재정제하고, 나노드롭으로 정량화하였다. mRNA는 또한 변성 및 스냅-냉각 후 변성 겔에서 레인 당 500 ng의 정제된 생성물을 실행시킴에 의해 겔 상에서 시각화하여 이차 구조를 제거한다.

실시예

실시예 1: 참조 번역가능 분자 534.

이 실시예에서, 참조 번역가능 분자 534를 제작하여 인간 WT 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현시키기 위해 사용하였다. 번역가능 분자는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, WT AGL CDS (서열번호 1), 제노푸스 베타-글로빈의 3'UTR, 및 114 As로 구성된 폴리(A) 꼬리 영역 (즉, "폴리(A) 114 꼬리 영역")을 포함했다. 참조 번역가능 분자는 AGL CDS의 즉시 다운스트림인 서열번호 40의 서열을 더 포함했다. 이 참조 번역가능 분자는 우리딘 대신에 N¹-메틸슈도우리딘으로 합성되었다.

이 참조 번역가능 분자의 구조의 세부사항은 아래와 같다: 서열번호 3의 담배 식각 바이러스 (TEV) 5' UTR, 서열번호 4의 코작 서열, 서열번호 5의 제노푸스 베타-글로빈 (XBG) 3' UTR, 및 서열번호 6의 폴리(A) 114 꼬리.

하기 실시예에서 번역가능 분자는 m7GpppGm cap인 5' cap으로 합성될 수 있다. 하기 실시예에서 번역가능 분자는 5'-UTR (예를 들어, TEV (서열번호 3)의 5' UTR), 번역 개시 서열 (예를 들어, 서열번호 4의 코작 서열), 서열번호 40의 서열, 3' UTR (예를 들어, 제노푸스 베타-글로빈 (서열번호 5)의 3' UTR), 및 폴리(A) 꼬리 (예를 들어, 서열번호 6, 서열번호 38, 또는 서열번호 39의 polyA 꼬리)를 함유할 수 있다.

실시예 2: AGL을 인코딩하는 번역가능 분자.

이 실시예에서, 번역가능 분자 522-533, 546, 730-740, 및 1783-1784를 제작하여 유익하게 상승된 번역의 효능으로 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현시키기 위해 사용하였다. 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현하는 이들 번역가능 분자는 GSD III을 개선하거나 또는 치료하는 방법에 사용하기에 적합한 활성을 나타냈다. 이들 번역가능 분자는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, AGL CDS, 및 제노푸스 베타-글로빈의 3'UTR을 포함했다. 번역가능 분자 522-533, 546, 및 1783-1784는 폴리(A) 114 꼬리 영역을 더 포함한다. 번역가능 분자 730은 폴리(A) 100 꼬리 영역을 더 포함하고, 반면에 번역가능 분자 731-740은 폴리(A) 110 꼬리 영역을 더 포함한다. 번역가능 분자 522-533, 546, 730-740, 및 1783-1784는 AGL CDS의 즉시 다운스트림인 서열번호 40의 서열을 더 포함한다. 폴리(A) 114 꼬리 영역과는 대조적으로 폴리(A) 100 꼬리 영역을 함유하는 것을 제외하고, 각각 546 및 1783과 동일한 2개의 추가의 번역가능 분자 - 2258 및 2259 -가 전개되었다. 1783 및 2259의 코딩 서열은 서열번호 45에서 반영된 바와 같이 12개 뉴클레오타이드 차이를 함유하도록 선택적으로 변형될 수 있다. 이 실시예에서 기재된 번역가능 분자는 우리딘 대신에 N¹-메틸슈도우리딘으로 합성되었다.

각각의 번역가능 분자에서 AGL CDS는 하기 서열로 구성된다:

본 실시예의 번역가능 분자는 AML12 및 C2C12 세포에서 번역되어 인간 AGL을 생산했다.

실시예 3: 제노푸스 베타-글로빈 3'UTR에 기초한 번역 향상제.

이 실시예에서, 번역가능 분자의 번역 효율을 향상시키는 데 사용하기 위한 3' UTR 서열의 구조가 도시되어 있다.

서열번호 33-37에 도시된 염기 서열은 기능성에서 제노푸스 베타-글로빈의 3'-UTR에 상응할 수 있는 번역가능 분자의 부분이다. 완전한 번역가능 분자는 5' cap (m7GpppGm), 5'-UTR, 및 하기 서열의 코딩 영역 (CDS) 업스트림, 및 하기 서열의 polyA 꼬리 다운스트림을 포함하고, 그 각각은 천연 인간 mRNA의 구조에 상응한다. 상기에서 나타낸 바와 같이, 코작 서열이 선택적으로 사용될 수 있다. 따라서, 하기 단편을 편입한 번역가능 분자는 향상된 번역 효율을 가질 수 있다. 제노푸스 베타-글로빈 유전자 서열은 수탁 번호 NM_001096347.1에 도시되어 있다.

실시예 4: 인간 일차 간세포에서 AGL 발현

이 실시예에서, 인간 일차 간세포는 코돈-최적화된 mRNA 분자 546, 1783, 및 1784로 형질감염되었다. AGL 단백질 발현은 형질감염 6, 24, 48, 및 72 시간 후에서 In-Cell Western^TM에 의해 측정되었다. 미처리된 대조군 ("unt")과 비교될 때 mRNA 서열의 발현은 도 5에 도시되어 있다.

실시예 5: 야생형 마우스에서 AGL 단백질 발현의 생체내 분석

이 실시예에서, 야생형 C57BL/6 마우스에 지질 나노입자로 제형화된 인간 AGL mRNA를 주입했다. 마우스를 주사 6 시간 후 희생시켰다. 간 생검 샘플을 마우스로부터 취하고, 간 균질물에서 인간 및 마우스 AGL 단백질 발현을 분석하였다. 도 6은 다양한 mRNA 분자로부터 인간 AGL 단백질의 이소성 발현을 도시한다. 도 7은 처리된 마우스에 걸쳐 마우스 AGL 단백질의 내인성 발현의 유사한 수준을 나타내는, 마우스 AGL 단백질 수준을 도시한다. 번역가능 분자 546.7 -도 6 및 7에서 나타낸 바와 같음-은 번역가능 분자 546에 동일한 핵염기 서열을 가지지만, N¹-메틸슈도우리딘 대신에 우리딘의 위치에 5-메톡시우리딘으로 합성되었다.

실시예 6: mRNA 처리는 GSD3 마우스에서 글리코겐 축적을 감소시킨다

이 실시예에서, AGL 넉아웃 마우스를 비히클 또는 ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리하였다. 비히클로 처리된 넉아웃 마우스 ("VEH")로부터의 간은 간세포의 현저한 내지 중증 공포화 및 간세포 내의 글리코겐 축적에서 중간 내지 현저한 증가를 나타냈다 (도 8). 그에 반해서, ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리된 넉아웃 마우스로부터의 간은 단지 간세포의 경도 내지 중간 정도 공포화 및 간세포 내의 글리코겐 축적에서 단지 경도 내지 중간 정도 증가를 가졌다 (도 9). 이 실시예에서 나타난 조직병리 결과에 기초하여, 비히클로 처리된 KO 마우스와 비교하여 mRNA로 처리된 넉아웃 마우스로부터의 간에서의 간세포 공포화 및 글리코겐 축적의 중증도에서의 감소가 있는 것으로 보인다.

실시예 7: AGL을 발현하는 추가의 번역가능 분자

4개의 추가의 번역가능 분자 - 1970, 1987, SD1, 및 SD2 - 가 각각 서열번호 41, 42, 43, 및 44에 도시된 추가로 변형된 코돈-최적화된 인간 AGL 코딩 서열로 설계되었다. 번역가능 분자 1970, 1987, SD1, 및 SD2는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, 코딩 서열의 즉시 다운스트림 서열번호 40의 서열, 제노푸스 베타-글로빈의 3' UTR, 및 폴리(A) 꼬리 영역 (예를 들어, 폴리(A) 100, 110, 또는 114 꼬리 영역)을 더 포함한다. 이들 번역가능 분자는 우리딘의 위치에 N¹-메틸슈도우리딘 또는 5-메톡시우리딘 중 어느 하나로 선택적으로 합성될 수 있다.

본 명세서에 구체적으로 언급된 모든 공보, 특허 및 문헌은 모든 목적을 위해 참고로 포함된다.

본 발명은 다양할 수 있기 때문에 기재된 특정 방법론, 프로토콜, 물질 및 시약에 제한되지 않는 것으로 이해된다. 또한, 본 명세서에서 사용된 용어는 단지 특정 구현예들을 설명하기 위한 것이고, 첨부된 청구범위에 의해 포함될 본 발명의 범위를 제한하는 것으로 의도되지 않는다는 것을 이해해야 한다.

본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태는 문맥상 명백하게 다르게 지시되지 않는 한 복수의 참조를 포함한다는 것에 유의해야 한다. 또한, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용될 수 있다. 용어 "포함하다", "포함하는", "함유하는", "포괄하는" 및 "갖는"은 상호교환적으로 사용될 수 있음을 또한 유의해야 한다.

추가의 부연 없이, 당 업계의 통상인은 상기 상세한 설명에 기초하여 본 발명을 최대한 정도로 활용할 수 있는 것으로 여겨진다. 이하 특정 구현예는 따라서 단지 예시적인 것으로 해석되어야 하며, 어떠한 방식으로 든 본 개시내용의 나머지를 제한하지 않는다.

본 명세서에 개시된 모든 특징들은 임의의 조합으로 결합될 수 있다. 본 명세서에 개시된 각각의 특징은 동일하거나, 동등하거나 또는 유사한 목적을 제공하는 대안적인 특징에 의해 대체될 수 있다.

<110> Ultragenyx Pharmaceutical Inc. <120> THERAPEUTICS FOR GLYCOGEN STORAGE DISEASE TYPE III <130> 2019-FPA-9715 <150> US 62/513,350 <151> 2017-05-31 <160> 45 <170> PatentIn version 3.5 <210> 1 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Consensus Human AGL Coding Sequence <400> 1 augggacaca guaaacagau ucgaauuuua cuucugaacg aaauggagaa acuggaaaag 60 acccucuuca gacuugaaca aggguaugag cuacaguucc gauuaggccc aacuuuacag 120 ggaaaagcag uuaccgugua uacaaauuac ccauuuccug gagaaacauu uaauagagaa 180 aaauuccguu cucuggauug ggaaaaucca acagaaagag aagaugauuc ugauaaauac 240 uguaaacuua aucugcaaca aucugguuca uuucaguauu auuuccuuca aggaaaugag 300 aaaaguggug gagguuacau aguuguggac cccauuuuac guguuggugc ugauaaucau 360 gugcuacccu uggacugugu uacucuucag acauuuuuag cuaaguguuu gggaccuuuu 420 gaugaauggg aaagcagacu uaggguugca aaagaaucag gcuacaacau gauucauuuu 480 accccauugc agacucuugg acuaucuagg ucaugcuacu cccuugccaa ucaguuagaa 540 uuaaauccug acuuuucaag accuaauaga aaguauaccu ggaaugaugu uggacagcua 600 guggaaaaau uaaaaaagga auggaauguu auuuguauua cugauguugu cuacaaucau 660 acugcugcua auaguaaaug gauccaggaa cauccagaau gugccuauaa ucuugugaau 720 ucuccacacu uaaaaccugc cugggucuua gacagagcac uuuggcguuu cuccugugau 780 guugcagaag ggaaauacaa agaaaaggga auaccugcuu ugauugaaaa ugaucaccau 840 augaauucca uccgaaaaau aauuugggag gauauuuuuc caaagcuuaa acucugggaa 900 uuuuuccaag uagaugucaa caaagcgguu gagcaauuua gaagacuucu uacacaagaa 960 aauaggcgag uaaccaaguc ugauccaaac caacaccuua cgauuauuca agauccugaa 1020 uacagacggu uuggcuguac uguagauaug aacauugcac uaacgacuuu cauaccacau 1080 gacaaggggc cagcagcaau ugaagaaugc uguaauuggu uucauaaaag aauggaggaa 1140 uuaaauucag agaagcaucg acucauuaac uaucaucagg aacaggcagu uaauugccuu 1200 uugggaaaug uguuuuauga acgacuggcu ggccaugguc caaaacuagg accugucacu 1260 agaaagcauc cuuuaguuac cagguauuuu acuuucccau uugaagagau agacuucucc 1320 auggaagaau cuaugauuca ucugccaaau aaagcuuguu uucugauggc acacaaugga 1380 uggguaaugg gagaugaucc ucuucgaaac uuugcugaac cggguucaga aguuuaccua 1440 aggagagaac uuauuugcug gggagacagu guuaaauuac gcuaugggaa uaaaccagag 1500 gacuguccuu aucucugggc acacaugaaa aaauacacug aaauaacugc aacuuauuuc 1560 cagggaguac gucuugauaa cugccacuca acaccucuuc acguagcuga guacauguug 1620 gaugcugcua ggaauuugca acccaauuua uauguaguag cugaacuguu cacaggaagu 1680 gaagaucugg acaaugucuu uguuacuaga cugggcauua guuccuuaau aagagaggca 1740 augagugcau auaauaguca ugaagagggc agauuaguuu accgauaugg aggagaaccu 1800 guuggauccu uuguucagcc cuguuugagg ccuuuaaugc cagcuauugc acaugcccug 1860 uuuauggaua uuacgcauga uaaugagugu ccuauugugc auagaucagc guaugaugcu 1920 cuaccaagua cuacaauugu uucuauggca uguugugcua guggaaguac aagaggcuau 1980 gaugaauuag ugccucauca gauuucagug guuucugaag aacgguuuua cacuaagugg 2040 aauccugaag cauugccuuc aaacacaggu gaaguuaauu uccaaagcgg cauuauugca 2100 gccaggugug cuaucaguaa acuucaucag gagcuuggag ccaaggguuu uauucaggug 2160 uauguggauc aaguugauga agacauagug gcaguaacaa gacacucacc uagcauccau 2220 cagucuguug uggcuguauc uagaacugcu uucaggaauc ccaagacuuc auuuuacagc 2280 aaggaagugc cucaaaugug caucccuggc aaaauugaag aaguaguucu ugaagcuaga 2340 acuauugaga gaaacacgaa accuuauagg aaggaugaga auucaaucaa uggaacacca 2400 gauaucacag uagaaauuag agaacauauu cagcuuaaug aaaguaaaau uguuaaacaa 2460 gcuggaguug ccacaaaagg gcccaaugaa uauauucaag aaauagaauu ugaaaacuug 2520 ucuccaggaa guguuauuau auucagaguu agucuugauc cacaugcaca agucgcuguu 2580 ggaauucuuc gaaaucaucu gacacaauuc aguccucacu uuaaaucugg cagccuagcu 2640 guugacaaug cagauccuau auuaaaaauu ccuuuugcuu cucuugccuc cagauuaacu 2700 uuggcugagc uaaaucagau ccuuuaccga ugugaaucag aagaaaagga agauggugga 2760 gggugcuaug acauaccaaa cuggucagcc cuuaaauaug caggucuuca agguuuaaug 2820 ucuguauugg cagaaauaag accaaagaau gacuuggggc auccuuuuug uaauaauuug 2880 agaucuggag auuggaugau ugacuauguc aguaaccggc uuauuucacg aucaggaacu 2940 auugcugaag uugguaaaug guugcaggcu auguucuucu accugaagca gaucccacgu 3000 uaccuuaucc cauguuacuu ugaugcuaua uuaauuggug cauauaccac ucuucuggau 3060 acagcaugga agcagauguc aagcuuuguu cagaaugguu caaccuuugu gaaacaccuu 3120 ucauuggguu caguucaacu guguggagua ggaaaauucc cuucccugcc aauucuuuca 3180 ccugcccuaa uggauguacc uuauagguua aaugagauca caaaagaaaa ggagcaaugu 3240 uguguuucuc uagcugcagg cuuaccucau uuuucuucug guauuuuccg cugcugggga 3300 agggauacuu uuauugcacu uagagguaua cugcugauua cuggacgcua uguagaagcc 3360 aggaauauua uuuuagcauu ugcggguacc cugaggcaug gacucauucc uaaucuacug 3420 ggugaaggaa uuuaugccag auacaauugu cgggaugcug ugugguggug gcugcagugu 3480 auccaggauu acuguaaaau gguuccaaau ggucuagaca uucucaagug cccaguuucc 3540 agaauguauc cuacagauga uucugcuccu uugccugcug gcacacugga ucagccauug 3600 uuugaaguca uacaggaagc aaugcaaaaa cacaugcagg gcauacaguu ccgagaaagg 3660 aaugcugguc cccagauaga ucgaaacaug aaggacgaag guuuuaauau aacugcagga 3720 guugaugaag aaacaggauu uguuuaugga ggaaaucguu ucaauugugg cacauggaug 3780 gauaaaaugg gagaaaguga cagagcuaga aacagaggaa ucccagccac accaagagau 3840 gggucugcug uggaaauugu gggccugagu aaaucugcug uucgcugguu gcuggaauua 3900 uccaaaaaaa auauuuuccc uuaucaugaa gucacaguaa aaagacaugg aaaggcuaua 3960 aagguaucau augaugagug gaacagaaaa auacaagaca acuuugaaaa gcuauuucau 4020 guuuccgaag acccuucaga uuuaaaugaa aagcauccaa aucugguuca caaacguggc 4080 auauacaaag auaguuaugg agcuucaagu ccuuggugug acuaucagcu caggccuaau 4140 uuuaccauag caaugguugu ggccccugag cucuuuacua cagaaaaagc auggaaagcu 4200 uuggagauug cagaaaaaaa auugcuuggu ccccuuggca ugaaaacuuu agauccagau 4260 gauaugguuu acuguggaau uuaugacaau gcauuagaca augacaacua caaucuugcu 4320 aaagguuuca auuaucacca aggaccugag uggcuguggc cuauugggua uuuucuucgu 4380 gcaaaauuau auuuuuccag auugaugggc ccggagacua cugcaaagac uauaguuuug 4440 guuaaaaaug uucuuucccg acauuauguu caucuugaga gauccccuug gaaaggacuu 4500 ccagaacuga ccaaugagaa ugcccaguac uguccuuuca gcugugaaac acaagccugg 4560 ucaauugcua cuauucuuga gacacuuuau gauuuauag 4599 <210> 2 <211> 1532 <212> PRT <213> Artificial Sequence <220> <223> Consensus Human AGL Amino Acid Sequence <400> 2 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 151015 151019 151024 151029 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 151034 151039 151044 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 151049 151054 151059 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 151064 151069 151074 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 151079 151084 151089 151094 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 151099 151104 151109 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 151114 151119 151124 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 151129 151134 151139 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 151144 151149 151154 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 151159 151164 151169 151174 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 151179 151184 151189 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 151194 151199 151204 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 151209 151214 151219 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 151224 151229 151234 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 151239 151244 151249 151254 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 151259 151264 151269 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 151274 151279 151284 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 151289 151294 151299 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 151304 151309 151314 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 151319 151324 151329 151334 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 151339 151344 151349 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 151354 151359 151364 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 151369 151374 151379 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 151384 151389 151394 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 151399 151404 151409 151414 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 151419 151424 151429 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 151434 151439 151444 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 151449 151454 151459 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 151464 151469 151474 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 151479 151484 151489 151494 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 151499 151504 151509 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 151514 151519 151524 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 151529 151534 151539 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 151544 151549 151554 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 151559 151564 151569 151574 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 151579 151584 151589 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 151594 151599 151604 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 151609 151614 151619 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 151624 151629 151634 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 151639 151644 151649 151654 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 151659 151664 151669 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 151674 151679 151684 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 151689 151694 151699 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 151704 151709 151714 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 151719 151724 151729 151734 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 151739 151744 151749 Pro Ser Ile His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg 151754 151759 151764 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 151769 151774 151779 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 151784 151789 151794 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 151799 151804 151809 151814 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 151819 151824 151829 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 151834 151839 151844 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 151849 151854 151859 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 151864 151869 151874 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 151879 151884 151889 151894 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala 151899 151904 151909 Ser Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu 151914 151919 151924 Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp 151929 151934 151939 Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala 151944 151949 151954 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 151959 151964 151969 151974 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 151979 151984 151989 Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe 151994 151999 152004 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 152009 152014 152019 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys 152024 152029 152034 Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu 152039 152044 152049 152054 Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu 152059 152064 152069 Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu 152074 152079 152084 Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu 152089 152094 152099 Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe 152104 152109 152114 Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala 152119 152124 152129 152134 Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile 152139 152144 152149 Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp 152154 152159 152164 Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val 152169 152174 152179 Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro 152184 152189 152194 Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu 152199 152204 152209 152214 Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln 152219 152224 152229 Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp 152234 152239 152244 Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val 152249 152254 152259 Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly 152264 152269 152274 Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp 152279 152284 152289 152294 Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp 152299 152304 152309 Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr 152314 152319 152324 Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn 152329 152334 152339 Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp 152344 152349 152354 Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly 152359 152364 152369 152374 Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln 152379 152384 152389 Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe 152394 152399 152404 Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu 152409 152414 152419 Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr 152424 152429 152434 Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala 152439 152444 152449 152454 Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly 152459 152464 152469 Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu 152474 152479 152484 Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His 152489 152494 152499 Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr 152504 152509 152514 Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp 152519 152524 152529 152534 Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 152539 152544 <210> 3 <211> 129 <212> RNA <213> Tobacco Etch Virus <400> 3 ucaacacaac auauacaaaa caaacgaauc ucaagcaauc aagcauucua cuucuauugc 60 agcaauuuaa aucauuucuu uuaaagcaaa agcaauuuuc ugaaaauuuu caccauuuac 120 gaacgauag 129 <210> 4 <211> 6 <212> RNA <213> Unknown <220> <223> Kozak Sequence <400> 4 gccacc 6 <210> 5 <211> 158 <212> RNA <213> Xenopus sp. <400> 5 cuagugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60 cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120 ucguaucugc uccuaauaaa aagaaaguuu cuucacau 158 <210> 6 <211> 114 <212> RNA <213> Unknown <220> <223> Poly(A) 114 Tail <400> 6 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 114 <210> 7 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 7 augggacacu ccaaacagau ccggauacug cugcugaacg agauggaaaa gcuggaaaag 60 acucuauucc ggcucgagca gggauacgag cugcaguucc gccugggccc cacccuacaa 120 gggaaggccg ugaccgucua caccaacuac ccuuucccgg gcgaaacuuu caaccgggag 180 aaguuccggu cccuugacug ggaaaacccg acugagcgcg aggacgacuc ggacaaauac 240 ugcaagcuga accuccagca gucgggcucu uuccaauauu acuucuugca agggaacgag 300 aaguccggug gcggcuacau cgugguggac ccaauuuugc gcgugggggc ugacaaccac 360 gugcugccac uggauugugu gacccugcaa accuuccugg ccaagugccu cggccccuuc 420 gacgaauggg agucgcgccu gagaguggcg aaagagagcg gauacaacau gauucacuuc 480 acgccgcucc aaacgcuggg ucugagccgg ucaugcuacu cacuggcgaa ccagcucgaa 540 cugaaccccg auuucucccg gccaaacagg aaguacaccu ggaacgacgu gggacagcug 600 gucgagaagu ugaagaagga guggaacgug aucuguauca ccgacgucgu guacaaccac 660 accgcugcaa acucgaagug gauccaggaa cauccggaau gugccuacaa ccucgugaac 720 agcccgcacc ugaagccugc cuggguguug gauagggcac uguggagguu cuccugugac 780 guggcagagg gaaaguacaa ggagaagggu auucccgcac ucaucgaaaa cgaucaccac 840 augaauucga ucagaaagau uaucugggag gauaucuucc cuaagcugaa gcugugggag 900 uucuuucaag uugaugugaa caaggcaguc gaacaguuuc ggcggcuguu aacccaagaa 960 aaccgccgcg ugaccaaguc cgauccgaau cagcaucuga ccauaaucca ggacccggaa 1020 uaccgccggu uuggcugcac cguggacaug aacauugccc ugacuaccuu uaucccgcau 1080 gauaagggcc ccgccgcuau cgaagaaugc ugcaacuggu uccacaagag gauggaggaa 1140 cugaacuccg aaaagcauag gcucauuaac uaccaccagg aacaggcagu gaacugccug 1200 cuggggaacg uguucuacga gcgacuggcu ggacacggac cgaaguuagg acccgugaca 1260 aggaagcacc cacuggucac uagauacuuc accuucccau uugaggaaau cgacuucuca 1320 auggaggagu cgaugaucca cuugccuaac aaggccugcu uucucauggc acauaacgga 1380 ugggucaugg gcgacgaucc ccuacggaau uuugcagaac caggcagcga ggucuaccuu 1440 cggcgggaac ugauuugcug gggcgacucc gucaagcugc gcuacggcaa caagccugag 1500 gacugucccu accuuugggc acacaugaag aaguacacug aaauuacugc gacauacuuc 1560 caaggagucc gcuuagauaa uugucacucc accccgcugc auguggcgga guacaugcug 1620 gaugccgcaa gaaaccucca gccgaaucuc uacgugguag cagagcuguu caccgggagc 1680 gaggaccugg acaauguguu ugucacccgg cuggggaucu ccucccugau ccgggaggcc 1740 auguccgccu acaacucaca cgaggagggg agacuggugu accgcuacgg aggagaaccc 1800 gugggcagcu uugugcagcc uugccuccgg ccgcugaugc ccgcgauugc gcaugcucug 1860 uucauggaua ucacucacga uaacgagugc cccauugugc acagauccgc cuacgacgcc 1920 cuuccuucca caaccaucgu guccauggca ugcugcgccu ccggcuccac ucgggguuac 1980 gaugagcugg ugccacacca gauuuccgug guguccgaag aacgcuucua caccaagugg 2040 aacccggaag cucugccguc aaacaccgga gaagugaacu uccaguccgg gaucaucgca 2100 gcgcgcugug cuauuagcaa gcugcaccag gagcugggag ccaagggguu cauccagguc 2160 uauguggacc aggucgauga ggauaucguc gcugucacga gacacagccc gucuauccau 2220 caaagcgucg uggccguguc ccggacugcg uuccggaacc cuaaaaccuc auucuauucc 2280 aaagaggugc cccagaugug caucccugga aagaucgaag aagucgugcu ggaagcccgg 2340 accaucgagc ggaacaccaa gccguacagg aaggacgaaa acuccaucaa ugguaccccu 2400 gacauuaccg uggaaaucag agaacauauc cagcugaacg aguccaagau cgugaagcag 2460 gccggcgugg cgaccaaggg ucccaacgag uacauucagg aaaucgaguu ugaaaaccug 2520 ucccccggaa gcgugaucau uuuccgggug ucccuggacc cgcaugcgca agucgcuguc 2580 ggaauucugc ggaaucaccu cacccaauuc ucgccgcauu ucaagagugg uucccuggcg 2640 guggauaaug ccgauccgau ccugaagauu cccuucgcgu cccuggcauc gagacucacc 2700 cuggcggagu ugaaccagau ucuguaccgc ugcgaauccg aggaaaagga ggacggaggc 2760 gguugcuacg acauccccaa cugguccgca cuuaaguacg cagggcugca gggucuuaug 2820 agcgugcugg cagaaauucg cccuaagaac gauuugggac accccuucug caacaaccuc 2880 cgguccggag acuggaugau cgauuacgug ucgaacagac ugauuucgag auccggcacc 2940 auugccgagg ucggaaagug gcuucaggcc auguucuucu accugaagca gaucccgaga 3000 uaccugauuc ccugcuacuu cgacgcaauc cugaucgggg cguauaccac ucuucuggac 3060 acugccugga agcagauguc cagcuucgug caaaacggau ccaccuucgu caagcaucuu 3120 agccugggcu cagugcaguu gugcggagug ggaaaauucc cuagccuccc uauucuuuca 3180 ccggcgcuga uggacgugcc uuaccgccug aacgaaauca ccaaagagaa ggagcagugu 3240 ugcgugucgc uggccgcggg ucugccgcau uucuccuccg gcaucuuccg gugcugggga 3300 agggacaccu ucaucgcucu gaggggaauc cugcugauua ccgggcgcua cguggaagcu 3360 cggaacauca uccuggccuu cgcgggaacu cugcgccacg gccugauucc aaacuugcuu 3420 ggcgaaggca ucuacgcgcg cuacaacugc cgcgacgcgg ucugguggug gcuccagugc 3480 auucaagacu acugcaagau ggugccaaac ggccuggaca uccugaagug cccggugucg 3540 agaauguacc ccaccgacga uucugcgccc cugccggccg guacucuuga ccaaccucug 3600 uucgaaguga uccaggaagc aaugcagaag cacaugcagg gcauucaguu ccgggagcgc 3660 aacgcagggc cgcaaaucga caggaacaug aaggacgaag gauucaacau caccgcggga 3720 guggacgaag agacuggcuu cgucuacggu ggaaaucggu ucaacugcgg gaccuggaug 3780 gacaagaugg gcgaaucaga ccgagcccgc aaccgcggaa ucccugccac cccccgggau 3840 gggagcgccg uggagauugu gggacugagc aagagcgcug ugcgcuggcu gcuggaguug 3900 agcaagaaga acauuuuccc cuaucacgaa gugaccguga agcggcacgg aaaagcuauc 3960 aaaguguccu acgacgagug gaacagaaag auccaggaca acuucgagaa gcuguuccac 4020 guguccgagg acccgucgga cuugaaugag aagcacccua accucgugca caagcgggga 4080 aucuacaagg acagcuacgg agcauccucg ccuuggugcg acuaucagcu gaggcccaac 4140 uucacuaucg caaugguggu ggccccagaa cuguucacua ccgaaaaggc cuggaaggca 4200 cuggagaucg cagagaaaaa gcugcugggc ccucugggca ugaaaacccu ggaccccgac 4260 gacauggugu acugcgggau cuacgauaac gcucuugaca augacaacua caaccuggcu 4320 aagggauuca acuaucacca gggccccgag uggcuguggc cgaucgguua cuuccugcgc 4380 gccaagcugu acuuuucccg gcugaugggc ccugagacua ccgcaaagac gaucgugcug 4440 gucaagaacg ugcugucacg gcacuacgug caucuggaac ggagcccgug gaagggguug 4500 cccgaacuga ccaacgaaaa cgcgcaguac uguccguucu cgugcgaaac ucaggccugg 4560 uccaucgcca cuauccucga aacucucuac gaccuguag 4599 <210> 8 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 8 augggacaua gcaaacaaau uaggauccuc cugcugaacg aaauggaaaa acuggaaaag 60 acgcuguuuc ggcuggaaca gggcuacgaa cuccaguuuc gccucgggcc aacgcugcaa 120 gggaaagcag ugaccgugua uacaaacuac ccauucccug gagagacauu caauagggag 180 aaguuuagaa gcuuagacug ggaaaaucca accgaacgag aagaugacag cgauaaguau 240 ugcaagcuga aucugcaaca guccggaagu uuucaguacu acuuuuugca agggaacgaa 300 aagagcggcg gagguuauau ugugguggau ccaauuuuga gaguuggggc cgacaaccau 360 guacugccuc uugacugugu gacacugcaa acguuccugg ccaagugccu gggcccguuu 420 gaugaguggg aaagccguuu gcgcguggcc aaggaauccg gguacaacau gauccauuuu 480 accccacugc aaaccuuagg ccugucaagg agcuguuaca gucuggccaa ccagcuggaa 540 cugaaucccg acuucucccg gccaaauagg aaguacacgu ggaacgacgu uggccagcua 600 guggagaagu ugaagaagga guggaacguu auuugcauca cugacgucgu guauaaucac 660 acugccgcua auagcaaaug gauccaggaa cauccagagu gugccuauaa ccuggucaac 720 agcccgcauc ugaagccagc augggugcug gaccgggcgu uguggcgguu cucgugugac 780 guggccgaag gaaaguauaa ggagaagggu auuccggcuc ugauagagaa cgaccaucau 840 augaauucca ucaggaagau cauuugggag gacaucuuuc caaaguugaa gcugugggag 900 uucuuucaag uggaugugaa caaggccgua gaacaguuuc gccgccuacu aacccaggaa 960 aauaggagag ucacaaaguc cgaucccaac caacaucuga ccauaauuca ggaccccgaa 1020 uaucgucgau uuggcugcac cguggauaug aacaucgcuu ugacaacuuu cauaccacac 1080 gacaaggguc cagccgccau ugaagagugu uguaacuggu uucacaaacg aauggaggag 1140 uugaacagug aaaagcaccg ccugaucaau uaucaucagg agcaggccgu gaacuguuug 1200 cuggggaaug uguucuauga gaggcucgcu ggucauggcc cuaagcuggg uccuguaaca 1260 agaaagcauc cauuagugac gcgcuacuuu acauucccau uugaggagau cgacuuuucg 1320 auggaagagu ccaugauuca ucuccccaac aaggccuguu uucugauggc ccacaacggc 1380 uggguuaugg gggaugaucc guugagaaau uuugcggaac cagguucaga aguguaucug 1440 cgucgggagc ugauuuguug gggcgacucc gugaagcucc gcuaugggaa caagccugag 1500 gauuguccuu aucugugggc gcauaugaag aaguauacag agaucacugc cacauauuuu 1560 cagggcguca ggcuggacaa uugucauagc accccgcuuc auguggcuga guauaugcug 1620 gacgcagcaa ggaaucugca gcccaaucug uauguggugg cggaacuguu uaccgggucc 1680 gaggaccugg acaauguauu uguaacccga uugggcaucu ccagccugau uagggaagca 1740 augagugcau acaacucaca cgaggagggg cggcugguuu aucgauaugg gggggaaccu 1800 gugggcagcu uuguacagcc augucuccgg ccguugaugc cugccauugc ucaugcgcuc 1860 uuuauggaua uaacacauga caacgaaugu ccaaucguuc auaggagugc uuacgacgcc 1920 cugccgagca caacgaucgu guccauggcc uguugugcaa guggcagcac acguggcuau 1980 gacgaauugg uaccccacca aauuagcgug guuuccgagg agagguucua uacaaagugg 2040 aauccagagg cuuugcccuc gaacaccgga gaggucaacu uucaaucugg cauaauugcc 2100 gcucgcugcg ccauaucuaa guugcaucag gaacugggcg cgaagggguu uauacaaguc 2160 uacguugacc aaguggauga ggacaucguu gcugucacgc ggcacucacc uaguauucau 2220 caauccgugg uagcaguguc ucggacggcc uuuagaaacc caaagacauc auuuuacucg 2280 aaagaagugc cucaaaugug uauaccuggc aaaauugaag aggugguccu ggaagcccgc 2340 acgauagaga ggaauacuaa gccguauaga aaggaugaaa auucuaucaa cggcacuccg 2400 gauauuacag uagaaaucag agagcacauu caacuuaaug agucuaagau uguuaagcag 2460 gcugguguug caaccaaagg gccaaacgag uacauccagg agauugaauu ugaaaaucug 2520 ucaccgggcu ccgugaucau cuuuagagua ucuuuggauc cacaugcuca agucgcuguu 2580 ggaauccuga gaaaccaucu gacacaauuu uccccacauu uuaagagcgg cagccuggcc 2640 guggacaacg cagacccaau ccugaagauc ccauuugcau cccuggcuuc ccgccugacu 2700 cuggcugagc ugaaccagau cuuguaucgc ugugaaucug aagaaaaaga ggauggcgga 2760 ggcuguuaug acaucccaaa uuggagcgcc cugaaauaug ccggacucca aggccugaug 2820 uccguucugg ccgagauuag gccaaagaau gaucugggac acccauuuug uaacaacuug 2880 cggucuggag acuggaugau cgacuauguc agcaaccgcc ugauaagcag auccgguacu 2940 aucgcugaag ucggaaaaug gcugcaggcu auguuuuucu auuugaagca gauuccgaga 3000 uauuugaucc ccuguuauuu ugaugccauu cugauuggug cuuauacuac ccugcuggau 3060 accgcuugga aacagaugag uagcuuuguc caaaauggcu ccaccuucgu aaagcaucug 3120 ucgcugggcu ccgugcaauu guguggcguc gggaaguucc cuagccugcc aauccugucc 3180 ccugcucuga uggacgugcc uuaucgccug aacgagauua cgaaggaaaa ggaacagugu 3240 ugcgugucac ucgcugcugg gcugccacac uuuucuucug gaauuuuucg guguuggggg 3300 cgggacaccu uuauugcccu gaggggcauu cugcugauua ccggccgcua ugucgaggcu 3360 aggaacauua uccuggcuuu cgcggguacc cuucggcacg gacucauacc caaccuccug 3420 ggagaaggaa ucuaugcacg guauaacugu cgggacgcag uuugguggug guugcagugu 3480 auucaagauu auugcaagau ggucccgaac ggacuggaca uacugaagug cccagugucc 3540 cggauguauc caacugacga cuccgcacca cugcccgcug ggacacuuga ccagccauug 3600 uuugaaguua uucaggaagc uaugcagaag cauaugcagg gaauucaguu uagggagaga 3660 aacgcuggac cccagauuga ccguaacaug aaggaugagg gguuuaacau uaccgcggga 3720 guggacgaag agacuggcuu cgucuauggu ggcaaucggu ucaacugcgg caccuggaug 3780 gacaaaaugg gcgaaagcga uagagcucga aauaggggca ucccagcaac accacgggau 3840 ggcucugccg uggagauugu gggccugucu aagagcgcag uucggugguu guuggaacuc 3900 agcaagaaga acauuuuucc auaccaugaa guuacaguga agcggcaugg gaaggccauc 3960 aagguuucuu acgacgaaug gaaucggaag auccaggaua acuucgagaa acuguuucau 4020 guauccgagg acccuucuga ccugaacgaa aagcauccaa auuugguaca caaaagggga 4080 aucuauaagg auaguuaugg agccagcagc ccuuggugcg acuaucagcu acgaccaaac 4140 uucacuauug ccaugguagu agcaccagaa cucuuuacua ccgaaaaggc uuggaaggca 4200 cuggagaucg ccgagaagaa gcuguuaggu ccacugggca ugaaaacccu ggaccccgac 4260 gacaugguuu acuguggcau cuaugacaac gcucuggaca augacaacua uaaucuggcc 4320 aagggcuuca acuaccacca gggcccagag uggcuauggc caauuggcua uuuucugcgg 4380 gcgaagcugu acuuuucacg auugaugggc ccagagacaa ccgcuaagac cauaguauug 4440 gucaagaacg ugcugagucg gcacuauguc caccuggaaa ggagccccug gaaggggcug 4500 cccgagcuga ccaacgaaaa ugcacaguau uguccguuuu caugcgaaac ccaggcuugg 4560 uccaucgcga cgauccugga aacccucuau gaucuguag 4599 <210> 9 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 9 augggacacu caaaacagau aaggauccug cugcugaacg aaauggagaa acuggaaaag 60 acccuguucc ggcucgaaca gggauaugaa cuccaguuua ggcugggccc aacucugcaa 120 ggaaaagcug ugaccgucua uacuaacuau ccauuucccg gggaaacguu uaaccgagag 180 aaguuccgau ccuuggacug ggaaaauccc acagagcggg aggaugauuc ggacaaguau 240 ugcaagcuga aucugcaaca aucgggcagc uuucaguacu auuuucuaca aggaaacgaa 300 aagagcggcg ggggauacau ugugguggac ccaauccuga ggguuggggc agacaaucac 360 guacugccuu uggacugugu gacauugcaa acauuccugg caaagugccu gggccccuuc 420 gaugaauggg agucacggcu gcgaguggcu aaggaaucug gcuauaauau gauucacuuu 480 acaccauuac aaacgcuggg ccugagcaga aguugcuacu cgcuggcuaa ucaguuggag 540 uugaacccgg acuuuagccg ucccaaccgg aaguauacau ggaaugaugu uggccaacuc 600 guggagaagc ugaagaagga guggaacgug aucuguauua ccgaugucgu guauaaucau 660 acagccgcga acuccaagug gauucaggag cacccagaau gugcauauaa cuuggucaau 720 agcccccacc ugaagccggc cuggguacug gaucgggccc uguggcgguu uucuugugac 780 guggcagaag gaaaguauaa ggaaaagggg aucccagcac ugauagagaa cgaccaucau 840 augaacagca uuaggaagau cauuugggag gacauuuucc caaaguugaa gcucugggag 900 uuuuuccaag uugacgucaa caaggccgug gaacaauuuc gaaggcugcu gacacaggaa 960 aacagacgug uaacgaaguc cgaccccaau cagcauuuga cgaucauaca ggauccugag 1020 uauaggcgcu uuggcuguac ggucgacaug aauauugcuc ugaccaccuu uaucccucau 1080 gacaaggggc cagccgccau cgaagagugu uguaauuggu uccacaagcg cauggaagag 1140 uugaauuccg aaaagcauag guugaucaac uaccaccagg aacaggcagu gaacugucug 1200 cugggcaacg uguuuuauga gcggcuggcc ggucauggcc cuaagcuggg accagugacc 1260 aggaagcauc cacucguaac cagauauuuu accuucccgu uugaggagau agauuuuagc 1320 auggaagaau ccaugauuca ccuaccgaac aaggcuuguu uucugauggc ucacaacggu 1380 uggguuaugg gcgaugaucc ccugcgcaac uuugcggaac cgggcucuga gguguacuug 1440 agaagggagc ugauauguug gggggacucc gucaaacugc gcuaugggaa uaagccugaa 1500 gauugcccuu aucugugggc ccauaugaag aaguauaccg agauuaccgc gacauauuuu 1560 caaggagugc ggcuggacaa cugccacagc acgccgcugc auguggcaga guauaugcug 1620 gacgcagccc gcaaucugca gccaaaucug uauguugugg cugagcuguu uacgggcucc 1680 gaggaccucg acaacguuuu cguaacccgg cugggcauca gcagccugau ccgggaagcu 1740 augucagcgu auaauagcca ugaggagggc agacuggugu acagauaugg uggcgaacca 1800 guuggcagcu uugugcagcc cuguuugcgc ccucugaugc ccgccaucgc acaugcuuug 1860 uucauggaca ucacgcauga uaacgaaugu cccauuguac aucgcuccgc cuaugacgcu 1920 uugccaucca caacaaucgu guccauggcu uguugugcaa gcggcagcac caggggauau 1980 gacgaauugg uuccgcauca aaucagcgug guaucagagg aaagguuuua uacaaagugg 2040 aauccugaag cccugccauc caacaccggc gaagugaacu uucagucggg uaucauugcc 2100 gcgcguugcg cuauuagcaa acugcaucag gagcugggug cuaaaggcuu uauccaaguu 2160 uauguggauc aaguagacga agauauuguu gccguaacca gacauagccc cagcauucau 2220 caauccgugg uugcuguguc ccggacggcc uucaggaacc cuaaaacauc cuuuuauucc 2280 aaggaagucc cacagaugug uauuccggga aagauagagg aagugguuuu ggaggcucgc 2340 acgauugagc ggaacaccaa gccauauagg aaggacgaga acucgaucaa cggcacgccc 2400 gacauuaccg uugaaauucg cgagcacauu cagcugaacg aaucgaaaau ugucaagcag 2460 gccggcguag cgaccaaggg uccaaacgag uauauccagg aaaucgaguu ugagaaucug 2520 ucgccugggu ccguaaucau uuuuagaguc agccuagacc cucacgcuca aguggccgua 2580 gggauccuga ggaaucaucu gacgcaguuu ucaccccauu uuaaguccgg cagccuggca 2640 guggauaacg ccgaccccau ccugaaaauu cccuuugcuu cccuggccuc gcgccugaca 2700 cuggcagaau ugaaucagau acuguaucgu ugcgagagcg aggagaagga ggacggaggg 2760 ggguguuaug auaucccgaa cugguccgcu cugaaauaug cgggauugca gggcuugaug 2820 aguguacugg ccgaaauuag acccaagaac gaucugggcc auccguucug uaacaaucug 2880 cgauccggcg auuggaugau ugauuauguc agcaaccggu ugauaagccg gagugggaca 2940 auugcagaag ucggaaagug guugcaagcc auguucuuuu accugaagca gaucccucga 3000 uaucugauac cauguuauuu cgaugccauu cugaucgggg ccuauacaac ucuguuagac 3060 acugcuugga aacagauguc uagcuucgug caaaacggcu caacauuugu uaagcacuug 3120 agccuggggu cugugcaguu guguggcgua ggaaaguuuc ccucacugcc cauccugucg 3180 cccgcccuga uggacgugcc cuaccgccuc aacgaaauua ccaaggagaa agagcagugu 3240 uguguuagcu uggcugccgg uuugccgcau uuuucaagcg gaaucuuccg augcugggga 3300 cgcgauacgu ucauagcccu gagggguauu cugcugauua cgggcagaua cguagaggcu 3360 cggaauauua uccuggccuu cgccggcacg cugcggcaug ggcugauucc gaacuugcug 3420 ggagagggca ucuacgcccg guacaacugc agggacgcug ugugguggug gcugcagugc 3480 auccaggacu auugcaaaau ggugccaaac ggccuugaca uacugaagug uccugucucu 3540 cggauguauc caacggauga cuccgcaccc cugcccgcug gaacccugga ucaaccccug 3600 uuugaaguga uacaggaagc aaugcagaag cacaugcagg gaauucaguu uagagagaga 3660 aaugcaggcc cccaaaucga cagaaacaug aaagaugaag gcuuuaacau cacggcugga 3720 guggacgaag aaacuggguu uguguauggc gggaauaggu uuaacugugg gacguggaug 3780 gacaagaugg gcgaauccga uagagcgcgg aacaggggaa ucccggcuac accccgggac 3840 gguagugcug uggagauugu cggcuuaucc aaauccgccg ugcgcuggcu gcuggagcug 3900 uccaagaaga acaucuuucc uuaccaugaa gugaccguga agcggcaugg aaaggccauc 3960 aaagucuccu acgacgaaug gaauaggaag auucaggaca auuuugagaa gcuguuucau 4020 guguccgagg aucccagcga ccugaacgag aagcacccua auuuggugca uaagcggggc 4080 aucuauaagg acuccuacgg cgcuaguucg ccuuggugcg acuaucagcu gcggccaaac 4140 uuuacgauug cgaugguggu agcccccgaa uuguuuacga cggaaaaggc uuggaaggcc 4200 cuggagaucg cagaaaagaa gcugcugggg cccuugggca ugaaaacgcu ggaccccgac 4260 gauaugguuu auuguggcau cuacgacaac gcccucgaca augacaauua caaccuggca 4320 aaggguuuua acuaucauca ggguccugaa uggcuguggc caauuggcua cuuuuugcgg 4380 gccaagcugu acuuuucacg gcugauggga ccugaaacca ccgcuaagac cauuguacug 4440 gucaagaacg ugcugagcag gcauuacgug caucuggaaa gaagcccgug gaagggucug 4500 ccagaguuga cgaacgagaa cgcgcaguau uguccuuucu cuugugaaac gcaggcuugg 4560 aguauugcaa ccauucugga aacucuuuau gaccuguag 4599 <210> 10 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 10 augggccacu caaagcagau uagaaucuua cuccugaacg agauggaaaa gcuggaaaag 60 acccuguucc gccuggaaca gggauaugag cugcaguucc ggcuuggacc aacccuccaa 120 ggaaaggccg ugaccgugua cacgaacuac ccauucccgg gcgaaaccuu caacagagag 180 aaguuccgga gccuggacug ggaaaacccg accgaaaggg aagaugauag cgacaaguac 240 ugcaagcuga acuugcaaca guccggauca uuccaguacu acuuucugca agggaacgag 300 aagucgggcg gcgguuacau cgugguggac ccuauucugc gcgugggagc cgacaaccac 360 guguugccuc uggacugugu cacccugcaa acuuuccugg ccaagugccu ggggccauuc 420 gaugaguggg aaucgcggcu gcggguggca aaagaguccg guuacaacau gauccacuuc 480 accccacucc aaacccuggg ccuguccagg ucgugcuacu cgcuggccaa ccagcuggaa 540 cugaacccgg auuucucgcg gccuaacaga aaguauaccu ggaaugacgu cggacagcuc 600 gucgaaaagc ugaagaagga auggaacgua aucuguauca ccgaugucgu guauaaccac 660 accgcugcca acuccaagug gauccaggaa caccccgagu gcgcuuacaa cuuggugaac 720 ucgccccacc ugaaaccggc uugggugcug gaccgggccc uguggcgguu cagcugcgau 780 guggcugagg gaaaguauaa ggagaagggu aucccagcgc ucauugaaaa cgaccaccau 840 augaacucga uccgcaagau cauuugggag gauauuuucc caaaguugaa acugugggag 900 uuuuuccaag uggacgugaa caaggcgguc gaacaguuca gacggcuguu gacucaggaa 960 aaucggaggg ucaccaaguc ggaucccaac cagcaccuga ccauaaucca ggauccagaa 1020 uaccggcggu ucggcugcac uguggacaug aacauugccc ugaccacuuu uaucccacac 1080 gacaagggcc cggccgccau cgaagagugc ugcaacuggu uccacaagcg gauggaggaa 1140 cugaacucgg agaagcaccg ccugaucaac uaccaccagg agcaggcggu uaacugucug 1200 uugggaaacg uguucuacga gcgguuggcc ggccacggcc cuaagcuggg cccggucacc 1260 cggaagcacc cccuggucac ccgcuacuuc accuuuccau ucgaggagau cgacuucagc 1320 auggaagaau cgaugaucca ucugccgaac aaggccugcu uccugauggc ucacaacgga 1380 ugggugaugg gcgacgaucc ucugagaaac uuugccgagc cgggcucgga gguguaccug 1440 aggagggagc ugaucuguug gggggacagc gugaagcuga gauacggaaa caagccagag 1500 gacugcccgu accugugggc ccauaugaag aaguacaccg agauuaccgc aacauacuuc 1560 caaggggucc ggcuggacaa uugccacucg acuccccugc acguggcgga guacaugcug 1620 gacgcggcca ggaaccucca gcccaaccuc uacgucgugg ccgagcuguu cacugguucc 1680 gaggaccugg auaacguguu cgugaccaga cuggggaucu ccucacugau ucgcgaagcc 1740 auguccgcgu auaacucgca ugaagagggc cgccuggugu accgcuacgg aggcgaaccu 1800 gugggcagcu ucgugcaacc gugucugcgg ccucugaugc cugccauugc gcacgcccug 1860 uucauggaca ucacccacga caacgaaugc cccaucgugc accgguccgc cuacgaugcc 1920 cucccuucga cuacuaucgu guccauggcu ugcugcgcgu ccggcucgac ccgcggcuac 1980 gaugagcucg ugccgcauca gauuagcgug guguccgagg aaagguucua caccaagugg 2040 aauccagaag cgcugccgag caacaccggg gaggucaacu uccagucggg aaucaucgcc 2100 gcccgcugug ccaucuccaa gcugcaccag gaacugggcg cgaaggguuu cauccaaguc 2160 uacgucgauc aggucgacga ggacaucgug gccgugacuc ggcauucccc gagcauucac 2220 caguccgugg uggccguguc gcgcaccgcc uuccgcaacc cuaagaccag cuucuauuca 2280 aaagaagugc cgcagaugug caucccugga aagaucgagg aggugguccu ggaagcgcgg 2340 acuaucgaaa ggaacaccaa gccauaccgc aaggacgaga acuccaucaa cgguaccccg 2400 gacaucacug uggagauccg cgagcauauu caacugaacg aguccaagau cgugaaacag 2460 gccggagugg caaccaaggg accgaacgag uauauccagg aaauugaguu cgagaaccuc 2520 uccccgggaa gcgugauuau cuuccgcgug ucccuggacc cacacgccca aguggccguc 2580 ggcaucuugc ggaaccaccu gacucaguuc uccccgcauu ucaaguccgg aagccuggcg 2640 guggacaacg cggacccaau ccugaagaua cccuucgccu cacuggccuc gcgccugacu 2700 uuggccgagu ugaaucagau ccuguaccgc ugcgaauccg aagaaaagga ggacggugga 2760 ggcuguuacg acaucccuaa cugguccgca cugaaauacg caggacugca gggacugaug 2820 uccguccucg cugaaaucag accgaagaac gaucucggcc acccauucug caacaaccug 2880 agauccggcg auuggaugau ugauuacgug ucgaaccgac ugaucucccg cucggguacu 2940 auugcggaag ucggaaaaug gcugcaggcc auguucuucu accugaagca gaucccacga 3000 uaccuuaucc cuugcuacuu ugacgcgauu cugauuggug ccuacacgac ccugcuggac 3060 acggccugga agcaaauguc cagcuuugug cagaacggca gcaccuucgu gaaacaccug 3120 ucgcugggau cggugcagcu cugcggcgug gggaaguuuc cgucacugcc gauccugucc 3180 ccggccuuga uggaugugcc cuaccggcug aacgaaauca ccaaggagaa ggagcagugc 3240 ugcgugucgc uggccgccgg gcugccucac uucuccuccg gaauuuuucg augcuggggu 3300 agagacacuu ucauugcgcu gagggggauu cugcuuauua ccggccgcua cguggaagcc 3360 aggaacauca uccuggcauu cgccggaacc cugcggcacg ggcugauucc caaccuccuc 3420 ggagaaggaa ucuacgcucg guacaauugc cgggacgcag ugugguggug gcuccagugc 3480 auccaggacu acugcaagau ggucccuaac ggacuggaca uucugaagug cccagugucc 3540 cggauguacc ccacugacga uucggcaccg cugccggcug guacccugga ccagccgcug 3600 uucgaaguga uccaggaagc caugcaaaag cauaugcagg ggauucaguu ccgcgaaaga 3660 aaugccggac cucagaucga ccgcaacaug aaggaugaag gcuuuaacau cacugccgga 3720 guggacgaag agacuggauu cgucuacggg ggaaacagau ucaauugcgg uacauggaug 3780 gauaagaugg gagaaagcga cagagcucgg aauagaggaa uuccggccac accucgggac 3840 ggcucagccg uggagaucgu ggggcuaucc aagucugccg ugcgcuggcu guuggaacug 3900 ucgaagaaga acauuuuccc auaccacgag gucaccguga agcgccacgg aaaggccauc 3960 aaagugucau acgaugaaug gaaccgcaag auucaggaca acuucgagaa gcuguuccau 4020 gugucggagg acccuuccga ccugaacgaa aagcauccaa accuggugca caagcggggg 4080 aucuacaagg acuccuacgg agcguccucc ccuuggugcg acuaccaacu ccggccaaau 4140 uucacgaucg cgaugguggu ggccccugaa uuguuuacca ccgaaaaggc cuggaaggcc 4200 cucgagaucg cagagaagaa acugcuggga ccccugggca ugaaaacccu ggacccggac 4260 gauauggugu acugcggaau cuacgacaac gcccucgaua augacaacua uaacuuggcc 4320 aaggguuuca auuaccacca ggggccagag uggcuguggc caaucgguua cuuucugcgg 4380 gccaagcugu acuucucgag auugaugggg cccgaaacca ccgcuaagac uaucgugcuc 4440 gucaagaacg ugcugucacg gcauuacgug caccuggaac gcagcccaug gaagggccug 4500 ccggaacuga ccaacgagaa cgcacaguac uguccguucu cgugugaaac ucaggccugg 4560 agcauugcga ccauccugga aacucucuau gaucuguag 4599 <210> 11 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 11 augggccauu cuaagcaaau ucggauacug cugcugaacg aaauggagaa acuugaaaag 60 acccuguucc ggcuggagca gggcuaugag cugcaguuua gauugggccc gacacugcag 120 gggaaggcag ucaccguuua uaccaauuau ccuuuuccug gggaaacguu caaucgugaa 180 aaguuucgga gccucgacug ggaaaacccu accgagcgag aggaugauag cgacaaguau 240 uguaaacuca aucugcagca gucaggcuca uuccaauauu auuuucugca agggaacgag 300 aagucuggcg gaggcuacau ugucguugau ccgauacugc ggguuggcgc cgacaaccac 360 guguugccuc uggacugcgu gacacugcaa acauuucucg cgaaaugcuu aggccccuuu 420 gaugaguggg aaagccgccu gagagucgcc aaggagagcg gcuauaauau gauccauuuu 480 acgccgcugc aaacacuggg ucugucuagg ucauguuacu cauuggcuaa ccagcuggag 540 cugaacccgg acuuuaguag gccuaacagg aaguauacau ggaaugaugu ugggcaacug 600 guggagaagc ugaagaagga auggaauguc auuuguauua ccgaugucgu guacaaccac 660 acggcagcaa auucaaagug gauucaggaa cauccggaau gcgcuuauaa ccucguaaac 720 ucaccgcacc ugaagccggc cuggguacug gacagggcac uguggagauu cucuugugau 780 guagccgagg ggaaguacaa ggagaaaggc auucccgcuc uuauugaaaa ugaccaccau 840 augaauagca uuaggaagau caucugggaa gauauuuuuc caaaacugaa gcugugggaa 900 uucuuucaag uugacgugaa caaggcuguc gagcaguuca ggcggcuguu gacccaggag 960 aacagacggg uuacuaagag ugaccccaac caacaucuga cgaucaucca ggacccagag 1020 uaucggcgcu uuggcugcac aguggacaug aacaucgccc ugaccacguu uaucccccau 1080 gauaagggcc cggccgcuau ugaagagugu uguaacuggu uucauaagcg cauggaagaa 1140 cucaacagcg aaaagcauag acugaucaac uaucaucaag aacaggcugu gaauugucug 1200 cugggcaacg uguuuuauga gcgguuggcu ggccauggcc ccaaguuggg ccccgugacg 1260 cgaaaacauc cccucgugac aagauauuuc accuuuccau uugaagagau cgacuucuca 1320 auggaggaaa gcaugauuca ucugccaaac aaggcuuguu uucugauggc ucauaauggc 1380 uggguuaugg gcgacgaccc ccugagaaac uuugcggaac cagggucuga aguguaucug 1440 cggagggaau ugauuugcug gggagacucu guaaagcugc gauaugggaa caagccggag 1500 gauuguccgu aucugugggc ccauaugaag aaguauacag aaauuaccgc aacguauuuu 1560 cagggcguac gccuggauaa uugucauuca acgccacugc auguggcaga guacaugcua 1620 gacgcggcua ggaaucugca gccgaaucug uaugucgugg ccgagcuguu caccggcucc 1680 gaagauuugg acaauguguu ugugacccgc cucgguauua gcucacugau uagagaagca 1740 augucggcuu acaauucgca ugaggaaggu cgccuggugu accguuacgg cggcgaaccc 1800 gugggcaguu uugugcaacc cugucugagg ccacuaaugc ccgcuauugc acaugcccug 1860 uuuauggaua uaacacauga uaacgaaugu ccaaucguac accggagugc uuaugaugcu 1920 cugcccucaa cgaccaucgu aucaauggca ugcugugccu ccggcucaac acggggcuau 1980 gaugaacugg uaccacacca gaucagcgug guuucugagg aacgguuuua cacaaagugg 2040 aauccugagg cguugccauc caacacuggc gaagugaacu uucagagcgg cauuauugcu 2100 gcccgaugug cuauuucaaa gcuacaccag gaguugggcg caaagggguu uauccagguu 2160 uauguggacc agguugacga agauaucgua gcugugacgc ggcacucucc gucuauccau 2220 caauccgugg uagccguguc uaggacggcu uuucgcaacc ccaagacaag uuucuauucc 2280 aaagaaguac cccagaugug uaucccgggg aagauugagg aagugguccu ggaggccagg 2340 acgauagaac ggaacacgaa gccguaucgc aaggacgaaa acagcauaaa cgggacgccu 2400 gacaucacgg uggagauucg cgagcacauc caguugaacg aaucaaagau agugaaacag 2460 gcuggggugg cuaccaaggg cccaaaugag uacauucagg agaucgaguu cgaaaaccug 2520 uccccgggca gugugaucau cuuuagaguc ucuuuggauc cgcaugccca ggucgcugug 2580 ggcaucuugc gaaaucaccu gacgcaguuu ucuccacauu uuaagagugg cucccuggcu 2640 guggacaacg ccgacccaau cuugaagauu ccguucgcuu cccuggcuuc acgucugacu 2700 cucgcugaau ugaaucaaau ucuguauaga ugcgaaucag aggagaagga agauggaggc 2760 gguuguuacg acaucccgaa uuggucggca cugaaauacg ccggucugca aggcuugaug 2820 agcguacugg ccgagauaag accaaagaac gaucugggcc acccauuuug caacaacuug 2880 cgguccggcg auuggaugau ugacuauguc ucuaaccgac ucaucaguag aagcggaacc 2940 auagcugagg ucggcaaaug gcugcaagcc auguucuucu auuugaagca gaucccccga 3000 uaucugaucc ccuguuauuu ugacgcaauc cucauuggcg ccuauaccac acuccucgac 3060 accgcuugga agcagauguc cucauuugug caaaacggua gcaccuuugu gaagcaucug 3120 ucgcugggua gugugcagcu cugcggcgua gggaaguucc ccaguuugcc gauccugagu 3180 ccagcucuaa uggacgugcc auauaggcug aacgagauua ccaaggaaaa ggagcagugu 3240 ugugucuccc uugcugccgg ucugccccau uuuuccucgg gcauuuuuag auguuggggg 3300 cgggacaccu ucaucgcucu gcggggcauc cugcugauca ccggcagaua uguggaggcu 3360 cggaauauua uucuggcuuu ugcugggacg cugcgccaug gacugauucc caaucuauug 3420 ggcgaaggca uauacgcuag guauaacugu cgggacgcug uuugguggug gcugcagugu 3480 auccaagauu auugcaagau gguccccaac ggccuggaca uacugaaaug uccaguaucu 3540 aggauguacc cgacugacga cagugcuccc cugcccgcug gaacuuugga ucaaccccug 3600 uuugagguua uucaagaggc uaugcagaag cacaugcagg gcauucaguu ucgcgaaagg 3660 aacgccggcc cccaaauuga ccguaacaug aaggacgaag gcuucaauau uacggcuggc 3720 guagaugaag aaacaggcuu uguguacggc ggcaaccgcu ucaacugugg gacauggaug 3780 gacaagaugg gcgaaagcga cagggcucgg aacaggggaa uuccagccac gccccgcgau 3840 ggcagugcug uugaaauugu cggcuuguca aaaucagccg uacgcugguu auuagagcuc 3900 uccaagaaga acaucuuucc guaucaugaa gucacgguua agcggcaugg aaaagcaauc 3960 aaagugucuu acgacgaaug gaauaggaaa auucaggaca acuuugagaa gcuguuccau 4020 gugucugagg acccguccga ucuuaacgag aagcauccca auuuggugca caagaggggc 4080 aucuauaagg acucauacgg ggcuagcuca ccuuggugug acuaucagcu gcgaccgaau 4140 uucacaauag cuauggucgu ggcuccggag cuuuuuacca ccgagaaggc uuggaaggcc 4200 cuggagauug ccgagaagaa gcuguuaggc ccguugggca ugaaaacguu ggauccagac 4260 gacauggucu auuguggcau cuaugacaac gcucucgaca augacaacua uaaccuagcu 4320 aagggcuuca auuaccauca gggcccggag uggcuguggc caauuggaua uuuccugagg 4380 gcaaagcugu auuucucccg gcugaugggc cccgagacaa cggcaaaaac cauagucuug 4440 guuaagaacg ugcugucccg ccacuaugug caccuugaaa ggaguccgug gaagggccug 4500 ccggagcuga caaacgaaaa ugcccaguac ugcccauuuu cuugcgaaac ucaggcuugg 4560 agcaucgcca caaucuugga aacccuguau gacuuguag 4599 <210> 12 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 12 augggacacu cgaagcagau ccgcauccuc cugcugaacg aaauggaaaa acuggaaaag 60 acacucuucc ggcuggaaca gggauaugag cugcaguuua gacuggggcc caccuuacaa 120 ggaaaggccg ugacugucua uaccaacuac ccguuccccg gagaaacuuu caaccgggaa 180 aaguuccggu cacuggacug ggaaaacccg accgagcggg aggacgauag cgacaaguac 240 ugcaagcuga accuucagca guccggaucg uuccaguacu acuuccugca agggaacgag 300 aagucgggcg gaggauacau uguggucgau ccuauccugc gcgugggagc ugacaaucac 360 gugcucccuc uggacugcgu gacgcugcaa accuuccucg caaagugccu cggaccuuuc 420 gacgaauggg aauccagacu ccgcguggcc aaggagucag gauacaacau gauccacuuc 480 acgccgcugc agaccuuggg acucucucgg agcuguuacu cccuggccaa ccagcuggaa 540 cugaacccag acuucucacg cccgaauaga aaguacaccu ggaacgacgu gggacagcuu 600 guggagaagc ucaagaagga auggaacguc aucugcauaa ccgacgucgu guacaaccac 660 accgcagcca auucuaagug gauucaggaa caccccgaau gcgccuacaa ucugguuaac 720 ucaccccacc uuaagcccgc cuggguccua gacagagccc ucuggcgguu cucgugugac 780 guggccgagg gaaaguacaa ggagaaggga auccccgcuc ugauugaaaa cgaccaccac 840 augaacucca uccgcaagau uaucugggag gacaucuucc cgaagcucaa gcugugggaa 900 uucuuccaag uggacgugaa caaggcgguc gagcaguuca gacgccugcu gacccaggaa 960 aaucggagag ugaccaagag cgauccuaac cagcaccuga ccaucaucca agacccagag 1020 uaccggcggu ucggaugcac uguggauaug aacaucgccc ugaccacuuu caucccucac 1080 gacaagggac cggccgcaau ugaggaaugc ugcaacuggu uccauaagcg gauggaggaa 1140 cugaacagcg agaagcaucg acugaucaau uaucaucaag agcaggcugu gaauugccug 1200 cugggaaacg uguucuacga acggcuggcc ggacauggcc cuaagcuggg gccugugacc 1260 cggaagcacc cucuugugac ccgauacuuc accuucccgu uugaagaaau ugauuucucc 1320 auggaagaau ccaugaucca ucugccaaac aaggccugcu uccuuauggc ccacaauggc 1380 ugggucaugg gggacgaccc ucuucggaac uucgccgaac cagggagcga gguguaccuc 1440 agaagggagc ucaucuguug gggggauucc gugaagcuca gauacggaaa caagccagaa 1500 gauugccccu accuuugggc ccacaugaag aaguacaccg aaaucaccgc cacauacuuc 1560 caaggagugc ggcuggacaa cugccauuca acuccccugc acgucgccga guacaugcug 1620 gacgcugcga gaaacuugca gcccaaccuu uacguggugg ccgagcuguu caccgggagc 1680 gaggaccugg acaacguguu ugugaccagg cucggaaucu cgucgcugau ucgcgaagcc 1740 augagcgccu acaacuccca cgaagagggu agacuggugu acagauacgg aggagagcca 1800 gugggauccu ucguccaacc gugccugcgg ccgcucaugc cugcgaucgc acacgcgcug 1860 uucauggaca ucacccacga uaacgaaugu ccuaucgugc auaggagcgc cuaugaugcc 1920 cuucccucca ccaccaucgu guccauggcg ugcugugccu cggguagcac caggggauac 1980 gacgagcugg ugccgcacca gaucucggug guguccgaag aacgguuuua cacuaagugg 2040 aacccugagg cgcugccuuc caacaccgga gaagugaacu uccaguccgg uaucauugcc 2100 gcucgcugcg caaucagcaa acugcaccag gagcuuggug ccaaaggauu cauccaaguu 2160 uacgucgauc aaguggacga ggauauugug gccgucacua ggcacucucc aagcauucac 2220 caguccguag uggcaguguc gaggaccgcc uuccggaacc ccaagacuuc auuuuacucg 2280 aaagaggucc cacagaugug caucccugga aagaucgaag aaguggugcu ggaagcccgg 2340 accaucgaga ggaacacaaa gcccuaccgg aaggacgaga acuccaucaa cggaaccccc 2400 gacauuaccg uggaaauuag agagcacauc caguugaacg agucgaagau cgugaagcag 2460 gccggagugg ccacuaaggg accaaacgag uacauccagg agaucgaguu ugaaaaccug 2520 uccccgggcu ccgugaucau cuuccgggug ucccuugacc cccaugccca aguggccguc 2580 ggaauccuua ggaaccaccu gacccaguuu ucgccccauu ucaaguccgg auccuuggcu 2640 gucgacaaug ccgaucccau ccugaaaauu ccguucgccu cccucgcuuc ccggcucacc 2700 cuugccgaac ucaaccagau ucuguaccgc ugcgagucag aagaaaagga agauggaggg 2760 ggaugcuacg acaucccgaa cugguccgcc cuuaaauacg ccgggcugca aggccugaug 2820 uccgugcugg cggagauuag accgaagaac gacuuggguc acccuuuuug caacaacuug 2880 cggagcggag acuggaugau cgacuacgug ucgaaccggc ugauuagucg guccggaacc 2940 aucgccgaag ucggaaagug gcuccaagcc auguucuucu accugaagca aauuccccgc 3000 uaccugauac cgugcuacuu cgacgccauc cucauuggag ccuacaccac gcugcuggac 3060 accgccugga agcaaaugag cuccuucgug caaaacggau caaccuucgu gaagcaccug 3120 ucccugggua gcguccagcu cuguggcgug ggaaaguuuc cgucccugcc aauucugagc 3180 ccggcucuga uggaugugcc guaucgccug aacgagauca cgaaggagaa ggagcagugu 3240 ugcgugucgc uggcugcggg acugccucac uucucguccg gaaucuuccg cuguugggga 3300 cgcgacacgu uuaucgcguu gagggguauu cuccucauua ccggacgcua cguggaagcg 3360 cggaacauua uccuggcguu cgccggaacc cugcgccacg gucugauucc uaaucugcug 3420 ggagagggaa ucuacgcgcg guacaacugc cgggaugcug ugugguggug guugcagugc 3480 auccaggacu auuguaaaau ggugccgaac ggccuggaca uccugaagug cccggugucc 3540 cggauguacc cgaccgauga uucagcacca cugcccgccg ggacccugga ccagccccug 3600 uucgaaguca uucaggaagc gaugcagaag cauaugcagg gaauccaguu ccgcgaaaga 3660 aacgccggac cucagaucga ccgcaacaug aaggaugagg gcuucaacau caccgcggga 3720 guggaugagg aaaccggcuu cgucuacgga gggaaccggu ucaacugcgg aaccuggaug 3780 gacaagaugg gagaguccga ccgcgcaaga aaccgcggua uuccugccac cccgcgggac 3840 ggaagcgcgg uggagaucgu cggacugagc aagagcgcag ugcgcuggcu gcuggaguug 3900 uccaagaaga auaucuuccc cuaucacgag gucaccguga aacgccacgg gaaggccauc 3960 aaaguguccu acgaugagug gaaccgcaag auucaggaua acuucgaaaa gcuguuucau 4020 guguccgagg aucccuccga ccucaacgaa aagcacccga accucgugca uaagaggggg 4080 aucuacaagg acagcuacgg ugccuccuca ccuuggugcg auuaucagcu ccgcccgaac 4140 uucaccauug ccaugguggu cgccccugaa cuguuuacua ccgagaaggc cuggaaggcg 4200 cuggagauug ccgaaaagaa gcuguuggga ccccugggca ugaaaacccu cgaccccgac 4260 gacauggugu acugcggaau cuacgacaac gcccucgaca acgacaacua caaccucgcg 4320 aagggguuca acuaccacca gggccccgaa uggcuguggc ccaucggaua cuuccuccgg 4380 gcgaaguugu acuucucccg ccugaugggc ccugaaacca cggccaaaac gaucgugcuc 4440 gugaagaacg ugcugucgag gcauuacgug caccucgagc ggagcccgug gaaggggcug 4500 ccggaacuga ccaacgagaa ugcacaguac ugccccuucu ccugcgaaac gcaggcuugg 4560 uccauugcca cuauuuugga aacgcuguac gaccuguag 4599 <210> 13 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 13 augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcuggaaaag 60 acccucuuuc ggcucgagca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120 ggaaaggcag ugacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180 aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacuc cgacaaguac 240 ugcaagcuga accuccaaca guccgguuca uuccaguacu acuuucugca agggaacgag 300 aaguccggag gcggcuacau cguggucgac ccgauacuua gagugggagc cgacaaucau 360 guccugccuc uggacugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420 gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480 acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540 cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660 acggccgcca acucgaagug gauccaagag caucccgagu gcgcguacaa ccucgugaac 720 agcccgcauc ugaagccugc uugggugcug gauagagccc ucuggagauu cagcugcgac 780 guggccgagg ggaaguacaa agaaaaggga auuccggccu ugauugagaa cgaccaucac 840 augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacucaagaa 960 aacagacgcg ucacuaaguc cgauccuaac cagcaccuua ccaucauuca agacccugag 1020 uaccgccggu uuggcugcac cgucgacaug aacaucgccc ugaccacuuu caucccgcau 1080 gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200 cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260 cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320 auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380 ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcucgga ggucuaccug 1440 agaagggaau ugauuugcug gggagacucc gucaagcugc gcuauggaaa caagcccgaa 1500 gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc cacguacuuc 1560 cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcuc 1620 gaugcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacuggcucc 1680 gaggaccucg acaacguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740 augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg cggagaaccc 1800 gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860 uucauggaua ucacucacga caacgaaugc cccauugugc aucgcucggc cuacgacgca 1920 cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ccgcggauac 1980 gaugaacucg ugccgcacca gaucagcgug guguccgaag aaagauucua uaccaagugg 2040 aaccccgaag cccugccgag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100 gcucgcugug ccaucagcaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160 uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220 caauccgucg ucgccguguc ccggacugcg uuucggaacc ccaagacuuc guucuacucg 2280 aaagaagugc cacagaugug uaucccggga aaaaucgaag aggucgugcu cgaagcccgg 2340 accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400 gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460 gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580 ggaauucuca gaaaccaccu gacccaguuc ucaccccacu uuaaguccgg uucccuggcg 2640 guggacaacg ccgauccgau cuugaagauc cccuucgcau cgcuggccuc ccgccugacu 2700 cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacggcggc 2760 ggcuguuacg auauccccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820 ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880 cggagcggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940 aucgccgagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000 uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060 accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120 ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180 ccggcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 uguguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg gugcuggggc 3300 cgggauaccu ucauugcccu gcggggaauc cugcuuauca ccggucgcua cguggaggcu 3360 cggaacauua uucuggcguu cgccggcacc cuuagacacg gucugauucc gaaucuuuug 3420 ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540 aggauguauc caaccgacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600 uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660 aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720 guggacgaag aaaccgguuu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780 gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840 ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900 agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960 aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020 guguccgagg aucccuccga ucugaacgaa aagcauccga aucucgugca caagcgcggg 4080 aucuacaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140 uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200 cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucuggcg 4320 aagggcuuca auuaccacca gggcccggaa uggcucuggc cuauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440 gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500 ccugagcuga cgaacgaaaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560 uccauugcca cuauacugga aaccuuauau gaccuguag 4599 <210> 14 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 14 augggucacu ccaagcaaau cagaaucuua cuccuuaacg aaauggaaaa gcuugaaaag 60 acacucuucc gcuuggagca gggcuacgag cugcaguucc ggcugggucc gacacuucag 120 gggaaagccg ugaccgugua uaccaacuac cccuuuccgg gagaaacauu caaucgcgag 180 aaguuccggu cgcuggacug ggagaacccu accgagaggg aggacgacuc ugauaaguac 240 ugcaagcuga aucuccagca aucagguucu uuccaauauu acuuccuuca aggaaacgaa 300 aaguccgggg gcggcuacau uguaguggac cccauccuuc gggucggcgc ggauaaccau 360 gugcuucccc ucgacugcgu gacucuccaa acuuuccucg ccaagugccu gggaccauuc 420 gaugaauggg aaucccgccu gcgcguggcc aaggagagcg gcuacaacau gauucacuuc 480 acuccgcuuc aaacccuugg gcugucccgc uccugcuauu cccuugcgaa ccagcuggaa 540 cuuaacccgg acuucucucg gccgaacaga aaguacacuu ggaacgacgu gggccagcuu 600 gucgagaagc ugaagaagga auggaacgug aucugcauca ccgacguggu guacaaccac 660 accgcggcaa acuccaagug gauccaggaa cauccugagu gcgcauacaa ccucgugaac 720 aguccgcauc ugaagccugc cugggugcug gauagagccc uguggcgcuu cuccugcgac 780 guggcugagg gaaaguacaa ggaaaagggc aucccugcgc ucauugaaaa cgaucaccac 840 augaacagca uccgcaagau uauuugggag gacaucuucc cuaagcucaa gcucugggag 900 uuuuuccaag uugacgugaa caaggccgug gagcaguuca gacggcuccu gacucaagaa 960 aacagacgcg ucaccaaguc cgacccuaac caacaccuca ccaucaucca ggaucccgaa 1020 uaccgccggu uuggcugcac uguggacaug aacauugccc ugaccaccuu cauuccgcac 1080 gacaaaggcc cggccgcgau ugaagagugc uguaacuggu uccacaagag aauggaggag 1140 cugaacuccg aaaagcauag acuuaucaac uaccaccagg aacaggccgu gaacugccug 1200 cugggaaacg uguuuuacga gagacucgcc ggacacgguc caaaguuggg uccugugacc 1260 cgcaaacacc cgcucgucac ccgcuacuuu accuucccgu ucgaggagau cgacuucagu 1320 auggaggaga gcaugaucca ucuccccaac aaggccuguu uccucauggc ccacaacggc 1380 ugggucaugg gcgacgaccc ccugcgcaac uucgcugaac ccggcucgga aguguaccuu 1440 cggagggagc uuaucuguug gggcgacagc gugaagcuua gauacggcaa caagccagaa 1500 gauuguccgu accugugggc gcacaugaag aaguacaccg agaucaccgc gacguacuuu 1560 caaggagugc ggcucgauaa cugccacucc accccucugc acguggcaga guacaugcua 1620 gacgcggccc ggaaccucca gcccaaccuu uacguggugg ccgaacucuu cacugguucu 1680 gaggaucuug auaacguguu cgugacuagg cucggcauuu ccucccucau ccgggaagcc 1740 augucggccu auaacuccca cgaggagggg cggcuggugu accgcuacgg aggcgaaccg 1800 gucggcagcu ucgugcagcc gugccuccgc ccucugaugc ccgcuauugc ucacgcccuu 1860 uucauggaua ucacucacga uaaugagugc ccuaucgugc aucggagcgc cuacgacgcu 1920 cucccuucca ccaccaucgu guccauggcg ugcugcgccu ccgguucaac caggggcuac 1980 gaugaacuug ugccgcacca gaucucaguc gucagcgagg aaagguucua cacuaagugg 2040 aacccugaag cccugcccuc uaacacgggc gaagugaacu uucagagcgg uaucauugcc 2100 gcuagaugcg caaucuccaa guugcaccag gaacugggag ccaagggguu cauccagguc 2160 uacguggacc aggucgacga ggacaucguc gccgugaccc ggcauucccc gagcauccau 2220 caguccgugg ucgccguguc acggaccgcc uuccgcaacc ccaagaccuc cuucuacucc 2280 aaggaagugc cgcaaaugug uaucccuggc aaaaucgagg aaguggugcu cgaagcgcgg 2340 acgauugaga ggaauacuaa gccguacaga aaggacgaaa acuccaucaa cggcaccccg 2400 gacaucacug uggagauccg ggagcacauc cagcucaacg agagcaaaau ugugaagcag 2460 gccggcgucg cuacuaaggg cccaaacgag uacauccagg agauugaguu cgaaaaccuu 2520 agcccugggu cugugaucau cuuucgcgug ucccucgacc cgcacgcaca ggucgcaguc 2580 gggauucucc ggaaccaucu gacucaguuc agcccccacu ucaagagcgg cagccuugcc 2640 gucgacaacg ccgaucccau ccucaaaauc ccuuucgcau cccuugcguc gaggcuuacc 2700 cuggcggaau ugaaccagau ucuguaccgc ugcgagucgg aagaaaaaga ggauggcggc 2760 ggcugcuacg acauuccgaa cugguccgcc cugaaauacg cgggccuuca gggccuuaug 2820 agcgucuugg ccgagauccg ccccaagaac gaccuggggc accccuuuug caacaaccuc 2880 agaagcggcg auuggaugau cgacuacgug ucgaacaggc ucaucagccg auccggcacu 2940 auagccgagg ucggaaagug gcugcaggcc auguucuuuu accucaaaca gaucccgcgg 3000 uaccugaucc cgugcuacuu cgacgcuauu cucauuggcg ccuacacuac ccugcucgau 3060 accgcuugga agcagaugag cucauucgug caaaacggaa gcaccuucgu gaagcaccuc 3120 ucccugggau cagugcagcu gugcggcgug ggaaaguucc cauccuuacc aauucucucg 3180 ccugcccuga uggacguccc uuaucgccug aacgaaauca cgaaggagaa ggaacagugu 3240 ugugucucac uggcugccgg ccucccgcac uucucauccg gcaucuuccg gugcuggggu 3300 agagacacuu ucauugcgcu ccggggaauu cugcuuauca cuggccgcua cguggaagcc 3360 cgcaacauca uccuugccuu ugccgggacc cugcggcacg gccugauccc uaaccuucuc 3420 ggggagggca ucuaugcgcg auacaauugc cgggacgccg ucugguggug gcugcagugc 3480 auucaggacu auugcaagau ggugccaaau ggucuggaca uucugaagug uccagugucc 3540 cggauguacc cuaccgacga uagcgcccca cugcccgccg gaacccucga ucagccccug 3600 uucgaaguca uucaggaagc gaugcagaag cauaugcagg guauccaauu ccgcgaaagg 3660 aaugccggcc cacaaaucga cagaaauaug aaggaugagg gcuuuaacau caccgccggc 3720 guggacgagg agacugguuu cgucuacggc ggcaaucggu ucaauugcgg gaccuggaug 3780 gacaagaugg gcgaaagcga ccgggccaga aaccggggca uuccggcuac cccccgcgau 3840 ggcucggccg uggaaaucgu gggccucucc aagucugccg ugcgguggcu uuuggagcuc 3900 uccaagaaaa acaucuuccc guaccacgaa gugaccguga agagacacgg gaaggccauc 3960 aaaguguccu acgacgaaug gaaccggaag auccaggaca acuucgaaaa gcuguuccac 4020 guguccgagg aucccuccga cuugaacgaa aagcacccca accucgugca caagcgcggc 4080 aucuacaagg auuccuacgg agcguccuca ccuuggugcg acuaucagcu gaggcccaac 4140 uucaccaucg caaugguggu ggccccugag uuguucacca cugagaaggc uuggaaggcc 4200 cuugagaucg ccgaaaagaa gcugcucggc ccgcugggga ugaaaacccu cgaccccgau 4260 gacauggugu acugcgggau auacgacaau gcacuagaca acgacaacua caaccuggcc 4320 aagggcuuca auuaccauca gggcccggag uggcuuuggc cuaucggcua cuuccugcgg 4380 gccaagcugu acuucucacg gcuuauggga ccggagacua cugcaaagac cauugugcuu 4440 gugaagaacg ugcuuucgcg ccacuacgug caucuggaac ggagccccug gaaggggcuc 4500 cccgagcuga ccaacgagaa cgcccaguac ugucccuucu ccugugaaac ccaggcuugg 4560 uccauugcca ccauucugga aacccuguac gaccucuag 4599 <210> 15 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 15 augggacacu caaagcaaau ucggauccuc cugcucaacg agauggaaaa gcucgagaaa 60 acccucuuuc gccuggagca ggguuaugag cuccaguucc gccugggucc gacccuccaa 120 gggaaggccg ucacugugua cacuaacuau ccauuccccg gagagacuuu caaccgggaa 180 aaguuccgca gccucgauug ggagaacccu acugaacggg aggacgauuc ggacaaguac 240 uguaaacuga accuccagca gagcggcuca uuucaauacu acuuucugca agggaacgag 300 aaguccggag ggggguacau cgucguggau ccuauccuuc gcgugggcgc cgacaaccau 360 gugcugccgu uggacugcgu gacccugcaa accuuccucg ccaaaugccu cggaccuuuc 420 gaugaguggg aauccaggcu gagaguggcc aaggaaucgg gguacaacau gauucacuuc 480 accccucucc aaacccuggg ccugucucgg agcugcuacu cccuggccaa ccagcuggag 540 cugaaucccg acuucucccg gcccaaccgg aaguacacuu ggaaugacgu gggccaacug 600 guggagaagc ucaagaagga guggaacgug aucugcauua ccgacguggu guacaaccau 660 accgccgcca acuccaagug gauccaggaa cacccagaau gugccuacaa ccucgucaac 720 ucaccccacc ugaaaccagc augggugcug gaucgcgccc ucuggcgguu cucgugugac 780 guggccgaag gaaaguacaa agagaagggc aucccugccc ugaucgaaaa ugaccaccac 840 augaauucca uuagaaagau cauuugggag gacauuuucc cuaaguugaa gcucugggag 900 uucuuccaag uggacgucaa caaggccgug gaacaguuuc gccggcuccu gacccaagaa 960 aaccgccgcg ugaccaaguc cgacccuaac cagcaccuga ccauaaucca ggacccugag 1020 uacagacggu ucgguugcac ugucgacaug aacaucgccu ugacuacuuu caucccgcac 1080 gacaaggguc cugccgccau ugaggagugc ugcaacuggu uccacaagcg gauggaagaa 1140 cugaacuccg aaaagcaccg ccucaucaac uaccaccagg agcaggccgu gaacugccug 1200 cuggggaacg uauucuacga gaggcuggcc ggacacggac ccaagcuggg acccgugacc 1260 agaaagcauc cucucgucac ccgcuacuuu acuuucccgu uugaagagau cgacuucuca 1320 auggaagagu cgaugaucca ucucccuaac aaggccugcu uccugauggc ccacaacggc 1380 ugggugaugg gcgacgaucc ucugagaaac uucgcugagc ccgguucgga aguguaccuu 1440 agacgggaac uuauuugcug gggcgauucc gugaaguuac gcuacggaaa caagccugag 1500 gacugcccuu accugugggc ccauaugaag aaguacaccg agauuaccgc caccuacuuc 1560 caaggggucc ggcuggacaa cugccacuca acuccucugc acguggcuga guacaugcug 1620 gaugcggccc ggaauuugca gccuaaccuu uacguggucg ccgaacucuu uaccgggucc 1680 gaggaccugg acaacguguu cgugacucgg cucggaaucu ccucacugau uagagaggcc 1740 auguccgcau acaacucgca cgaagaaggc cggcuggucu aucgauacgg cggcgaaccu 1800 gucggaagcu ucguccagcc cugccugcgg ccgcugaugc cagcgaucgc ccacgcccuc 1860 uucauggaca ucacccauga caacgaaugu cccaucgugc accgcuccgc cuacgaugcc 1920 uugccaagca ccaccaucgu guccauggcg ugcugcgcca gcgguagcac uaggggcuac 1980 gaugaacuug ugccgcacca gaucagcgug guguccgagg aaagguuuua cacgaagugg 2040 aaccccgaag cccugcccuc caacacuggg gaagugaacu uccaguccgg gaucauugcg 2100 gcccgcugcg cgaucucgaa gcuccaccag gaacucggcg cgaaaggauu cauucaaguu 2160 uacguggacc aggucgacga ggacaucguc gccgugacuc gccacucccc uucaauccau 2220 caauccgugg uggcgguguc gcggaccgcu uuccggaacc cuaagacuuc guucuacucg 2280 aaagaagugc cucagaugug uauccccgga aagaucgagg aaguggugcu cgaggccagg 2340 acuauugaga ggaauaccaa gccuuaccgg aaggaugaga acuccauuaa cgguacuccu 2400 gacaucaccg ucgagauccg ggaacacauc cagcucaacg aaagcaaaau cgugaagcag 2460 gccggcgugg ccacuaaggg uccgaacgag uacauccagg aaaucgaauu ugagaaccug 2520 ucgcccggaa gcgugauuau uuuucgggug ucccuggacc cgcacgccca agucgccgug 2580 gguauccugc gcaaucaucu gacucaguuc agcccucacu ucaaguccgg cagccuugcc 2640 guggacaacg ccgauccgau ccugaagauc ccauucgccu cacucgccuc acggcucaca 2700 cuggccgaac ucaaucagau ccucuaucgc ugugaauccg aagagaagga ggacggcgga 2760 gguugcuacg auauuccgaa uugguccgca cugaaauacg ccggacugca gggccucaug 2820 uccguguugg ccgaaauccg cccuaagaac gaccucggcc acccguucug caacaaccuc 2880 agaucuggag acuggaugau cgauuacgug ucaaaccgcc ugaucucgag guccggcacu 2940 aucgccgaag ucggaaagug gcuccaagca auguucuucu accugaagca gaucccucgc 3000 uaccugauac cuuguuacuu cgacgccauc cucauuggcg ccuacacuac ucugcuggau 3060 acugccugga agcaaaugag cagcuucgug cagaacggaa gcacuuucgu caagcaucug 3120 ucgcucggga gcgugcagcu gugcggcguc ggaaaguuuc cuucccugcc cauucugucc 3180 ccugcccuca uggaugugcc guaccgccuu aacgagauca cuaaggagaa ggagcagugu 3240 ugcgugagcc uggcugccgg gcucccucac uucucguccg gaaucuucag augcuggggc 3300 cgcgacaccu ucauugcccu gcgagggauc cuguugauua cuggccgcua cguggaggcc 3360 aggaauauca uucucgccuu cgcgggaacc cugcggcacg gccugauccc uaaccuccug 3420 ggagaaggaa ucuaugcgag auauaacugc agggacgccg ugugguggug gcuccagugc 3480 auccaggacu acugcaagau ggugcccaac gggcuggaca uccucaagug ccccguguca 3540 cggauguacc caacugauga cagugcuccu cugccggccg guacucucga ccagccacuc 3600 uuugaaguca uccaggaggc caugcagaag cacaugcagg gcauucaauu ccgggagagg 3660 aacgccggac cucagauuga ccggaacaug aaggacgagg guuucaauau cacugccggc 3720 guggacgaag aaaccggcuu cgucuacgga ggaaacagau ucaacugcgg aaccuggaug 3780 gauaagaugg gagaaagcga cagagcgcgg aacaggggua ucccugccac uccccgggac 3840 ggaucggccg uggaaauugu gggacuuucc aaguccgccg ugcgguggcu ccuggagcuu 3900 uccaagaaga acaucuuccc uuaccaugaa gugaccguga agcggcacgg gaaggccauc 3960 aaagucuccu acgaugaaug gaaccgcaag auucaggaca auuucgagaa gcuguuccau 4020 gucuccgagg acccuucuga ccugaaugag aagcauccca accuggugca caagagaggc 4080 aucuacaagg acagcuacgg agcuuccucc ccuuggugcg auuaccagcu ccggccaaac 4140 uucacuaucg ccaugguggu ggcgccugaa cuguucacca cugaaaaggc cuggaaggcg 4200 cucgaaaucg cggagaagaa gcugcucggg ccucucggga ugaaaacccu cgacccugau 4260 gauauggugu acugcggaau cuacgauaac gcccuagaca acgacaacua caaccuggcc 4320 aagggauuca acuaccauca ggggcccgag ugguuguggc cuauuggcua cuuccugaga 4380 gccaagcucu acuucucccg ccucaugggc cccgaaacca cugccaagac caucgugcuc 4440 gugaagaacg ugcucucccg gcacuaugug caccuugagc gcucgccaug gaagggacug 4500 cccgaacuga cuaacgagaa cgcccaguac ugccccuucu ccugugaaac ucaggccugg 4560 uccaucgcca caauuuugga aacccucuac gaucuguag 4599 <210> 16 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 16 augggacauu caaagcaaau ccggauucug uuacuuaaug agauggagaa guuggagaaa 60 acauuguuua gacucgagca gggcuacgaa cugcaguuuc gccugggccc uacacuacaa 120 gggaaagccg ucaccgucua uacaaacuau cccuuccccg gcgaaacguu uaaucgggag 180 aaguucagau cucuggauug ggagaacccc accgaacggg aggaugauag cgacaaguau 240 ugcaaacuga acuugcagca gucuggcagu uuucaguauu auuuucugca agggaacgag 300 aaguccggcg gcggcuauau aguggucgac cccauccuuc gugugggagc ugacaaccau 360 guguugcccc uggacugugu uacacugcaa accuuucugg cuaagugucu cgguccuuuu 420 gaugaauggg aaucgcggcu caggguggca aaagaauccg gcuauaacau gauucauuuu 480 acaccccugc aaacccuggg ccucucaagg aguuguuaca gccuugccaa ucagcuggag 540 cugaaccccg acuuuucccg ucccaaccgg aaguauacuu ggaacgacgu gggccagcuc 600 guagaaaagc ugaaaaagga guggaacgug aucuguauaa ccgauguggu cuauaaccac 660 accgccgcca auucgaagug gauccaggag caucccgagu gugcuuacaa ccucgugaac 720 agcccccauc uuaagcccgc uuggguacuu gaccgcgcac uuuggagguu uuccugugac 780 guggcugagg ggaaguauaa ggaaaagggc auccccgccc ugaucgaaaa cgaccaucac 840 augaacagua uacggaagau cauuugggag gauauuuuuc ccaaacugaa gcugugggag 900 uuuuuucaag uggaugugaa caaggcuguc gaacaguuua ggaggcugcu gacccaagaa 960 aauagacgcg ugacuaagag cgacccaaau cagcauuuga caauuauaca ggaccccgaa 1020 uaucgccgau ucggcuguac cguggauaug aauaucgcau ugacuacuuu caucccccac 1080 gacaagggcc ccgccgcuau ugaggaaugc uguaauuggu uucauaagcg aauggaggag 1140 cugaacucug agaagcacag gcugauuaac uaucaucagg aacaggccgu uaacuguuug 1200 cugggcaacg uguuuuauga acggcuugcc ggccauggcc cgaaguuggg cccgguuaca 1260 agaaagcauc cacuugugac ccgcuacuuc accuuuccgu ucgaagaaau ugacuuuagc 1320 auggaggagu caaugaucca ccuccccaac aaggcuugcu uucuuauggc ucacaacggc 1380 ugggugaugg gcgacgaccc ccugcggaac uuugcggaac cgggcucaga ggucuaucua 1440 agaagggaac ugauuugcug gggcgacucc gugaagcuga gauacgggaa caagccugag 1500 gauugccccu accucugggc ucacaugaaa aaguauacag aaauuacugc uacguauuuc 1560 caaggcguac ggcuugacaa cugucacucc accccacugc augucgccga guauauguua 1620 gaugcugcuc gaaacuugca gcccaauuug uauguggucg cugaacuguu uacggggagu 1680 gaagaucucg acaacgucuu uguaacccga cugggcauca gcucgcuaau ucgggaggcc 1740 auguccgcuu acaacuccca ugaggaaggc cgccuuguau aucguuaugg cggcgaaccc 1800 guggggagcu uuguucaacc gugucuacgc ccccugaugc ccgccaucgc ucaugcccua 1860 uucauggaua ucacucauga caaugagugu ccuauugugc auaggagugc uuaugacgcc 1920 cucccaagca caacgaucgu guccauggcu uguugugcua guggcuccac aagaggcuau 1980 gacgaacugg ugccccauca aaucuccgua gugucugaag agagauuuua caccaagugg 2040 aaccccgagg cucucccuuc aaacacugga gagguuaacu uucaauccgg gauuauugcu 2100 gcuagaugug cuaucagcaa gcuccaucag gaacugggcg caaagggcuu cauucaaguu 2160 uauguagacc agguugacga ggacauaguu gcaguaacuc ggcauucccc uucgauacau 2220 cagucugucg uggccguguc caggacagca uuucgcaauc ccaagacuag cuuuuacucc 2280 aaagaaguac cacaaaugug uauccccggg aagaucgagg aagugguacu ggaagcccgg 2340 acuauugaga gaaacaccaa gccguaucgg aaggacgaga auucuaucaa cggcacaccu 2400 gauauaacag uggaaauacg cgaacacauu caguugaaug aguccaagau cgugaagcag 2460 gccggcgucg ccaccaaggg ccccaacgag uauauccagg agaucgaauu ugaaaaccug 2520 agccccggcu cuguuauuau auuucggguu ucauuagauc cucaugcuca aguggcugua 2580 ggcauccucc ggaaucaucu gacucaguuc ucuccccacu ucaagagcgg cagccuggcu 2640 gucgauaaug ccgaccccau acuuaagauu cccuuugcuu cccuggcuuc aaggcugacc 2700 cuggcugaac uuaaucaaau ccuauaccga ugcgaaagcg aagagaagga agauggcggc 2760 ggcuguuacg auaucccgaa cuggagcgca cugaaauaug cuggcuuaca aggccucaug 2820 aguguguugg cugagauuag acccaagaau gacuugggcc auccauuuug uaacaaccug 2880 agaagcggcg acuggaugau cgauuacgug ucuaaccgac ucaucucccg aagcggcacc 2940 auugcugagg uuggcaaaug gcugcaggcu auguucuuuu aucugaaaca gauuccucgg 3000 uaccugauuc ccuguuauuu cgacgcuauu cugauuggcg cauauaccac gcucuuggac 3060 acugcaugga agcaaaugag cucuuuuguc caaaauggcu ccacuuuugu uaaacaucug 3120 aguuugggca gcgugcaguu auguggcguu ggcaaauuuc caagccugcc cauacugucc 3180 cccgcucuga uggacguccc cuaccgacug aacgagauca ccaaggaaaa ggaacagugc 3240 ugugugucuu uagcugccgg cuugccgcau uuuucaagcg gcauuuuccg guguuggggu 3300 cgggacaccu ucaucgcacu gagaggcauu cugcugauca cuggccgcua uguggaagcu 3360 aggaauauca uuuuagccuu ugcggguacc cuucggcacg ggcugauccc caaucuuuug 3420 ggcgaaggca ucuacgcacg uuacaauugc cgggaugccg uaugguggug gcuccaaugu 3480 auccaggacu auugcaagau gguucccaac ggccucgaua uccugaagug ccccguguca 3540 aggauguauc cuaccgauga cagugcuccc cuuccugcug gcacccugga ucagccgcuc 3600 uuugaaguua uucaggaagc aaugcaaaag cauaugcagg gcauccaguu ucgggaaaga 3660 aacgcuggcc cgcaaauaga caggaacaug aaggaugaag gcuucaauau uacugcuggc 3720 guagacgaag agacaggguu cgucuacggc ggcaauaggu uuaacugugg cacuuggaug 3780 gacaagaugg gcgaaucuga ccgcgcgagg aacagaggca ucccagcaac accgagggac 3840 ggcagcgcug uggagauugu gggccugucu aagucugccg ugcgcuggcu acucgaacug 3900 uccaagaaga auaucuuucc cuaucaugaa gucaccguaa agcggcaugg caaagcuauu 3960 aagguuuccu augacgagug gaacaggaag auucaggaca auuuugagaa gcuguuccau 4020 gugucggagg acccuagcga ucucaacgag aagcacccca acuuaguaca uaagaggggc 4080 aucuauaagg auagcuaugg cgcuagcagc ccuuggugug acuaucagcu ccgucccaac 4140 uuuaccauug cuaugguagu ggcgcccgag uuguuuacca cugagaaggc uuggaaggcu 4200 cuugaaauag ccgagaagaa auugcugggc ccccugggca ugaaaacucu ggaucccgau 4260 gacaugguau acuguggcau cuaugacaau gcccuggaca augacaauua caaucuggcc 4320 aaggguuuua acuaucacca gggcccugaa uggcuguggc cuauuggcua uuuucuucgc 4380 gccaagcuau auuuuaguag gcugaugggu ccagaaacaa cugcaaagac aauugugcuc 4440 gugaagaacg ugcuuucccg gcacuaugug caucuggaaa ggaguccaug gaagggcuug 4500 ccggaauuga cuaacgagaa cgcccaguau ugucccuuuu cuugugaaac ucaggccugg 4560 uccauugcua cuauucugga gacucuauau gacuuguag 4599 <210> 17 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 17 augggccauu ccaagcaaau ucgaauucug cugcugaacg aaauggaaaa guuggaaaag 60 acauuguucc gucuggagca gggcuaugag cugcaguuua ggcuuggccc gacguugcag 120 ggcaaagccg ugaccguaua uacuaacuau cccuucccug gcgaaacguu uaaccgggag 180 aaguuucgcu cacuggacug ggagaauccc acggaaaggg aggacgauag cgauaaguac 240 uguaaacuga aucugcaaca gucuggcucu uuccaauauu auuuucugca agggaacgag 300 aaguccgggg gcggcuauau uguaguggac cccaucuuga gagugggcgc ugacaaccau 360 guauuacccc uugauugcgu gacgcugcag accuuucugg cuaaguguuu gggcccuuuc 420 gaugaguggg aaagccggcu gaggguggcc aaggagagcg gcuauaauau gauucauuuu 480 accccuuugc aaacucuggg gcucucuagg agcuguuauu ccuuggcuaa ucagcuggaa 540 cugaaccccg auuuuagccg gcccaaccga aaguauacau ggaaugacgu ugggcaauug 600 guugagaagc ugaagaagga auggaauguu auauguauaa cagacguggu guauaaccau 660 accgcugcua auucgaaaug gauucaggaa cauccugagu gcgccuacaa ccucguaaau 720 aguccucauc ugaagccggc uugggugcug gacagggcuc ucuggagguu uagcugugau 780 guggccgaag ggaaguauaa ggagaagggu aucccggcuc ugauugagaa cgaccaccau 840 augaacagua uaaggaagau aaucugggag gacauuuuuc ccaaacugaa gcugugggaa 900 uucuuucaag uggacgugaa caaggccguu gagcaguuua gacgcuugcu gacacaagag 960 aaccgaaggg ucaccaagag ugacccuaac cagcaucuua caauuaucca agaccccgag 1020 uaucgucggu uuggcuguac uguggacaug aacauugcuc ugaccaccuu uauaccccac 1080 gauaagggcc ccgcugcuau cgaagagugu uguaacuggu uccacaagag gauggaagag 1140 uugaacucug aaaagcaucg gcugauuaac uaucaucagg aacaggcugu gaacugccug 1200 cucggcaacg uauucuacga gagauuggcu ggccauggac cuaagcuggg cccgguuacg 1260 agaaagcauc cccugguuac gcgguauuuc accuucccgu uugaggagau ugauuuuagc 1320 auggaagaau ccaugaucca ccuccccaac aaggcuugcu uccugauggc acauaacgga 1380 uggguuaugg gcgacgaccc ccugaggaau uuugcugaac ccggcuccga agucuaucug 1440 agaagggaac ugaucuguug gggcgacucc gucaaguugc gcuauggcaa uaagccugag 1500 gacuguccau aucugugggc ucacaugaag aaguacacag agaucaccgc uacauacuuu 1560 cagggcguca ggcucgacaa uugucacucc acaccccugc acguggcuga guauaugcug 1620 gaugccgcua ggaaucucca gccuaaccua uauguggucg cugaacuguu caccggcucu 1680 gaggaucugg auaauguguu ugugacacgc cugggcauca gcucccugau ccgcgaggcu 1740 augagugccu acaauaguca cgaggaaggc cggcuugugu accgcuaugg cggcgaaccc 1800 gugggcagcu uuguacaacc uugucugcgg ccucugaugc ccgcuauugc ucacgcuuug 1860 uuuauggaca ucacccauga caacgaaugu cccauuguac accggucugc uuacgacgcu 1920 cugcccucca caacuauugu caguauggcu uguugugcau cuggcucaac ucggggcuac 1980 gacgaauuag uuccgcauca aaucucugua guguccgaag aacgguuuua uacaaaaugg 2040 aaccccgaag cgcugcccuc caauaccggc gaagugaacu uucagucugg gaucaucgcc 2100 gcuagaugug cuauuucuaa acugcaucag gaacugggcg cuaagggcuu uauucaagua 2160 uauguggacc aggucgacga ggacaucgua gcuguaaccc ggcacagccc cagcauacau 2220 cagagugucg uggcuguguc uagaacagcu uuuaggaacc caaagaccuc uuuuuacucc 2280 aaagagguuc cacagaugug uaucccgggc aaaauugagg aaguggucuu ggaggccagg 2340 acaauugagc guaauacgaa gcccuauaga aaggaugaga auagcaucaa cggcacuccu 2400 gauaucacug uggaaauccg ggagcauaua caguugaacg agucuaagau cguuaagcag 2460 gcugguguag cuaccaaggg ucccaaugag uauauucagg aaauugaguu ugaaaaccug 2520 uccccgggca gcguaauuau cuuuagaguc agucucgacc cccaugcuca aguggcagug 2580 gggauccugc ggaaccauuu gacucaguuc uccccccauu uuaagucugg cagucuggcc 2640 guugacaacg cugaccccau auugaagauu cccuuugcuu cccuggcuuc acgguugacc 2700 cuggccgaac ugaaccagau uuuauaucgc ugcgaguccg aggaaaagga ggauggcggc 2760 ggcuguuaug acauucccaa cuggucugcu cuaaaauacg cugggcugca gggucugaug 2820 agugugcugg cugaaauucg ccccaagaac gaccugggcc auccauuuug caacaaucug 2880 cgcaguggcg acuggaugau ugauuaugug uccaaccggc ugauuagucg gagcggcacg 2940 aucgcagaag ucggcaaaug gcuccaggcu auguuuuuuu accuaaagca gauacccaga 3000 uaccugaucc cuuguuauuu ugacgcuaua cugauuggcg cuuacacaac cuugcuggac 3060 accgccugga agcagaugag cagcuuuguc caaaauggca gcacauucgu gaagcauuug 3120 ucucugggca gugugcagcu guguggcgug ggcaaauuuc caaguuugcc gauccugucu 3180 cccgcuuuga uggaugugcc auaucgacug aacgagauaa ccaaggaaaa ggaacagugu 3240 uguguuucac ucgcugcugg cuugccccau uuuuccucug gcauuuuccg auguuggggg 3300 agggacacau ucauugcccu gcgugggauc cugcugauua ccggccgcua cguugaggcu 3360 agaaacauua uuuuggcuuu cgccggcaca uugagacaug gucugauacc caaucugcug 3420 ggcgaaggca uauaugcuag guauaacugu cgcgacgcag ugugguggug gcugcaaugc 3480 auccaggauu auugcaagau gguuccuaac ggccuagaca uccugaagug cccagugucc 3540 cggauguauc caaccgauga uucagcuccc cugcccgccg guacacugga ccaaccccug 3600 uucgaaguua uucaagaagc caugcagaag cacaugcagg guauccaguu ucgagagagg 3660 aaugcaggcc cccaaauuga ccggaacaug aaggaugaag gcuucaacau uacugcuggc 3720 gucgacgaag aaacaggguu uguguacggc ggcaaccggu uuaacugcgg cacauggaug 3780 gacaagaugg gcgaaagcga ucgcgcacgg aaccggggca uccccgccac gccgcgugau 3840 ggcucugcug uggagaucgu cggccucagc aaauccgcug uccgauggcu guuagagcug 3900 ucgaagaaga acaucuuucc cuaccaugag guuaccguua agagacacgg caaagcuauc 3960 aaagugucuu augacgaaug gaauagaaag auucaagaca acuucgagaa acuguuucau 4020 guguccgagg aucccagcga ccucaacgaa aagcauccca aucucguaca uaagaggggc 4080 aucuauaagg acucauaugg cgcaucaagu ccuuggugcg acuaucagcu ucggcccaau 4140 uucacgaucg caauggucgu ggcacccgag cuguuuacua cggagaaggc uuggaaggcu 4200 cuggaaaucg cugagaagaa gcugcugggc cccuugggca ugaaaacccu ggaucccgac 4260 gacaugguau acuguggcau auaugacaac gcucuggaua acgauaacua uaauuuggcu 4320 aaaggcuuua auuaucacca gggcccagaa uggcuauggc ccauuggcua cuuucugcga 4380 gcuaagcuau auuuuucucg ccugaugggc ccugaaacca ccgcuaagac uaucgugcuc 4440 gucaagaacg uacugaguag gcauuacgug cacuuggagc gcagcccaug gaagggcuug 4500 ccggaacuga cgaacgaaaa cgcucaguau uguccguuuu cuugugaaac acaggcuugg 4560 aguauugcua cuauccugga aacucuguac gaucuguag 4599 <210> 18 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 18 augggucauu ccaaacaaau uaggauccug cuguugaacg aaauggaaaa gcucgaaaag 60 accuuauuuc gccuggagca gggcuaugag uugcaguuuc ggcugggacc aacucugcaa 120 ggaaaggcug uaaccgugua cacaaauuau ccuuuucccg gcgaaacguu uaacagggag 180 aaguuucgau cucuggauug ggagaacccc acugaaaggg aggacgauag cgacaaguau 240 ugcaaacuga aucugcaaca guccggcagc uuucaauauu auuuucugca agggaacgaa 300 aagagcggcg ggggcuauau uguaguagac ccuauacuga gagucggagc ugacaaccau 360 guucugcccu uggacugcgu gacacugcag accuuuuugg cuaagugucu gggccccuuu 420 gaugaauggg agagucggcu ccguguggcu aaggagagcg gguacaauau gauucacuuu 480 accccccugc aaacuuuggg acuuucccgg agcuguuaua gccuggcaaa ccagcuggag 540 uugaauccug acuuuucccg cccaaauagg aaguauaccu ggaacgacgu gggccaacug 600 guggagaagc ugaagaagga guggaacgug aucugcauua ccgacgucgu guauaaucau 660 accgccgcca acuccaagug gauacaggaa cauccugagu gugcuuacaa ccucguaaac 720 uccccgcauc ugaagccagc uuggguucug gauagagcuu uguggcgguu cagcugugac 780 gucgcugagg gaaaguacaa ggaaaaaggg auuccugcuc ucaucgagaa ugaccaccac 840 augaacagua uuaggaagau uaucugggag gacaucuucc cgaagcuaaa gcugugggaa 900 uucuuccaag uggacgugaa caaggccgug gagcaguucc gacggcuguu aacucaagag 960 aaccguaggg ucacaaaauc ggauccuaac cagcaccuga ccauuaucca agacccggaa 1020 uaucggcggu ucggcuguac uguggacaug aacauugcuu ugacaacuuu cauuccccac 1080 gacaaggguc cagcagcuau cgaggaaugu uguaauuggu uucauaagcg gauggaggaa 1140 cucaacuccg agaagcauag gcugauuaau uaucaucagg aacaggcugu gaauugucug 1200 uugggcaaug uuuucuacga acggcuggcu ggccauggcc ccaaacucgg accuguuaca 1260 aggaagcauc cacugguuac ccgauacuuu accuuuccau uugaagaaau ugauuuuagc 1320 auggaagaau ccaugaucca ucuaccuaac aaggccuguu uucugauggc ccauaacggc 1380 uggguuaugg gagaugaucc cuugcggaac uuugcugaac ccggaucuga aguauaucug 1440 cggagagagu ugauuuguug gggcgacucc guaaagcugc gcuauggcaa caagccagag 1500 gacugucccu auuugugggc ucauaugaag aaguauaccg agaucaccgc uacguauuuu 1560 caaggcguca ggcucgauaa uugucauucc acuccgcugc auguugcuga guauauguug 1620 gacgcugcuc gaaaucugca gcccaauuug uauguugugg ccgagcuguu uaccggcucc 1680 gaggaccucg auaacguguu cgucacgcga cuaggcauca gcagcuugau ccgggaagcc 1740 auguccgcuu auaacuccca cgaggagggc cgacuggucu accgcuaugg cggcgaacca 1800 gugggcaguu uuguacagcc uugucugagg ccccucaugc ccgcuauugc ucaugcucug 1860 uucauggaca uuacucauga uaacgagugc ccuauagugc aucgguccgc cuacgacgcc 1920 cugccgagca cuacaauagu guccauggcu uguugugcaa gcgggagcac ccgcggcuau 1980 gacgagcugg ugccgcauca aauaucugua gucagcgaag aaagguuuua uaccaagugg 2040 aacccggaag cuuuaccuuc caauacuggg gaagugaacu uucagagcgg cauuaucgcu 2100 gcgagaugug cuauauccaa guugcaucag gaacuggggg caaagggguu uauucaagua 2160 uauguagacc agguugacga agauauagug gcugugacac gccacagccc aagcauccac 2220 caguccgugg uggcugucag ccggacugcu uuucgcaacc caaagacaag cuuuuauagc 2280 aaagaagugc cgcagaugug cauucccggc aaaauugagg aggucgugcu ggaggcuagg 2340 acuaucgaaa ggaacaccaa gccguacagg aaggacgaga auuccaucaa cgggacucca 2400 gauauuacag uugagauccg ggaacauauu caguugaaug agucgaagau uguuaagcag 2460 gcuggcguag cuacaaaggg gccaaacgag uauauucaag agauagaauu cgaaaaccug 2520 agccccgguu ccgugaucau uuuucgagug ucccuggauc cucaugcuca aguggccguu 2580 ggcauucuga gaaaccaucu cacacaauuu uccccucacu uuaaaagugg cagccuggcu 2640 guggacaacg ccgauccgau ccugaagauu ccauucgcuu cccuggcuag ucgccugaca 2700 cuggcugaac uaaaccagau ucuuuaccgc ugugaaucug aagagaagga ggacggcggc 2760 gguugcuaug acaucccaaa uuggagcgcu cugaaauacg cugggcugca gggccucaug 2820 agcguacugg cagaaaucag acccaagaac gaccugggcc accccuucug uaacaaccug 2880 agguccggcg auuggaugau cgacuaugug ucgaacagac ucaucucaag aagcggcacu 2940 auagcugagg ucggcaaaug guugcaggcu auguucuuuu aucugaagca aauuccgcgg 3000 uaucugaucc cgugcuauuu ugacgcuaua uugaucggcg cuuauacgac uuugcuggac 3060 acagccugga agcagauguc cagcuucgug cagaacggca gcacuuuugu gaagcaccug 3120 agucugggcu caguacagcu guguggcgug ggcaaauucc ccagccuacc aauucugucc 3180 cccgcucuga uggauguucc cuaucggcug aacgagauua ccaaggaaaa ggagcaaugu 3240 ugcgugagcc uggcagccgg ccugccccac uuuucuuccg gcauuuuucg cuguuggggu 3300 cgggacaccu ucauugcacu gcggggcauc cuguuaauca ccggccgcua uguggaagcu 3360 agaaauauua ucuuggcuuu ugcuggcacu cugcgacacg gccugauccc caaccuucug 3420 ggcgaaggca ucuaugcucg cuacaauugu cgcgacgccg ucugguggug gcugcagugu 3480 auacaggacu auugcaagau ggugccaaau ggccuggaca uccuuaaaug uccaguuucc 3540 cggauguacc caacugacga cagcgcuccu uugccugccg gcacacugga ucagccgcug 3600 uuugaaguga uccaggaagc uaugcagaag cauaugcagg gcauucaguu ucgggaacga 3660 aaugcuggcc cacaaauuga cagaaacaug aaggaugagg guuuuaacau uacugcuggc 3720 gucgaugaag agacaggguu uguguacggc ggcaacaggu ucaacugcgg cacauggaug 3780 gacaagaugg gcgaaucuga ccgugcuagg aacaggggaa uccccgcuac cccccgggac 3840 ggcagcgcug uggaaaucgu aggccugucc aaguccgccg uucgcuggcu ucuggagcug 3900 agcaagaaaa acaucuuucc cuaucacgag gucacaguga agagacaugg caaagcuauc 3960 aaagucucuu acgaugagug gaauagaaag auucaagaua acuuugaaaa guuguuccac 4020 guuucggagg accccagcga ucugaaugag aagcauccca acuuggugca caagaggggc 4080 auauacaagg acucuuaugg ugcuagcagc ccuuggugcg acuaucagcu gaggcccaac 4140 uuuacuaucg ccaugguggu ggcaccggaa cuguuuacaa cggagaaggc uuggaaggcu 4200 cuggaaauug cugagaagaa guugcugggg ccccugggga ugaaaacgcu ggauccagac 4260 gacauggucu acuguggcau auaugauaau gcucuggaua acgauaauua caaucuggcu 4320 aaggguuuca acuaucauca ggggccagag uggcucuggc cuauuggcua uuuccuccgu 4380 gcuaagcugu acuuuucucg ccugaugggg ccagaaacua ccgcaaagac cauuguauug 4440 gucaagaacg ugcugagccg gcauuaugua cauuuggaac gguccccuug gaaaggccug 4500 cccgaacuca cuaacgagaa cgcucaguau uguccguuuu ccugcgaaac ccaggcuugg 4560 uccaucgcaa cuauuuugga aacccuguac gaccuguag 4599 <210> 19 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 19 augggccaca gcaagcaaau cagaauccuc cugcucaacg agauggaaaa gcucgaaaag 60 acccuguuca gacuggagca gggauacgag cugcaguucc gccucggacc aacccuccaa 120 gggaaggccg ugaccgugua caccaacuac ccauucccgg gagaaaccuu caaccgggaa 180 aaguucagga gccuggacug ggaaaacccc accgagagag aggacgacag cgacaaauac 240 ugcaagcuga accuccaaca gagcggcagc uuccaguacu acuuccucca aggaaacgaa 300 aagagcgggg gcggcuacau cgugguggac ccaauccugc gggucggggc agacaaccac 360 gugcugccac uggacugcgu gacacugcag accuuccugg ccaagugccu gggaccguuc 420 gacgaauggg agagccggcu gcggguggcc aaggagagcg gcuacaacau gauccacuuc 480 acaccgcucc aaacccucgg ccugagcaga agcugcuaca gccuagccaa ccagcuggag 540 cucaacccgg acuucagcag gcccaacaga aaguacaccu ggaacgacgu gggacagcuc 600 guggaaaagc ugaaaaagga auggaacgug aucugcauca ccgacguggu guacaaccac 660 accgccgcca acagcaaaug gauccaggaa cacccggaau gcgcguacaa ccucgugaac 720 agcccccacc ugaagccggc cuggguacug gacagggcac uguggcgcuu cagcugcgac 780 guggccgaag gaaaguacaa ggagaagggc auccccgccc ugaucgagaa cgaccaccac 840 augaacagca uccggaagau caucugggag gacaucuucc caaagcugaa gcugugggag 900 uucuuccaag ucgacgugaa caaggccgug gaacaguuca gacgccugcu gacgcaggag 960 aaccggaggg ucaccaagag cgaccccaac cagcaccuga ccaucaucca agacccggaa 1020 uaccggagau ucggaugcac cguggacaug aacaucgccc ugaccaccuu caucccacac 1080 gacaaggggc ccgcagccau cgaggagugc ugcaacuggu uccacaagag aauggaggaa 1140 cugaacagcg aaaagcaccg ccucaucaac uaccaccagg aacaggccgu gaacugccuc 1200 cucggaaacg uguucuacga gcggcuggcc ggccacgggc ccaagcuggg ccccgugacc 1260 cgcaagcacc cgcucgugac gcgguacuuc accuucccgu ucgaagaaau cgacuucagc 1320 auggaggaga gcaugaucca ccucccgaac aaggccugcu uccucauggc ccacaacggc 1380 ugggucaugg gcgacgaccc gcugcggaac uucgcagagc ccggaagcga aguguaccuc 1440 agaagggagc ugaucugcug gggagacagc gugaagcugc gcuacggaaa caagcccgag 1500 gacugcccgu accugugggc gcacaugaag aaguacaccg agaucaccgc caccuacuuc 1560 caaggagugc ggcuggacaa cugccacagc accccgcugc acguggccga guacaugcug 1620 gacgccgcca gaaaccucca gcccaaccuc uacguggugg cagagcuguu caccgggagc 1680 gaggaccucg acaacguguu cgugacccga cucggcauca gcagccugau ccgggaagca 1740 augagcgccu acaacagcca cgaggaaggg aggcuggugu acagauacgg aggagaaccc 1800 gugggcagcu ucgugcagcc gugccugagg ccccugaugc cagccaucgc gcacgcgcug 1860 uucauggaca ucacccacga caacgaaugc ccgaucgugc accggagcgc auacgacgcc 1920 cugccgagca ccacgaucgu cagcauggcc ugcugcgcca gcggcagcac ccgaggauac 1980 gacgagcugg ugccccacca aaucagcguc gucagcgaag aacgcuucua caccaagugg 2040 aacccggaag cacugccgag caacaccgga gaagugaacu uccagagcgg aaucaucgcc 2100 gcgcgcugcg cgaucagcaa acugcaccag gaacugggag ccaagggguu cauccagguc 2160 uacgucgacc aaguggacga ggacaucgug gcagugaccc gccacagccc cagcauccac 2220 caaagcgugg uggccgugag ccggacagcg uuccggaacc ccaagacgag cuucuacagc 2280 aaagaggugc cccagaugug caucccggga aagaucgagg aaguggugcu cgaagcgcgc 2340 accaucgaac gcaacaccaa accguaccgc aaggacgaaa acagcauaaa cgggaccccc 2400 gacaucaccg uggagaucag ggaacacauc cagcugaacg agagcaagau cgugaagcag 2460 gccggggucg ccaccaaggg cccgaacgag uacauccagg agaucgaguu cgagaaccuc 2520 agccccggga gcgugaucau cuucagaguc agccuggacc cacacgccca aguggccgug 2580 ggcauccucc ggaaccaccu gacccaguuc agcccgcacu ucaagagcgg gagccucgcc 2640 guggacaacg ccgacccgau ccugaagauc ccguucgcga gccuggccag ccggcucacc 2700 cuggccgaac ugaaccagau ccuguaccgc ugcgagagcg aagaaaagga ggacggagga 2760 gggugcuacg acaucccaaa cuggagcgcg cugaaauacg cgggccugca gggccugaug 2820 agcgugcugg ccgaaauccg ccccaagaac gaccugggac acccauucug caacaaccug 2880 aggagcggag acuggaugau cgacuacguc agcaacagac ugaucagccg cagcggcacc 2940 aucgccgaag ucggaaaaug gcuccaggcc auguucuucu accugaagca gaucccgcgg 3000 uaccugaucc cgugcuacuu cgacgccauc cugaucggcg ccuacaccac ccugcucgac 3060 accgccugga agcagaugag cagcuucguc caaaacggga gcaccuucgu gaagcaccuc 3120 agccugggca gcgugcagcu gugcgggguc ggaaaauucc cgagccugcc cauccugagc 3180 ccggcgcuga uggacgugcc guacagacug aacgagauca ccaaggaaaa ggaacagugc 3240 ugcgugagcc uggccgccgg acugccgcac uucagcagcg gcaucuuccg gugcuggggg 3300 cgcgacaccu ucaucgcccu gcggggaauc cugcugauca cgggccgcua cguggaggcc 3360 cggaacauca uccuggccuu cgccggcacc cugcggcacg gacugauccc gaaccuccug 3420 ggagagggga ucuacgcccg guacaacugc cgggacgccg ugugguggug gcugcagugc 3480 auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgucagc 3540 cggauguacc cgaccgacga cagcgccccg cuccccgccg gaacccucga ccagccacug 3600 uucgaaguga uccaggaggc caugcaaaag cacaugcagg gaauccaguu cagagaacgg 3660 aacgccggac cccagaucga ccggaacaug aaggacgagg gauucaacau caccgccgga 3720 gucgacgagg aaaccggcuu cgucuacgga gggaaccggu ucaacugcgg aacauggaug 3780 gacaagaugg gagagagcga ccgcgccagg aaccgcggaa ucccagcaac cccgcgggac 3840 gggagcgcag uggaaaucgu ggggcugagc aaaagcgccg ugcgguggcu gcucgaacuc 3900 agcaagaaga acaucuuccc cuaccacgaa gucaccguga agagacacgg aaaggccauc 3960 aaagucagcu acgacgaaug gaacaggaag auacaggaca acuucgagaa gcuguuccac 4020 gucagcgagg acccgagcga ccugaacgag aagcacccca accuggugca caagcgcggg 4080 aucuacaagg acagcuacgg cgcgagcagc ccguggugcg acuaccaacu gcgccccaac 4140 uucaccaucg ccauggucgu ggcccccgaa cucuucacga ccgagaaagc guggaaggcg 4200 cuggagaucg cggaaaagaa gcuccucgga ccccugggga ugaaaacccu ggaccccgac 4260 gacauggugu acugcggcau cuacgacaac gcgcuggaca acgacaacua caaccuggcc 4320 aagggcuuca acuaccacca gggccccgaa uggcuauggc cgaucggcua cuuccugcgg 4380 gccaagcugu acuucagccg ccucaugggc ccagaaacca ccgcaaagac caucgugcug 4440 gucaagaacg uccugagccg ccacuacgug caccucgaga gaagcccaug gaagggacug 4500 cccgagcuga ccaacgaaaa cgcgcaguac ugcccguuca gcugcgaaac ccaggccugg 4560 agcaucgcca ccauccugga aacacuguac gaccucuag 4599 <210> 20 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 20 augggccaca gcaaacagau ccggauccuc cuacucaacg aaauggaaaa gcucgaaaag 60 acucuguucc ggcuggagca aggauacgag cuucaguucc gguugggccc gacgcugcag 120 gggaaggccg ugacagucua cacuaacuac ccauuccccg gcgaaaccuu caacagagag 180 aaguucaggu cccuggacug ggagaacccc acugaacggg aagaugauuc cgacaaguac 240 ugcaagcuga accuccagca auccgguuca uuccaguacu auuuccugca aggaaacgaa 300 aagagcggag gaggcuacau ugugguugau ccaauccuuc gcgugggagc cgauaaucau 360 gugcugccgc uggauugcgu cacccugcaa accuuccugg cgaagugccu gggcccguuc 420 gacgaauggg aaucccgccu gcgggucgcc aaagaguccg gguauaacau gauccacuuc 480 accccacucc aaacucuugg ccuguccaga uccugcuacu cguuggccaa ccaguuggag 540 cugaacccgg acuucucacg gccuaaccgg aaguacacuu ggaacgacgu cggacaacuc 600 guggagaagc ugaagaagga auggaauguc aucugcauua cugaugucgu guacaaccac 660 acggcggcga auucaaagug gauccaggag cacccagaau gcgccuacaa ccuggucaau 720 uccccucacc ugaagccggc cugggugcuc gaccgggccc uguggcgguu uucgugcgau 780 guggcggagg gaaaguacaa ggagaagggg auuccggcuc ucaucgaaaa cgaccaccac 840 augaacucca uccggaaaau uaucugggag gacaucuucc cgaaacuuaa gcugugggaa 900 uucuuccaag uggacgucaa caaggcugug gagcaguucc ggagauugcu gacacaagaa 960 aaccgccgcg ugaccaaauc cgauccgaac cagcaccuga cuaucauuca agacccggaa 1020 uaccggaggu uuggcugcac uguggacaug aauaucgcgc ugaccaccuu caucccgcac 1080 gacaagggac cggcagccau cgaagagugc uguaacuggu uccauaagag gauggaagaa 1140 uugaacucug aaaagcaccg gcugauuaac uaccaucagg aacaggccgu gaacugucuc 1200 cugggaaacg uguucuacga gcggcuggcg ggacacggac ccaagcucgg ccccgugacc 1260 cgcaagcauc cucucgugac uagauacuuu acuuucccau ucgaggagau cgacuucucc 1320 auggaagaau caaugaucca ccucccuaac aaggcuugcu uucugauggc acacaacggc 1380 ugggugaugg gcgaugaccc ccugaggaac uuugccgagc ccggcuccga aguguaccug 1440 aggagagagc ugauuugcug gggggacagc gucaagcugc gcuauggaaa caagccggaa 1500 gauugcccuu accucugggc ccacaugaag aaguacacug agauuacugc caccuacuuu 1560 caaggagugc gccuggauaa cugccacuca accccgcugc augucgcuga guacauguug 1620 gacgcagccc ggaaucugca accgaaccuc uacguggugg cggagcuguu caccggcucg 1680 gaggaucucg acaacguguu cgugacucgc cugggcaucu caucgcugau ccgggaagca 1740 auguccgccu acaacuccca ugaggagggu cggcuggugu accgcuacgg cggagaaccc 1800 gugggguccu ucgugcaacc gugccugcga ccccugaugc ccgccaucgc ccaugcccuc 1860 uuuauggaua uuacccacga uaacgaaugc ccuaucgugc accgcucagc cuaugaugcc 1920 cuccccucca ccaccaucgu guccauggcc ugcugcgccu cggggagcac ccgggguuau 1980 gacgagcugg ugccgcacca gauuucggug guguccgagg agagauucua caccaagugg 2040 aacccagaag cucugccguc aaacacugga gagguuaacu uucaguccgg uauuaucgcc 2100 gcuagaugug cuauuagcaa acugcaccaa gagcugggcg ccaaggguuu cauccaaguc 2160 uacgucgauc aggucgacga ggacaucgug gcugucacua ggcacucacc uagcauccac 2220 cagagcgugg uggccgugag ccgcacugcc uuccgcaacc caaagaccag cuuuuacucc 2280 aaggaggucc cucagaugug cauuccugga aagaucgaag aagugguccu ggaagcccgg 2340 accaucgaac gcaacaccaa gccuuaccgg aaggacgaaa acucgaucaa cgguaccccg 2400 gauauuacug uggagauucg cgaacacauc cagcucaaug aguccaagau cgugaagcag 2460 gccggagugg caaccaaggg gccgaacgag uacauccagg agaucgaauu cgagaaucuc 2520 agcccuggca gcgugaucau cuuccgagug ucguuggacc cacaugcuca ggucgccgug 2580 ggcauccuga ggaaccaccu gacccaguuu uccccgcauu ucaaguccgg uucgcuggcc 2640 guggacaacg cagauccgau ccugaagauc cccuucgccu ccuuggcuuc gcgccucacg 2700 cuggccgagc ugaaccagau ccuguauaga ugcgaauccg aagaaaagga agauggaggc 2760 gguuguuacg acaucccgaa cugguccgcc uugaaauacg ccggacugca gggauugaug 2820 uccgugcugg ccgaaauuag accgaagaac gaccuggggc acccguucug caacaaccuc 2880 cggucggggg acuggaugau ugauuacgug ucgaaccgcc ucaucucccg guccgguacu 2940 auugcggagg ucggcaaaug gcuccaggcc auguucuucu acuugaagca aaucccccgc 3000 uaccugaucc ccugcuacuu cgacgccauc cugaucggag ccuacaccac ccugcuggac 3060 accgcgugga agcagauguc uagcuucguc cagaacggcu ccaccuucgu gaagcaccug 3120 ucacugggcu cagugcagcu gugcggaguu ggaaaguucc ccagccugcc uauccugucc 3180 ccggccuuga uggacgugcc guacagacug aacgaaauca cuaaggagaa ggagcagugu 3240 ugcgugucgu uggcggccgg gcugccccac uuuucaagcg ggauuuuccg gugcugggga 3300 agggacaccu ucaucgcgcu gcggggaauc cugcugauua ccggacgcua cguggaggcu 3360 cggaacauca uucucgcguu cgccggcacc cugcgccaug gacugauccc uaaucugcuu 3420 ggagagggca ucuacgcucg guacaacugc agagaugccg ugugguggug gcuccaaugc 3480 auccaggauu acugcaagau ggugccuaac ggucuggaca uucugaagug cccugugucc 3540 cgcauguacc ccaccgacga cuccgccccc cugccugccg gaacccucga ccagccucug 3600 uucgaaguca uccaagaggc caugcagaag cauaugcagg gcauucaguu ccgcgaacgg 3660 aacgcagggc cccagaucga ccggaacaug aaggaugaag gguucaacau caccgccgga 3720 guggaugaag agacuggauu ugucuacgga ggaaaccgcu uuaacugcgg gaccuggaug 3780 gacaagaugg gagagucaga cagggccaga aauagaggaa uccccgcgac cccgcgcgac 3840 ggauccgccg uggagauugu gggccuguca aagagcgccg uccgcuggcu gcuggaacuu 3900 agcaagaaga acaucuuccc uuaccacgaa gugaccguga aaagacaugg caaagccauc 3960 aaagucuccu acgacgagug gaaccgcaag auucaggaca acuucgaaaa gcuguuccac 4020 guguccgaag aucccuccga ucugaacgag aagcauccga accuggucca uaagcgggga 4080 aucuacaagg auagcuacgg ugccagcucg ccguggugug acuaccagcu gcggccaaau 4140 uucacgauug cgauggucgu cgccccugag uuguucacca cugagaaggc cuggaaagcc 4200 cuggaaauag ccgagaagaa auuacugggg ccacugggca ugaaaacucu cgacccugac 4260 gacauggugu acuguggaau cuacgacaac gcacuggaca acgauaacua caauuuggcc 4320 aagggauuca acuaccacca ggggcccgaa uggcuguggc cuaucggaua cuuccuucgg 4380 gcaaagcuuu acuucucccg ccugauggga ccugaaacua cugccaagac cauugugcuu 4440 gugaagaacg ugcucucacg gcacuacgug caccuggaga gauccccgug gaaggggcuc 4500 ccggagcuga ccaacgagaa cgcccaguac ugcccuuucu ccugcgaaac ccaagccugg 4560 uccaucgcca ccauacuuga aacucuguac gaccuguag 4599 <210> 21 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 21 augggacacu ccaagcagau ccgcauucuc cuccugaacg aaauggaaaa gcuggaaaag 60 accuuauuuc gccuugaaca aggauacgag cugcaguucc ggcuuggacc gacccuccaa 120 gggaaagcug ucaccgucua caccaacuac cccuucccgg gggagacuuu caacagagag 180 aaguucagau ccuuggacug ggaaaauccc acggaacggg aggacgacuc cgauaaguac 240 uguaaacuga accuccagca gucgggaucg uuccaguacu acuuccuaca agggaacgaa 300 aaguccggug gugguuacau cgugguggac ccgauccugc gcgugggggc cgacaaccac 360 gugcugccgc uggacugcgu gacucugcaa accuuccugg ccaagugccu cggcccguuc 420 gaugaauggg agucgagacu gcggguggcc aaggaaagcg gauacaauau gauucacuuu 480 acuccgcugc aaacccuggg gcugucgcgc uccugcuacu cgcucgcuaa ccagcuggaa 540 cugaauccgg auuuuagccg gccgaaccgg aaguauacgu ggaacgacgu cggucagcug 600 gucgagaagc ucaagaagga guggaacguc auuugcauca ccgacguggu cuacaaccac 660 accgcggcca auuccaagug gauccaggaa cacccggagu gcgccuauaa cuuggugaac 720 uccccucauu ugaaacccgc augggugcuc gaccgggccc uguggcgcuu uucaugcgac 780 guggcggaag ggaaguacaa ggaaaagggg auucccgccc ugaucgagaa cgaucaccac 840 augaacucaa uucgcaaaau caucugggag gauaucuucc cuaagcucaa gcugugggaa 900 uucuuccaag ucgacgucaa caaggccgug gaacaauuca gaaggcugcu gacccaagag 960 aaccgcagag ugaccaaguc ggacccgaac cagcaccuga cuauaaucca ggacccggaa 1020 uaccggaggu ucgguugcac cguggacaug aacauugcac ucaccaccuu caucccgcac 1080 gauaaggguc cggcggcgau ugaggagugc ugcaacuggu uccacaagcg gauggaggaa 1140 cugaacuccg agaagcaccg gcugauuaac uaccaccagg aacaggcugu gaauugccug 1200 cuggggaacg uguucuacga acggcucgcc ggccacggcc ccaagcuggg gcccgucacc 1260 cgcaagcacc cgcucgugac ucgauauuuc accuucccgu ucgaggaaau ugauuucucc 1320 auggaggaau caaugaucca ucugccgaac aaggccuguu ucuugauggc ccacaacggc 1380 ugggugaugg gagaugaccc gcugagaaau uucgccgagc cgggguccga gguguaccug 1440 aggagagaac ucaucugcug gggggauucc gugaaacugc gcuacgggaa caagcccgag 1500 gacugccccu accugugggc acauaugaag aaguacaccg aaaucaccgc caccuacuuc 1560 caaggggucc ggcuggauaa cugccauuca acuccgcucc auguggccga auacaugcug 1620 gacgccgcac ggaacuugca gcccaaccuc uacguggugg ccgaacucuu cacugggagc 1680 gaagaucucg auaacguguu cgugacccgg cucggaauuu cgagccugau ccgggaagcg 1740 augucugcuu acaacucgca cgaagaggga aggcuggugu acagauacgg gggggagccc 1800 gugggauccu ucgugcaacc gugccugagg ccgcuuaugc ccgcgaucgc ccacgcucug 1860 uucauggaca ucacccacga caacgaaugu ccgauugucc accggagugc cuacgaugcc 1920 cuuccgagca cuaccaucgu gucgauggcg ugcugugcgu ccgggucuac ccgcggcuac 1980 gacgaacucg ucccgcacca aaucagcgug guguccgaag aacgguuuua cacuaagugg 2040 aacccggagg ccuugcccuc gaacaccggg gaggucaacu uccagucggg aaucauugcc 2100 gcccgaugug ccaucucaaa guugcaccaa gaacucgggg caaagggguu cauccaagug 2160 uacguggacc aaguggacga ggauauugug gccgugacca ggcacucccc gucgauccac 2220 caguccgugg uggcagucuc aagaacugcc uuccggaacc ccaagaccuc cuuuuacucg 2280 aaggaagugc cccagaugug caucccgggc aaaaucgaag aagucgugcu ggaagccaga 2340 acuaucgagc ggaacaccaa gcccuaccgg aaggaugaga acagcaucaa cggcacgccc 2400 gacaucaccg ucgagaucag agagcacauc cagcugaacg aauccaagau ugucaagcag 2460 gccggcguag cgacuaaggg acccaacgaa uacauccagg agaucgaauu cgaaaaccug 2520 ucgccgggau ccgugauuau cuuccgggug ucccuggacc cgcacgccca aguggccgug 2580 ggaauccugc ggaaccaccu gacccaguuc uccccgcauu ucaaguccgg cucccuggcg 2640 guggacaaug cagacccgau ucucaagauc ccguucgccu ccuuggccuc ccgccugacc 2700 cucgccgaac ucaaccagau ccuguaccgc ugcgagucug aggaaaagga ggacggggga 2760 ggaugcuacg auauuccgaa cuggucugcc cuuaaauacg cgggacugca gggucugaug 2820 ucggugcucg ccgagaucag accgaagaac gaccuggggc acccguuuug caacaaccug 2880 agaucggggg auuggaugau cgacuacgug ucgaaccggc uuaucucucg cuccggcacc 2940 aucgccgagg ucgggaagug gcugcaggcc auguucuucu accugaagca aauuccgcgc 3000 uaccugaucc cgugcuacuu ugaugccauc cugaucggcg ccuacacgac cuugcuggac 3060 accgccugga agcagaugag cagcuucgug cagaacggcu ccacguucgu gaagcaucug 3120 ucccugggau ccgugcagcu uugcgguguc ggaaaguucc cuucgcugcc uauucugucc 3180 ccggcgcuga uggacgugcc guaccggcug aacgagauca cuaaggagaa ggaacaaugc 3240 ugcgugucac uggcggcggg acucccccac uucuccuccg ggauuuuccg guguugggga 3300 agagauaccu ucauugcccu gagggggaua cugcugauca ccggaagaua cguggaggcu 3360 agaaacauca uccucgccuu cgccggcacu cuccgccacg ggcugauccc caaccucuug 3420 ggcgaaggaa ucuacgcccg guauaacugc cgcgacgcgg ucugguggug gcuucagugc 3480 auccaggauu acugcaaaau ggugccgaau ggacuggaua uucugaagug ccccguuagc 3540 cgcauguacc ccaccgauga cuccgcaccc uugccggcgg gcaccuugga ccagccgcuc 3600 uuugaaguga uccaggaggc caugcagaag cacaugcagg guauccaguu cagagagcgg 3660 aacgcugggc cgcagauuga ccggaacaug aaggacgaag guuucaacau uacugccggg 3720 guggacgaag agacuggguu uguguacggg gggaaccgcu ucaacugugg gaccuggaug 3780 gauaagaugg gggagucgga ucgggcucgg aacaggggga uccccgcuac cccccgggac 3840 gggucggcug uggagauugu cgggcugagc aagagcgcag ugcgcuggcu gcuggagcuc 3900 agcaaaaaga acaucuuccc cuaccacgaa gucacuguga agagacacgg aaaggccauc 3960 aagguguccu acgaugagug gaacagaaag auccaagaca acuucgagaa gcuguuccau 4020 guguccgagg auccgagcga ucugaacgaa aagcauccga accucgugca caagcgcggg 4080 aucuacaagg acucguacgg cgcauccucg ccguggugcg acuaccagcu gcgccccaau 4140 uucaccauug ccaugguggu ggcgcccgag cuguucacua ccgagaaggc cuggaaggcc 4200 cuggagauug cugagaagaa gcugcuggga ccgcucggga ugaaaacuuu ggacccugac 4260 gacauggugu acuguggaau cuacgacaau gcgcucgaca acgacaacua caaucuugcg 4320 aagggauuca acuaccauca ggggcccgaa uggcuguggc cgaucgggua cuuccugcgc 4380 gccaagcugu acuucucccg gcugaugggg cccgagacaa ccgccaagac cauugugcuc 4440 gucaagaacg uucucucccg gcacuacgug caccucgaaa gauccccgug gaaggggcug 4500 cccgagcuca ccaacgagaa cgcacaguac ugcccguucu ccugugaaac ccaggccugg 4560 agcaucgcca ccauauugga aacucuguau gaccucuag 4599 <210> 22 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 22 augggacacu cgaaacagau cagaauccug uugcugaacg aaauggagaa gcuggaaaag 60 acccucuuuc ggcucgaaca gggcuacgag cugcaguucc gccugggucc gacucuacaa 120 ggaaaggcag ugacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180 aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugauuc cgacaaguac 240 ugcaagcuga accuccaaca guccggauca uuccaguacu acuuuuugca aggaaacgag 300 aaguccggag gaggcuacau cguggucgac ccgauucuga gagugggagc ugacaaucau 360 guccugccuc uggacugcgu aacccugcaa accuucuugg ccaaaugccu gggcccguuc 420 gaugaguggg aaagccgccu ccgggucgca aaggaaagcg gcuacaauau gauucacuuc 480 acuccucugc aaacccucgg ucugucccgg uccuguuauu cccuggcgaa ccagcuggag 540 cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccac 660 accgcggcca acuccaagug gauccaagaa caucccgaau gcgcguacaa ccucgugaac 720 agcccgcauc ugaagccugc cugggugcug gauagggccc ucuggagauu cagcugcgac 780 guggccgagg ggaaguacaa agaaaaggga auucccgccc ugauugagaa cgaccaucac 840 augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacgugaa caaggcagug gagcaguuca gaaggcugcu gacucaagaa 960 aacagacggg ucacuaaguc cgacccuaac cagcaccuua ccaucauuca agacccggag 1020 uaccgccggu uuggcugcac ugucgacaug aacaucgccc ugaccacuuu caucccgcau 1080 gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200 cugggaaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260 cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuuuucc 1320 auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380 ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcagcga ggucuaccug 1440 agaagggaac ugauuugcug gggagacucc gucaagcugc gcuauggaaa caagcccgaa 1500 gauugccccu accugugggc ucacaugaag aaguacacug aaaucacugc cacguacuuc 1560 cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcuc 1620 gaugcagcga ggaaucugca gcccaaucug uacgugguug ccgaacuguu caccggcucc 1680 gaggaccucg acaacguguu cgugaccaga cuugggauuu ccagccugau ccgggaagcc 1740 augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg cggagaaccc 1800 gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860 uucauggaua uuacccacga caacgaaugc cccaucgugc aucgcucggc cuacgacgca 1920 cugccuucga ccaccaucgu guccauggcc ugcugcgccu ccgguagcac ccgcggauac 1980 gaugaacucg ugccgcacca gaucagcgug guguccgaag aaagauucua caccaagugg 2040 aacccugagg cacugccgag caacaccgga gaagugaacu uccagucggg uauuaucgcc 2100 gcucgcugug ccaucuccaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160 uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220 caauccgucg ucgccguguc acggacugcc uuccggaacc ccaagacuuc guucuacucg 2280 aaagaggugc cacagaugug uauccccgga aagaucgaag aggucguccu ggaagcccgg 2340 accauugaga ggaacaccaa gccuuaccgg aaggacgaga acagcaucaa cgguaccccu 2400 gauauuacug uggagauccg cgaacacauc cagcucaacg aaucaaagau ugucaagcag 2460 gccggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccguc 2580 ggcauccuca gaaaccaccu gacccaguuc ucaccccauu ucaaguccgg uucccuggcg 2640 guggacaacg ccgauccgau cuugaagauc cccuuugcau cccuggccuc ccgccugacu 2700 cucgcggaac ugaaccagau ccuguaccgc ugcgaaucag aggaaaagga ggacggcggc 2760 ggcuguuacg auaucccgaa uugguccgcu cugaaauaug cgggacuuca ggggcugaug 2820 agcgugcugg cggagauccg gccgaagaau gaccugggac acccauucug caacaacuug 2880 cggagcggag acuggaugau cgauuacguc agcaacagau ugaucucccg gagcggcacu 2940 aucgcggagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000 uaccucaucc cguguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060 accgccugga agcagaugag cuccuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120 ucacugggau cagugcagcu cugcggcgug ggaaaauucc ccucgcugcc cauucugagc 3180 ccggcccuca uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 uguguuuccc uggcugccgg acuuccacac uucucguccg gcaucuuccg gugcuggggc 3300 cgggauaccu ucauugcccu gcggggcauc uuguugauca ccggucgcua cguggaggcu 3360 cggaacauua uucuggcauu cgccggcacu cugagacacg gucugauucc gaaucuuuug 3420 ggcgaaggaa ucuacgcccg cuacaacugu cgggacgccg ugugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540 aggauguauc caaccgacga cagcgcgccu cugccggccg ggacccucga ccaaccccug 3600 uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagaga 3660 aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720 guggacgaag aaaccgguuu uguguacgga ggaaaccggu ucaacugcgg uaccuggaug 3780 gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840 ggaucagcgg uggaaauugu gggacugagc aagagcgccg ugcgcuggcu ccuggaacug 3900 agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960 aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020 guguccgagg aucccuccga ucugaacgaa aagcauccga aucucgugca caagcgcggc 4080 aucuacaagg acucguacgg agccuccucc ccuuggugcg auuaucagcu gcggccuaac 4140 uucaccauug ccauggucgu ggcuccggag cuguucacua cugagaaggc cuggaaggca 4200 cuugaaauug ccgagaagaa gcugcuuggg ccuuugggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuggaca acgacaacua caaucuggcg 4320 aagggcuuca auuaccacca gggcccggaa uggcuguggc cuauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440 gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggccuu 4500 ccugagcuga ccaacgaaaa cgcccaguac ugccccuucu ccugcgaaac ccaggcuugg 4560 uccauugcca cuauacugga aaccuuauau gaccuguag 4599 <210> 23 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 23 augggacacu caaagcagau ccggauccuc cugcugaacg aaauggaaaa gcucgaaaag 60 acucuguucc ggcuggaaca gggcuaugag cugcaguucc ggcucggacc gacgcugcaa 120 ggaaaggccg ugacugugua caccaacuac cccuucccgg gagaaacuuu uaacagagaa 180 aaguuuaggu cccuggacug ggagaacccg accgagcggg aagaugacuc cgauaaguac 240 ugcaagcuga accuccagca gucgggaucg uuccaguacu acuuccuuca aggaaaugag 300 aagucuggug gaggauacau cgugguggac cccauccuga gagugggagc cgacaaucac 360 guccugccgc uugacugcgu gacucugcaa accuuccugg cuaagugucu cgggccguuc 420 gacgaauggg aguccaggcu gcgcguggcu aaggagagcg gcuacaauau gauccacuuc 480 accccgcucc aaacucucgg acucucgcgc uccuguuacu cccucgccaa ccaacuggag 540 cugaacccgg acuucucccg cccgaaccgg aaguacaccu ggaacgacgu cggucagcuc 600 guggagaaau ugaagaagga guggaacgug aucugcauua cggacgucgu guacaaccau 660 acugcggcca acuccaagug gauucaagag cacccggaau gcgcuuacaa ccuugucaac 720 uccccgcacc ugaagccggc cugggugcug gacagagccc uguggcgguu cucgugcgac 780 guggcagagg gaaaguacaa ggagaagggc auccccgccc uuauugagaa ugaccaucac 840 augaacucca uccggaagau caucugggag gauaucuucc cgaagcucaa gcugugggaa 900 uucuuccaag uggacgugaa caaggccgug gaacaguucc ggagacuccu gacccaagaa 960 aaccggagag ugaccaagag cgacccgaac cagcaucuga cuaucauuca ggauccggag 1020 uaucggcggu uuggcugcac uguggacaug aacaucgccc ucaccaccuu caucccgcac 1080 gacaagggcc ccgccgcgau cgaggaaugc ugcaacuggu uccacaagcg cauggaggag 1140 cugaauuccg aaaagcaccg ccugaucaac uaccaucagg agcaggcagu gaacugucuc 1200 cugggaaacg uguuuuacga acggcuggcc ggacacggcc cgaagcuggg ucccgugacc 1260 cgcaagcauc cccucgugac gcgguacuuc accuucccgu ucgaggagau cgacuucagc 1320 auggaagagu ccaugaucca ucugccgaac aaggccugcu uccucauggc gcauaauggu 1380 ugggucaugg gagaugaucc ccuccgaaac uuugcggagc cggguucgga aguguaucug 1440 aggagggagc ucaucugcug gggagauagc gugaaacuga gauacgggaa caagccggaa 1500 gauuguccgu accugugggc acacaugaag aaguacaccg aaaucacugc cacuuacuuc 1560 caaggaguuc gccuggauaa cugccauuca accccucugc augucgccga guacaugcug 1620 gacgccgcuc gcaaccuuca gccgaaucuc uacguggucg ccgagcuguu caccgguucc 1680 gaagaucugg acaacguguu cgugacuaga cugggaauca gcagccugau ccgggaagcg 1740 augagcgccu acaacuccca cgaagagggc cggcucgugu auagauacgg cggagagccg 1800 gucgggagcu ucgugcaacc cugccugcgg ccgcugaugc ccgccauugc ccacgccuug 1860 uucauggaua ucacccacga caacgagugu ccgaucgugc accggagcgc guacgacgcg 1920 uuaccgucca ccacgauugu gucgauggcc ugcugcgccu ccggaucgac ccgcggcuac 1980 gaugagcugg ucccgcauca aaucagcguc gucagcgaag aacgguucua cacuaagugg 2040 aaccccgagg cgcuccccuc caacaccgga gaagugaacu uccaauccgg cauuaucgcu 2100 gcacgcugcg cgauuagcaa gcugcaucag gagcuuggcg cuaagggguu cauacagguc 2160 uacguggauc aggucgacga ggacauugug gccgugacuc gccacucacc guccauucac 2220 caaagcgugg uggcuguguc ccggaccgcu uuccggaauc ccaagaccuc auucuacucc 2280 aaggagguuc cgcagaugug uaucccggga aagauugagg aagugguccu agaggcucgc 2340 acuauugaac gcaacaccaa gccguacaga aaggacgaga auuccauuaa cgggaccccg 2400 gauauuaccg uagaaauuag agaacauauu cagcugaacg agucgaagau cgugaagcag 2460 gccggggugg cuaccaaggg cccgaacgaa uacauccagg agauugaguu cgaaaaccuc 2520 ucccccggcu cggugaucau cuuccgggug ucccucgauc cccacgccca aguggccgug 2580 ggaaucuuga gaaaccaccu gacucaguuc agcccgcauu ucaaguccgg aucacucgcc 2640 guggacaacg ccgacccgau ccuuaagauc cccuucgcau cacuggccag ccgccugacc 2700 cuugccgaac ugaaccaaau ccucuaucgg ugcgaauccg aggagaagga agaugggggu 2760 ggaugcuaug acauuccuaa cuggucugcc cugaaauacg caggccugca gggacugaug 2820 uccguccugg ccgaaauccg cccgaagaau gaccuggggc accccuuuug caacaaucug 2880 agguccggag auuggaugau ugauuacgug uccaaccgcc ugauuucgcg gagcggcacc 2940 aucgcggaag ugggaaagug gcugcaagcc auguuuuucu accugaaaca gaucccccgg 3000 uaccucaucc cgugcuauuu cgaugcgauu uugauuggcg cguacaccac ccuccucgac 3060 acugccugga agcaaaugag cuccuucgug caaaacgguu caaccuucgu caagcacuug 3120 ucgcuggggu cgguccaacu guguggaguc ggaaaguucc cgagccugcc cauccugucg 3180 ccugcccuga uggacgugcc cuaccggcug aacgagauca ccaaagaaaa ggagcagugc 3240 ugcguguccc uggcggccgg acucccccau uucucguccg ggaucuuuag auguugggga 3300 cgggauacuu ucauugcgcu gcgcggcauc uuguugauua ccggacgcua cguggaagcg 3360 cggaacauca uacucgccuu cgccggcacc cucagacacg gccugauccc gaaccuccug 3420 ggagaaggca ucuacgcacg auacaacugu cgggacgccg ucugguggug gcugcagugc 3480 auucaggacu acugcaagau ggugccgaac ggucuggaca uccugaagug ccccguguca 3540 aggauguacc cgaccgacga uagcgcaccg cugcccgcgg ggacccugga ucagccgcug 3600 uucgaaguga uccaagaagc caugcaaaag cacaugcagg gaauucaguu cagagaaagg 3660 aacgcaggcc cccagauuga ccggaacaug aaggacgagg guuucaacau caccgccggc 3720 gucgacgaag aaacgggguu uguguacggg ggcaaccgcu ucaacugcgg uacuuggaug 3780 gacaagaugg gggaaucaga ccgcgcccgc aaccgcggaa uuccggcgac cccgcgcgau 3840 ggauccgcag uggaaaucgu gggacugucc aagucggcug ugcgguggcu gcuggagcug 3900 uccaagaaga acaucuuccc guaccacgag gucaccguga agagacacgg gaaggccauc 3960 aagguguccu acgacgaaug gaaccggaaa auccaggaua acuucgaaaa acuguuucac 4020 guguccgagg acccgucuga ccugaacgaa aaacacccga acuuggugca uaagcgggga 4080 aucuacaagg acaguuacgg agccucaagc ccguggugcg acuaccagcu gcggcccaac 4140 uucacaaucg cgaugguggu ggcgcccgag cuuuucacca cggagaaagc cuggaaggca 4200 cuggagaucg cugaaaagaa gcugcucggu ccccucggca ugaaaacccu ggacccggac 4260 gauauggugu acugcggaau cuacgacaac gcccuggaca augauaacua caaccuggcc 4320 aagggauuca auuaccacca ggggccggaa uggcuguggc cgaucggcua cuuucugcgg 4380 gcuaagcucu acuucucgcg gcugauggga ccggaaacca cagccaagac cauuguccuc 4440 gucaagaacg ugcugucccg ccacuacgug caucuggagc ggucaccuug gaagggccug 4500 cccgagcuga ccaacgaaaa cgcccaguac ugccccuucu ccugugaaac ucaagccugg 4560 ucaaucgcca cuauucucga aacucuguac gaucuguag 4599 <210> 24 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 24 augggucaca gcaaacaaau ccggauccug cugcucaacg aaauggaaaa gcuggaaaag 60 acucuguuuc gccuggagca gggcuacgaa cuccaauucc ggcugggacc aacgcugcaa 120 gggaaggccg ucaccgugua caccaacuac cccuuucccg gagagacuuu uaaccgcgaa 180 aaguucagaa gccuggacug ggaaaacccc accgaacggg aagaugauuc ggacaaguac 240 ugcaagcuga accuccagca guccggcagc uuccaguacu acuuccucca agggaacgaa 300 aagagcggag gaggcuacau cgugguggau ccgauccuuc ggguuggagc ggacaaccau 360 gugcugccuc uggacugcgu gacucugcaa accuuccuag ccaagugccu cggcccguuc 420 gaugaguggg aaucccggcu gcgaguggcg aaggagucag guuacaacau gauccacuuc 480 acaccgcugc agacccuggg acucucccgg uccugcuacu cauuggccaa ccagcucgaa 540 cugaacccgg acuucucaag gccgaaccgc aaguacacuu ggaaugacgu gggacaguug 600 guggagaagc ugaagaaaga guggaacgug aucugcauua ccgacguggu guacaaccac 660 acugcggcga auucgaagug gauucaggaa cauccggaau gcgccuacaa cuuggugaac 720 ucaccucacc ugaagccugc cugggugcug gacagagccc uguggcgcuu uagcugugac 780 gucgcggagg ggaaguacaa ggaaaaggga auccccgccc ugaucgagaa cgaccaccau 840 augaauagca uucgcaagau caucugggag gacauuuucc cgaagcugaa gcugugggag 900 uucuuccaag ucgacgucaa caaggccguc gaacaguucc ggcgguugcu gacccaagaa 960 aaccggagag ugacgaaaag cgacccuaac cagcaccuga caaucauuca ggacccugaa 1020 uaccggagau ucggcuguac cgucgauaug aacaucgccc ugaccaccuu uauuccccac 1080 gauaagggcc cggcggccau cgaggagugu ugcaacuggu uccacaagag aauggaggaa 1140 cucaacuccg aaaaacaccg guugauuaau uaccaccagg agcaggcggu caacugccug 1200 cugggcaacg uguucuacga aaggcucgcu gggcacggcc cuaagcuggg accugucacu 1260 cggaaacacc cccuggugac ccgguacuuu acuuucccgu ucgaagagau cgacuucucc 1320 auggaggaaa gcaugaucca ccucccuaac aaggccugcu uccugauggc ccacaacgga 1380 ugggucaugg gcgacgaccc uuugcggaac uuugccgagc cgggcucaga gguguaccuu 1440 agacgcgaac ugaucugcug gggagacucc gugaagcugc gcuacgggaa caagcccgaa 1500 gauuguccuu accugugggc acacaugaag aaguacaccg aaaucacugc caccuacuuc 1560 caaggagugc gcuuggauaa cugucauagc acuccucugc acgucgccga guacaugcug 1620 gacgcagcca ggaaucucca gccuaaucug uacguggugg ccgaacuguu caccgggagc 1680 gaggaccugg acaacguguu cgugacccgg cugggcauca gcucccuuau ccgggaggcc 1740 auguccgcau acaacucgca cgaggagggu cgccuggugu accgcuacgg aggagagccg 1800 gucggaucau uuguccaacc augccuccgg ccccugaugc cagcgaucgc gcacgcucuc 1860 uucauggaca ucacccacga uaacgaaugc ccuaucgugc accggagcgc uuacgacgcc 1920 cucccuucga ccaccauugu guccauggcc ugcugcgccu ccgguuccac ucggggcuac 1980 gaugaacugg ugccacacca gauuuccgug gugucagagg agcgguucua caccaagugg 2040 aacccagagg cgcugccgag caacacuggg gaagugaacu uccaguccgg aaucauagcg 2100 gcuagaugug caauuuccaa gcuucaucag gagcugggcg ccaaaggauu cauccagguc 2160 uacguggacc aaguggauga ggacauugug gccgugacua gacauucacc gucaauccac 2220 caaucggucg uggcuguguc cagaaccgca uuccgcaacc ccaagacuuc cuucuacucc 2280 aaggaggucc cucagaugug caucccggga aagaucgagg agguggugcu ggaggccagg 2340 accaucgaaa gaaacacuaa gccuuaccgg aaagacgaaa acuccaucaa ugggacuccc 2400 gauauuaccg uggagauuag ggagcacauu cagcugaacg aaucaaagau ugugaaacag 2460 gccggggucg caacuaaagg gccuaaugag uacauccaag agaucgaguu cgaaaaccug 2520 ucgccggguu ccgugaucau uuuccgcgug uccuuggacc cucacgccca aguggccgug 2580 ggcauccuga ggaaccaccu gacccaguuc agcccacacu ucaaguccgg auccuuggcu 2640 guggacaacg ccgauccaau ccucaagauc ccuuuugcgu cgcuggccuc acggcuuacc 2700 cuggccgagc ugaaccagau ccuguaccgc ugcgagagcg aagaaaagga ggacggugga 2760 gguugcuacg acauuccaaa cugguccgcg cuuaaguacg ccggacucca gggucugaug 2820 uccgugcuug ccgagaucag accgaaaaac gaccuggggc accccuuuug caacaaccug 2880 agaagcggag acuggaugau cgacuaugug uccaaccggc ugauuucgag aagcgguacu 2940 auugccgagg ucggaaagug gcuccaagca auguuuuucu accugaagca aauuccccgc 3000 uaccugaucc cgugcuacuu ugacgccauu cugaucggug cauacacuac ccugcuggac 3060 accgcgugga agcagauguc cagcuucgug cagaauggcu ccaccuucgu caagcaucug 3120 ucccucggaa gcgugcagcu gugcggagug ggaaaguuuc cgucgcugcc aauccugucc 3180 cccgcgcuga uggauguccc guaccggcug aacgaaauca cgaaggaaaa agaacagugc 3240 ugcguguccc uugccgccgg acugccgcac uucuccuccg gcauuuuccg gugcugggga 3300 cgggauaccu ucaucgcgcu gagagguauu cugcugauua ccggcagaua uguggaagcc 3360 cgcaacauca uccuggccuu ugccggcacu cugcggcacg ggcucauccc uaaccucuug 3420 ggagaaggca ucuacgcgcg cuacaacugc cgggaugcug ugugguggug gcugcagugc 3480 auccaggacu acuguaaaau ggugcccaau ggccuugaca uccucaagug cccagugucc 3540 cggauguacc cgaccgauga cuccgcgccc cugcccgccg gcacccuuga ucaaccucug 3600 uucgaaguca uccaagaggc caugcagaag cacaugcagg gaauccaguu cagggaaaga 3660 aacgccgggc cucagaucga ccggaacaug aaggacgagg gauucaacau uaccgccgga 3720 guggacgagg aaacuggcuu cguguacggu ggaaaccgcu ucaacugcgg caccuggaug 3780 gauaagaugg gcgaauccga ucgcgcccgc aaccggggaa ucccagcaac uccuagggac 3840 ggaagcgcag ucgagaucgu ggggcugucc aaguccgccg ugcgguggcu cuuagaacug 3900 uccaagaaga auauuuuccc cuaccacgag gucaccguga agcgccaugg aaaggccauc 3960 aaaguguccu augacgaaug gaaccgcaag auccaggaca acuucgaaaa guuguuccac 4020 guguccgagg accccagcga ucugaacgaa aagcacccca accucgugca caagaggggc 4080 aucuacaagg acuccuacgg agcuagcucc ccuuggugcg auuaccaacu gcggccuaau 4140 uucaccaucg ccauggucgu cgcacccgaa cucuucacca ccgagaaggc cuggaaggcu 4200 cuggaaaucg ccgaaaagaa gcuucugggc ccgcugggca ugaaaacucu cgauccugac 4260 gauauggucu acuguggcau cuacgacaac gcccuugaca acgacaacua caaccuggcc 4320 aagggcuuua acuaccacca gggcccagag uggcucuggc ccaucggaua uuuccugcgg 4380 gccaaacugu acuucucgcg guugaugggu ccggaaacca cagcuaagac caucgugcuc 4440 gugaagaaug ugcugucgcg gcacuauguc caucuggagc gcucccccug gaagggacuc 4500 ccugagcuga cuaaugagaa cgcccaguac ugcccuuucu ccugcgaaac ccaggccugg 4560 agcaucgcua ccauucucga aacgcucuac gaucuguag 4599 <210> 25 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 25 augggacauu cuaaacagau ucggauccuc cugcucaacg aaauggagaa gcucgaaaag 60 acccuguucc ggcucgaaca gggauacgaa cugcaauucc ggcugggucc caccuuacaa 120 ggaaaggccg ugacugucua caccaacuac ccguuccccg gcgaaaccuu caauagggag 180 aaguuccggu cccucgauug ggagaacccu acagagcgcg aagaugauuc agacaaguau 240 ugcaagcuga auuugcagca gagcggcuca uuccaauacu acuuccugca aggaaacgaa 300 aagucgggcg gcggcuacau cgugguggac ccuauucuga gagugggcgc cgacaaccau 360 guccugccgc uggacugcgu cacccugcaa acuuuccugg ccaagugccu ggguccuuuc 420 gaugaguggg aaucgagacu ucgcguggca aaggaaucgg guuauaauau gauucacuuc 480 accccgcugc aaacccuggg ccugucgcgg ucuugcuacu cacuggccaa ccagcuggaa 540 cugaacccag auuucucacg ccccaaccgg aaguacaccu ggaacgaugu gggccagcuu 600 guggaaaagc ucaaaaagga guggaacgug aucugcauua cugacguggu guacaaccau 660 acugcugcua auuccaagug gauccaggaa cauccugagu gugcuuacaa ccuggucaac 720 uccccacacc ugaagcccgc cugggugcug gaucgggcuc ucuggcgguu cuccugcgau 780 gucgccgaag gaaaguacaa ggagaagggg aucccugcgc ugaucgaaaa cgaccaucac 840 augaauucca ucaggaaaau caucugggag gacaucuucc cuaagcucaa gcugugggag 900 uucuuucaag ucgacgugaa caaggccgug gagcaguuca gacggcugcu gacacaagag 960 aaccgccgcg ucaccaagag cgacccgaau cagcaccuga cgauuaucca ggacccugag 1020 uacagaagau ucggcugcac cguggauaug aacauugcuc ugaccaccuu caucccccac 1080 gauaaggguc ccgcagccau ugaggagugc ugcaacuggu uccacaagag gauggaagaa 1140 cugaauuccg agaagcaccg gcugaucaau uaucaccaag aacaagccgu gaacugccuu 1200 cugggaaacg ucuuuuacga gcgccuggcg ggacaugggc caaagcucgg gcccgugacc 1260 agaaagcacc cacuggucac ccgcuacuuc accuucccgu ucgaggaaau cgacuucagc 1320 auggaagagu cgaugaucca cuugccgaac aaggccugcu uccucauggc ccauaacggu 1380 ugggucaugg gcgaugaccc ucuucgcaac uucgcggagc ccgguucuga agucuaucuu 1440 cggcgggaac ugauuugcug gggagacucc gucaagcugc gcuacggaaa caagcccgag 1500 gauugcccgu acuugugggc ccauaugaag aaguacacug agaucacugc cacuuacuuc 1560 caaggagugc gccucgacaa uugucacagc acuccgcugc acguggcgga guacaugcug 1620 gacgccgcuc gcaacuugca gccuaaucug uaugucgugg ccgaguuguu caccggcucg 1680 gaagaucugg acaacguguu cgucacucgc cugggaaucu ccucccugau ccgggaagcg 1740 augagcgccu acaacuccca cgaagagggg cgguuggugu accgcuacgg cggagagccu 1800 gucggaaguu ucgugcagcc cugucugagg ccccugaugc ccgcuaucgc ccaugcgcug 1860 uuuauggaca ucacccacga caacgaaugc ccuauugugc accgcuccgc cuaugaugcc 1920 cugcccucca ccacuauugu cagcauggcc ugcugcgccu cgggguccac ccggggauac 1980 gacgaacugg ugccccacca aauuuccgug guguccgagg aacgguucua caccaagugg 2040 aacccugaag cgcugccauc gaacacugga gaagugaacu uucagucggg aauuaucgca 2100 gcccgaugcg ccaucagcaa gcugcaccag gaacucggcg caaaggguuu uauccaaguc 2160 uacguggacc aggucgacga ggacauuguc gccgugaccc ggcacucccc auccauccac 2220 cagucugugg uggcuguguc aaggacggcu uuccggaacc caaagaccag cuucuacagc 2280 aaggaagugc cucagaugug caucccgggg aagaucgaag aaguggugcu ggaggccaga 2340 accaucgaaa gaaacaccaa gcccuaucgg aaggacgaga acucgaucaa cgguacuccg 2400 gacauuaccg ucgagauacg cgagcacauu cagcugaacg aguccaaaau cgugaagcag 2460 gccggggugg ccacgaaggg ucccaacgag uacauucagg agaucgaguu cgagaaccug 2520 agccccgggu ccgugaucau cuuccgcgug ucccuggacc cccacgccca aguggccgug 2580 ggcauccugc ggaaccaucu gacccaguuc uccccgcacu ucaagagcgg cucgcucgcc 2640 guggacaacg cggacccgau ccucaagauc ccuuucgcau cgcuggccuc ccgccugacc 2700 cuggccgaac ugaaucagau cuuguaccga ugcgaaucag aagagaagga ggacgggggg 2760 ggcugcuacg auauccccaa cuggagcgcg uugaaguacg caggauugca gggauugaug 2820 uccguccucg cugaaauccg cccgaagaac gaccugggac acccguuuug caacaaccug 2880 agaucagggg auuggaugau cgauuacgug ucgaacagac ugaucucgcg cagcggcacu 2940 auugccgaag uggggaagug gcuccaggcc auguucuucu accugaagca gaucccucgg 3000 uacuugaucc cuuguuacuu cgacgccauc cugaucggag ccuacaccac ccugcuugac 3060 acugcaugga agcagauguc cagcuucgug caaaacggaa gcaccuucgu gaagcaccug 3120 ucccugggau ccgugcagcu cugcggcgug ggaaaguuuc cgucccuccc cauccugagc 3180 ccugcccuua uggacgugcc guacaggcug aacgaaauua ccaaagagaa ggagcaaugc 3240 uguguguccu uggcggccgg auugccgcau uucuccuccg ggauuuuccg gugcugggga 3300 cgggacaccu uuaucgcacu gagggguauu cuccugauca ccggucgcua cguggaggcu 3360 cgcaacauua uucuggccuu cgcgggcacg cuuagacaug gauugauccc uaaccuucug 3420 ggagaaggga ucuacgcgcg guacaacugc cgcgaugccg ugugguggug gcugcagugc 3480 auccaggacu acugcaaaau ggugccgaau ggucuggaua uccugaagug uccgguuucg 3540 cggauguacc cuaccgacga cagcgccccu cucccggccg gcacucucga ccagccccua 3600 uuugaaguaa uccaggaggc caugcaaaag cacaugcagg gcauacaguu cagagagagg 3660 aacgccggac cgcagauuga ccggaacaug aaggacgagg gauucaacau uaccgcggga 3720 guggaugagg aaacugguuu cguguacggc ggaaaccggu uuaacugcgg cacuuggaug 3780 gacaagaugg gagaauccga ccgcgcccga aaccgcggaa uucccgccac uccccgcgac 3840 ggcuccgccg uggaaauugu gggacuguca aaguccgcag uccgcuggcu gcuggaacuc 3900 ucaaagaaga acaucuuccc guaccacgag gucaccguga agcggcacgg caaagcgauc 3960 aaagugucgu acgacgagug gaaccggaag auucaggaua acuucgagaa gcuguuucac 4020 guguccgaag auccaagcga ccugaacgag aagcauccca acuuggugca caagcgcggc 4080 aucuacaagg auuccuacgg agccagcagc ccguggugcg acuaccaacu ccgccccaac 4140 uucaccaucg ccaugguggu ggcgccggag cuguucacga cggagaaagc uuggaaggcu 4200 cucgaaaucg cggagaagaa gcugcugggu ccucugggga ugaaaacccu ggacccggac 4260 gauauggugu acugugggau cuacgacaac gcccuggaca acgacaacua caaccucgcc 4320 aagggguuca acuaccacca gggacccgaa uggcucuggc caaucggaua cuuccugaga 4380 gcgaagcuuu acuucucgcg gcugaugggu ccugaaacca cggccaagac caucgugcuc 4440 gugaaaaaug ugcugucaag gcacuacgug caucuggaga ggucgccaug gaagggucug 4500 ccggaacuga ccaacgaaaa cgcacaguac ugccccuuuu cgugcgagac ucaggccugg 4560 uccaucgcca ccauucucga aacucucuac gaccuguag 4599 <210> 26 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 26 augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcuggaaaag 60 acccucuuuc ggcucgaaca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120 ggaaaggcag ucacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180 aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacuc cgacaaguac 240 ugcaagcuga accuccaaca guccggauca uuccaguacu acuuucugca agggaacgag 300 aaguccggag gcggcuacau cguggucgac ccaauacuua gagugggagc cgacaaucau 360 guccugccuc uggacugcgu gacccugcaa accuucuugg cgaaaugucu gggcccguuc 420 gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480 acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540 cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660 acggccgcca acucgaagug gauccaagag caucccgagu gcgcguacaa ccucgugaau 720 agcccgcauc ugaagccugc uugggugcug gauagagccc ucuggagauu cagcugcgac 780 guggccgagg ggaaguacaa agaaaaggga auuccggccu ugauugagaa cgaccaucac 840 augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacucaagaa 960 aacagacggg ucacuaaguc cgauccuaac cagcaccuua ccaucauuca agacccugag 1020 uaccgccggu uuggcugcac cgucgacaug aacaucgccc ugaccacuuu caucccgcau 1080 gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu caacugccuc 1200 cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260 cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320 auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380 ugggucaugg gcgacgaccc acugcgcaau uucgcugagc cuggcucgga ggucuaccug 1440 agaagggaau ugauuugcug gggagacucc gugaagcugc gcuauggcaa caagccugaa 1500 gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc cacguacuuc 1560 cagggagucc ggcuggacaa uugccacucg accccgcucc auguggccga guacaugcug 1620 gaugcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacuggcucc 1680 gaggaccucg acaacguguu cgugaccaga cuggggauuu ccucacugau ccgggaagcc 1740 augucggccu acaacuccca ugaagagggc cgccuggugu accgcuaugg gggagaaccc 1800 gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860 uucauggaua ucacucacga caacgaaugc cccauugugc aucgcucggc cuacgacgca 1920 cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ccgcggauac 1980 gaugaacucg ugccgcacca gaucagcgug guguccgaag aacgguucua caccaagugg 2040 aaccccgaag cccugccuag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100 gcucgcugcg ccaucuccaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160 uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220 caauccgucg ucgccguguc ccggacugcg uuucggaacc ccaagacuuc guucuacucg 2280 aaagaagugc cacagaugug uaucccggga aaaaucgagg aggucgugcu cgaagcccgg 2340 accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400 gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460 gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580 ggaauucuca gaaaccaccu gacccaguuc ucaccacacu uuaaguccgg uucccuggcg 2640 guggacaacg ccgauccgau cuugaagauc cccuucgcau cgcucgccuc ccgccugacu 2700 cucgcggaac ugaaccagau ccuguaccgc ugugaauccg aggaaaagga ggacggcggc 2760 ggcuguuacg auauccccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820 ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880 cggagcggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940 aucgccgagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000 uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060 accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120 ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180 cccgcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 uguguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg guguuggggc 3300 cgggauaccu ucauugcccu gcggggaauc cugcuuauca ccggucgcua cguggaggcu 3360 cggaacauua uucucgcguu cgccggcacc cugagacacg gucugauucc gaaucuguug 3420 ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540 aggauguauc caacugacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600 uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660 aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720 guggacgaag aaaccgguuu uguguacgga ggaaaccgcu ucaacugcgg uaccuggaug 3780 gacaagaugg gagaauccga ucgcgcgcgc aacagaggga ucccggcaac cccucgggac 3840 ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900 uccaaaaaga acaucuuccc cuaccacgaa gugaccguga agagacacgg aaaggccauc 3960 aaagucucau acgaugaaug gaacaggaag auccaggaua acuucgagaa gcuguuucac 4020 guguccgagg aucccuccga ucugaacgag aagcauccga aucuggugca caagcgcggg 4080 aucuacaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140 uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200 cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucucgcg 4320 aagggcuuca auuaccacca aggccccgaa uggcucuggc cuauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440 gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500 ccugagcuga cgaacgaaaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560 uccauugcca cuauacugga aaccuuauau gaccuguag 4599 <210> 27 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 27 augggacacu cgaaacagau ccggauccug uugcugaacg aaauggagaa gcuugaaaag 60 acccuguuuc ggcuggagca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120 ggaaaggccg ugacugugua caccaacuac ccauuucccg gagaaacuuu caaccgggag 180 aaguuccggu cccuggacug ggaaaaccca accgaacgag aggacgacuc ggacaaguac 240 ugcaagcuga accuccaaca guccggauca uuccaguacu acuuucugca agggaacgag 300 aaguccggag gcggcuacau cguggucgac ccgauacuua gagugggcgc cgacaaucau 360 guccugccuc uggauugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420 gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucauuuc 480 accccgcugc aaacccuggg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540 cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660 acggccgcca acucgaagug gauccaggag caucccgagu gcgcauacaa ccucgugaac 720 agcccgcacc uuaagccugc uugggugcug gacagagccc ucuggagauu caguugcgac 780 guggccgagg ggaaguacaa ggaaaaggga auuccggccu ugaucgagaa cgaccaucac 840 augaacucaa ucaggaagau caucugggag gacaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacccaagaa 960 aacagacgcg ucacuaaguc cgauccuaac caacaccuua ccaucauuca agacccugaa 1020 uaccgccggu uuggcugcac cgucgauaug aacaucgccc ugaccacuuu caucccgcau 1080 gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag aauggaagaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaacugccug 1200 cugggcaaug uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260 aggaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucg 1320 auggaagaau ccaugaucca ucugccuaac aaggcuugcu uccugauggc gcacaacgga 1380 ugggucaugg gcgacgaccc ccugcgcaac uucgccgagc cuggcucgga ggucuaccug 1440 agaagggaac uuaucuguug gggagacucc gucaagcugc gcuacggaaa caagcccgaa 1500 gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc aacguacuuc 1560 cagggagucc ggcuggacaa uugccacucc accccccuuc auguggccga guacaugcuc 1620 gaugcagcga ggaaucugca gccgaaucug uacgugguug ccgaacuguu cacuggcucc 1680 gaggacuugg acaacguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740 augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg gggagaaccc 1800 gugggaagcu ucgugcaacc uugccugcgg ccgcugaugc cugcgaucgc ccacgcccug 1860 uucauggaca ucacucacga uaacgaaugc ccgauugugc aucgcucggc cuacgacgca 1920 cugccgagca ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ucgcggauac 1980 gaugaacucg ugccgcacca gaucagcgug guguccgaag aacgcuucua uaccaagugg 2040 aaccccgaag cgcugccauc gaauacuggc gaagugaacu uccaguccgg uauuaucgcc 2100 gcucgcugug ccaucagcaa acugcaccaa gagcuuggug ccaagggauu cauucaaguc 2160 uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220 caaucagucg uggccguguc ccggaccgcg uuccggaacc ccaagaccag cuucuacucg 2280 aaagaagugc cucagaugug uaucccggga aaaaucgaag aggucgugcu ggaagcccgg 2340 accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400 gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460 gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccuggcu ccgugauuau cuuucgggug ucccuggacc cucacgccca aguggccgug 2580 ggaauucuca gaaaccaccu gacccaguuc ucaccccacu ucaaguccgg uucccuggcg 2640 guggauaacg ccgacccgau uuugaagauc cccuucgccu cgcuggccuc ccgccugacu 2700 cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaaaga ggacggcggc 2760 ggcuguuacg auauucccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820 ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880 cgguccggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940 aucgcugagg ucggaaagug gcugcaggcc auguucuucu aucugaagca gaucccccga 3000 uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060 accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120 ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucucugcc cauucugagc 3180 ccggcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 ugcguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg gugcuggggc 3300 cgggauaccu ucaucgcccu gcgggguauc cugcuuauca ccggucgcua cguggaggcu 3360 cggaacauua uucuggcguu cgccggcacc cuuagacacg gacugauucc gaaccuuuug 3420 ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuucagugc 3480 auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540 aggauguauc caaccgacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600 uucgaaguca uucaggaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660 aacgcggggc cgcagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720 guggacgaag aaaccgguuu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780 gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840 ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu gcuggaacug 3900 agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960 aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020 guguccgagg aucccuccga ucugaacgaa aagcacccga aucucgugca caagcgcggg 4080 aucuauaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140 uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200 cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucuggcc 4320 aagggcuuca auuaccacca gggcccggaa uggcuguggc ccauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440 gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500 ccugaacuga cuaacgagaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560 uccauugcca ccauacugga aacccuuuau gaccuguag 4599 <210> 28 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 28 augggacacu cgaaacagau uagaauccug uugcucaacg aaauggagaa gcuggaaaag 60 acccucuuuc ggcuggagca gggcuacgag cuccaguucc gccugggucc gacacuacaa 120 gggaaggcag ugaccgugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180 aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacag cgacaaguac 240 ugcaagcuga accuccaaca gucgggaucg uuccaguacu acuuucugca agggaacgag 300 aaguccggag gaggcuacau cguggucgac ccgauacuua gagugggagc cgacaaccau 360 guccugccuc uggacugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420 gaugaguggg aaagccgccu cagaguggcc aaggaguccg gguacaacau gauucacuuc 480 acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540 cugaaccccg acuucucccg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauua cugacguggu guacaaccac 660 accgccgcca acucgaagug gauccaagaa caucccgagu gcgcguacaa ccucgugaac 720 agcccgcauc ugaagccggc uugggugcuc gauagagccc ucuggagauu cuccugugac 780 gucgccgagg ggaaguacaa agagaagggu auuccggccc ucauugagaa cgaccaucac 840 augaacucaa uccggaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacguaaa caaggccgug gaacaguuca gaaggcugcu gacucaagaa 960 aaccgccgcg ucacuaaguc cgauccuaac cagcaucuua ccaucaucca agacccugag 1020 uaucgccggu uugggugcac cgucgacaug aacaucgcac ugaccacuuu caucccgcau 1080 gacaaggggc cggcggccau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200 cuggggaacg uguucuacga aaggcuggcu ggacacggac cgaagcuggg gcccgugacu 1260 cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucuca 1320 auggaagaau ccaugaucca ccucccgaac aaggcuugcu ucuugauggc gcacaaugga 1380 ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcucgga ggucuaccug 1440 agaagggaau ugauuugcug gggggacucc gucaagcugc gcuauggaaa caagccggaa 1500 gauugccccu accugugggc ucacaugaag aaguacacgg aaauuacugc cacguacuuc 1560 cagggcgucc ggcuggacaa cugccacucc acuccccucc auguggccga guacaugcuc 1620 gacgcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacugggucc 1680 gaggaccucg acaauguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740 augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg gggagaaccc 1800 guggggagcu ucgugcagcc uugccuccgc ccgcugaugc cugccaucgc ccacgcccug 1860 uucauggaua ucacucauga caacgaaugu cccauugugc aucgcucggc cuacgacgca 1920 cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac caggggauac 1980 gacgaacucg ugccgcacca gaucagcgug guguccgaag agagauucua uaccaagugg 2040 aaccccgaag cgcugcccag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100 gcucgcugug cgaucagcaa gcuccaccag gagcucggug ccaagggauu cauucaaguc 2160 uacguggacc aggucgacga agauaucgug gccgugacca ggcacucacc uuccauucac 2220 caauccgugg ucgccguguc ccggacugcu uuucggaacc ccaagacuuc guucuacucg 2280 aaagaagugc cacagaugug uaucccgggg aaaaucgaag aggucguccu cgaagcccgg 2340 accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgggaccccu 2400 gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460 gcuggagugg cgaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580 ggaauucuca gaaaccaccu gacucaguuc ucaccccacu uuaagucugg gucccuggcg 2640 guggacaacg ccgauccgau cuugaaaauc ccuuucgcaa gccuggccuc ccgccugacu 2700 uuggccgagc ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacgggggu 2760 ggcuguuacg auauccccaa cugguccgcu uugaaauacg cgggacugca ggggcugaug 2820 uccgugcugg cggaaaucag accgaagaac gaucuggggc accccuucug caacaacuug 2880 cgguccggag acuggaugau cgauuacguc agcaaccggu ugaucagcag aagcgguacu 2940 aucgccgagg ucggaaagug gcugcaggcc auguucuucu accugaagca gaucccucga 3000 uaccucaucc ccuguuacuu cgacgccauu uugaucgggg ccuacaccac ccugcuggac 3060 acugccugga agcagaugag caguuuugug caaaaugggu cgaccuucgu gaagcaccuu 3120 uccuugggcu cagugcagcu cugcggcgug gggaaguucc ccucgcugcc cauucugucc 3180 ccggcccuga uggacguccc uuaccggcug aacgagauua ccaaggagaa ggagcagugc 3240 uguguuuccc uggcugccgg gcugccacac uucucguccg ggaucuuccg gugcuggggc 3300 cgcgauaccu ucauugcgcu gcgggguauc cugcuuauca ccggucgcua cguggaggcu 3360 cggaacauua uccuugcauu cgccgguacc cugagacacg gucugauccc gaaucuucuc 3420 ggggaaggaa ucuacgcaag auacaacugc cgggacgccg ugugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugccgaac ggacuugaca uccugaagug cccagugucg 3540 aggauguacc cuaccgacga cagcgcuccu cugccggccg ggacccugga ccaaccccug 3600 uucgaaguca uccaagaggc uaugcagaag cacaugcagg guauucaguu ccgggaacgg 3660 aacgcggggc cccagauuga uaggaacaug aaggacgagg guuucaacau cacugccggc 3720 guggacgaag aaacuggguu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780 gacaagaugg gagaauccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840 ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900 uccaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960 aaagucucau acgaugaaug gaaucggaag auccaggaua acuucgagaa gcuguuucac 4020 guguccgagg aucccuccga ucucaacgaa aagcauccga aucucgugca caagcgcggg 4080 aucuacaagg acucguacgg ggcguccuca ccuuggugcg acuaucagcu gcggccuaac 4140 uucacuauug cgauggucgu ggccccggag uuauucacaa cggagaaggc cuggaaggcc 4200 cuugaaauug cggagaagaa gcugcugggg ccucucggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuugaca acgauaacua caaucuggcc 4320 aagggguuca auuaccacca ggggccggaa uggcucuggc ccauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugaugggg ccagagacua ccgccaagac uaucguccuc 4440 gugaaaaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacug 4500 ccagagcuga cgaacgagaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560 ucgauugcca cuauacugga aaccuuauau gaccuguag 4599 <210> 29 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 29 augggacacu caaagcaaau ccgcauucug cugcugaacg agauggaaaa gcuggaaaag 60 acucuguucc ggcuggaaca ggguuacgag cugcaguuuc ggcucggccc aaccuugcaa 120 gggaaggccg ucacugucua caccaacuac ccuuuuccgg gggagacuuu caaccgcgaa 180 aaguuccgcu cccuggauug ggaaaacccc acugaacggg aggaugacag cgacaaguac 240 ugcaaacuga accuucagca guccggcagc uuccaauacu acuuccugca aggaaacgaa 300 aaguccggcg gcgguuacau cguggucgac cccauucuga gagugggagc cgauaaucau 360 gugcugcccc uggacugcgu cacccugcaa acuuuccugg cuaagugccu gggaccguuc 420 gaugaguggg aauccaggcu ccgcguggcg aaggagucgg gcuacaacau gauucauuuc 480 acuccccuuc aaacucuggg gcugagucgc agcuguuacu cccuggccaa ccagcuugaa 540 cugaacccag acuuuucccg gccaaacaga aaguacaccu ggaacgacgu gggacaauug 600 guggagaagc uuaagaagga auggaacgug aucugcauca ccgauguggu guauaaccac 660 acugccgcga auuccaagug gauccaggaa caccccgagu gugcuuacaa ccuugugaac 720 agcccucacc uuaagccggc cugggugcug gaucgggcgc uguggagauu cuccugcgac 780 guggccgaag ggaaguacaa agaaaaggga auccccgccc ugauugaaaa ugaccaccau 840 augaacucca uucggaaaau cauuugggaa gauaucuuuc ccaagcugaa gcucugggag 900 uucuuucaag uggaugugaa caaggcugug gagcaguucc ggcggcugcu gacccaggag 960 aaccgccgcg ugaccaaguc cgacccuaac cagcacuuga ccaucauaca ggacccggaa 1020 uaccggagau ucggcugcac ugucgacaug aacauugccc ucacuaccuu caucccgcau 1080 gacaagggac ccgcugccau cgaagagugc ugcaacuggu uccacaagcg gauggaagaa 1140 cugaacucug aaaagcacag gcugaucaac uaccaccagg aacaggcugu gaacugccug 1200 cugggcaacg uguucuacga gagacucgca ggacacggac cgaagcuggg cccugugacc 1260 cggaagcauc cucuggucac ccgcuacuuc accuucccgu ucgaagagau cgacuuuucg 1320 auggaagaau cgaugaucca ccucccuaac aaggccugcu uccucauggc gcacaacggc 1380 ugggucaugg gcgacgaccc gcugagaaac uucgccgagc ccgggagcga aguguaccuc 1440 cggcgggaac uuauuugcug gggagauagc gugaagcuua gauauggcaa caagccugag 1500 gacugcccau accugugggc gcacaugaag aaguacacug aaauuaccgc gaccuacuuc 1560 caaggagucc gacucgacaa cugccacagc accccacuuc acgucgcgga guacauguug 1620 gaugccgcac ggaaucucca gcccaaucug uaugucgugg cugaacuguu cacuggaucc 1680 gaggaccuug acaauguguu cgugacuaga cuggggaucu ccagccugau ccgggaagcu 1740 auguccgcgu acaacuccca cgaagaggga cggcuggugu accgcuacgg cggagagccc 1800 gugggaagcu ucgugcagcc cugccugcgg ccucugaugc cggccaucgc ucacgcccug 1860 uucauggaua ucacucacga caaugagugu ccuaucgugc acaggagcgc guacgacgcc 1920 cugcccucca cuacuaucgu gucgauggcc ugcugcgcaa gcgguucuac ccgcgguuac 1980 gacgagcuug ucccgcacca aauauccgug gugucagagg aacgguucua caccaagugg 2040 aacccggagg cccugccuuc aaacaccggc gaagugaacu uccaguccgg aaucauugcc 2100 gcccgcugug ccauuucaaa guugcaccag gagcugggcg ccaagggauu cauucagguc 2160 uacguugacc aggucgacga agauaucgug gccguuacua gacauucacc gagcauccau 2220 cagagcgugg ucgcagucag caggacugcc uuccgcaacc cgaaaaccuc guucuacucc 2280 aaggaagugc cccagaugug uaucccggga aaaauugagg aaguggugcu ggaggcccgg 2340 accaucgagc ggaacacuaa gcccuaccgg aaggacgaga auucaaucaa cggaaccccu 2400 gacaucaccg uggagauccg cgagcauauc caacugaacg agucgaagau cgucaagcag 2460 gcuggggugg caacuaaggg cccuaacgag uacauucagg agauugaauu cgagaaccug 2520 ucccccgggu ccgugaucau uuuccgcgug ucccuggacc cacaugcuca aguagcagug 2580 gggauccuga gaaaccaccu gacccaguuu agcccgcacu ucaaguccgg aucccuggcc 2640 guggauaacg ccgacccgau ccugaagauc cccuuugcau cccuggcuuc ccggcugacc 2700 uuggccgaac ugaaccagau ucuguaccgc ugcgaaucag aggaaaagga ggacggaggc 2760 ggaugcuacg auauccccaa uuggucggcg cugaaguacg ccggccuuca aggacugaug 2820 uccgugcugg ccgagaucag gccgaagaau gaccugggac acccguucug caacaacuug 2880 agaagcgggg acuggaugau ugauuacgug ucgaaccggc ugaucucccg gagcggcacc 2940 aucgcggaag ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccgc 3000 uaccugaucc ccugcuacuu cgacgcgauc uugauugggg cauacaccac ucugcuugac 3060 accgcuugga agcagauguc cuccuucgug caaaacggau ccaccuucgu gaagcaccug 3120 ucccuuggau cagugcagcu gugcggcgug ggaaaguucc cuucccuucc cauccugucc 3180 ccugcgcuga uggacgugcc guaccggcuc aacgagauca ccaaggaaaa ggaacagugc 3240 ugcgugucac uggcagccgg ccuuccgcau uuuucgagcg gaauuuucag auguuggggc 3300 agagacaccu ucauugcgcu gcgcgguauc cugcugauua ccggcagaua cguggaagcc 3360 agaaacauua uccuggcguu ugcugguacu cugcggcacg gacugauucc uaaccuguug 3420 ggagagggga ucuacgcccg guacaauugc agagaugccg ugugguggug gcugcagugc 3480 auccaggacu acugcaagau ggugcccaac ggacuugaca uucugaagug cccggugucg 3540 cgcauguacc ccaccgacga cucugcgccc cugccggccg guacccugga ucagccgcug 3600 uucgaaguga uccaggaagc caugcaaaag cacaugcagg gaauucaguu cagggaacgg 3660 aacgcaggcc cgcaaaucga ccggaacaug aaggacgaag gcuucaacau uaccgccggc 3720 guggacgagg aaaccggcuu cguguacggc ggcaaccggu ucaauugcgg uacuuggaug 3780 gacaagaugg gagaaagcga ccgcgccagg aaucggggca uuccugccac cccgcgggac 3840 gguagcgcgg uggagaucgu gggccuuucg aaguccgcgg uccgcuggcu ucuggagcug 3900 ucuaagaaaa acaucuuccc uuaccacgag gucaccguga aacgccacgg aaaggccauc 3960 aagguguccu acgacgaaug gaacaggaag auccaggaca acuuugagaa gcuguuucac 4020 gugucggaag auccguccga ccugaacgaa aagcacccca accuugucca uaagcgcggu 4080 aucuacaaag auucguaugg ugcauccucc ccuuggugcg acuaccaacu ccggccgaac 4140 uucaccaucg caaugguggu ggccccggag cuguucacca cugaaaaggc cuggaaggcc 4200 cuggaaaucg ccgaaaagaa gcugcuggga ccgcugggga ugaaaacccu ggaccccgau 4260 gauauggugu acugcgggau cuacgacaac gcccuggaua acgacaacua caaccuggcc 4320 aagggcuuca acuaccauca ggguccggag uggcuguggc caaucggaua cuuccugagg 4380 gccaagcugu acuucucccg cuugaugggc cccgaaacua ccgcaaagac uaucgugcuc 4440 gugaagaacg uccugucccg gcacuacgug caucuggaac ggucgccgug gaaaggccug 4500 ccagaguuga ccaacgagaa ugcccaguau ugcccguucu caugcgaaac ccaagccugg 4560 agcauugcca cuauucugga aacccucuac gaccuguag 4599 <210> 30 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 30 augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcucgaaaag 60 acccuguucc ggcuggagca ggguuacgag cugcaguucc gccugggucc gacucuacaa 120 gggaaagcag ugacggucua caccaacuac ccguuucccg gagaaaccuu caaccgggag 180 aaguuccggu cccuggacug ggagaacccg accgaacgag aggaugacuc agauaaguac 240 ugcaagcuga acuugcaaca guccggguca uuccaguacu acuuucugca agggaacgag 300 aagucaggag ggggcuacau cguggucgac ccgauacugc gcgugggagc cgacaaucac 360 guccugccgc uggacugcgu gacccugcaa accuuccucg ccaaaugucu ggggccguuc 420 gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480 acuccgcugc aaacacucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540 cuuaaucccg acuuuucccg cccgaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600 guggaaaagc ugaagaagga guggaacgug aucugcauca cugauguggu guacaaccac 660 acggcugcca acucgaagug gauccaagag caucccgagu gcgcguacaa cuuggugaac 720 agcccgcauc ugaagccugc uugggugcug gacagagccc ucuggagauu cagcugcgac 780 guggccgagg ggaaguacaa agaaaagggg auuccggccu ugauugagaa cgaccaucac 840 augaacucaa uccgcaagau cauuugggag gauaucuucc cuaagcuuaa guugugggag 900 uucuuccaag uggacguaaa caaggcagug gagcaguuca gaaggcugcu gacucaagaa 960 aacagacgcg ucacuaaguc cgacccgaac cagcaccuua ccaucaucca agacccggag 1020 uaccgccggu ucggcugcac cgucgauaug aacauagccc ugaccacuuu caucccccau 1080 gacaaggggc cggcggcaau cgaggaaugc uguaacuggu uucauaagcg gauggaggaa 1140 cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaacugccug 1200 cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260 agaaagcauc cgcucgucac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320 auggaagaau ccaugaucca cuugccgaac aaggcuugcu uccugauggc gcacaacgga 1380 ugggucaugg gcgacgaccc gcugaggaau uucgcggagc cggguucgga aguguaccug 1440 agaagggaac ucauuugcug gggagacucc gucaagcugc gcuaugggaa caagcccgag 1500 gauugccccu accugugggc ucacaugaag aaguacacgg aaaucaccgc cacguacuuc 1560 cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcug 1620 gaugcagcgc gcaaucugca gccgaaucug uacgugguug cagagcuguu cacugggucc 1680 gaggaccucg acaacguguu cgugacuaga uuggggaucu ccucccucau ccgggaagcc 1740 augucggccu acaacuccca ugaggagggg aggcuggugu acagauacgg cggcgaaccc 1800 gugggaagcu ucgugcagcc gugccuccgg ccgcugaugc cggccaucgc ccacgcccug 1860 uucauggaua ucacucacga caacgaaugc ccgaucgugc aucgcucggc cuacgacgca 1920 cugccgucca ccacuaucgu guccauggca ugcugcgccu ccgggagcac ccgcggauac 1980 gaugagcucg ugccgcacca gauuagcgug guguccgaag aacgcuucua uaccaagugg 2040 aaccccgaag cccugccguc caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100 gcucgcugug cgaucucgaa acuccaccaa gagcucggug ccaagggguu cauucagguc 2160 uacguggauc aggucgacga ggauauugug gcagugacca ggcacucacc uagcauccac 2220 caauccgugg ucgccguguc acgcacugcg uuucggaacc ccaagaccuc guucuacucg 2280 aaagaagugc cgcagaugug uaucccggga aagaucgaag aggucgugcu ggaagcacgg 2340 accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgggaccccg 2400 gauaucacug uggagauucg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460 gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520 uccccggggu ccgugaucau cuuccgggug ucccuggacc cccacgccca aguggccgug 2580 ggaauucuca gaaaccaccu gacccaguuc ucaccccacu uuaagucggg uucccuggcc 2640 guggacaacg ccgauccgau ccucaagauc ccguucgcgu cgcuggccuc ccgccucacu 2700 cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacggcggc 2760 ggcuguuacg auauuccgaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820 ucuguccugg cggaaauccg gccgaagaac gaccuggggc acccguucug caacaacuug 2880 cggagcggag auuggaugau cgacuacguc agcaacagac ugaucagccg gagcggcacu 2940 aucgccgagg ucggaaagug guugcaggcc auguucuucu accugaagca gaucccccga 3000 uaccucaucc cguguuacuu cgacgccauc cugaucgggg ccuacaccac ccuccuggac 3060 accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120 ucccugggcu cagugcagcu gugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180 ccggcccuga uggacguccc cuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 uguguguccc uggcugccgg gcugccgcac uuuucguccg gcaucuuccg gugcuggggg 3300 cgggauaccu ucauugcccu gcggggaauc cuucuuauca ccggucgcua uguggaggcu 3360 cggaacauua uucuggcguu cgccggaacc cugagacacg ggcugauucc gaaccucuug 3420 ggggaaggga ucuacgcccg cuacaacugu cgggacgccg ugugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugcccaac gggcuggaca uccugaagug cccggugucg 3540 aggauguauc cgaccgacga cagcgcaccc cugccggccg ggacccucga ccaaccccug 3600 uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggaacgg 3660 aacgcggggc cccagauuga uaggaacaug aaagacgagg guuucaacau cacugccggc 3720 guggacgaag aaaccgguuu uguguacgga ggaaaccggu ucaacugcgg uaccuggaug 3780 gauaagaugg gagaaucaga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840 ggaucggcug uggaaauugu gggacugagc aagagcgccg ugcgguggcu gcuggaacug 3900 agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960 aaagucuccu acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuuuuucac 4020 guguccgagg aucccuccga ucugaacgag aagcauccga aucucgugca uaagaggggg 4080 aucuacaagg acuccuacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140 uucaccauug ccauggucgu ggccccggag cucuuuacaa ccgagaaggc cuggaaggcc 4200 cucgaaauug ccgaaaagaa gcugcugggg cccuugggga ugaaaacccu ggauccggac 4260 gacauggugu acugcggaau cuacgacaac gcccuggaca acgacaacua caaucuggcg 4320 aagggcuuca auuaccacca ggggccggaa uggcucuggc cgauugggua cuuccugcgc 4380 gccaagcugu acuucucacg gcugauggga ccggagacua ccgccaagac caucguccuc 4440 gugaagaacg ugcugucgcg gcacuacgug caccuggaga ggagccccug gaaggggcuu 4500 cccgagcuga cgaacgagaa cgcgcaguac ugucccuucu ccugcgaaac ccaagccugg 4560 uccauugcca cuauacugga aaccuuauau gaccuguag 4599 <210> 31 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 31 augggccaca gcaagcagau ccggaucuug cugcugaacg agauggagaa gcuggagaag 60 acccuguuca ggcuggagca gggcuacgag cugcaguucc gguugggccc caccuugcag 120 ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgaaaccuu caacagggag 180 aaguuccggu cccuggacug ggagaacccc accgagaggg aggacgacuc cgacaaguac 240 ugcaagcuga accugcagca guccggcucc uuccaguacu acuuccugca gggcaacgag 300 aaaagcggcg gcggcuacau cgugguggac cccaucuugc gggugggcgc cgacaaccac 360 gugcugcccu uggacugcgu gacccugcag accuucuugg ccaagugcuu gggccccuuc 420 gacgaguggg agagcaggcu gaggguggcc aaggaguccg gcuacaacau gauccacuuc 480 acccccuugc agacccuggg ccuguccagg uccugcuacu cccuggccaa ccaguuggag 540 uugaaccccg acuucuccag gcccaacagg aaguacaccu ggaacgacgu gggccagcug 600 guggagaagu ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660 accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720 uccccccacu ugaagcccgc cuggguguug gacagggccc uguggcgguu cuccugcgac 780 guggccgagg gcaaguacaa ggagaagggc auccccgccu ugaucgagaa cgaccaccac 840 augaacucca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900 uucuuccagg uggacgugaa caaggccgug gagcaguuca ggaggcugcu gacccaggag 960 aacaggcggg ugaccaaguc cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020 uacaggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080 gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagag gauggaggag 1140 uugaacuccg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200 uugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260 aggaagcacc ccuuggugac cagguacuuc accuuccccu ucgaggagau cgacuucucc 1320 auggaggagu ccaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380 ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcuccga gguguaccug 1440 aggagggagc ugaucugcug gggcgacagc gugaaguugc gguacggcaa caagcccgag 1500 gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560 cagggcgugc ggcuggacaa cugccacucc accccccugc acguggccga guacauguug 1620 gacgccgcca ggaacuugca gcccaacuug uacguggugg ccgagcuguu caccggcagc 1680 gaggaccugg acaacguguu cgugaccagg cugggcauca gcuccuugau cagggaggcc 1740 augagcgccu acaacagcca cgaggagggc agguuggugu accgguacgg cggcgagccc 1800 gugggcuccu ucgugcagcc cugcuugagg cccuugaugc ccgccaucgc ccacgcccug 1860 uucauggaca ucacccacga caacgagugc cccaucgugc acagguccgc cuacgacgcc 1920 cugcccagca ccaccaucgu guccauggcc ugcugcgcca gcggcagcac caggggcuac 1980 gacgaguugg ugccccacca gaucuccgug guguccgagg agcgguucua caccaagugg 2040 aaccccgagg ccuugcccuc caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100 gccaggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160 uacguggacc agguggacga ggacaucgug gccgugacca ggcacucccc cagcauccac 2220 caguccgugg uggccguguc caggaccgcc uucaggaacc ccaagaccuc cuucuacagc 2280 aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggccagg 2340 accaucgaga ggaacaccaa gcccuacagg aaggacgaga acuccaucaa cggcaccccc 2400 gacaucaccg uggagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460 gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaacuug 2520 ucccccggca gcgugaucau cuucagggug agccuggacc cccacgccca gguggccgug 2580 ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaaguccgg cagccuggcc 2640 guggacaacg ccgaccccau cuugaagauc cccuucgccu cccuggccuc cagguugacc 2700 uuggccgagc ugaaccagau ccuguaccgg ugcgaguccg aggagaagga ggacggcggc 2760 ggcugcuacg acauccccaa cugguccgcc cugaaguacg ccggccugca gggcuugaug 2820 uccguguugg ccgagaucag gcccaagaac gacuugggcc accccuucug caacaacuug 2880 agguccggcg acuggaugau cgacuacgug agcaaccggc ugaucucccg guccggcacc 2940 aucgccgagg ugggcaagug guugcaggcc auguucuucu accugaagca gaucccccgg 3000 uaccugaucc ccugcuacuu cgacgccauc uugaucggcg ccuacaccac ccugcuggac 3060 accgccugga agcagauguc cagcuucgug cagaacggcu ccaccuucgu gaagcaccug 3120 uccuugggcu ccgugcagcu gugcggcgug ggcaaguucc ccucccugcc cauccugucc 3180 cccgcccuga uggacgugcc cuacagguug aacgagauca ccaaggagaa ggagcagugc 3240 ugcguguccc uggccgccgg cuugccccac uucuccuccg gcaucuuccg gugcuggggc 3300 agggacaccu ucaucgcccu gaggggcauc cugcugauca ccggccggua cguggaggcc 3360 aggaacauca ucuuggccuu cgccggcacc cugaggcacg gccugauccc caaccugcug 3420 ggcgagggca ucuacgccag guacaacugc cgggacgccg ugugguggug gcugcagugc 3480 auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugucc 3540 aggauguacc ccaccgacga cuccgccccc uugcccgccg gcacccugga ccagcccuug 3600 uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagagg 3660 aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720 guggacgagg aaaccggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780 gacaagaugg gcgagagcga cagggccagg aacaggggca uccccgccac ccccagggac 3840 ggcuccgccg uggagaucgu gggccugagc aaguccgccg ugcggugguu gcuggaguug 3900 uccaagaaga acaucuuccc cuaccacgag gugaccguga agaggcacgg caaggccauc 3960 aagguguccu acgacgagug gaacaggaag auccaggaca acuucgagaa gcuguuccac 4020 guguccgagg accccuccga cuugaacgag aagcacccca accuggugca caagcggggc 4080 aucuacaagg acagcuacgg cgccuccagc cccuggugcg acuaccagcu gaggcccaac 4140 uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200 uuggagaucg ccgagaagaa guugcugggc ccccugggca ugaagaccuu ggaccccgac 4260 gacauggugu acugcggcau cuacgacaac gccuuggaca acgacaacua caaccuggcc 4320 aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380 gccaaguugu acuucuccag guugaugggc cccgaaacca ccgccaagac caucguguug 4440 gugaagaacg ugcugucccg gcacuacgug caccuggaga ggucccccug gaagggccug 4500 cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgaaac ccaggccugg 4560 uccaucgcca ccauccugga aacccuguac gacuuguag 4599 <210> 32 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 32 augggacaua gcaagcagau ccggaucuug cugcugaaug aaauggaaaa gcuggaaaag 60 acccuguuca gacuggaaca gggauacgaa cugcaguucc gguugggacc uaccuugcag 120 ggaaaggcug ugaccgugua caccaauuac ccuuucccug gagaaaccuu caauagagaa 180 aaguucagau cucuagauug ggaaaauccu accgaaagag aagaugauuc ugauaaguac 240 ugcaagcuga aucugcagca gucuggaucu uuccaguacu acuuccugca gggaaaugaa 300 aagagcggag gaggauacau cgugguggau ccuaucuugc gggugggagc ugauaaucau 360 gugcugccuu uggauugcgu gacccugcag accuucuugg cuaagugcuu gggaccuuuc 420 gaugaauggg aaagcagacu gagaguggcu aaggaaucug gauacaauau gauccauuuc 480 accccuuugc agacccuggg acugucuaga ucuugcuacu cucuggcuaa ucaguuggaa 540 uugaauccug auuucucuag accuaauaga aaguacaccu ggaaugaugu gggacagcug 600 guggaaaagu ugaagaagga auggaaugug aucugcauca ccgauguggu guacaaucau 660 accgcugcua auagcaagug gauccaggaa cauccugaau gcgcuuacaa ucuggugaau 720 ucuccucauu ugaagccugc uuggguguug gauagagcuc uguggcgguu cucuugcgau 780 guggcugaag gaaaguacaa ggaaaaggga aucccugcuu ugaucgaaaa ugaucaucau 840 augaauucua uccggaagau caucugggaa gauaucuucc cuaagcugaa gcugugggaa 900 uucuuccagg uggaugugaa uaaggcugug gaacaguuca gaagacugcu gacccaggaa 960 aauagacggg ugaccaaguc ugauccuaau cagcaucuga ccaucaucca ggauccugaa 1020 uacagacggu ucggaugcac cguggauaug aauaucgcuc ugaccaccuu caucccucau 1080 gauaagggac cugcugcuau cgaagaaugc ugcaauuggu uccauaagag aauggaagaa 1140 uugaauucug aaaagcaucg gcugaucaau uaccaucagg aacaggcugu gaauugccug 1200 uugggaaaug uguucuacga acggcuggcu ggacauggac cuaagcuggg accugugacc 1260 agaaagcauc cuuuggugac cagauacuuc accuucccuu ucgaagaaau cgauuucucu 1320 auggaagaau cuaugaucca ucugccuaau aaggcuugcu uccugauggc ucauaaugga 1380 ugggugaugg gagaugaucc ucugcggaau uucgcugaac cuggaucuga aguguaccug 1440 agaagagaac ugaucugcug gggagauagc gugaaguugc gguacggaaa uaagccugaa 1500 gauugcccuu accugugggc ucauaugaag aaguacaccg aaaucaccgc uaccuacuuc 1560 cagggagugc ggcuggauaa uugccauucu accccucugc auguggcuga auacauguug 1620 gaugcugcua gaaauuugca gccuaauuug uacguggugg cugaacuguu caccggaagc 1680 gaagaucugg auaauguguu cgugaccaga cugggaauca gcucuuugau cagagaagcu 1740 augagcgcuu acaauagcca ugaagaagga agauuggugu accgguacgg aggagaaccu 1800 gugggaucuu ucgugcagcc uugcuugagg ccuuugaugc cugcuaucgc ucaugcucug 1860 uucauggaua ucacccauga uaaugaaugc ccuaucgugc auagaucugc uuacgaugcu 1920 cugccuagca ccaccaucgu gucuauggcu ugcugcgcua gcggaagcac cagaggauac 1980 gaugaauugg ugccucauca gaucucugug gugucugaag aacgguucua caccaagugg 2040 aauccugaag cuuugccuuc uaauaccgga gaagugaauu uccagagcgg aaucaucgcu 2100 gcuagaugcg cuaucagcaa gcugcaucag gaacugggag cuaagggauu cauccaggug 2160 uacguggauc agguggauga agauaucgug gcugugacca gacauucucc uagcauccau 2220 cagucugugg uggcuguguc uagaaccgcu uucagaaauc cuaagaccuc uuucuacagc 2280 aaggaagugc cucagaugug caucccugga aagaucgaag aaguggugcu ggaagcuaga 2340 accaucgaaa gaaauaccaa gccuuacaga aaggaugaaa auucuaucaa uggaaccccu 2400 gauaucaccg uggaaaucag agaacauauc cagcugaaug aaagcaagau cgugaagcag 2460 gcuggagugg cuaccaaggg accuaaugaa uacauccagg aaaucgaauu cgaaaauuug 2520 ucuccuggaa gcgugaucau cuucagagug agccuggauc cucaugcuca gguggcugug 2580 ggaauccugc ggaaucaucu gacccaguuc agcccucauu ucaagucugg aagccuggcu 2640 guggauaaug cugauccuau cuugaagauc ccuuucgcuu cucuggcuuc uagauugacc 2700 uuggcugaac ugaaucagau ccuguaccgg ugcgaaucug aagaaaagga agauggagga 2760 ggaugcuacg auaucccuaa uuggucugcu cugaaguacg cuggacugca gggauugaug 2820 ucuguguugg cugaaaucag accuaagaau gauuugggac auccuuucug caauaauuug 2880 agaucuggag auuggaugau cgauuacgug agcaaucggc ugaucucucg gucuggaacc 2940 aucgcugaag ugggaaagug guugcaggcu auguucuucu accugaagca gaucccucgg 3000 uaccugaucc cuugcuacuu cgaugcuauc uugaucggag cuuacaccac ccugcuggau 3060 accgcuugga agcagauguc uagcuucgug cagaauggau cuaccuucgu gaagcaucug 3120 ucuuugggau cugugcagcu gugcggagug ggaaaguucc cuucucugcc uauccugucu 3180 ccugcucuga uggaugugcc uuacagauug aaugaaauca ccaaggaaaa ggaacagugc 3240 ugcgugucuc uggcugcugg auugccucau uucucuucug gaaucuuccg gugcugggga 3300 agagauaccu ucaucgcucu gagaggaauc cugcugauca ccggacggua cguggaagcu 3360 agaaauauca ucuuggcuuu cgcuggaacc cugagacaug gacugauccc uaaucugcug 3420 ggagaaggaa ucuacgcuag auacaauugc cgggaugcug ugugguggug gcugcagugc 3480 auccaggauu acugcaagau ggugccuaau ggacuggaua uccugaagug cccugugucu 3540 agaauguacc cuaccgauga uucugcuccu uugccugcug gaacccugga ucagccuuug 3600 uucgaaguga uccaggaagc uaugcagaag cauaugcagg gaauccaguu ccgggaaaga 3660 aaugcuggac cucagaucga ucggaauaug aaggaugaag gauucaauau caccgcugga 3720 guggaugaag aaaccggauu cguguacgga ggaaaucggu ucaauugcgg aaccuggaug 3780 gauaagaugg gagaaagcga uagagcuaga aauagaggaa ucccugcuac cccuagagau 3840 ggaucugcug uggaaaucgu gggacugagc aagucugcug ugcggugguu gcuggaauug 3900 ucuaagaaga auaucuuccc uuaccaugaa gugaccguga agagacaugg aaaggcuauc 3960 aaggugucuu acgaugaaug gaauagaaag auccaggaua auuucgaaaa gcuguuccau 4020 gugucugaag auccuucuga uuugaaugaa aagcauccua aucuggugca uaagcgggga 4080 aucuacaagg auagcuacgg agcuucuagc ccuuggugcg auuaccagcu gaggccuaau 4140 uucaccaucg cuaugguggu ggcuccugaa cuguucacca ccgaaaaggc uuggaaggcu 4200 uuggaaaucg cugaaaagaa guugcuggga ccucugggaa ugaagaccuu ggauccugau 4260 gauauggugu acugcggaau cuacgauaau gcuuuggaua augauaauua caaucuggcu 4320 aagggauuca auuaccauca gggaccugaa uggcuguggc cuaucggaua cuuccugcgg 4380 gcuaaguugu acuucucuag auugauggga ccugaaacca ccgcuaagac caucguguug 4440 gugaagaaug ugcugucucg gcauuacgug caucuggaaa gaucuccuug gaagggacug 4500 ccugaacuga ccaaugaaaa ugcucaguac ugcccuuuca gcugcgaaac ccaggcuugg 4560 ucuaucgcua ccauccugga aacccuguac gauuuguag 4599 <210> 33 <211> 158 <212> RNA <213> Artificial Sequence <220> <223> Modified Xenopus beta-globin 3'UTR <220> <221> misc_feature <222> (2) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (157) <223> n is unlocked nucleomonomer UNA-A <400> 33 cnagugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60 cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120 ucguaucugc uccuaauaaa aagaaaguuu cuucacnu 158 <210> 34 <211> 158 <212> RNA <213> Artificial Sequence <220> <223> Modified Xenopus beta-globin 3'UTR <220> <221> misc_feature <222> (2) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (3) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (4) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (155) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (156) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (157) <223> n is unlocked nucleomonomer UNA-A <400> 34 cnnnugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60 cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120 ucguaucugc uccuaauaaa aagaaaguuu cuucnnnu 158 <210> 35 <211> 158 <212> RNA <213> Artificial Sequence <220> <223> Modified Xenopus beta-globin 3'UTR <220> <221> misc_feature <222> (2) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (8) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (14) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (20) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (26) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (32) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (38) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (44) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (50) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (56) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (62) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (68) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (74) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (80) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (86) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (92) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (98) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (104) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (110) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (116) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (122) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (128) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (134) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (140) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (146) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (152) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (157) <223> n is unlocked nucleomonomer UNA-A <400> 35 cnaguganug acunggaucn gguuancacu anaccagncu caanaacacn cgaaungagu 60 cncuaagnua caunauaccn acuuanacuu anaaaaunuu gucncccaan auguanccau 120 unguaucngc uccnaauaan aagaanguuu cnucacnu 158 <210> 36 <211> 158 <212> RNA <213> Artificial Sequence <220> <223> Modified Xenopus beta-globin 3'UTR <220> <221> misc_feature <222> (2) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (3) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (8) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (9) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (14) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (15) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (20) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (21) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (26)..(27) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (32)..(33) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (38)..(39) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (44) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (45) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (50)..(51) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (56)..(57) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (62) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (63) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (68) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (69) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (74)..(75) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (80)..(81) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (86) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (87) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (92) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (93) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (98) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (99) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (104)..(105) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (110)..(111) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (116) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (117) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (122) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (123) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (128) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (129) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (134) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (135) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (140)..(141) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (146) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (147) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (152)..(153) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (157) <223> n is unlocked nucleomonomer UNA-A <400> 36 cnnguganng acunngaucn nguuannacu annccagnnu caannacacn ngaaunnagu 60 cnnuaagnna caunnuaccn ncuuanncuu annaaaunnu gucnnccaan nuguanncau 120 unnuaucnnc uccnnauaan nagaannuuu cnncacnu 158 <210> 37 <211> 158 <212> RNA <213> Artificial Sequence <220> <223> Modified Xenopus beta-globin 3'UTR <220> <221> misc_feature <222> (1) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (2) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (3) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (4) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (5) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (6) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (7) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (8) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (9) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (10) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (11) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (12) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (13) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (14) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (15)..(16) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (17) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (18) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (19) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (20) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (21)..(22) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (23)..(24) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (25) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (26)..(27) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (28) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (29) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (30) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (31)..(33) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (34)..(35) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (36) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (37) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (38)..(39) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (40) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (41) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (42)..(43) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (44) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (45)..(46) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (47) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (48) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (49)..(51) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (52) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (53)..(54) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (55) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (56)..(57) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (58) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (59) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (60) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (61) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (62) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (63) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (64) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (65)..(66) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (67) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (68) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (69) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (70) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (71) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (72) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (73) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (74)..(75) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (76) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (77) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (78)..(79) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (80)..(81) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (82) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (83)..(84) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (85) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (86) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (87) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (88) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (89)..(90) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (91) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (92) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (93)..(96) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (97) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (98) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (99)..(100) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (101) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (102) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (103)..(107) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (108)..(111) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (112) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (113) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (114) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (115) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (116) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (117)..(118) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (119) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (120)..(121) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (122) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (123) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (124) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (125) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (126) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (127) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (128) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (129) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (130) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (131) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (132)..(133) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (134) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (135)..(136) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (137) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (138)..(142) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (143) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (144)..(146) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (147) <223> n is unlocked nucleomonomer UNA-G <220> <221> misc_feature <222> (148)..(149) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (150) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (151) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (152)..(153) <223> n is unlocked nucleomonomer UNA-U <220> <221> misc_feature <222> (154) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (155) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (156) <223> n is unlocked nucleomonomer UNA-C <220> <221> misc_feature <222> (157) <223> n is unlocked nucleomonomer UNA-A <220> <221> misc_feature <222> (158) <223> n is unlocked nucleomonomer UNA-U <400> 37 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnn 158 <210> 38 <211> 100 <212> RNA <213> Unknown <220> <223> Poly(A) 100 Tail <400> 38 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 100 <210> 39 <211> 110 <212> RNA <213> Unknown <220> <223> Poly(A) 110 Tail <400> 39 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 110 <210> 40 <211> 9 <212> RNA <213> Unknown <220> <223> Triple Stop Codon <400> 40 auaagugaa 9 <210> 41 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 41 augggccaca gcaagcagau ccggauccug cugcugaacg agauggagaa gcuggagaag 60 acccuguucc ggcuggagca gggcuacgag cugcaguucc ggcugggccc cacccugcag 120 ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgagaccuu caaccgggag 180 aaguuccgga gccuggacug ggagaacccc accgagcggg aggacgacag cgacaaguac 240 ugcaagcuga accugcagca gagcggcagc uuccaguacu acuuccugca gggcaacgag 300 aagagcggcg gcggcuacau cgugguggac cccauccugc gggugggcgc cgacaaccac 360 gugcugcccc uggacugcgu gacccugcag accuuccugg ccaagugccu gggccccuuc 420 gacgaguggg agagccggcu gcggguggcc aaggagagcg gcuacaacau gauccacuuc 480 accccccugc agacccuggg ccugagccgg agcugcuaca gccuggccaa ccagcuggag 540 cugaaccccg acuucagccg gcccaaccgg aaguacaccu ggaacgacgu gggccagcug 600 guggagaagc ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660 accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720 agcccccacc ugaagcccgc cugggugcug gaccgggccc uguggcgguu cagcugcgac 780 guggccgagg gcaaguacaa ggagaagggc auccccgccc ugaucgagaa cgaccaccac 840 augaacagca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900 uucuuccagg uggacgugaa caaggccgug gagcaguucc ggcggcugcu gacccaggag 960 aaccggcggg ugaccaagag cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020 uaccggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080 gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagcg gauggaggag 1140 cugaacagcg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200 cugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260 cggaagcacc cccuggugac ccgguacuuc accuuccccu ucgaggagau cgacuucagc 1320 auggaggaga gcaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380 ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcagcga gguguaccug 1440 cggcgggagc ugaucugcug gggcgacagc gugaagcugc gguacggcaa caagcccgag 1500 gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560 cagggcgugc ggcuggacaa cugccacagc accccccugc acguggccga guacaugcug 1620 gacgccgccc ggaaccugca gcccaaccug uacguggugg ccgagcuguu caccggcagc 1680 gaggaccugg acaacguguu cgugacccgg cugggcauca gcagccugau ccgggaggcc 1740 augagcgccu acaacagcca cgaggagggc cggcuggugu accgguacgg cggcgagccc 1800 gugggcagcu ucgugcagcc cugccugcgg ccccugaugc ccgccaucgc ccacgcccug 1860 uucauggaca ucacccacga caacgagugc cccaucgugc accggagcgc cuacgacgcc 1920 cugcccagca ccaccaucgu gagcauggcc ugcugcgcca gcggcagcac ccggggcuac 1980 gacgagcugg ugccccacca gaucagcgug gugagcgagg agcgguucua caccaagugg 2040 aaccccgagg cccugcccag caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100 gcccggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160 uacguggacc agguggacga ggacaucgug gccgugaccc ggcacagccc cagcauccac 2220 cagagcgugg uggccgugag ccggaccgcc uuccggaacc ccaagaccag cuucuacagc 2280 aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggcccgg 2340 accaucgagc ggaacaccaa gcccuaccgg aaggacgaga acagcaucaa cggcaccccc 2400 gacaucaccg uggagauccg ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460 gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaaccug 2520 agccccggca gcgugaucau cuuccgggug agccuggacc cccacgccca gguggccgug 2580 ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaagagcgg cagccuggcc 2640 guggacaacg ccgaccccau ccugaagauc cccuucgcca gccuggccag ccggcugacc 2700 cuggccgagc ugaaccagau ccuguaccgg ugcgagagcg aggagaagga ggacggcggc 2760 ggcugcuacg acauccccaa cuggagcgcc cugaaguacg ccggccugca gggccugaug 2820 agcgugcugg ccgagauccg gcccaagaac gaccugggcc accccuucug caacaaccug 2880 cggagcggcg acuggaugau cgacuacgug agcaaccggc ugaucagccg gagcggcacc 2940 aucgccgagg ugggcaagug gcugcaggcc auguucuucu accugaagca gaucccccgg 3000 uaccugaucc ccugcuacuu cgacgccauc cugaucggcg ccuacaccac ccugcuggac 3060 accgccugga agcagaugag cagcuucgug cagaacggca gcaccuucgu gaagcaccug 3120 agccugggca gcgugcagcu gugcggcgug ggcaaguucc ccagccugcc cauccugagc 3180 cccgcccuga uggacgugcc cuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240 ugcgugagcc uggccgccgg ccugccccac uucagcagcg gcaucuuccg gugcuggggc 3300 cgggacaccu ucaucgcccu gcggggcauc cugcugauca ccggccggua cguggaggcc 3360 cggaacauca uccuggccuu cgccggcacc cugcggcacg gccugauccc caaccugcug 3420 ggcgagggca ucuacgcccg guacaacugc cgggacgccg ugugguggug gcugcagugc 3480 auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugagc 3540 cggauguacc ccaccgacga cagcgccccc cugcccgccg gcacccugga ccagccccug 3600 uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagcgg 3660 aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720 guggacgagg agaccggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780 gacaagaugg gcgagagcga ccgggcccgg aaccggggca uccccgccac cccccgggac 3840 ggcagcgccg uggagaucgu gggccugagc aagagcgccg ugcgguggcu gcuggagcug 3900 agcaagaaga acaucuuccc cuaccacgag gugaccguga agcggcacgg caaggccauc 3960 aaggugagcu acgacgagug gaaccggaag auccaggaca acuucgagaa gcuguuccac 4020 gugagcgagg accccagcga ccugaacgag aagcacccca accuggugca caagcggggc 4080 aucuacaagg acagcuacgg cgccagcagc cccuggugcg acuaccagcu gcggcccaac 4140 uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200 cuggagaucg ccgagaagaa gcugcugggc ccccugggca ugaagacccu ggaccccgac 4260 gacauggugu acugcggcau cuacgacaac gcccuggaca acgacaacua caaccuggcc 4320 aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380 gccaagcugu acuucagccg gcugaugggc cccgagacca ccgccaagac caucgugcug 4440 gugaagaacg ugcugagccg gcacuacgug caccuggagc ggagccccug gaagggccug 4500 cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgagac ccaggccugg 4560 agcaucgcca ccauccugga gacccuguac gaccuguag 4599 <210> 42 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 42 augggccaua gcaagcagau ccggauccuc cugcucaaug agauggaaaa gcucgagaaa 60 acccucuuua ggcuggagca aggcuacgaa cuccaguuuc ggcucgggcc cacucuccag 120 ggcaaggccg ugaccgucua caccaacuau cccuucccug gcgagaccuu caacagggag 180 aaguuucggu cccucgacug ggagaacccc accgagaggg aggacgacuc cgacaaguau 240 ugcaagcuga accuccaaca auccgggucc uuccaguacu acuuucugca aggcaacgaa 300 aagagcgggg gcggguauau uguggucgau cccauccucc gggugggggc ugacaaccac 360 guccuccccc uggauugcgu gacucugcag accuuccucg cuaaaugccu gggcccuuuc 420 gacgaguggg agagcaggcu gcggguggcc aaggaguccg gguauaauau gauccacuuc 480 accccccugc agacucuggg ccucucccgg uccuguuaua gccuggccaa ccagcucgag 540 cucaacccug auuucuccag gccuaacagg aaauacaccu ggaacgacgu gggccagcuc 600 gucgagaagc ucaagaaaga guggaacgug aucugcauca cugacguggu cuauaaccac 660 acugcugcua acagcaagug gauucaggag caccccgagu gcgccuacaa ccuggucaac 720 uccccccauc ucaagccugc cuggguccuc gauagggccc uguggcgguu uagcugcgac 780 guggccgagg gcaaguauaa ggagaaaggc auuccugcuc ugaucgagaa cgaccaucac 840 augaacagca uucggaagau uaucugggaa gacaucuucc ccaaacugaa gcucugggag 900 uucuuucaag ucgacgucaa uaaggcugug gaacaauuca ggaggcugcu gacccaagag 960 aaccggcggg ucaccaaauc cgaccccaau caacaucuga cuaucaucca agacccugag 1020 uauaggcggu ucgggugcac ugucgacaug aauaucgccc ucacuacuuu uauuccccac 1080 gauaaaggcc ccgccgccau cgaggagugu ugcaacuggu uccacaagag gauggaagag 1140 cucaacuccg aaaaacaccg gcucaucaau uaccaccagg agcaggccgu gaacugucug 1200 cugggcaacg ucuucuacga gcggcucgcu gggcacgggc ccaagcucgg cccugucacu 1260 aggaaacacc cucucgugac ccgguacuuc acuuuucccu ucgaggaaau ugauuuuagc 1320 auggaggagu ccaugaucca ccuccccaac aaggcuugcu uccucauggc ccauaacggc 1380 ugggucaugg gcgacgaccc ucugcggaau uucgcugagc ccggguccga gguguaucuc 1440 cggagggagc ugaucuguug gggcgauagc gugaagcucc gguacggcaa caagcccgaa 1500 gauugcccuu accucugggc ccauaugaag aaguauacug agauuacugc cacuuacuuu 1560 cagggcgucc ggcuggacaa uugucauucc accccucugc augucgcuga auauaugcug 1620 gacgcugcuc ggaaccugca acccaaccuc uacgucgucg cugagcucuu uaccggcagc 1680 gaggaccucg auaacgucuu cgugacuagg cucgggauca gcagccucau uagggaagcc 1740 augagcgccu acaacagcca cgaggaaggg aggcucgugu aucgguacgg cggcgagccu 1800 gugggcagcu ucgugcagcc cugccugcgg ccucucaugc ccgcuaucgc ccacgcccuc 1860 uucauggaca ucacucacga caacgaaugc ccuaucgucc acagguccgc uuacgacgcu 1920 cugcccagca cuaccaucgu guccauggcc ugcugcgcua gcggcagcac caggggguac 1980 gacgagcucg ucccucacca gaucuccguc guguccgagg agcgguucua uacuaaaugg 2040 aacccugagg cccugccuuc caauaccggg gaggugaacu uucaaagcgg gaucaucgcc 2100 gcccggugcg cuauuagcaa gcugcaccag gaacugggcg ccaaaggguu cauccagguc 2160 uacgucgacc aaguggacga ggauauuguc gccgucacca ggcauucccc uagcauucac 2220 caguccgugg ucgcugucuc caggacugcu uuucggaacc ccaaaacuuc cuucuauagc 2280 aaagaggucc cucaaaugug uauuccuggg aagaucgagg aggucgugcu ggaggcuagg 2340 acuaucgaaa ggaauacuaa gccuuaccgg aaagacgaaa acuccauuaa cggcaccccc 2400 gacauuaccg ucgagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcaa 2460 gcuggcgugg ccaccaaggg ccccaacgag uacauccaag agauugaguu cgagaaucug 2520 ucccccggca gcgugaucau uuuuagggug agccuggacc cccacgccca agucgcugug 2580 ggcauccugc ggaaccaccu cacccaauuu agcccucauu ucaaguccgg gagccucgcu 2640 guggauaacg ccgacccuau ucucaagauc ccuuucgcuu cccuggccag caggcucacu 2700 cuggcugaac ucaaccagau ucuguaucgg ugcgaguccg aggagaaaga ggacgggggc 2760 ggcuguuacg auauucccaa uugguccgcc cugaaguacg ccgggcugca agggcucaug 2820 uccguccugg ccgagauuag gcccaaaaac gaucugggcc acccuuucug caacaaccug 2880 agguccggcg acuggaugau cgauuacguc agcaaucggc ugaucucccg guccggcacu 2940 aucgcugagg uggggaagug gcugcaggcu auguuuuuuu aucucaaaca gauuccccgg 3000 uaucugauuc ccugcuauuu cgacgcuauu cucaucgggg ccuacaccac ucugcucgac 3060 accgccugga aacagauguc cagcuucgug cagaacgggu ccaccuucgu caagcaucug 3120 ucccuggggu ccgugcaacu cugcggcguc ggcaaguuuc cuagccuccc cauccugucc 3180 ccugcccuca uggacguccc uuaccggcuc aacgaaauua ccaaggagaa agaacaaugc 3240 ugcguguccc ucgcugccgg gcucccucac uucuccuccg ggaucuuucg guguuggggc 3300 cgggacacuu ucaucgcccu gagggggauu cuccucauca cuggccggua cgucgaggcc 3360 cggaacauca uccucgccuu cgcugggacc cuccggcacg ggcucauccc uaaccuccuc 3420 ggggagggca ucuacgccag guauaacugc cgggacgcug ucugguggug gcuccagugc 3480 auucaggacu auugcaagau ggugcccaac gggcucgaua uccucaaaug ucccgugagc 3540 aggauguacc cuaccgacga cuccgcuccu cugccugcug ggacccucga ccagccccug 3600 uucgagguca uucaggaggc caugcaaaag cauaugcagg ggauucaguu ucgggagcgg 3660 aacgcugggc cccagauuga ccggaauaug aaagaugagg gguucaacau uacugccggc 3720 guggacgagg agaccggcuu cguguacggc ggcaaccggu uuaacugcgg gaccuggaug 3780 gacaagaugg gcgagagcga uagggcuagg aauaggggca uucccgccac ccccagggac 3840 ggcuccgcug ucgagaucgu cgggcucagc aaguccgcug ugcgguggcu gcucgagcuc 3900 agcaagaaga acaucuuucc uuaccacgag gucaccguca agaggcacgg caaagcuauu 3960 aaagucuccu acgacgaaug gaauaggaag auucaagaua auuucgagaa acucuuccac 4020 gugagcgagg auccuuccga ccucaacgag aaacacccca accucgugca uaagcggggg 4080 auuuauaagg acagcuacgg cgcuuccagc ccuuggugcg auuaccagcu ccggccuaac 4140 uucaccauug ccaugguggu cgccccugaa cucuucacua ccgagaaggc cuggaaggcu 4200 cuggaaaucg ccgagaagaa gcugcugggg ccccugggga ugaagacucu cgaccccgac 4260 gacauggugu auugcggcau cuacgauaac gcccucgaua acgauaauua uaaccuggcu 4320 aagggguuua acuaccauca aggcccugaa uggcucuggc cuaucggcua cuuccugcgg 4380 gccaagcucu acuucagcag gcugaugggg cccgaaacua cugccaaaac uauugugcug 4440 gugaagaacg ugcugagccg gcacuacgug caccuggaaa ggagcccuug gaagggccug 4500 cccgagcuca ccaacgaaaa cgcccaguau ugcccuuuua gcugcgagac ccaagccugg 4560 uccaucgcua cuauccugga aacccuguac gaccucuag 4599 <210> 43 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 43 auggggcaca gcaaacaaau caggauccuc cuccucaacg aaauggaaaa acucgaaaaa 60 acccucuuca ggcucgaaca aggguacgaa cuccaauuca ggcucgggcc gacgcuccaa 120 gggaaagcgg ugacggugua cacgaacuac ccguucccgg gggaaacguu caacagggaa 180 aaauucagga gccucgacug ggaaaacccg acggaaaggg aagacgacag cgacaaauac 240 ugcaaacuca accuccaaca aagcgggagc uuccaauacu acuuccucca agggaacgaa 300 aaaagcgggg ggggguacau cgugguggac ccgauccuca gggugggggc ggacaaccac 360 gugcucccgc ucgacugcgu gacgcuccaa acguuccucg cgaaaugccu cgggccguuc 420 gacgaauggg aaagcaggcu caggguggcg aaagaaagcg gguacaacau gauccacuuc 480 acgccgcucc aaacgcucgg gcucagcagg agcugcuaca gccucgcgaa ccaacucgaa 540 cucaacccgg acuucagcag gccgaacagg aaauacacgu ggaacgacgu ggggcaacuc 600 guggaaaaac ucaaaaaaga auggaacgug aucugcauca cggacguggu guacaaccac 660 acggcggcga acagcaaaug gauccaagaa cacccggaau gcgcguacaa ccucgugaac 720 agcccgcacc ucaaaccggc gugggugcuc gacagggcgc ucuggagguu cagcugcgac 780 guggcggaag ggaaauacaa agaaaaaggg aucccggcgc ucaucgaaaa cgaccaccac 840 augaacagca ucaggaaaau caucugggaa gacaucuucc cgaaacucaa acucugggaa 900 uucuuccaag uggacgugaa caaagcggug gaacaauuca ggaggcuccu cacgcaagaa 960 aacaggaggg ugacgaaaag cgacccgaac caacaccuca cgaucaucca agacccggaa 1020 uacaggaggu ucgggugcac gguggacaug aacaucgcgc ucacgacguu caucccgcac 1080 gacaaagggc cggcggcgau cgaagaaugc ugcaacuggu uccacaaaag gauggaagaa 1140 cucaacagcg aaaaacacag gcucaucaac uaccaccaag aacaagcggu gaacugccuc 1200 cucgggaacg uguucuacga aaggcucgcg gggcacgggc cgaaacucgg gccggugacg 1260 aggaaacacc cgcucgugac gagguacuuc acguucccgu ucgaagaaau cgacuucagc 1320 auggaagaaa gcaugaucca ccucccgaac aaagcgugcu uccucauggc gcacaacggg 1380 ugggugaugg gggacgaccc gcucaggaac uucgcggaac cggggagcga aguguaccuc 1440 aggagggaac ucaucugcug gggggacagc gugaaacuca gguacgggaa caaaccggaa 1500 gacugcccgu accucugggc gcacaugaaa aaauacacgg aaaucacggc gacguacuuc 1560 caagggguga ggcucgacaa cugccacagc acgccgcucc acguggcgga auacaugcuc 1620 gacgcggcga ggaaccucca accgaaccuc uacguggugg cggaacucuu cacggggagc 1680 gaagaccucg acaacguguu cgugacgagg cucgggauca gcagccucau cagggaagcg 1740 augagcgcgu acaacagcca cgaagaaggg aggcucgugu acagguacgg gggggaaccg 1800 guggggagcu ucgugcaacc gugccucagg ccgcucaugc cggcgaucgc gcacgcgcug 1860 uucauggaca ucacgcacga caacgaaugc ccgaucgugc acaggagcgc guacgacgcg 1920 cucccgagca cgacgaucgu gagcauggcg ugcugcgcga gcgggagcac gaggggguac 1980 gacgaacucg ugccgcacca aaucagcgug gugagcgaag aaagguucua cacgaaaugg 2040 aacccggaag cgcucccgag caacacgggg gaagugaacu uccaaagcgg gaucaucgcg 2100 gcgaggugcg cgaucagcaa acuccaccaa gaacucgggg cgaaaggguu cauccaagug 2160 uacguggacc aaguggacga agacaucgug gcggugacga ggcacagccc gagcauccac 2220 caaagcgugg uggcggugag caggacggcg uucaggaacc cgaaaacgag cuucuacagc 2280 aaagaagugc cgcaaaugug caucccgggg aaaaucgaag aaguggugcu cgaagcgagg 2340 acgaucgaaa ggaacacgaa accguacagg aaagacgaaa acagcaucaa cgggacgccg 2400 gacaucacgg uggaaaucag ggaacacauc caacucaacg aaagcaaaau cgugaaacaa 2460 gcgggggugg cgacgaaagg gccgaacgaa uacauccaag aaaucgaauu cgaaaaccuc 2520 agcccgggga gcgugaucau cuucagggug agccucgacc cgcacgcgca aguggcggug 2580 gggauccuca ggaaccaccu cacgcaauuc agcccgcacu ucaaaagcgg gagccucgcg 2640 guggacaacg cggacccgau ccucaaaauc ccguucgcga gccucgcgag caggcucacg 2700 cucgcggaac ucaaccaaau ccucuacagg ugcgaaagcg aagaaaaaga agacgggggg 2760 gggugcuacg acaucccgaa cuggagcgcg cucaaauacg cggggcucca agggcucaug 2820 agcgugcucg cggaaaucag gccgaaaaac gaccucgggc acccguucug caacaaccuc 2880 aggagcgggg acuggaugau cgacuacgug agcaacaggc ucaucagcag gagcgggacg 2940 aucgcggaag uggggaaaug gcuccaagcg auguucuucu accucaaaca aaucccgagg 3000 uaccucaucc cgugcuacuu cgacgcgauc cucaucgggg cguacacgac gcuccucgac 3060 acggcgugga aacaaaugag cagcuucgug caaaacggga gcacguucgu gaaacaccuc 3120 agccucggga gcgugcaacu cugcggggug gggaaauucc cgagccuccc gauccucagc 3180 ccggcgcuca uggacgugcc guacaggcuc aacgaaauca cgaaagaaaa agaacaaugc 3240 ugcgugagcc ucgcggcggg gcucccgcac uucagcagcg ggaucuucag gugcuggggg 3300 agggacacgu ucaucgcgcu cagggggauc cuccucauca cggggaggua cguggaagcg 3360 aggaacauca uccucgcguu cgcggggacg cucaggcacg ggcucauccc gaaccuccuc 3420 ggggaaggga ucuacgcgag guacaacugc agggacgcgg ugugguggug gcuccaaugc 3480 auccaagacu acugcaaaau ggugccgaac gggcucgaca uccucaaaug cccggugagc 3540 aggauguacc cgacggacga cagcgcgccg cucccggcgg ggacgcucga ccaaccgcug 3600 uucgaaguga uccaagaagc gaugcaaaaa cacaugcaag ggauccaauu cagggaaagg 3660 aacgcggggc cgcaaaucga caggaacaug aaagacgaag gguucaacau cacggcgggg 3720 guggacgaag aaacgggguu cguguacggg gggaacaggu ucaacugcgg gacguggaug 3780 gacaaaaugg gggaaagcga cagggcgagg aacaggggga ucccggcgac gccgagggac 3840 gggagcgcgg uggaaaucgu ggggcucagc aaaagcgcgg ugagguggcu ccucgaacuc 3900 agcaaaaaaa acaucuuccc guaccacgaa gugacgguga aaaggcacgg gaaagcgauc 3960 aaagugagcu acgacgaaug gaacaggaaa auccaagaca acuucgaaaa acucuuccac 4020 gugagcgaag acccgagcga ccucaacgaa aaacacccga accucgugca caaaaggggg 4080 aucuacaaag acagcuacgg ggcgagcagc ccguggugcg acuaccaacu caggccgaac 4140 uucacgaucg cgaugguggu ggcgccggaa cucuucacga cggaaaaagc guggaaagcg 4200 cucgaaaucg cggaaaaaaa acuccucggg ccgcucggga ugaaaacgcu cgacccggac 4260 gacauggugu acugcgggau cuacgacaac gcgcucgaca acgacaacua caaccucgcg 4320 aaaggguuca acuaccacca agggccggaa uggcucuggc cgaucgggua cuuccucagg 4380 gcgaaacucu acuucagcag gcucaugggg ccggaaacga cggcgaaaac gaucgugcuc 4440 gugaaaaacg ugcucagcag gcacuacgug caccucgaaa ggagcccgug gaaagggcuc 4500 ccggaacuca cgaacgaaaa cgcgcaauac ugcccguuca gcugcgaaac gcaagcgugg 4560 agcaucgcga cgauccucga aacgcucuac gaccucuga 4599 <210> 44 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 44 augggccaca gcaagcagau caggauccuc cuccucaacg aaauggaaaa gcucgaaaag 60 acacucuuca ggcucgaaca gggcuacgaa cuccaguuca ggcucggccc aacacuccag 120 ggcaaggccg ugacagugua cacaaacuac ccauucccag gcgaaacauu caacagggaa 180 aaguucagga gccucgacug ggaaaaccca acagaaaggg aagacgacag cgacaaguac 240 ugcaagcuca accuccagca gagcggcagc uuccaguacu acuuccucca gggcaacgaa 300 aagagcggcg gcggcuacau cgugguggac ccaauccuca gggugggcgc cgacaaccac 360 gugcucccac ucgacugcgu gacacuccag acauuccucg ccaagugccu cggcccauuc 420 gacgaauggg aaagcaggcu caggguggcc aaggaaagcg gcuacaacau gauccacuuc 480 acaccacucc agacacucgg ccucagcagg agcugcuaca gccucgccaa ccagcucgaa 540 cucaacccag acuucagcag gccaaacagg aaguacacau ggaacgacgu gggccagcuc 600 guggaaaagc ucaagaagga auggaacgug aucugcauca cagacguggu guacaaccac 660 acagccgcca acagcaagug gauccaggaa cacccagaau gcgccuacaa ccucgugaac 720 agcccacacc ucaagccagc cugggugcuc gacagggccc ucuggagguu cagcugcgac 780 guggccgaag gcaaguacaa ggaaaagggc aucccagccc ucaucgaaaa cgaccaccac 840 augaacagca ucaggaagau caucugggaa gacaucuucc caaagcucaa gcucugggaa 900 uucuuccagg uggacgugaa caaggccgug gaacaguuca ggaggcuccu cacacaggaa 960 aacaggaggg ugacaaagag cgacccaaac cagcaccuca caaucaucca ggacccagaa 1020 uacaggaggu ucggcugcac aguggacaug aacaucgccc ucacaacauu caucccacac 1080 gacaagggcc cagccgccau cgaagaaugc ugcaacuggu uccacaagag gauggaagaa 1140 cucaacagcg aaaagcacag gcucaucaac uaccaccagg aacaggccgu gaacugccuc 1200 cucggcaacg uguucuacga aaggcucgcc ggccacggcc caaagcucgg cccagugaca 1260 aggaagcacc cacucgugac aagguacuuc acauucccau ucgaagaaau cgacuucagc 1320 auggaagaaa gcaugaucca ccucccaaac aaggccugcu uccucauggc ccacaacggc 1380 ugggugaugg gcgacgaccc acucaggaac uucgccgaac caggcagcga aguguaccuc 1440 aggagggaac ucaucugcug gggcgacagc gugaagcuca gguacggcaa caagccagaa 1500 gacugcccau accucugggc ccacaugaag aaguacacag aaaucacagc cacauacuuc 1560 cagggcguga ggcucgacaa cugccacagc acaccacucc acguggccga auacaugcuc 1620 gacgccgcca ggaaccucca gccaaaccuc uacguggugg ccgaacucuu cacaggcagc 1680 gaagaccucg acaacguguu cgugacaagg cucggcauca gcagccucau cagggaagcc 1740 augagcgccu acaacagcca cgaagaaggc aggcucgugu acagguacgg cggcgaacca 1800 gugggcagcu ucgugcagcc augccucagg ccacucaugc cagccaucgc ccacgcccuc 1860 uucauggaca ucacacacga caacgaaugc ccaaucgugc acaggagcgc cuacgacgcc 1920 cucccaagca caacaaucgu gagcauggcc ugcugcgcca gcggcagcac aaggggcuac 1980 gacgaacucg ugccacacca gaucagcgug gugagcgaag aaagguucua cacaaagugg 2040 aacccagaag cccucccaag caacacaggc gaagugaacu uccagagcgg caucaucgcc 2100 gccaggugcg ccaucagcaa gcuccaccag gaacucggcg ccaagggcuu cauccaggug 2160 uacguggacc agguggacga agacaucgug gccgugacaa ggcacagccc aagcauccac 2220 cagagcgugg uggccgugag caggacagcc uucaggaacc caaagacaag cuucuacagc 2280 aaggaagugc cacagaugug caucccaggc aagaucgaag aaguggugcu cgaagccagg 2340 acaaucgaaa ggaacacaaa gccauacagg aaggacgaaa acagcaucaa cggcacacca 2400 gacaucacag uggaaaucag ggaacacauc cagcucaacg aaagcaagau cgugaagcag 2460 gccggcgugg ccacaaaggg cccaaacgaa uacauccagg aaaucgaauu cgaaaaccuc 2520 agcccaggca gcgugaucau cuucagggug agccucgacc cacacgccca gguggccgug 2580 ggcauccuca ggaaccaccu cacacaguuc agcccacacu ucaagagcgg cagccucgcc 2640 guggacaacg ccgacccaau ccucaagauc ccauucgcca gccucgccag caggcucaca 2700 cucgccgaac ucaaccagau ccucuacagg ugcgaaagcg aagaaaagga agacggcggc 2760 ggcugcuacg acaucccaaa cuggagcgcc cucaaguacg ccggccucca gggccucaug 2820 agcgugcucg ccgaaaucag gccaaagaac gaccucggcc acccauucug caacaaccuc 2880 aggagcggcg acuggaugau cgacuacgug agcaacaggc ucaucagcag gagcggcaca 2940 aucgccgaag ugggcaagug gcuccaggcc auguucuucu accucaagca gaucccaagg 3000 uaccucaucc caugcuacuu cgacgccauc cucaucggcg ccuacacaac acuccucgac 3060 acagccugga agcagaugag cagcuucgug cagaacggca gcacauucgu gaagcaccuc 3120 agccucggca gcgugcagcu cugcggcgug ggcaaguucc caagccuccc aauccucagc 3180 ccagcccuca uggacgugcc auacaggcuc aacgaaauca caaaggaaaa ggaacagugc 3240 ugcgugagcc ucgccgccgg ccucccacac uucagcagcg gcaucuucag gugcuggggc 3300 agggacacau ucaucgcccu caggggcauc cuccucauca caggcaggua cguggaagcc 3360 aggaacauca uccucgccuu cgccggcaca cucaggcacg gccucauccc aaaccuccuc 3420 ggcgaaggca ucuacgccag guacaacugc agggacgccg ugugguggug gcuccagugc 3480 auccaggacu acugcaagau ggugccaaac ggccucgaca uccucaagug cccagugagc 3540 aggauguacc caacagacga cagcgcccca cucccagccg gcacacucga ccagccacuc 3600 uucgaaguga uccaggaagc caugcagaag cacaugcagg gcauccaguu cagggaaagg 3660 aacgccggcc cacagaucga caggaacaug aaggacgaag gcuucaacau cacagccggc 3720 guggacgaag aaacaggcuu cguguacggc ggcaacaggu ucaacugcgg cacauggaug 3780 gacaagaugg gcgaaagcga cagggccagg aacaggggca ucccagccac accaagggac 3840 ggcagcgccg uggaaaucgu gggccucagc aagagcgccg ugagguggcu ccucgaacuc 3900 agcaagaaga acaucuuccc auaccacgaa gugacaguga agaggcacgg caaggccauc 3960 aaggugagcu acgacgaaug gaacaggaag auccaggaca acuucgaaaa gcuguuccac 4020 gugagcgaag acccaagcga ccucaacgaa aagcacccaa accucgugca caagaggggc 4080 aucuacaagg acagcuacgg cgccagcagc ccauggugcg acuaccagcu caggccaaac 4140 uucacaaucg ccaugguggu ggccccagaa cucuucacaa cagaaaaggc cuggaaggcc 4200 cucgaaaucg ccgaaaagaa gcuccucggc ccacucggca ugaagacacu cgacccagac 4260 gacauggugu acugcggcau cuacgacaac gcccucgaca acgacaacua caaccucgcc 4320 aagggcuuca acuaccacca gggcccagaa uggcucuggc caaucggcua cuuccucagg 4380 gccaagcucu acuucagcag gcucaugggc ccagaaacaa cagccaagac aaucgugcuc 4440 gugaagaacg ugcucagcag gcacuacgug caccucgaaa ggagcccaug gaagggccuc 4500 ccagaacuca caaacgaaaa cgcccaguac ugcccauuca gcugcgaaac acaggccugg 4560 agcaucgcca caauccucga aacacucuac gaccucuga 4599 <210> 45 <211> 4599 <212> RNA <213> Artificial Sequence <220> <223> Codon-Optimized AGL Coding Sequence <400> 45 augggccaca gcaagcagau ccggaucuug cugcugaacg agauggagaa gcuggagaag 60 acccuguuca ggcuggagca gggcuacgag cugcaguucc gguugggccc caccuugcag 120 ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgagacguu caacagggag 180 aaguuccggu cccuggacug ggagaacccc accgagaggg aggacgacuc cgacaaguac 240 ugcaagcuga accugcagca guccggcucc uuccaguacu acuuccugca gggcaacgag 300 aagaguggcg gcggcuacau cgugguggac cccaucuugc gggugggcgc cgacaaccac 360 gugcugcccu uggacugcgu gacccugcag accuucuugg ccaagugcuu gggccccuuc 420 gacgaguggg agagcaggcu gaggguggcc aaggaguccg gcuacaacau gauccacuuc 480 acccccuugc agacccuggg ccuguccagg uccugcuacu cccuggccaa ccaguuggag 540 uugaaccccg acuucuccag gcccaacagg aaguacaccu ggaacgacgu gggccagcug 600 guggagaagu ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660 accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720 uccccccacu ugaagcccgc cuggguguug gacagggccc uguggcgguu cuccugcgac 780 guggccgagg gcaaguacaa ggagaagggc auccccgccu ugaucgagaa cgaccaccac 840 augaacucca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900 uucuuccagg uggacgugaa caaggccgug gagcaguuca ggaggcugcu gacccaggag 960 aacaggcggg ugaccaaguc cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020 uacaggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080 gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagag gauggaggag 1140 uugaacuccg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200 uugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260 aggaagcacc ccuuggugac cagguacuuc accuuccccu ucgaggagau cgacuucucc 1320 auggaggagu ccaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380 ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcuccga gguguaccug 1440 aggagggagc ugaucugcug gggcgacagc gugaaguugc gguacggcaa caagcccgag 1500 gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560 cagggcgugc ggcuggacaa cugccacucc accccccugc acguggccga guacauguug 1620 gacgccgcca ggaacuugca gcccaacuug uacguggugg ccgagcuguu caccggcagc 1680 gaggaccugg acaacguguu cgugaccagg cugggcauca gcuccuugau cagggaggcc 1740 augagcgccu acaacagcca cgaggagggc agguuggugu accgguacgg cggcgagccc 1800 gugggcuccu ucgugcagcc cugcuugagg cccuugaugc ccgccaucgc ccacgcccug 1860 uucauggaca ucacccacga caacgagugc cccaucgugc acagguccgc cuacgacgcc 1920 cugcccagca ccaccaucgu guccauggcc ugcugcgcca gcggcagcac caggggcuac 1980 gacgaguugg ugccccacca gaucuccgug guguccgagg agcgguucua caccaagugg 2040 aaccccgagg ccuugcccuc caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100 gccaggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160 uacguggacc agguggacga ggacaucgug gccgugacca ggcacucccc cagcauccac 2220 caguccgugg uggccguguc caggaccgcc uucaggaacc ccaagaccuc cuucuacagc 2280 aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggccagg 2340 accaucgaga ggaacaccaa gcccuacagg aaggacgaga acuccaucaa cggcaccccc 2400 gacaucaccg uggagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460 gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaacuug 2520 ucccccggca gcgugaucau cuucagggug agccuggacc cccacgccca gguggccgug 2580 ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaaguccgg cagccuggcc 2640 guggacaacg ccgaccccau cuugaagauc cccuucgccu cccuggccuc cagguugacc 2700 uuggccgagc ugaaccagau ccuguaccgg ugcgaguccg aggagaagga ggacggcggc 2760 ggcugcuacg acauccccaa cugguccgcc cugaaguacg ccggccugca gggcuugaug 2820 uccguguugg ccgagaucag gcccaagaac gacuugggcc accccuucug caacaacuug 2880 agguccggcg acuggaugau cgacuacgug agcaaccggc ugaucucccg guccggcacc 2940 aucgccgagg ugggcaagug guugcaggcc auguucuucu accugaagca gaucccccgg 3000 uaccugaucc ccugcuacuu cgacgccauc uugaucggcg ccuacaccac ccugcuggac 3060 accgccugga agcagauguc cagcuucgug cagaacggcu ccaccuucgu gaagcaccug 3120 uccuugggcu ccgugcagcu gugcggcgug ggcaaguucc ccucccugcc cauccugucc 3180 cccgcccuga uggacgugcc cuacagguug aacgagauca ccaaggagaa ggagcagugc 3240 ugcguguccc uggccgccgg cuugccccac uucuccuccg gcaucuuccg gugcuggggc 3300 agggacaccu ucaucgcccu gaggggcauc cugcugauca ccggccggua cguggaggcc 3360 aggaacauca ucuuggccuu cgccggcacc cugaggcacg gccugauccc caaccugcug 3420 ggcgagggca ucuacgccag guacaacugc cgggacgccg ugugguggug gcugcagugc 3480 auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugucc 3540 aggauguacc ccaccgacga cuccgccccc uugcccgccg gcacccugga ccagcccuug 3600 uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagagg 3660 aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720 guggacgagg agacuggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780 gacaagaugg gcgagagcga cagggccagg aacaggggca uccccgccac ccccagggac 3840 ggcuccgccg uggagaucgu gggccugagc aaguccgccg ugcggugguu gcuggaguug 3900 uccaagaaga acaucuuccc cuaccacgag gugaccguga agaggcacgg caaggccauc 3960 aagguguccu acgacgagug gaacaggaag auccaggaca acuucgagaa gcuguuccac 4020 guguccgagg accccuccga cuugaacgag aagcacccca accuggugca caagcggggc 4080 aucuacaagg acagcuacgg cgccuccagc cccuggugcg acuaccagcu gaggcccaac 4140 uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200 uuggagaucg ccgagaagaa guugcugggc ccccugggca ugaagaccuu ggaccccgac 4260 gacauggugu acugcggcau cuacgacaac gccuuggaca acgacaacua caaccuggcc 4320 aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380 gccaaguugu acuucuccag guugaugggc cccgagacga ccgccaagac caucguguug 4440 gugaagaacg ugcugucccg gcacuacgug caccuggaga ggucccccug gaagggccug 4500 cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgagac gcaggccugg 4560 uccaucgcca ccauccugga gacgcuguac gacuuguag 4599

Claims

인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 폴리뉴클레오타이드로서,
상기 폴리뉴클레오타이드는 천연 및 화학적으로-변형된 뉴클레오타이드를 포함하고, AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능한 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 인간 AGL 야생형 mRNA와 비교하여 코돈-최적화된 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는
5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 2-티오시티딘;
5-하이드록시우리딘, 5-메틸우리딘, 5,6-디하이드로-5-메틸우리딘, 2'-O-메틸우리딘, 2'-O-메틸-5-메틸우리딘, 2'-플루오로-2'-데옥시우리딘, 2'-아미노-2'-데옥시우리딘, 2'-아지도-2'-데옥시우리딘, 4-티오우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-아이오도우리딘, 5-플루오로우리딘;
슈도우리딘, 2'-O-메틸-슈도우리딘, N¹-하이드록시슈도우리딘, N¹-메틸슈도우리딘, 2'-O-메틸-N¹-메틸슈도우리딘, N¹-에틸슈도우리딘, N¹-하이드록시메틸슈도우리딘, 및 아라우리딘;
N⁶-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 7-데아자아데노신, 8-옥소아데노신, 이노신;
티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 및 6-O-메틸구아닌;으로부터 선택되는 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 N¹-메틸슈도우리딘인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 슈도우리딘 및 N¹-메틸슈도우리딘의 조합인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메틸시티딘 및 N¹-메틸슈도우리딘의 조합인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘 및 N¹-메틸슈도우리딘의 조합인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘, 5-메틸시티딘 및 N¹-메틸슈도우리딘의 조합인 폴리뉴클레오타이드.
청구항 1 내지 청구항 9 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 50% 증가된 것인 폴리뉴클레오타이드.
청구항 1 내지 청구항 10 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 3-배 증가된 것인 폴리뉴클레오타이드.
청구항 1 내지 청구항 11 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드는 200 내지 12,000 뉴클레오타이드를 포함하는 폴리뉴클레오타이드.
청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
화학적으로-변형된 뉴클레오타이드는 1-99%의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드.
청구항 1 내지 청구항 13 중 어느 한 항에 있어서,
화학적으로-변형된 뉴클레오타이드는 50-99%의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 꼬리 영역을 포함하는 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 번역 향상제를 포함하는 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 발현하도록 포유동물 세포에서 번역가능한 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 발현하도록 대상체의 생체내에서 번역가능한 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드의 번역 생성물은 AGL 활성을 갖는 활성 인간 AGL 또는 이의 단편인 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 인간 AGL 야생형 mRNA와 비교하여 감소된 면역원성을 갖는 폴리뉴클레오타이드.
청구항 1에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열을 포함하는 폴리뉴클레오타이드.
인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 번역가능한 올리고머로서,
상기 올리고머는 천연 및 화학적으로-변형된 뉴클레오타이드, 하나 이상의 UNA 단량체를 포함하고, AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL) 또는 이의 단편을 제공하도록 발현가능한 올리고머.
청구항 22에 있어서,
상기 올리고머는 인간 AGL 야생형 mRNA와 비교하여 코돈 최적화된 올리고머.
청구항 22에 있어서,
상기 올리고머의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 50% 증가된 올리고머.
청구항 22에 있어서,
상기 올리고머의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 3-배 증가된 올리고머.
청구항 22에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는
5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 2-티오시티딘;
5-하이드록시우리딘, 5-메틸우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-플루오로우리딘, 5-아이오도우리딘, 5,6-디하이드로-5-메틸우리딘, 2'-O-메틸우리딘, 2'-O-메틸-5-메틸우리딘, 2'-플루오로-2'-데옥시우리딘, 2'-아미노-2'-데옥시우리딘, 2'-아지도-2'-데옥시우리딘;
슈도우리딘, 2'-O-메틸-슈도우리딘, N¹-하이드록시슈도우리딘, N¹-메틸슈도우리딘, N¹-하이드록시메틸슈도우리딘, 2'-O-메틸-N¹-메틸슈도우리딘, N¹-에틸슈도우리딘, 아라우리딘;
N⁶-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 7-데아자아데노신, 8-옥소아데노신, 이노신;
티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 및 6-O-메틸구아닌;으로부터 선택되는 올리고머.
청구항 22 내지 청구항 26 중 어느 한 항에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 1-99%의 뉴클레오타이드를 포함하는 올리고머.
청구항 22 내지 청구항 27 중 어느 한 항에 있어서,
상기 올리고머는 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 꼬리 영역을 포함하는 올리고머.
청구항 22에 있어서,
상기 올리고머는 번역 향상제를 포함하는 올리고머.
청구항 22에 있어서,
상기 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL) 또는 이의 단편을 발현하도록 포유동물 세포에서 번역가능한 올리고머.
청구항 22에 있어서,
상기 올리고머의 번역 생성물은 AGL 활성을 갖는 활성 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 또는 이의 단편인 올리고머.
청구항 22에 있어서,
상기 올리고머는 인간 AGL 야생형 mRNA와 비교하여 감소된 면역원성을 갖는 올리고머.
청구항 22 내지 청구항 32 중 어느 한 항에 있어서,
상기 올리고머는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열을 포함하는 올리고머.
서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 90% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 99% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기를 포함하는 폴리뉴클레오타이드.
청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드, 청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
청구항 38 내지 청구항 40 중 어느 한 항에 있어서,
상기 담체는 형질감염 시약, 나노입자, 또는 리포좀을 포함하는 조성물.
의료 요법에 사용하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물.
인간 또는 동물 신체의 치료에 사용하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물.
이를 필요로 하는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 장애를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 약제를 제조 또는 생산하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물의 용도.
청구항 44에 있어서,
상기 질환은 글리코겐 축적 질환 유형 III인 용도.
청구항 45에 있어서,
상기 글리코겐 축적 질환 유형 III은 글리코겐 축적 질환 유형 IIIa, 글리코겐 축적 질환 유형 IIIb, 글리코겐 축적 질환 유형 IIIc, 및 글리코겐 축적 질환 유형 IIId로부터 선택되는 용도.
대상체에게 청구항 38 내지 청구항 40 중 어느 한 항의 조성물을 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 장애를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 방법.
청구항 47에 있어서,
상기 질환은 글리코겐 축적 질환 유형 III인 방법.
청구항 48에 있어서,
상기 글리코겐 축적 질환 유형 III은 글리코겐 축적 질환 유형 IIIa, 글리코겐 축적 질환 유형 IIIb, 글리코겐 축적 질환 유형 IIIc, 및 글리코겐 축적 질환 유형 IIId로부터 선택되는 방법.
청구항 47 내지 청구항 49 중 어느 한 항에 있어서,
상기 투여는 정맥내, 피하, 폐, 근육내, 복강내, 진피, 경구, 비강, 또는 흡입인 방법.
청구항 47 내지 청구항 50 중 어느 한 항에 있어서,
상기 투여는 매일 1회, 매주, 격주로, 또는 매월인 방법.
청구항 47 내지 청구항 51 중 어느 한 항에 있어서,
상기 투여는 0.01 내지 10 mg/kg의 유효 용량을 포함하는 방법.
청구항 47 내지 청구항 52 중 어느 한 항에 있어서,
상기 투여는 상기 대상체의 간, 혈청, 혈장, 신장, 심장, 근육, 뇌, 뇌척수액, 또는 림프절에서 AGL의 발현을 증가시키는 방법.
청구항 47에 있어서,
투여 후 상기 대상체의 간에서 AGL의 수준은 10 내지 1500 ng/mg의 총 간 단백질인 방법.
청구항 47에 있어서,
투여 후 상기 대상체의 간에서 AGL의 수준은 20 내지 150 ng/mg의 총 간 단백질인 방법.
0.1 내지 500 mg 용량의 청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드, 또는 청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머와, 상기 용량을 투여하기 위한 장치를 포함하는, 생체내에서 인간 AGL을 발현하기 위한 키트.
청구항 56에 있어서,
상기 장치는 주사 바늘, 정맥내 바늘, 또는 흡입기인 키트.
서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 19에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 31에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 45에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 19의 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 31의 핵염기 서열을 포함하는 폴리뉴클레오타이드.
서열번호 45의 핵염기 서열을 포함하는 폴리뉴클레오타이드.