KR20190056388A

KR20190056388A - 산-알파 글루코시다제 변이체 및 이의 용도

Info

Publication number: KR20190056388A
Application number: KR1020197010349A
Authority: KR
Inventors: 페데리코 민고치; 주세페 론치티; 파스콸리나 코렐라; 프란체스코 푸초
Original assignee: 제네똥; 쏘흐본느 유니베흐시테
Priority date: 2016-09-12
Filing date: 2017-09-12
Publication date: 2019-05-24
Also published as: IL302354B1; PE20190802A1; CN109843930A; RU2019110772A3; SG11201901430WA; EP3510049A1; FI3510049T3; EP3510049B1; CL2019000610A1; EP4361178A2; US20210040503A1; WO2018046775A1; US20190390224A1; IL302354A; AU2017322377A1; EP3510049B8; JP2019533991A; CO2019002248A2; MX2019002841A; JP2022180543A

Abstract

본 발명은 산-알파 글루코시다제의 변이체 및 이의 용도에 관한 것이다.

Description

산-알파 글루코시다제 변이체 및 이의 용도

본 발명은 산-알파 글루코시다제 (GAA)의 변이체 및 이의 용도에 관한 것이다. 상기 변이체는 이종성 신호 펩티드에 연결된다.

제II형 당원 축적병 (GSD) 및 산 말타제 결핍증이라고도 알려진 폼페 병은 리소솜 효소 산 알파-글루코시다제 (GAA)의 결핍으로 초래되는 상염색체 열성 물질대사성 근육병증이다. GAA는 리소솜 내에서 글리코겐을 포도당으로 가수분해하는 엑소-1,4 및 1,6-α-글루코시다제이다. GAA의 결핍은 리소솜 내에 글리코겐 축적을 야기시켜서 호흡기, 심장 및 골격 근육에 대한 점진적인 손상을 초래한다. 이 질환은 그 범위가 일반적으로 1세 내지 2세까지 치명적인 급속 진행성 유아 과정부터 아동과 성인에서 상당한 이환율 및 조기 사망률을 초래하는 보다 느리게 진행되는 이종성 과정에 이른다. [Hirschhorn RR, The Metabolic and Molecular Bases of Inherited Disease, 3: 3389-3420 (2001, McGraw-Hill); Van der Ploeg and Reuser, Lancet 372: 1342-1351 (2008)].

폼페 병을 치료하기 위한 현행 인간 요법은 달리 효소-대체 요법 (ERT)라고 하는 재조합 인간 GAA의 투여를 포함한다. ERT는 중증, 유아 GSD II에 대한 효능이 입증되었다. 그러나, 효소 요법의 이득은 빈번한 주입 필요성 및 재조합 hGAA에 대한 억제제 항체의 발생으로 인해 제한적이다 (Amalfitano, A., et al. (2001) Genet. In Med. 3:132-138). 더 나아가서, ERT는 전신을 효율적으로 교정하지 않는데, 아마도 말초 정맥 전달 이후 단백질의 불충분한 생체분포, 몇몇 조직으로부터의 흡수 결여 및 높은 면역원성의 조합때문인 듯 하다.

ERT에 대한 대안 또는 부가물로서, GSD-II를 치료하기 위한 유전자 요법 접근법의 실현가능성이 조사되었다 (Amalfitano, A., et al. (1999) Proc. Natl. Acad. Sci. USA 96:8861-8866, Ding, E., et al. (2002) Mol. Ther. 5:436-446, Fraites, T. J., et al. (2002) Mol. Ther. 5:571-578, Tsujino, S., et al. (1998) Hum. Gene Ther. 9:1609-1616). 그러나, 유전자 결함을 교정하기 위한 근육-지정 유전자 전달은 이식유전자의 근육 발현이 다른 조직과 비교하여 더 면역원성이 되는 경향이 있다는 사실 및 이 질환의 전신 성질의 한계에 직면해야 한다.

문헌 [Doerfler et al., 2016]은 하나는 간 특이적 프로모터의 제어 하에 있고 나머지 하나는 근육-특이적 프로모터의 제어 하에 있는, 인간 코돈-최적화된 GAA를 코딩하는 2개 구성체의 병용 투여를 기술한다. 간-특이적 프로모터 구동된 GAA의 발현은 Gaa^-/- 마우스 모델에서 GAA에 대한 면역 관용을 촉진시키도록 적용되는 반면, 근육-특이적 프로모터 구동된 GAA의 발현은 요법의 표적이 되는 조직의 일부분에서 치료적 단백질의 발현을 제공한다. 그러나, 이러한 전략은 다수 구성체의 사용을 필요로 하고 GAA의 신체 전반적 발현이 일어나지 않는다는 점에서 전체적으로 만족스럽지 않다.

변형된 GAA 단백질은 과거에 리소솜 축적병의 치료를 개선시키기 위해 제안되었었다. 특히, 국제 공개 특허 출원 WO2004064750 및 문헌 [Sun et al., 2006]은 분비 경로로 단백질의 표적화를 증강시키기 위한 방법으로서 GAA에 작동적으로 연결된 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 개시한다.

그러나, 환자에게 이용가능한 요법들이 전체적으로 만족스럽지 않고 개선된 GAA 폴리펩티드 및 GAA 생산이 여전히 당분야에서 요구된다. 특히, GAA 치료의 장기간 효능, 고수준의 GAA 생산, 생산된 GAA 폴리펩티드에 대한 개선된 면역학적 관용, 및 이를 필요로 하는 세포 및 조직에 의한 GAA의 개선된 흡수에 대한 요구가 여전히 존재한다. 또한, WO2004064750 및 문헌 [Sun et al., 2006]에서, 여기에 개시된 키메라 GAA 폴리펩티드의 조직 분포는 전체적으로 만족스럽지 않다. 그러므로, 모든 관심 조직은 아니더라도 대부분에서 글리코겐 축적의 교정을 가능하게 함으로써, 완전하게 치료적일 수 있는 GAA 폴리펩티드에 대한 요구가 여전히 존재한다.

본 발명은 야생형 GAA 단백질과 비교하여 더 높은 수준으로 발현되고 분비되며, 전신 글리코겐의 병리학적 축적의 개선된 교정을 유발시키고 그 결과로 GAA에 대한 면역학적 관용을 유도하는 GAA 변이체에 관한 것이다.

일 양상에 따라서, 본 발명은 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 기능성 키메라 GAA 폴리펩티드를 코딩하는 핵산 분자를 제공한다. 코딩된 키메라 GAA 폴리펩티드에서, GAA 폴리펩티드의 내생성 (또는 천연) 신호 펩티드는 다른 단백질의 신호 펩티드로 교체된다. 그러므로, 핵산 분자는 GAA 폴리펩티드에 작동적으로 연결된, GAA 이외의 다른 단백질 유래 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 코딩한다. 코딩된 키메라 폴리펩티드는 기능성 GAA 단백질로서, GAA의 천연 신호 펩티드 (예컨대 인간 GAA를 코딩하는 야생형 핵산인 SEQ ID NO: 1의 뉴클레오티드 1 내지 81에 상응하는 것)에 상응하는 아미노산 서열은 상이한 단백질의 아미노산 서열로 교체된다. 바람직한 구체예에서, 코딩된 신호 펩티드는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 아미노산 서열을 갖는다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드의 N-말단 절두 형태이다.

특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 결실되고, 부모 폴리펩티드는 이의 신호 펩티드가 없는 GAA 폴리펩티드의 전구체 형태에 상응한다. 특정 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 적어도 2개, 특히 적어도 2개, 특히 적어도 3개, 특히 적어도 4개, 특히 적어도 5개, 특히 적어도 6개, 특히 적어도 7개, 특히 적어도 8개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 75개, 특히 최대로 70개, 특히 최대로 60개, 특히 최대로 55개, 특히 최대로 50개, 특히 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 보다 특정한 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 다른 특정 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개, 특히 1 내지 47개, 특히 1 내지 46개, 특히 1 내지 45개, 특히 1 내지 44개, 특히 1 내지 43개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 2 내지 43개, 특히 3 내지 43개, 특히 4 내지 43개, 특히 5 내지 43개, 특히 6 내지 43개, 특히 7 내지 43개, 특히 8 내지 43개의 연속되는 아미노산이 결실된다. 보다 특정한 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 27, 28, 29, 30, 31, 40, 41, 42, 43, 44, 45, 46 또는 47개의 연속되는 아미노산이 결실되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 7, 8, 9, 28, 29, 30, 41, 42, 43 또는 44, 보다 특히 8, 29, 42 또는 43개의 연속되는 아미노산이 결실된다. 예시적인 부모 GAA 폴리펩티드는 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 표시된 인간 GAA 폴리펩티드로 대표된다.

다른 특정 구체예에서, 본 발명의 핵산 분자는 생체 내에서 키메라 GAA의 발현을 개선시키고/시키거나 이에 대한 면역 관용을 개선시키도록 최적화된 뉴클레오티드 서열이다.

특정 구체예에서, 본 발명의 핵산 분자는 하기 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 모이어티를 포함하는 키메라 GAA 폴리펩티드를 코딩한다:

표 1

표 1'

표 1"

예를 들어, 이러한 핵산 분자는 하기 표 2, 표 2' 또는 표 2"에 표시된 조합의 결과일 수 있다:

표 2

표 2'

표 2"

또 다른 양상에서, 본 발명은 하나 이상의 조절성 서열 예컨대 프로모터, 인트론, 폴리아데닐화 신호 및/또는 인핸서 (예를 들어, 시스-조절성 모듈, 또는 CRM)에 작동적으로 연결된 본 발명의 핵산 분자를 포함하는 핵산 구성체에 관한 것이다. 특정 구체예에서, 프로모터는 바람직하게 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터로 이루어진 군에서 선택되는 간-특이적 프로모터이다. 다른 특정 구체예에서, 프로모터는 근육-특이적 프로모터, 예컨대 Spc5-12, MCK 및 데스민 프로모터이다. 다른 구체예에서, 프로모터는 편재성 프로모터 예컨대 CMV, CAG 및 PGK 프로모터이다. 핵산 구성체는 임의로 인트론, 특히 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론, 닭 베타-글로빈 인트론 및 SV40 인트론으로 이루어진 군에서 선택되는 인트론을 더 포함할 수 있고, 상기 인트론은 임의로 변형된 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론, 또는 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론이다.

다른 특정 구체예에서, 핵산 구성체는 바람직하게 이 순서대로, 인핸서; 인트론; 프로모터, 특히 간-특이적 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 폴리아데닐화 신호를 포함하고, 구성체는 바람직하게, 이 순서대로, ApoE 제어 영역; HBB2 인트론, 특히 변형된 HBB2 인트론; hAAT 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다. 특별한 구체예에서, 핵산 구성체는 표 2, 표 2' 또는 표 2", 특히 표 2' 또는 2"에 표시된 서열의 조합으로 이루어진 군에서 선택되는 뉴클레오티드 서열, 보다 특히 SEQ ID NO: 17 (SEQ ID NO: 26 및 SEQ ID NO: 32의 융합체에 상응), 18 (SEQ ID NO: 27 및 SEQ ID NO: 32의 융합체에 상응) 또는 19 (SEQ ID NO: 28 및 SEQ ID NO: 32의 융합체에 상응)의 뉴클레오티드 서열을 포함한다.

다른 양상에 따라서, 본 발명은 본 발명에 따른 핵산 분자 또는 핵산 구성체를 포함하는 벡터에 관한 것이다. 특정 구체예에서, 벡터는 바이러스 벡터, 바람직하게 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터, 또는 AAV 벡터이다.

다른 구체예에 따라서, 바이러스 벡터는 단일-가닥 또는 이중-가닥 자기-상보성 AAV 벡터, 바람직하게 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖거나 또는 키메라 캡시드를 갖는 AAV 벡터이다.

추가의 특정한 구체예에 따라서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 보다 특히 AAV8 캡시드를 갖는다.

다른 양상에서, 본 발명은 본 발명의 핵산 분자, 핵산 구성체 또는 벡터로 형질전환된 세포에 관한 것이다. 특정 구체예에서, 세포는 간 세포 또는 근육 세포이다.

다른 양상에 따라서, 본 발명은 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드에 관한 것이다. 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4, 바람직하게 SEQ ID NO: 2로 이루어진 군에서 선택된다. 더 나아가서, GAA 모이어티는 부모 GAA 폴리펩티드의 절두된 형태, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 절두되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 20, 41, 42, 43 또는 44개의 연속되는 아미노산이 절두되고, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8 또는 42개의 연속되는 아미노산이 절두된 GAA 모이어티일 수 있고, 여기서 GAA 모이어티는 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질의 절두된 형태이다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드 (보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 부모 GAA 폴리펩티드)와 비교하여 이의 N-말단부에서 8개의 연속되는 아미노산이 절두된다. 본 발명의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 아미노산 서열의 조합으로 이루어진 군에서 선택된다. 부모 GAA 폴리펩티드의 절두형을 포함하는 키메라 GAA 폴리펩티드의 추가의 특정 구체예가 하기 구체적인 내용에서 개시된다.

다른 양상에서, 본 발명은 약학적으로 허용가능한 담체에, 본 명세서에 개시된 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드를 포함하는 약학 조성물에 관한 것이다.

본 발명의 다른 양상은 약물로서 사용을 위한, 본 발명의 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드에 관한 것이다.

또 다른 양상에서, 본 발명은 당원 축적병을 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드에 관한 것이다. 특정 구체예에서, 당원 축적병은 GSDI, GSDII, GSDIII, GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 또는 심장의 치명적인 선천성 당원 축적병이다. 보다 특정한 구체예에서, 당원 축적병은 GSDI, GSDII 및 GSDIII으로 이루어진 군, 보다 특히 GSDII 및 GSDIII으로 이루어진 군에서 선택된다. 보다 더 특정한 구체예에서, 당원 축적병은 GSDII이다.

도 1. 신호 펩티드가 시험관 내 및 생체 내에서 다양한 정도로 hGAA의 분비를 증강시킨다. 패널 A. 인간 간세포암 세포 (Huh7)는 Lipofectamine™에 의해서 대조군 플라스미드 (GFP), 간 특이적 프로모터의 전사 제어 하에서 야생형 hGAA를 발현하는 플라스미드 (sp1로 표시), 또는 합성 기원 또는 다른 고도의 분비성 단백질로부터 유래된 신호 펩티드 1-8 (sp2 (sp1-8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 플라스미드로 형질감염되었다. 형질감염 후 48시간에, 배양 배지 중 hGAA의 활성은 형광원성 효소 어세이를 통해 측정하였고 4-메틸엄벨리페론의 표준 곡선에 대해서 GAA 활성을 평가하였다. 히스토그램 그래프는 3회의 상이한 실험으로부터 유래된 분비형 hGAA의 수준의 평균 ± SE를 도시한다. 통계 분석은 ANOVA로 수행하였다 (* = 모의 형질감염 세포 대비 p < 0.05). 패널 B. 히스토그램 그래프는 PBS (PBS) 또는 1E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1 내지 3 및 7-8 (sp1-3, 7-8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터의 주사 후 1개월에 3개월령 C57Bl6J 마우스 (n=5 마우스/그룹)의 혈청 중 hGAA의 활성의 평균 ± SE를 도시한다. 혈청 중 hGAA의 활성은 형광원성 효소 어세이를 통해 정량하였고 GAA 활성은 재조합 hGAA 단백질의 표준 그래프에 대해 평가하였다. 통계 분석은 ANOVA로 수행하였다 (* = PBS 주사 대비 p < 0.05, § = sp2 대비 p < 0.05).
도 2. sp7 신호 펩티드는 폼페 병 마우스 모델에서 순환성 hGAA의 수준을 증가시키고 호흡기 손상을 구제한다. 4개월령 야생형 (WT) 및 GAA^-/- 마우스 (n=6-9 마우스/그룹)는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 2, 7 및 8 (sp1, 2, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8이 정맥내로 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 후 3개월에 혈액 중 형광원성 어세이를 통해서 측정된 hGAA 활성을 보여준다. 통계 분석은 ANOVA로 수행하였다 (* = 표시된 대로 p < 0.05, § = sp1 처치 마우스 대비 p < 0.05). 패널 B. 카플란-마이어 생존 그래프는 상기 기술된 바와 같이 처치된 마우스에서 측정하였고 6개월 동안 추적하였다. 통계 분석은 log-순위 검정으로 수행하였다 (* = p < 0.05). 패널 C. 호흡 기능 평가. 히스토그램은 표시된 벡터로 처치 후 3개월 (회색 막대) 및 6개월 (검은색 막대)에 측정된 밀리리터 (mL) 단위의 1회 호흡량을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서 sp1 처치된 GAA -/- 동물 대비 수득된 p-값이 기록되어 있다 (* = p < 0.05).
도 3. 사두근 내 글리코겐 함량의 생물학적 교정. 4개월령 GAA^-/- 마우스는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 사두근에서 형광원성 어세이로 측정된 hGAA 활성. 패널 B. 히스토그램에서는 사두근에서 측정된 글리코겐의 효소 분해 이후에 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05).
도 4. 심장, 횡격막 및 사두근 내 글리코겐 함량의 생화학적 교정. 4개월령 야생형 (WT) 및 GAA^-/- 마우스 (n=4-5 마우스/그룹)는 PBS 및 6E11 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 이후 3개월에 혈액 중 형광원성 어세이를 통해 측정된 hGAA 활성을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서는 PBS 처치된 GAA -/- 동물 대비 수득된 p-값으로 기록되어 있다 (* = p < 0.05). 패널 B-D. 히스토그램 그래프는 심장 (패널 B), 횡격막 (패널 C) 및 사두근 (패널 D)에서 측정된 글리코겐의 효소 분해 후 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05, § = sp1-처치된 마우스 대비 p < 0,05).
도 5. 고도로 분비된 hGAA는 폼페 병 마우스 모델의 이식유전자에 대하여 유도된 체액성 반응을 감소시킨다. 4개월령 GAA-/- 마우스는 PBS 또는 신호 펩티드 1 (co), 신호 펩티드 2 (sp2-Δ8-co), 신호 펩티드 7 (sp7-Δ8-co) 또는 신호 펩티드 8 (sp8-Δ8-co)이 융합되는, Δ8 hGAA를 코딩하는, 인간 알파-1-항트립신 프로모터의 전사 제어 하의 최적화된 서열을 포함하는 AAV8 벡터의 2가지 상이한 용량 (5E11 또는 2E12 vg/kg)이 정맥내로 주사되었다. 주사 후 1개월에, 혈청은 ELISA를 통해 항-hGAA 항체의 존재에 대해 분석되었다. 정량은 표준물로서 정제된 마우스 IgG를 사용하여 수행되었다. 통계 분석은 두네트 (Dunnett)의 사후 검정과 ANOVA를 통해 수행되었다 (* = p < 0.01).
도 6. AAV8-hAAT-sp7-Δ8-hGAAco1 주사는 NHP에서 혈중 hGAA의 효율적인 분비 및 근육 내 흡수를 야기시킨다. 2마리의 마카카 파시쿨라리스 (Macaca Fascicularis) 원숭이는 0일에 2E12 vg/kg의 AAV8-hAAT-sp7-Δ8-hGAAco1이 주사되었다. 패널 A. hGAA 웨스턴 블롯은 벡터 투여 전 12일 및 투여 후 30일에 수득된 2마리 원숭이로부터의 혈청에서 수행되었다. 좌측은 샘플과 함께 흘려준 분자량 마커 (st)의 밴드 위치가 표시되어 있다. 패널 B. 벡터 주사 후 3개월에 원숭이를 희생시켰고 hGAA 흡수의 생화학적 평가를 위해 조직을 수집하였다. hGAA 웨스턴 블롯은 이두근 및 횡격막으로부터 수득된 조직 추출물에서 수행되었다. 항-튜불린 항체가 로딩 대조군으로서 사용되었다. 샘플과 동시에 흘려준 분자량 마커의 밴드 위치가 표시되어 있다.
도 7. 이종성 sp7 또는 sp8 신호 펩티드와 조합된 GAA 변이체를 코딩하는 플라스미드로 형질감염된 세포의 배지 중 증가된 GAA 활성. 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 또는 sp8 신호 펩티드 (sp7-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 이후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정된 GAA 활성. eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001.
도 8. hGAA 발현 벡터가 주사된 GDE -/- 동물의 간 중 글리코겐 함량의 생화학적 교정. 3개월령 야생형 (WT) 또는 GDE -/- 마우스는 PBS 또는 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 7 (AAV8-hAAT-sp7--Δ8-hGAAco1)이 융합된 코돈 최적화된 hGAA를 발현하는 AAV8 벡터가 1E11 또는 1E12 vg/마우스의 용량으로 정맥내 주사되었다. 히스토그램 그래프는 간에서 측정된, 글리코겐의 효소 분해 후 방출된 포도당으로 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GDE -/- 마우스 대비 p < 0.05, §= PBS 주사 WT 동물 대비 p < 0.05).
도 9. 상이한 GAA 변이체를 코딩하는 플라스미드가 형질감염된 세포의 배지 중 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 24시간 (패널 A) 및 48시간 (패널 B)에 HuH7 세포의 배지 중에서 측정되었다. sp7 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과를 평가하였다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대에서 해쉬 마크 (#)는 co 대비 통계적으로 유의한 편차를 보여주고; tau 기호 (τ)는 sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 10. 상이한 GAA 변이체의 세포내 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 용해물에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과가 평가되었다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드는 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. tau 기호 (τ)는 sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD를 보여준다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 11. sp6 또는 sp8 신호 펩티드와 조합된 Δ8 결실을 사용한 세포 배지 중 증가된 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp6 또는 sp8 신호 펩티드 (sp6-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 8개 아미노산의 결실의 효과가 평가되었다 (sp6-Δ8-co, sp8-Δ8-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대의 별표는 co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호가 사용된 경우는 예외이다.

본 발명은 키메라 GAA 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다. 이러한 키메라 GAA 폴리펩티드는 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하고, 여기서 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택된다. 발명자는 놀랍게도 GAA 단백질과 이들 신호 펩티드 중 하나의 융합이 이의 면역원성은 감소시키면서 GAA 분비는 상당히 개선시킨다는 것을 확인하였다.

리소솜 산 α-글루코시다제 또는 "GAA" (E.C. 3.2. 1.20) (1,4-α-D-글루칸 글루코하이드롤라제)는 올리고사카라이드의 α-1,4 및 α-1,6 연결 둘 모두를 가수분해하여 포도당을 유리시키는 엑소-1,4-α-D-글루코시다제이다. GAA의 결핍으로 인해 제II형 당원 축적병 (GSDII)이 발생되고, 이를 또한 폼페 병이라고도 한다 (그러나 이 용어는 공식적으로 질환의 유아기 개시 형태를 의미함). 이 효소는 분지 지점에서 둔화되는 글리코겐의 완전한 분해를 촉매한다. 17번 염색체 상의 28 kb 인간 산 α-글루코시다제 유전자는 3.6 kb mRNA를 코딩하여 952개 아미노산 폴리펩티드를 생산한다 (Hoefsloot et al., (1988) EMBO J. 7: 1697; Martiniuk et al., (1990) DNA and Cell Biology 9: 85). 효소는 세포질 망상구조 내에서 공번역 N-연결 글리코실화를 수용한다. 이것은 110-kDa 전구체 형태로서 합성되어서, 광범위한 글리코실화 변형, 인산화 및 대략 90-kDa 엔도솜 중간체에서 최종 리소솜 76 및 67 kDa 형태로 단백질가수분해 프로세싱을 통해 성숙된다 (Hoefsloot, (1988) EMBO J. 7: 1697; Hoefsloot et al., (1990) Biochem. J. 272: 485; Wisselaar et al., (1993) J. Biol. Chem. 268: 2223; Hermans et al., (1993) Biochem. J. 289: 681).

GSD II가 있는 환자에서, α-글루코시다제의 결핍은 리소솜 내 글리코겐의 대량 축적을 초래하여, 세포 기능을 파괴한다 (Hirschhorn, R. and Reuser, A. J. (2001), in The Metabolic and Molecular Basis for Inherited Disease, (eds, Scriver, C. R. et al.) pages 3389-3419 (McGraw-Hill, New York)). 가장 일반적인 유아기 형태에서, 환자는 진행성 근육 변성 및 심근병증을 나타내고 2세 이전에 사망한다. 중증 쇠약증이 청소년 및 성인 개시 형태에 존재한다.

더 나아가서, 다른 GSD를 갖는 환자는 GAA의 최적화된 형태의 투여를 통해서 이득을 얻을 수 있다. 예를 들어, GAA의 투여는 제III형 당원 축적병 (GSD III) 환자 유래의 초대 근아세포 중에서 글리코겐을 감소시키는 것으로 확인되었다 (Sun et al. (2013) Mol Genet Metab 108(2): 145; WO2010/005565).

본 명세서에서 사용되는 용어 "GAA" 또는 "GAA 폴리펩티드"는 성숙 (∼76 또는 ∼67 kDa) 및 전구체 (예, ∼110 kDa) GAA, 특히 전구체 형태를 비롯하여, GAA의 기능성 유도체, 즉 GAA (즉, 천연 GAA 단백질의 적어도 하나의 생물학적 활성을 가지며, 예를 들어 상기에 정의된 바와 같이 글리코겐을 가수분해할 수 있음) 및 GAA 변이체 (예를 들어, 문헌 [Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269]에 기술된 GAA II; 문헌 [Hirschhorn, R. and Reuser, A. J. (2001) In The Metabolic and Molecular Basis for Inherited Disease (Scriver, C. R. , Beaudet, A. L., Sly, W. S. & Valle, D. Eds.), pp. 3389- 3419. McGraw-Hill, New York, 페이지 3403-3405 참조]에 기재된 GAA 다형체 및 SNP)의 생물학적 기능을 보유하는 삽입(들), 결실(들) 및/또는 치환(들)에 의해 변형되거나 또는 돌연변이된 GAA 단백질 또는 이의 단편을 포괄한다. 당분야에 공지된 임의의 GAA 코딩 서열이 사용될 수 있고, 예를 들어, SEQ ID NO: 1; GenBank 수탁 번호 NM_00152 및 문헌 [Hoefsloot et al., (1988) EMBO J. 7: 1697] 및 [Van Hove et al., (1996) Proc. Natl. Acad. Sci. USA 93: 65 (인간)], GenBank 수탁 번호 NM_008064 (마우스), 및 문헌 [Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269 (메추라기)]을 참조한다.

본 발명의 문맥에서, "GAA의 전구체 형태"는 이의 천연 신호 펩티드를 포함하는 GAA 폴리펩티드의 형태이다. 예를 들어, SEQ ID NO: 12 및 SEQ ID NO: 37의 서열은 인간 GAA (hGAA) 변이체의 전구체 형태이다. SEQ ID NO: 12 및 SEQ ID NO: 37 내에서, 아미노산 잔기 1-27은 hGAA 폴리펩티드의 신호 펩티드에 상응한다.

본 발명의 문맥에서, 본 발명의 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드로부터 유래된다. 본 발명에 따라서, "부모 GAA 폴리펩티드"는 상기에 정의된 바와 같이 기능성, 전구체 GAA 서열일 수 있지만, 이의 신호 펩티드는 없을 수 있다. 예를 들어, 야생형 인간 GAA 폴리펩티드를 참조하면, 완전한 야생형 GAA 폴리펩티드 (즉, GAA의 전구체 형태)는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 표시되고 신호 펩티드 (SEQ ID NO: 12 또는 SEQ ID NO: 37의 아미노산 1-27에 상응)를 갖지만, 이들 야생형 인간 GAA 폴리펩티드의 절두된 GAA 형태의 기초로서 제공되는 부모 GAA 폴리펩티드는 SEQ ID NO: 5 및 SEQ ID NO: 36으로 표시되고 신호 펩티드를 갖지 않는다. 이러한 예에서, 후자가 SEQ ID NO: 12의 아미노산 28-952 및 SEQ ID NO: 37의 아미노산 28-952에 상응하고, 부모 GAA 폴리펩티드를 의미한다.

GAA 폴리펩티드의 코딩 서열은 조류 및 포유동물 종을 포함한 임의의 공급원으로부터 유래될 수 있다. 본 명세서에서 사용되는 용어 "조류"는 제한없이 닭, 오리, 거위, 메추라기, 칠면조 및 꿩을 포함한다. 본 명세서에서 사용되는 용어 "포유동물"은 제한없이 인간, 유인원 및 다른 인간이외의 영장류, 소, 양, 염소, 말, 고양이, 개, 토끼목 등을 포함한다. 본 발명의 구체예에서, 본 발명의 핵산은 인간, 마우스 또는 메추라기, 특히 인간, GAA 폴리펩티드를 코딩한다. 추가의 특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 폴리펩티드는 이의 신호 펩티드가 없는 hGAA에 상응하는 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 표시되는 아미노산 서열을 포함한다 (특히, hGAA의 천연 신호 펩티드는 이의 천연 신호 펩티드를 포함하는 hGAA에 상응하는 SEQ ID NO: 12 또는 SEQ ID NO: 37의 아미노산 1-27에 상응함).

본 발명의 다른 구체예에서, 본 발명의 핵산 분자는 SEQ ID NO: 37의 야생형 hGAA를 코딩하는 서열인, SEQ ID NO: 1로 표시된 서열의 뉴클레오티드 82-2859와 적어도 75% (예컨대 적어도 77%), 적어도 80% 또는 적어도 82% (예컨대 적어도 83%) 동일성을 갖는다 (SEQ ID NO: 1의 뉴클레오티드 1-81은 hGAA의 천연 신호 펩티드를 코딩하는 일부분임).

본 발명의 핵산 분자의 GAA 모이어티는 바람직하게 생체 내 이식유전자 발현을 위해 최적화된 서열인, SEQ ID NO: 13 또는 14의 뉴클레오티드 서열과 적어도 85%, 더 바람직하게 적어도 90%, 및 보다 더 바람직하게 적어도 92% 동일성, 특히 적어도 95% 동일성, 예를 들어 적어도 98%, 99% 또는 100% 동일성을 갖는다.

또한, 본 발명의 핵산 분자가 코딩하는 키메라 GAA 단백질의 신호 펩티드 모이어티는 최종 서열이 기능성 신호 펩티드, 즉 GAA 단백질의 분비를 가능하게 하는 신호 펩티드에 해당하는 한, SEQ ID NO: 2 내지 4에 표시된 서열과 비교하여 1 내지 5개, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 결실(들), 삽입(들) 또는 치환(들)을 포함할 수 있다. 특정 구체예에서, 신호 펩티드 모이어티 서열은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 서열로 이루어진다.

용어 "동일한" 및 이의 편차는 2개 핵산 분자 간 서열 동일성을 의미한다. 2개의 비교되는 서열 둘 모두에서 한 위치가 동일한 염기로 점유된 경우, 예를 들어 2개의 DNA 분자 각각의 위치를 아데닌이 점유하고 있으면, 그 분자들은 그 위치에서 동일하다. 2개 서열 간 동일성의 %는 2개 서열이 공유하는 일치된 위치의 개수를 비교된 위치의 개수로 나누고 100을 곱한 함수이다. 예를 들어, 2개 서열에서 10개 위치 중 6개가 일치되면 그 2개 서열은 60%가 동일하다. 일반적으로, 2개 서열을 정렬하여 최대 동일성이 제공될 때 비교한다. 당업자에게 공지된 다양한 생물정보학 도구 예컨대 BLAST 또는 FASTA를 사용하여 핵산 서열을 정렬할 수 있을 것이다.

특정 구체예에서, 본 발명의 핵산 분자의 GAA 모이어티는 SEQ ID NO: 13 또는 SEQ ID NO: 14로 표시된 서열을 포함한다.

본 발명의 핵산 분자는 기능성 GAA 폴리펩티드를 코딩하며, 다시 말해서, 발현될 때, 야생형 GAA 단백질의 기능성을 갖는 인간 GAA 폴리펩티드를 코딩한다. 상기에 정의된 바와 같이, 야생형 GAA의 기능성은 올리고사카라이드 및 폴리사카라이드, 보다 특히 글리코겐의 α-1,4 및 α-1,6 연결부 둘 모두를 가수분해하여 포도당을 유리시키는 것이다. 본 발명의 핵산이 코딩하는 기능성 GAA 폴리펩티드는 SEQ ID NO: 1, SEQ ID NO: 13 또는 SEQ ID NO: 14의 핵산 서열에 의해 코딩되는 야생형 GAA 폴리펩티드 (즉, SEQ ID NO: 5의 아미노산 서열을 갖는 GAA 폴리펩티드)와 비교하여 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 적어도 100%의 글리코겐에 대한 가수분해 활성을 가질 수 있다. 본 발명의 핵산에 의해 코딩되는 GAA 단백질의 활성은 SEQ ID SEQ ID NO: 1, NO:13 또는 SEQ ID NO: 14의 핵산 서열에 의해 코딩되는 야생형 GAA 폴리펩티드 (즉, SEQ ID NO: 5의 아미노산 서열을 갖는 GAA 폴리펩티드)의 활성의 100% 초과, 예컨대 110%, 120%, 130%, 140%를 초과하거나, 또는 심지어 150%를 초과할 수 있다.

당업자는 본 발명에 따른 핵산이 기능성 GAA 단백질을 발현하는지 여부를 쉽게 결정할 수 있다. 적합한 방법은 당업자에게 자명할 것이다. 예를 들어, 시험관 내 방법으로 적합한 것에는 벡터, 예컨대 플라스미드 또는 바이러스 벡터에 핵산을 삽입시키는 단계, 숙주 세포, 예컨대 293T 또는 HeLa 세포 또는 다른 세포 예컨대 Huh7을 벡터로 형질감염 또는 형질도입시키는 단계, 및 GAA 활성에 대해 어세이하는 단계를 포함한다. 대안적으로, 적합한 생체 내 방법은 폼페 병 또는 다른 당원 축적 질병의 마우스 모델에 핵산을 함유하는 벡터를 형질도입시키는 단계 및 마우스의 혈장 내 기능성 GAA 및 조직 내 GAA의 존재에 대해 어세이하는 단계를 포함한다. 적합한 방법은 하기 실험 부분에서 보다 상세하게 설명된다.

본 발명자는 상기 기술된 핵산 분자가 야생형 GAA cDNA와 비교하여 시험관 내 및 생체 내 둘 모두에서 기능성 GAA 단백질의 높은 수준의 발현을 야기시킨다는 것을 놀랍게도 발견하였다. 더 나아가서, 또한 본 발명자가 확인한 바와 같이, 본 발명의 핵산 분자를 발현하는 간 및 근육 세포로부터 생산된 키메라 GAA 폴리펩티드는 이식유전자에 대해서 체액성 면역 반응을 유도시키지 않는다. 이것은 이 핵산 분자가 GAA 폴리펩티드를 높은 수준으로 생산하는데 사용될 수 있고, 치료적 이득을 제공할 수 있는데, 예컨대 면역억제성 치료에 대한 도움을 제거하고, 저용량 면역억제성 치료를 가능하게 하고, 본 발명의 핵산 분자를 이를 필요로 하는 대상체에게 반복 투여할 수 있게 한다는 것을 의미한다. 그러므로, 본 발명의 핵산 분자는 GAA 발현 및/또는 활성이 결핍된 상황 또는 GAA의 고수준 발현이 질환, 예컨대 당원 축적병을 경감시킬 수 있는 상황에서 특별히 관심이 있다. 특히, 당원 축적병은 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 또는 심장의 치명적인 선천성 당원 축적병일 수 있다. 보다 특히, 당원 축적병은 GSDI, GSDII 및 GSDIII으로 이루어진 군, 보다 더 특히 GSDII 및 GSDIII으로 이루어진 군에서 선택된다. 보다 더 특정한 구체예에서, 당원 축적병은 GSDII이다. 특히, 본 발명의 핵산 분자는 GAA-결핍 병태, 또는 글리코겐의 축적과 연관된 다른 병태 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII를 치료하기 위한 유전자 요법에서 유용할 수 있다. 보다 더 특정한 구체예에서, 본 발명의 핵산 분자는 GSDII를 치료하기 위한 유전자 요법에서 유용할 수 있다.

기능성 GAA를 코딩하는 본 발명의 핵산 분자의 서열은 생체 내에서 GAA 폴리펩티드의 발현을 위해 최적화된다. 서열 최적화는 코돈 최적화, GC 함량의 증가, CpG 아일랜드의 수 감소, 선택적 오픈 리딩 프레임 (alternative open reading frame) (ARF)의 수 감소 및 스플라이스 도너 및 스플라이스 억셉터 부위의 수 감소를 비롯해 핵산 서열 내 많은 변화를 포함할 수 있다. 유전자 코드의 축퇴성때문에, 상이한 핵산 분자가 동일한 단백질을 코딩할 수 있다. 상이한 유기체의 유전자 코드는 종종 다른 것들에 비해 동일한 아미노산을 코딩하는 몇몇 코돈 중 하나를 사용하는 쪽으로 편향된다는 것도 역시 충분히 공지되어 있다. 코돈 최적화를 통해서, 소정 세포 상황에서 존재하는 코돈 편향성을 이용하는 변화를 뉴클레오티드 서열에 도입시켜서 코돈 최적화된 뉴클레오티드 서열이 코돈 비최적화된 서열과 비교하여 비교적 높은 수준으로 이러한 소정 세포 상황에서 더 발현될 수 있도록 할 수 있을 것이다. 본 발명의 바람직한 구체예에서, 절두형 GAA를 코딩하는 이러한 서열 최적화된 뉴클레오티드 서열은 예를 들어 인간 특이적 코돈 용법 편향성을 이용함으로써, 동일한 절두형 GAA 단백질을 코딩하는 코돈 비최적화된 뉴클레오티드 서열과 비교하여 인간 세포에서 이의 발현을 개선시키도록 코돈 최적화된다.

표 3은 본 발명자가 수행한 서열 최적화와 관련된 관련 매개변수의 설명을 제공한다:

표 3. 최적화된 서열의 설명. 표는 야생형 서열과 비교하여 2종의 hGAA 최적화된 서열의 특징을 예시한다. a) 코돈 적합도 지수 및 b) 희귀 코돈 분석 도구 (http://www.genscript.com)를 사용해 계산된 GC 함량. c) 및 d) 는 각각 5'에서 3' (aORF 5'→3') 및 3'에서 5' (aORF 3'→5') 가닥 상에서 계산된 선택적 오픈 리딩 프레임이다. e) 및 f) 는 각각 스플라이싱 부위 온라인 예측 도구 (http://www.fruitfly.org/seq_tools/splice.html)를 사용해 계산된 억셉터 (SA) 및 도너 (SD) 스플라이싱 부위이다. g) 및 h) 는 각각 야생형 (wt) 및 최적화된 co1 서열에 대해서 계산된 %동일성이다. i) MethDB 온라인 도구 (http://www.methdb.de/links.html)를 사용해 계산된 CpG 아일랜드. CpG 아일랜드는 GC 함량 > 60%이고 관찰/기대 비율 > 0.6인, 100 bp보다 긴 서열이다.

특정 구체예에서, 최적화된 GAA 코딩 서열은 SEQ ID NO: 1의 야생형 hGAA 코딩 서열의 뉴클레오티드 82-2859와 비교하여, 코돈 최적화되고/되거나, 증가된 GC 함량을 갖고/갖거나, 감소된 수의 선택적 오픈 리딩 프레임을 갖고/갖거나, 감소된 수의 스플라이스 도너 및/또는 스플라이스 억셉터 부위를 갖는다. 예를 들어, 본 발명의 핵산 서열은 그 결과로 야생형 GAA 서열의 서열과 비교하여 GAA 서열의 GC 함량의 적어도 2, 3, 4, 5 또는 10% 증가가 일어난다. 특정 구체예에서, 본 발명의 핵산 서열은 야생형 GAA 뉴클레오티드 서열의 서열과 비교하여 GAA 서열의 GC 함량의 2, 3, 4 또는 보다 특히, 5% 또는 10% (특히 5%) 증가가 일어난다. 특정 구체예에서, 기능성 GAA 폴리펩티드를 코딩하는 본 발명의 핵산 서열은 SEQ ID NO: 1로 표시된 서열의 뉴클레오티드 82-2859와 "실질적으로 동일하고", 다시 말해서 약 70%가 동일하거나, 더 바람직하게 약 80%가 동일하거나, 보다 더 바람직하게 약 90%가 동일하거나, 보다 더 바람직하게 약 95%가 동일하거나, 보다 더 바람직하게 약 97%, 98% 또는 심지어 99%가 동일하다. 상기에 언급된 바와 같이, GC 함량 및/또는 ARF의 수 이외에도, 서열 최적화는 또한 서열의 CpG 아일랜드의 수 감소 및/또는 스플라이스 도너 및 억셉터 부위의 수 감소를 포함할 수 있다. 물론, 당업자에게 충분히 공지된 바와 같이, 서열 최적화는 모든 이들 매개변수 간의 균형인데, 최적화된 서열이 이식유전자의 개선, 예컨대 생체 내에서 이식유전자에 대한 면역 반응 감소 및/또는 개선된 발현을 유도시키는 한, 상기 매개변수 중 적어도 하나가 개선되지만 나머지 매개변수 중 하나 이상은 그렇지 않다면 서열이 최적화된 것으로 간주될 수 있다는 의미이다.

또한, 인간 세포의 코돈 용법으로 기능성 GAA를 코딩하는 뉴클레오티드 서열의 적합화는 코돈 적합도 지수 (codon adaptation index) (CAI)로서 표시될 수 있다. 본 명세서에서 코돈 적합도 지수는 고도로 발현되는 인간 유전자의 코돈 용법쪽으로 유전자의 코돈 용법의 상대적 적합도의 척도로서 정의된다. 각 코돈의 상대적 적합도 (w)는 동일한 아미노산에 대해 가장 풍부한 코돈에 대한 각 코돈의 용법의 비율이다. CAI는 이들 상대적 적합도 값의 기하 평균으로서 정의된다. 비동의 코돈 및 종결 코돈 (유전자 코드에 의존적)은 배제된다. CAI 값은 0 내지 1의 범위이고, 더 높은 값은 가장 풍부한 코돈이 더 높은 비율이라는 것을 의미한다 (문헌 [Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295] 참조; 또한 문헌 [Kim et al, Gene. 1997, 199:293-301]; [zur Megede et al, Journal of Virology, 2000, 74: 2628-2635] 참조). 바람직하게, GAA를 코딩하는 핵산 분자는 적어도 0.75 (특히 0.77), 0.8, 0.85, 0.90, 0.92 또는 0.94의 CAI를 갖는다.

일 구체예에서, 본 발명의 핵산 분자는 SEQ ID NO: 13 또는 SEQ ID NO: 14의 뉴클레오티드 서열에 의해 코딩되는 단백질에 대해서 0 내지 50개, 0 내지 30개, 0 내지 20개, 0 내지 15개, 0 내지 10개, 또는 0 내지 5개의 아미노산 변화를 갖는 단백질을 코딩한다. 더 나아가서, 본 발명의 핵산에 의해 코딩되는 GAA 단백질은 당분야에 공지된 기능성 GAA 단백질의 변이체일 수 있고, 여기서 본 발명의 핵산 분자는 당분야에 공지된 GAA 단백질에 대해서 0 내지 50개, 0 내지 30개, 0 내지 20개, 0 내지 15개, 0 내지 10개, 또는 0 내지 5개 아미노산 변화를 갖는 단백질을 코딩한다. 기능성 변이체를 디자인하기 위한 기초로서 제공될 수 있는 당분야에 공지된 이러한 GAA 단백질은 GAA의 Uniprot 등재 (수탁 번호 P10253; GenBank CAA68763.1에 상응; SEQ ID NO: 37)에서 확인할 수 있다. 추가의 특정 구체예에서, 본 발명의 핵산 서열의 GAA 모이어티는 변이체 GAA 폴리펩티드, 또는 본 명세서에 정의된 바와 같은 이러한 펩티드의 기능성 변이체, 예컨대 GenBank 수탁 번호 AAA52506.1 (SEQ ID NO: 38), EAW89583.1 (SEQ ID NO: 39) 및 ABI53718.1 (SEQ ID NO: 40)로서 식별되는 폴리펩티드로 이루어진 군에서 선택되는 것들을 코딩한다. 다른 변이체 GAA 폴리펩티드는 WO2012/145644, WO00/34451 및 US6,858,425에 기술된 것들을 포함한다. 특정 구체예에서, 부모 GAA 폴리펩티드는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 표시되는 아미노산 서열로부터 유래된다.

특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 폴리펩티드는 기능성 GAA이고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5에 표시된 hGAA 단백질과 서열 동일성을 가지며, 임의로 절두 형태가 적어도 80%, 특히 적어도 85%, 90%, 95%, 보다 특히 적어도 96%, 97%, 98%, 또는 99%의 서열 동일성에 대한 기준으로서 고려되면 절두의 수행을 고려한다. 특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 단백질은 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 서열을 갖는다.

폴리펩티드를 언급시 용어 "동일한" 및 이의 편차는 2개의 비교되는 폴리펩티드 서열 내 위치가 동일한 아미노산에 의해 점유되어 있을 때 (예를 들어, 2개 폴리펩티드 각각의 위치가 류신으로 점유되어 있으면), 그 폴리펩티드들은 그 위치가 동일하다는 것을 의미한다. 2개 폴리펩티드 간 동일성의 백분율은 2개 서열이 공유하는 일치된 위치의 수를 비교되는 위치의 수로 나누고 100을 곱한 함수이다. 예를 들어, 2개 폴리펩티드의 10개 위치 중 6개가 일치되면 그 2개 서열은 60%가 동일하다. 일반적으로, 2개의 서열이 최대 동일성을 제공하도록 정렬될 때 비교된다. 당업자에게 공지된 다양한 생물정보학 도구, 예컨대 BLAST 또는 FASTA가 핵산 서열을 정렬시키는데 사용될 수 있다.

용어 "핵산 서열" (또는 핵산 분자)은 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 특히 본 발명에 따른 GAA 단백질을 코딩하는 DNA를 의미한다.

본 발명은 또한 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드를 포함하는 키메라 기능성 GAA 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.

특히, 본 발명자는 신호 펩티드 교체가 인간 알파-1-항트립신 (hAAT, WO2004064750 및 문헌 [Sun et al. 2006]에 기재된 키메라 GAA 단백질)의 신호 펩티드에 융합된 GAA를 포함하는 이전에 보고된 다른 키메라 GAA 폴리펩티드와 비교하여 기능성 GAA 폴리펩티드를 더 높은 발현 수준 및 더 높은 분비성으로 생산하게 된다는 것을 놀랍게도 더욱 확인하였다. 본 발명의 핵산 분자에서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 아미노산 서열을 갖는 신호 펩티드를 코딩하는 서열에 상응한다 (달리 본 명세서에서 "대안적 신호 펩티드"라고 함). 본 발명의 핵산 분자는 또한 기능성 GAA 폴리펩티드에 작동적으로 연결된 대안적 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 코딩하는 최적화된 서열일 수 있다.

야생형 GAA 폴리펩티드와 비교하여, 야생형 GAA의 내생성 신호 펩티드는 외생성 신호 펩티드, 즉, GAA와 상이한 단백질로부터 유래된 신호 펩티드로 교체된다. GAA 단백질의 나머지에 융합된 외생성 신호 펩티드는 이의 천연 신호 펩티드를 포함하는 상응하는 GAA 폴리펩티드와 비교하여 최종 키메라 GAA 폴리펩티드의 분비성을 증가시킨다. 더 나아가서, 본 발명의 특정한 구체예에 따라서, 대안적 신호 펩티드에 상응하는 뉴클레오티드 서열은 상기 제공된 바와 같은 최적화된 서열일 수 있다.

본 발명에서 활용가능한 신호 펩티드는 이두로네이트-2-술파타제 유래의 아미노산 1-25 (SEQ ID NO: 3), 키모트립시노겐 B2 유래 아미노산 1-20 (SEQ ID NO: 2) 및 프로테아제 C1 억제제 유래 아미노산 1-23 (SEQ ID NO: 4)을 포함한다. SEQ ID NO: 2 내지 SEQ ID NO: 4의 신호 펩티드는 이의 천연 펩티드를 포함하는 GAA, 또는 hAAT의 신호 펩티드를 포함하는 키메라 GAA 단백질과 비교했을 때 시험관 내 및 생체 내 둘 모두에서 키메라 GAA 단백질의 더 높은 분비를 가능하게 한다.

세포로부터 분비되는 새롭게 합성된 GAA의 상대적인 비율은 당분야에 공지되고 실시예에 기술된 방법을 통해서 통상적으로 결정할 수 있다. 분비되는 단백질은 세포 배양 배지, 혈청, 유액 등에서 단백질 활성 어세이 (예를 들어, 효소 어세이)를 통해서 또는 단백질 자체를 직접 측정 (예를 들어, 웨스턴 블롯)하여 검출될 수 있다.

당업자는 키메라 GAA 폴리펩티드가 예를 들어 핵산 구성체의 조작 결과로서, 예컨대 제한효소 부위의 첨가로 인해, 추가적인 아미노산을, 이들 추가적인 아미노산이 신호 펩티드 또는 GAA 폴리펩티드를 비기능성으로 만들지 않는 한, 함유할 수 있다는 것을 더욱 이해하게 될 것이다. 추가적인 아미노산은 보유가 비기능성 폴리펩티드를 야기시키지 않는다면 성숙한 폴리펩티드에 의해 보유될 수 있거나 또는 절단될 수 있다.

더 나아가서, 본 명세서에 기술된 바와 같은 핵산 분자에 의해 코딩되는 키메라 GAA 폴리펩티드는 GAA의 기능성, 절두 형태인 GAA 모이어티를 포함할 수 있다. "절두 형태"란, 부모 GAA 폴리펩티드의 N-말단부로부터 결실된 하나 또는 몇개의 연속되는 아미노산을 포함하는 GAA 폴리펩티드를 의미한다. 그러므로, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 부모 GAA 폴리펩티드의 N-말단 절두 형태일 수 있다. 본 발명에 따라서, "부모 GAA 폴리펩티드"는 신호 펩티드가 없는 GAA 폴리펩티드, 예컨대 신호 펩티드가 없는 GAA의 전구체 형태, 특히 SEQ ID NO: 5, 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 hGAA 폴리펩티드이고, 상기 개시된 바와 같은 임의의 변이체일 수 있다. 예를 들어, 전형적인 야생형 인간 GAA 폴리펩티드를 참조하여, 완전한 야생형 GAA 폴리펩티드는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 대표되고, 신호 펩티드를 갖는 반면, 이러한 야생형 인간 GAA 폴리펩티드의 절두된 GAA 형태를 위한 기초로서 제공되는 부모 GAA 폴리펩티드는 각각 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 대표되고, 신호 펩티드를 갖지 않는다. 이러한 예에서, 후자를 부모 GAA 폴리펩티드라고 한다. 이러한 특정한 구체예의 변이체에서, 적어도 하나의 아미노산은 부모 GAA 단백질의 N-말단부로부터 결실된다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부로부터 적어도 1개, 특히 적어도 2개, 특히 적어도 3개, 특히 적어도 4개, 특히 적어도 5개, 특히 적어도 6개, 특히 적어도 7개, 특히 적어도 8개의 연속되는 아미노산이 결실될 수 있다. 예를 들어, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부로부터 1 내지 75개의 연속되는 아미노산 또는 75개를 초과하는 연속되는 아미노산이 결실될 수 있다. 다른 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 75개, 특히 최대로 70개, 특히 최대로 60개, 특히 최대로 55개, 특히 최대로 50개, 특히 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 추가의 특정 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 특히, 절두된 GAA 모이어티는 부모 GAA 단백질과 비교하여 이의 N-말단부로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 또는 75개의 연속되는 아미노산이 결실될 수 있다 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 폴리펩티드의 절두 형태). 다른 특정 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개, 특히 1 내지 47개, 특히 1 내지 46개, 특히 1 내지 45개, 특히 1 내지 44개, 특히 1 내지 43개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 2 내지 43개, 특히 3 내지 43개, 특히 4 내지 43개, 특히 5 내지 43개, 특히 6 내지 43개, 특히 7 내지 43개, 특히 8 내지 43개의 연속되는 아미노산이 결실된다 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 폴리펩티드의 절두 형태). 대안적인 명명법을 사용하여, 부모 GAA 폴리펩티드에서 1개 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ1 GAA 절두 형태라고 하고, N-말단부로부터 2개의 연속되는 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ2 GAA 절두 형태라고 하며, 부모 GAA 폴리펩티드에서 3개의 연속되는 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ3 GAA 절두 형태 등이라고 한다. 특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 또는 Δ46의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 또는 Δ44의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.

특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9 또는 Δ10 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8 또는 Δ9 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 절두 형태이다.

특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ27, Δ28, Δ29, Δ30 또는 Δ31 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ28, Δ29 또는 Δ30 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ29 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42 또는 Δ43 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42, Δ43, Δ44 또는 Δ45 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42, Δ43 또는 Δ44 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ43 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 또는 Δ42 절두 형태이다.

본 발명의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 기능성 부모 인간 GAA 폴리펩티드로부터 유래된 절두형 GAA 모이어티를 포함한다. 추가의 특정 구체예에서, 부모 hGAA 폴리펩티드는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드이다. 이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75 GAA 절두 형태이다. 추가의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성 (예를 들어 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성)을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47, 특히 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43, 특히 Δ8 또는 Δ42 절두 형태이다.

이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 또는 Δ46 GAA 절두 형태이다.

이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 또는 Δ44 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 서열을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9 또는 Δ10, 특히 Δ7, Δ8 또는 Δ9, 보다 특히 Δ8 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ27, Δ28, Δ29, Δ30 또는 Δ31, 특히 Δ28, Δ29 또는 Δ30, 보다 특히 Δ29 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ41, Δ42 또는 Δ43, 보다 특히 Δ42 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ42, Δ43 또는 Δ44, 보다 특히 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8 또는 Δ42 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8 또는 Δ42 절두 형태이다.

특별한 구체예에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43으로 표시되는 서열로 이루어진 아미노산 서열, 특히 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열로 이루어진 아미노산 서열, 특히 SEQ ID NO: 29 또는 SEQ ID NO: 30으로 표시되는 서열로 이루어진 아미노산 서열을 갖는다.

본 발명은 또한 본 발명의 핵산 분자를 포함하는 핵산 구성체에 관한 것이다. 핵산 구성체는 하나 이상의 발현 제어 서열 및/또는 이식유전자의 발현을 개선시키는 다른 서열 및/또는 코딩된 단백질의 분비를 증강시키는 서열 및/또는 코딩된 단백질의 흡수를 증강시키는 서열에 작동적으로 연결된 본 발명의 핵산 서열을 포함하는 발현 카세트에 해당될 수 있다. 본 명세서에서 사용되는 용어 "작동적으로 연결된"은 기능적 관련성의 폴리뉴클레오티드 엘리먼트의 연결을 의미한다. 핵산은 다른 핵산 서열과 기능적 관련성으로 위치될 때 "작동적으로 연결된"다. 예를 들어, 프로모터, 또는 다른 전사 조절성 서열은 코딩 서열의 전사에 영향을 미치면 코딩 서열에 작동적으로 연결되는 것이다. 이러한 발현 제어 서열, 예컨대 프로모터, 인핸서 (예컨대 시스-조절성 모듈 (CRM)), 인트론, 폴리A 신호 등이 당분야에 공지되어 있다.

특히, 발현 카세트는 프로모터를 포함할 수 있다. 프로모터는 편재성 또는 조직-특이적 프로모터, 특히 GAA의 발현이 바람직한 세포 또는 조직 예컨대 GAA 발현이 GAA-결핍 환자에서 바람직한 세포 또는 조직에서 발현을 촉진할 수 있는 프로모터일 수 있다. 특정 구체예에서, 프로모터는 간-특이적 프로모터 예컨대 알파-1 항트립신 프로모터 (hAAT) (SEQ ID NO: 15), 트랜스타이레틴 프로모터, 알부민 프로모터, 타이록신-결합 글로불린 (TBG) 프로모터, LSP 프로모터 (갑상선 호르몬-결합 글로불린 프로모터 서열, 2개 카피의 알파1-마이크로글로불린/비쿠닌 인핸서 서열, 및 리더 서열을 포함함 - 34.Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) 등이다. 다른 유용한 간-특이적 프로모터, 예를 들어 Cold Spring Harbor Laboratory 에서 편집한 간 특이적 유전자 프로모터 데이타베이스 (http://rulai.cshl.edu/LSPD/)에 열거된 것들이 당분야에 공지되어 있다. 본 발명의 상황에서 바람직한 프로모터는 hAAT 프로모터이다. 다른 구체예에서, 프로모터는 하나의 관심 조직 또는 세포 (예컨대 근육 세포), 및 간 세포에서 발현을 유도하는 프로모터이다. 예를 들어, 어느 정도로, 근육 세포에 특이적인 프로모터 예컨대 데스민, Spc5-12 및 MCK 프로모터는 간 세포로 약간의 발현 누수가 존재할 수 있는데, 이것은 본 발명의 핵산으로부터 발현되는 GAA 단백질에 대해 대상체의 면역 관용을 유도시키기 위해 유리할 수 있다.

다른 조직-특이적 또는 조직-비특이적 프로모터가 본 발명의 실시에서 유용할 수 있다. 예를 들어, 발현 카세트는 간 특이적 프로모터와 상이한 프로모터인 조직-특이적 프로모터를 포함할 수 있다. 예를 들어 프로모터는 근육-특이적일 수 있고, 예컨대 데스민 프로모터 (및 데스민 프로모터 변이체 예컨대 천연 또는 인공 인핸서를 포함하는 데스민 프로모터), SPc5-12 프로모터 또는 MCK 프로모터일 수 있다. 다른 구체예에서, 프로모터는 다른 세포 계통에 특이적인 프로모터, 예컨대 적혈구 계통의 세포로부터 GAA 폴리펩티드의 발현을 위한, 에리쓰로포이어틴 프로모터이다.

다른 구체예에서, 프로모터는 편재성 프로모터이다. 대표적인 편재성 프로모터는 사이토메갈로바이러스 인핸서/닭 베타 액틴 (CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV), PGK 프로모터, SV40 초기 프로모터 등을 포함한다.

또한, 프로모터는 또한 내생성 프로모터 예컨대 알부민 프로모터 또는 GAA 프로모터일 수 있다.

특정 구체예에서, 프로모터는 인핸서 서열, 예컨대 시스-조절성 모듈 (CRM) 또는 인공 인핸서 서열과 연관된다. 예를 들어, 프로모터는 인핸서 서열 예컨대 인간 ApoE 제어 영역 (또는 인간 아포리포단백질 E/C-I 유전자의 유전자좌, 간 제어 영역 HCR-1 - GenBank 수탁 번호 U32510, SEQ ID NO: 16으로 표시됨)과 연관될 수 있다. 특정 구체예에서, 인핸서 서열 예컨대 ApoE 서열은 간-특이적 프로모터 예컨대 상기 열거된 것들, 및 특히 예컨대 hAAT 프로모터와 연관된다. 본 발명의 실시에서 유용한 다른 CRM은 문헌 [Rincon et al., Mol Ther. 2015 Jan;23(1):43-52], [Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13] 또는 [Nair et al., Blood. 2014 May 15;123(20):3195-9]에 기술된 것들을 포함한다.

다른 특정 구체예에서, 핵산 구성체는 인트론, 특히 프로모터 및 GAA 코딩 서열 사이에 위치된 인트론을 포함한다. 인트론은 mRNA 안정성 및 단백질 생산을 증가시키기 위해 도입될 수 있다. 추가 구체예에서, 핵산 구성체는 인간 베타 글로빈 b2 (또는 HBB2) 인트론, 응고 인자 IX (FIX) 인트론, SV40 인트론 또는 닭 베타-글로빈 인트론을 포함한다. 다른 추가의 구체예에서, 본 발명의 핵산 구성체는 상기 인트론에 존재하는 선택적 오픈 리딩 프레임 (ARF)의 수를 감소시키거나, 또는 심지어 완전히 제거시키도록 디자인된 변형된 인트론 (특히 변형된 HBB2 또는 FIX 인트론)을 함유한다. 바람직하게, ARF는 50 bp에 걸쳐 포괄된 그 길이가 제거되고 출발 코돈과 인 프레임으로 중지 코돈을 갖는다. ARF는 인트론의 서열을 변형시켜 제거될 수 있다. 예를 들어, 변형은 뉴클레오티드 치환, 삽입 또는 결실에 의해서, 바람직하게 뉴클레오티드 치환에 의해서 수행될 수 있다. 예시로서, 관심 인트론의 서열에 존재하는 ATG 또는 GTG 출발 코돈에서 하나 이상의 뉴클레오티드, 특히 하나의 뉴클레오티드는 비출발 코돈이 생성되도록 교체될 수 있다. 예를 들어, ATG 또는 GTG는 관심 인트론의 서열 내에서, 출발 코돈이 아닌 CTG에 의해 교체될 수 있다.

핵산 구성체에서 사용되는 고전적인 HBB2 인트론은 SEQ ID NO: 6으로 표시된다. 예를 들어, 이러한 HBB2 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 구성체에 포함된 변형된 HBB2 인트론은 SEQ ID NO: 7로 표시된 서열을 갖는다. 핵산 구성체에서 사용되는 고전적인 FIX 인트론은 인간 FIX의 제1 인트론으로부터 유래되고 SEQ ID NO: 8로 표시된다. FIX 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 본 발명의 구성체에 포함된 변형된 FIX 인트론은 SEQ ID NO: 9로 표시된 서열을 갖는다. 핵산 구성체에서 사용되는 고전적인 닭-베타 글로빈 인트론은 SEQ ID NO: 10으로 표시된다. 닭-베타 글로빈 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 본 발명의 구성체에 포함된 변형된 닭-베타 글로빈 인트론은 SEQ ID NO: 11로 표시된 서열을 갖는다.

본 발명자는 이러한 변형된 인트론, 특히 변형된 HBB2 또는 FIX 인트론이 유리한 특성을 가지며 이식유전자의 발현을 상당히 개선시킬 수 있다는 것을 이전에 WO2015/162302에서 확인하였다.

특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 임의로 인핸서가 선행되는 프로모터, 본 발명의 코딩 서열 (즉, 본 발명의 최적화된 GAA 코딩 서열, 본 발명의 키메라 GAA 코딩 서열, 또는 본 발명의 키메라 및 최적화된 GAA 코딩 서열), 및 폴리아데닐화 신호 (예컨대 소 성장 호르몬 폴리아데닐화 신호, SV40 폴리아데닐화 신호, 또는 다른 천연 발생 또는 인공 폴리아데닐화 신호)를 포함하는 발현 카세트이다. 특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 임의로 인핸서가 선행된 프로모터, (예컨대 ApoE 제어 영역), 인트론 (특히 상기에 정의된 바와 같은 인트론), 본 발명의 코딩 서열, 및 폴리아데닐화 신호를 포함하는 발현 카세트이다. 추가의 특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 인핸서 예컨대 ApoE 제어 영역, 프로모터, 인트론 (특히 상기에 정의된 바와 같은 인트론), 본 발명의 코딩 서열, 및 폴리아데닐화 신호를 포함하는 발현 카세트이다. 본 발명의 추가의 특정한 구체예에서, 발현 카세트는 5'에서 3'의 배향으로, ApoE 제어 영역, hAAT-간 특이적 프로모터, HBB2 인트론 (특히 상기에 정의된 바와 같은 변형된 HBB2 인트론), 본 발명의 코딩 서열, 및 소 성장 호르몬 폴리아데닐화 신호를 포함하는 발현 카세트, 예컨대 SEQ ID NO: 2 내지 4로 표시된 신호 펩티드-코딩 서열 각각과 조합된 SEQ ID NO: 13의 서열-최적화된 GAA 핵산 분자를 포함하는, SEQ ID NO: 20 내지 SEQ ID NO: 22 중 어느 하나로 표시된 핵산 구성체를 포함한다. 다른 구체예에서, 발현 카세트는 상기 표 2, 표 2" 또는 표 2", 특히 표 2' 또는 표 2"에 표시된 서열의 조합 중 어느 하나로부터 생성된 코딩 서열을 함유한다.

특정 구체예에서, 발현 카세트는 ApoE 제어 영역, hAAT-간 특이적 프로모터, 코돈-최적화된 HBB2 인트론, 본 발명의 코딩 서열 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다.

본 발명의 핵산 구성체를 디자인하는 경우에, 당업자는 세포 또는 장기로 상기 구성체를 전달하기 위해 사용되는 벡터의 크기 제약에 대해 주의하게 될 것이다. 특히, 당업자는 AAV 벡터의 주요한 한계가 AAV 혈청형마다 다양할 수 있지만 대략 부모 바이러스 게놈의 크기로 제한된다고 여겨지는 이의 카고 수용능이라는 것을 알고 있다. 예를 들어, 5 kb가 일반적으로 AAV8 캡시드에 패키징되는 것으로 여겨지는 최대 크기이다 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). 따라서, 당업자는 AAV 5'-ITR 및 3'-ITR을 코딩하는 서열을 포함하는 최종 핵산 서열이, 바람직하게 시행되는 AAV 벡터의 카고 수용능의 110%를 넘지않도록, 특히 바람직하게 5.5 kb를 넘지 않도록 본 발명의 핵산 구성체의 성분을 선택하도록 본 발명을 실시하는데 주의하게 될 것이다.

본 발명은 또한 본 명세서에 개시된 바와 같은 핵산 분자 또는 구성체를 포함하는 벡터에 관한 것이다. 특히, 본 발명의 벡터는 단백질 발현, 바람직하게 유전자 요법에서 사용에 적합한 벡터이다. 일 구체예에서, 벡터는 플라스미드 벡터이다. 다른 구체예에서, 벡터는 본 발명의 핵산 분자, 특히 본 발명의 GAA 폴리펩티드를 코딩하는 메신저 RNA를 함유하는 나노입자이다. 다른 구체예에서, 벡터는 표적 세포의 게놈으로 본 발명의 핵산 분자 또는 구성체의 통합을 가능하게 하는, 트랜스포존을 기반으로 하는 시스템, 예컨대 초활성 슬리핑 뷰티 (SB100X) 트랜스포존 시스템이다 (Mates et al. 2009). 다른 구체예에서, 벡터는 임의의 관심 세포, 예컨대 간 조직 또는 세포, 근육 세포, CNS 세포 (예컨대 뇌 세포), 또는 조혈 줄기 세포 예컨대 적혈구 계통의 세포 (예컨대 적혈구)를 표적으로 하는 유전자 요법에 적합한 바이러스 벡터이다. 이 경우에서, 본 발명의 핵산 구성체는 당분야에서 충분히 공지된 바와 같이, 효율적인 바이러스 벡터를 생산하는데 적합한 서열을 함유한다. 특정 구체예에서, 바이러스 벡터는 통합된 바이러스로부터 유래된다. 특히, 바이러스 벡터는 레트로바이러스 또는 렌티바이러스로부터 유래될 수 있다. 추가의 특정 구체예에서, 바이러스 벡터는 AAV 벡터, 예컨대 간 조직 또는 세포를 형질도입시키는데 적합한 AAV 벡터, 보다 특히 AAV-1, AAV-2 및 AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 AAV-cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6 등의 벡터 또는 레트로바이러스 벡터 예컨대 렌티바이러스 벡터 및 알파-레트로바이러스이다. 당분야에 공지된 바와 같이, 사용에 고려되는 특이적 바이러스 벡터에 따라서, 추가적인 적합한 서열이 기능성 바이러스 벡터를 수득하기 위해 본 발명의 핵산 구성체에 도입될 것이다. 적합한 서열은 AAV 벡터의 경우 AAV ITR, 또는 렌티바이러스 벡터의 경우 LTR을 포함한다. 이와 같이, 본 발명은 또한 각 측면 상에 ITR 또는 LTR이 측접된 상기에 정의된 바와 같은 발현 카세트에 관한 것이다.

바이러스 벡터의 장점은 하기 본 개시 내용의 일부에서 기술한다. 바이러스 벡터, 예컨대 레트로바이러스 벡터, 예를 들어 렌티바이러스 벡터, 또는 비병원성 파보바이러스, 더 바람직하게 AAV 벡터는 본 발명의 핵산 분자 또는 구성체를 전달하는데 바람직하다. 인간 파보바이러스 아데노-연합 바이러스 (AAV)는 잠복 감염을 확고히 하기 위해서 감염된 세포의 게놈으로 통합될 수 있는 천연적으로 복제가 결핍된 디펜도바이러스이다. 마지막 특성은 통합이 염색체 19 (19q13.3-qter) 상에 위치된 AAVS1이라고 불리는 인간 게놈 내 특별한 위치에서 발생되기 때문에 포유동물 바이러스 사이에서 고유한 것으로 보인다.

그러므로, AAV 벡터는 인간 유전자 요법을 위한 잠재적인 벡터로서 상당한 관심이 유발되었다. 바이러스의 바람직한 특성 중에는 임의의 인간 질환과 이의 연관성의 결여, 분열 및 비분열 세포 둘 모두를 감염시키는 이의 능력, 및 감염시킬 수 있는 상이한 조직으로부터 유래된 광범위 세포주가 있다.

충분히 특징규명되고 인간 또는 인간이외의 영장류 (NHP)로부터 단리된 AAV의 혈청형 중에서, 인간 혈청형 2는 유전자 전달 벡터로서 개발된 최초의 AAV이다. 다른 현재 사용되는 AAV 혈청형은 AAV-1, AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된, 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 리신 및 세린 캡시드 돌연변이체 등을 포함한다. 또한, 다른 비천연의 조작된 변이체 및 키메라 AAV가 또한 유용할 수 있다.

AAV 바이러스는 핵산 서열의 세포 특이적 전달, 면역원성의 최소화, 안정성 및 입자 수명의 조율, 효율적인 분해, 핵으로 정확한 전달을 위해 이들 입자들을 최적화하는 것을 가능하게 만드는 통상의 분자 생물학 기술을 사용해 조작될 수 있다.

벡터로 조립을 위한 바람직한 AAV 단편은 vp1, vp2, vp3 및 초가변 영역을 포함하는 cap 단백질, rep 78, rep 68, rep 52 및 rep 40을 포함하는 rep 단백질, 및 이들 단백질을 코딩하는 서열을 포함한다. 이들 단편은 다양한 벡터 시스템 및 숙주 세포에서 쉽게 이용될 수 있다.

Rep 단백질이 결여된 AAV-기반 재조합 벡터는 낮은 효율성으로 숙주의 게놈으로 통합되고 표적 세포에서 수년 동안 지속될 수 있는 안정한 원형 에피솜으로서 주로 존재한다.

AAV 천연 혈청형을 사용하는 대안으로서, 제한없이, 비천연 발생 캡시드 단백질을 갖는 AAV를 포함하여, 인공 AAV 혈청형이 본 발명의 상황에서 사용될 수 있다. 이러한 인공 캡시드는 상이한 선택된 AAV 혈청형, 동일한 AAV 혈청형의 비인접 부분, 비-AAV 바이러스 공급원, 또는 비바이러스 공급원으로부터 수득될 수 있는 이종성 서열과 조합된 선택된 AAV 서열 (예를 들어, vp1 캡시드 단백질의 단편)을 사용하여, 임의의 적합한 기술을 통해 생성될 수 있다. 인공 AAV 혈청형은 제한없이, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화" AAV 캡시드일 수 있다.

따라서, 본 발명은 본 발명의 핵산 분자 또는 구성체를 포함하는 AAV 벡터에 관한 것이다. 본 발명의 상황에서, AAV 벡터는 관심 표적 세포, 특히 간세포를 형질도입시킬 수 있는 AAV 캡시드를 포함한다. 특정한 구체예에 따라서, AAV 벡터는 AAV-1, AAV-2, AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 AAV-cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 리신 및 세린 캡시드 돌연변이체 등의 혈청형의 것이다. 특정 구체예에서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형의 것이다 (즉, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형의 캡시드를 가짐). 추가의 특정 구체예에서, AAV 벡터는 위형화된 벡터로서, 다시 말해서 이의 게놈 및 캡시드는 상이한 혈청형의 AAV로부터 유래된다. 예를 들어, 위형화된 AAV 벡터는 그 게놈이 상기에 언급된 AAV 혈청형 중 하나로부터 유래되고, 그의 캡시드가 다른 혈청형으로부터 유래된 벡터일 수 있다. 예를 들어, 위형화된 벡터의 게놈은 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형으로부터 유래된 캡시드를 가질 수 있고, 이의 게놈은 상이한 혈청형으로부터 유래될 수 있다. 특정 구체예에서, AAV 벡터는 AAV8, AAV9 또는 AAVrh74 혈청형의 캡시드, 특히 AAV8 또는 AAV9 혈청형의 캡시드, 보다 특히 AAV8 혈청형의 캡시드를 갖는다.

특별한 구체예에서, 벡터가 근육 세포로 이식유전자를 전달하는데 사용을 위한 경우에, AAV 벡터는 특히 AAV8, AAV9 및 AAVrh74로 이루어진 군에서 선택될 수 있다.

다른 특별한 구체예에서, 벡터가 간 세포로 이식유전자를 전달하는데 사용을 위한 경우에, AAV 벡터는 다른 것들 중에서, AAV5, AAV8, AAV9, AAV-LK03, AAV-Anc80 및 AAV3B로 이루어진 군에서 선택될 수 있다.

다른 구체예에서, 캡시드는 변형된 캡시드이다. 본 발명의 상황에서, "변형된 캡시드"는 하나 이상의 야생형 AAV VP 캡시드 단백질로부터 유래된 하나 이상의 변이체 VP 캡시드 단백질을 포함하는 캡시드 또는 키메라 캡시드일 수 있다.

특정 구체예에서, AAV 벡터는 키메라 벡터이고, 다시 말해서, 이의 캡시드는 적어도 2종의 상이한 AAV 혈청형으로부터 유래된 VP 캡시드 단백질을 포함하거나, 또는 적어도 2종의 AAV 혈청형으로부터 유래된 VP 단백질 영역 또는 도메인이 조합된 적어도 하나의 키메라 VP 단백질을 포함한다. 간 세포를 형질도입시키는데 유용한 이러한 키메라 AAV 벡터의 예는 문헌 [Shen et al., Molecular Therapy, 2007] 및 [Tenney et al., Virology, 2014]에 기술되어 있다. 예를 들어 키메라 AAV 벡터는 상기에 특별히 언급된 임의의 것들과 같은, AAV8 혈청형과 상이한 AAV 혈청형의 서열과 AAV8 캡시드 서열의 조합으로부터 유래될 수 있다. 다른 구체예에서, AAV 벡터의 캡시드는 하나 이상의 변이체 VP 캡시드 단백질 예컨대 WO2015013313에 기술된 것들, 특히 높은 간 향성이 존재하는 RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 및 RHM15-6 캡시드 변이체를 포함한다.

다른 구체예에서, 변형된 캡시드는 에러 프론 PCR 및/또는 펩티드 삽입으로 삽입된 캡시드 변형으로부터 또한 유래될 수 있다 (예를 들어, 문헌 [Bartel et al., 2011]에 기술된 바와 같음). 또한, 캡시드 변이체는 단일 아미노산 변화 예컨대 티로신 돌연변이체를 포함할 수 있다 (예를 들어, 문헌 [Zhong et al., 2008]에 기술된 바와 같음).

또한, AAV 벡터의 게놈은 단일 가닥 또는 자기-상보성 이중-가닥 게놈일 수 있다 (McCarty et al., Gene Therapy, 2003). 자기-상보성 이중-가닥 AAV 벡터는 AAV 말단 반복부 중 하나로부터 말단 분해 부위 (trs)를 결실시켜 생성될 수 있다. 그 복제 게놈이 야생형 AAV 게놈의 절반 길이인 이들 변형된 벡터는 DNA 이량체를 패키징시키는 경향을 갖는다. 바람직한 구체예에서, 본 발명의 실시에서 실행되는 AAV 벡터는 단일 가닥 게놈을 가지며, 더욱 바람직하게는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함한다.

특히 바람직한 구체예에서, 본 발명은 단일-가닥 또는 이중-가닥, 자기-상보성 게놈 (예를 들어, 단일-가닥 게놈)에, 본 발명의 핵산 구성체를 포함하는 AAV 벡터에 관한 것이다. 일 구체예에서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함한다. 추가의 특정 구체예에서, 상기 핵산은 프로모터, 특히 편재성 또는 간-특이적 프로모터에 작동적으로 연결된다. 특별한 변이체 구체예에 따라서, 프로모터는 편재성 프로모터 예컨대 사이토메갈로바이러스 인핸서/닭 베타 액틴(CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV), PGK 프로모터 및 SV40 초기 프로모터이다. 특별한 변이체에서, 편재성 프로모터는 CAG 프로모터이다. 다른 변이체에 따라서, 프로모터는 간-특이적 프로모터 예컨대 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터이다. 특별한 변이체에서, 간-특이적 프로모터는 SEQ ID NO: 15의 hAAT 간-특이적 프로모터이다. 추가의 특정 구체예에서, 본 발명의 AAV 벡터의 게놈에 포함된 핵산 구성체는 프로모터 및 GAA 코딩 서열을 코딩하는 핵산 서열 (즉, 본 발명의 최적화된 GAA 코딩 서열, 본 발명의 키메라 GAA 코딩 서열, 또는 본 발명의 키메라 및 최적화된 GAA 코딩 서열) 사이에 위치하는 인트론을 더 포함한다. AAV 벡터 게놈 내에 도입된 핵산 구성체 내에 포함될 수 있는 대표적인 인트론은 제한없이, 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론 및 닭 베타-글로빈 인트론을 포함한다. AAV 벡터의 게놈 내 상기 인트론은 상기 인트론 내 선택적인 오픈 리딩 프레임 (ARF)의 수를 감소시키거나, 또는 심지어 전체로 제거되도록 디자인된 변형된 인트론일 수 있거나 또는 고전적인 (또는 비변형된) 인트론일 수 있다. 본 발명의 핵산이 AAV 벡터 내에 도입되는 이러한 구체예의 실시에서 사용될 수 있는 변형 및 미변형 인트론은 완전히 상기에 기술되어 있다. 특정 구체예에서, 본 발명의 AAV 벡터, 특히 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함하는 AAV 벡터는 이의 게놈 내에 변형된 (또는 최적화된) 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론 및 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론을 포함한다. 추가의 특정 구체예에서, 본 발명의 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함하고, 5'에서 3'의 배향으로: AAV 5'-ITR (예컨대 AAV2 5'-ITR); ApoE 제어 영역; hAAT-간 특이적 프로모터; HBB2 인트론 (특히 상기 정의된 바와 같은 변형된 HBB2 인트론); 본 발명의 GAA 코딩 서열; 소 성장 호르몬 폴리아데닐화 신호; 및 AAV 3'-ITR (예컨대 AAV2 3'-ITR)을 함유하는 게놈, 예컨대 AAV 5'-ITR (예컨대 AAV2 5'-ITR) 및 AAV 3'-ITR (예컨대 AAV2 3'-ITR)이 측접된 SEQ ID NO: 20, 21 또는 22 (각각이 SEQ ID NO: 5의 부모 hGAA로부터 유래된 GAA의 Δ8 절두 형태를 코딩하는 최적화된 서열에 상응하는 SEQ ID NO: 17, 18 및 19로 표시되는 핵산 서열을 포함함)로 표시되는 핵산을 포함하는 게놈을 포함하는 AAV 벡터이다. 본 발명의 실시에서 유용한 다른 발현 카세트는 상기 표 2, 표 2' 또는 표 2", 특히 표 2' 또는 표 2"에 표시된 서열 조합 중 어느 하나의 신호 펩티드 모이어티 및 GAA 모이어티를 포함한다.

본 발명의 특정 구체예에서, 본 발명의 핵산 구성체는 상기에 기술된 바와 같은 간-특이적 프로모터를 포함하고, 벡터는 상기 기술된 바와 같이 간 조직 또는 세포를 형질도입시킬 수 있는 바이러스 벡터이다. 본 발명자들은 간의 프로관용원성 및 물질대사 특성이 간세포에서 GAA의 분비가능한 형태를 발현시키고 그 단백질에 대한 면역 관용을 유도시키도록 고도로 효율적이고 최적화된 벡터를 개발하기 위한 이러한 구체예 덕분에 유리하게 실행된다는 것을 확인한 데이타를 하기에 제시한다.

또한, 추가의 특정 구체예에서, 본 발명은 관심 세포에서 유전자 전달 및 치료 효능을 개선시키기 위해 2종의 벡터, 예컨대 2종의 바이러스 벡터, 특히 2종의 AAV 벡터의 조합을 제공한다. 예를 들어, 2종의 벡터는 이들 2종 벡터 각각에서 하나의 상이한 프로모터의 제어 하에, 본 발명의 GAA 단백질을 코딩하는 본 발명의 핵산 분자를 운반할 수 있다. 특정 구체예에서, 하나의 벡터는 간-특이적 프로모터 (상기 기술된 것 중 하나)인 프로모터를 포함하고, 나머지 벡터는 당원 축적 질병의 치료를 위해 다른 관심 조직에 특이적인 프로모터, 예컨대 근육-특이적 프로모터, 예를 들어 데스민 프로모터를 포함한다. 이러한 구체예의 특정 변이체에서, 벡터의 이러한 조합은 WO2015196179에 기술된 바와 같이 생산된 다수의 공동-패키징된 AAV 벡터에 상응한다.

다른 양상에서, 본 발명은 신호 펩티드 모이어티 및 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드를 제공하고, 여기서 천연 발생 GAA 신호 펩티드는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드로 교체된다. 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 상기 기술된 바와 같이, GAA의 절두 형태로부터 유래된 폴리펩티드일 수 있다. 예를 들어, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)일 수 있다.

특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9 또는 Δ10 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8 또는 Δ9 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 절두 형태이다.

다른 특정 구체예에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ27, Δ28, Δ29, Δ30 또는 Δ31, 특히 Δ28, Δ29 또는 Δ30, 보다 특히 Δ29 절두 형태이다.

다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42 또는 Δ43 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ42, Δ43 또는 Δ44, 보다 특히 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8 또는 Δ42 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.

이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8 또는 Δ42 절두 형태이다.

특별한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43로 표시되는 서열, 또는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43으로 표시된 서열과 비교하여 1 내지 5개 아미노, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다. 다른 특정한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열, 또는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열과 비교하여 1 내지 5개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다. 특별한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29 또는 SEQ ID NO: 30로 표시된 서열, 또는 SEQ ID NO: 29 또는 SEQ ID NO: 30으로 표시된 서열과 비교하여 1 내지 5개 아미노, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다 .

특정 구체예에서, 키메라 GAA 폴리펩티드는 상기 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 조합 중 하나에 의해 생성된 서열을 갖거나, 또는 생성된 서열 조합과 적어도 90% 동일성, 특히 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 이의 기능성 변이체이다.

본 발명은 또한 생체외 유전자 요법의 경우에서 처럼 본 발명의 핵산 분자 또는 구성체로 형질전환되는 세포, 예를 들어 간 세포에 관한 것이다. 본 발명의 세포는 이를 필요로 하는 대상체, 예컨대 GAA-결핍 환자에게, 임의의 적절한 투여 경로 예컨대 상기 대상체의 혈류 또는 간으로의 주사를 통해서 전달될 수 있다. 특정 구체예에서, 본 발명은 본 발명의 핵산을 간 세포, 특히 치료하려는 대상체의 간 세포에 도입시키는 단계, 및 상기 핵산이 도입된 형질전환된 간 세포를 대상체에게 투여하는 단계를 포함한다. 유리하게, 이러한 구체예는 상기 세포로부터 GAA를 분비시키는데 유용하다. 특정 구체예에서, 간 세포는 치료하려는 환자 유래의 간 세포이거나, 또는 환자에게 후속 투여를 위해서 더욱 형질전환시켜, 시험관 내에서 간 세포로 분화시킨 간 줄기 세포이다.

본 발명은 또한 그 게놈에 본 발명에 따른 GAA 단백질을 코딩하는 핵산 분자 또는 구성체를 포함하는 유전자이식된, 인간이외의 동물에 관한 것이다. 특정 구체예에서, 동물은 마우스이다.

하기 실시예에서 구체화되는 특별한 전달 시스템 이외에도, 다양한 전달 시스템이 공지되어 있으며, 예를 들어, 리포솜 내 캡슐화, 미세입자, 미세캡슐, 본 발명의 코딩 서열을 발현할 수 있는 재조합 세포, 수용체-매개 세포내이입, 레트로바이러스 또는 다른 벡터의 일부로서 치료적 핵산의 구축 등이 본 발명의 핵산 분자 또는 구성체를 투여하는데 사용될 수 있다.

구체예에 따라서, 임의의 적합한 경로를 통해서 대상체의 간으로 본 발명의키메라 GAA 폴리펩티드, 핵산 분자, 핵산 구성체 또는 세포를 도입시키는 것이 바람직할 수 있다. 또한 나형 DNA 예컨대 미니서클 및 트랜스포존이 전달 또는 렌티바이러스 벡터로 사용될 수 있다. 추가적으로, 유전자 편집 기술 예컨대 징크 핑거 뉴클레아제, 메가뉴클레아제, TALEN 및 CRISPR가 또한 본 발명의 코딩 서열을 전달하는데 사용될 수 있다.

본 발명은 또한 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드, 또는 세포를 포함하는 약학 조성물을 제공한다. 이러한 조성물은 치료제 (본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포)의 치료적 유효량, 및 약학적으로 허용가능한 담체를 포함한다. 특별한 구체예에서, 용어 "약학적으로 허용가능한"은 U.S. 또는 유럽 약전 또는 다른 일반적으로 동물 및 인간에서 사용에 대해 인정되는 약전에 열거되거나 또는 연방 정부 또는 주정부의 규제 기관이 승인한 것을 의미한다. 용어 "담체"는 치료제와 투여되는 희석제, 보강제, 부형제 또는 비히클을 의미한다. 이러한 약학 담체는 멸균된 액체, 예컨대 물 및 석유, 동물, 식물 또는 합성 기원의 것을 포함하는 오일, 예컨대 땅콩유, 대두유, 미네랄유, 참깨유 등일 수 있다. 물은 약학 조성물이 정맥내로 투여될 때 바람직한 담체이다. 또한 염수 용액 및 수성 덱스트로스 및 글리세롤 용액은 특히 주사용 용액을 위한 액상 담체로서 적용될 수 있다. 적합한 약학 부형제는 전분, 포도당, 락토스, 수크로스, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 탈크, 소듐 클로라이드, 탈지유, 글리세롤, 프로필렌 글리콜, 물, 에탄올 등을 포함한다.

바람직하다면, 조성물은 또한 소량의 습윤제 또는 유화제, 또는 pH 완충제를 함유할 수도 있다. 이들 조성물은 용액제, 현탁제, 에멀션, 정제, 알약, 캡슐, 분말, 지속-방출형 제제 등의 형태를 취할 수 있다. 경구 제제는 표준 담체 예컨대 약학 등급의 만니톨, 락토스, 전분, 마그네슘 스테아레이트, 소듐 사카린, 셀룰로스, 마그네슘 카보네이트 등을 포함할 수 있다. 적합한 약학 담체의 예는 문헌 ["Remington's Pharmaceutical Sciences" by E. W. Martin]에 기술되어 있다. 이러한 조성물은 대상체에게 적절한 투여를 위한 형태를 제공하도록 적합한 양의 담체와 함께, 바람직하게 정제된 형태의 치료제의 치료적 유효량을 함유하게 될 것이다. 특정 구체예에서, 본 발명의 핵산, 벡터 또는 세포는 포스페이트-완충 염수를 포함하고 0.25% 인간 혈청 알부민이 보충된 조성물로 제제화된다. 다른 특정 구체예에서, 본 발명의 핵산, 벡터 또는 세포는 링거 락테이트 및 비이온성 계면활성제, 예컨대 총 조성물의 중량 기준으로 0.01 내지 0.0001%의 최종 농도, 예컨대 0.001%의 농도로 pluronic F68을 포함하는 조성물로 제제화된다. 제제는 혈청 알부민, 특히 인간 혈청 알부민, 예컨대 인간 혈청 알부민을 0.25%로 더 포함할 수 있다. 저장 또는 투여를 위해 적절한 다른 제제는 당분야, 특히 WO 2005/118792 또는 문헌 [Allay et al., 2011]에 공지되어 있다.

바람직한 구체예에서, 조성물은 인간에게 정맥내 투여를 위해 적합화된 약학 조성물로서 통상의 절차에 따라 제제화된다. 전형적으로, 정맥내 투여용 조성물은 멸균된 등장성 수성 완충액의 용액이다. 필요한 경우에, 조성물은 또한 주사 부위의 통능을 완화시키기 위해서 가용화제 및 국소 마취제 예컨대 리그노카인을 포함할 수 있다.

일 구체예에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 소포체 특히 리포솜으로 전달될 수 있다. 또 다른 구체예에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 제어 방출 시스템으로 전달될 수 있다

본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 투여 방법은 제한없이 피부내, 근육내, 복강내, 정맥내, 피하, 비내, 경막외 및 경구 경로를 포함한다. 특정 구체예에서, 투여는 정맥내 또는 근육내 경로를 통한다. 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 벡터화되거나 또는 그렇지 않건 무관하게, 임의의 편리한 경로를 통해서, 예를 들어 주입 또는 볼러스 주사를 통해서, 상피 또는 점막피부 내층 (예를 들어, 경구 점막, 직장 및 장 점막 등)을 통한 흡수에 의해 투여될 수 있고 다른 생물학적 활성제와 함께 투여될 수 있다. 투여는 전신이거나 또는 국소일 수 있다.

특별한 구체예에서, 치료를 필요로 하는 영역, 예를 들어 간에 국소적으로 본 발명의 약학 조성물을 투여하는 것이 바람직할 수 있다. 이것은 예를 들어, 임플란트를 통해 수행될 수 있고, 상기 임플란트는 막, 예컨대 시알라스틱 막, 또는 섬유를 포함하는, 다공성, 비다공성 또는 젤라틴성 재료이다.

당원 축적병의 치료에 효율적이게 되는 본 발명의 치료제 (즉, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포)의 양은 표준 임상 기술을 통해 결정할 수 있다. 또한, 생체 내 및/또는 시험관 내 어세이는 임의로 최적 용량 범위를 예측하는데 도움이 되도록 적용될 수 있다. 제제에 적용되는 정확한 용량은 또한 투여 경로, 및 질환의 심각도에 따라 좌우될 것이고, 의사의 판단 및 각 환자의 상황에 따라 결정되어야 한다. 이를 필요로 하는 대상체에게 투여되는 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 용량은 제한없이, 투여 경로, 치료되는 특별한 질환, 대상체의 연령 또는 치료적 효과를 수득하는데 필요한 발현 수준을 포함한 몇몇 인자들을 기반으로 다양하게 될 것이다. 당업자는 당분야에서 이의 지식을 기반으로 하여, 이들 인자 및 다른 것들을 기반으로 요구되는 용량 범위를 쉽게 결정할 수 있다. 바이러스 벡터, 예컨대 AAV 벡터를 대상체에게 투여하는 단계를 포함하는 치료의 경우에서, 벡터의 전형적인 용량은 체중 킬로그램 당 적어도 1x10⁸ 벡터 게놈 (vg/kg), 예컨대 적어도 1x10⁹ vg/kg, 적어도 1x10¹⁰ vg/kg, 적어도 1x10¹¹ vg/kg, 적어도 1x10¹² vg/kg 적어도 1x10¹³ vg/kg, 또는 적어도 1x10¹⁴ vg/kg이다.

본 발명은 또한 이를 필요로 하는 대상체에게 본 발명의 핵산, 벡터, 키메라 폴리펩티드, 약학 조성물 또는 세포의 치료 유효량을 전달하는 단계를 포함하는, 당원 축적병을 치료하기 위한 방법에 관한 것이다.

본 발명은 또한 이를 필요로 하는 대상체에게 본 발명의 핵산 분자, 핵산 구성체, 벡터, 약학 조성물 또는 세포의 치료적 유효량을 전달하는 단계를 포함하는,당원 축적병을 치료하기 위한 방법에 관한 것이고, 상기 방법은 이식유전자 (즉, 본 발명의 키메라 GAA 폴리펩티드)에 대해 면역 반응을 유도하지 않거나, 또는 이식유전자에 대한 감소된 면역 반응을 유도시킨다. 본 발명은 또한 당원 축적병을 치료하기 위한 방법에 관한 것이고, 상기 방법은 이를 필요로 하는 대상체에게 본 발명의 핵산 분자, 핵산 구성체, 벡터, 약학 조성물 또는 세포의 치료적 유효량을 반복 투여하는 단계를 포함한다. 이러한 양상에서, 본 발명의 핵산 분자 또는 핵산 구성체는 간 세포에서 기능성이어서, 이로부터 생산된 발현된 키메라 GAA 폴리펩티드에 대한 면역 관용을 가능하게 하는 프로모터를 포함한다. 역시, 이러한 양상에서, 이 양상에서 사용되는 약학 조성물은 간 세포에서 기능성인 프로모터를 포함하는 핵산 분자 또는 핵산 구성체를 포함한다. 간 세포의 전달의 경우에서, 상기 세포는 치료를 필요로 하는 대상체로부터 이전에 수집되고, 그들에게 본 발명의 핵산 분자 또는 핵산 구성체를 도입하여 본 발명의 키메라 GAA 폴리펩티드를 생산할 수 있게 조작된 세포일 수 있다. 구체예에 따라서, 반복 투여를 포함하는 양상에서, 상기 투여는 적어도 1회 또는 그 이상이 반복될 수 있고, 심지어 주기적인 스케줄에 따라서, 예컨대 1주, 1개월 또는 1년에 1회 수행되는 것이 고려될 수도 있다. 주기적 스케줄은 또한 2, 3, 4, 5, 6, 7, 8, 9 또는 10년 마다 1회, 또는 10년을 초과하여 1회 투여를 포함할 수 있다. 다른 특정 구체예에서, 본 발명의 바이러스 벡터의 각 투여의 투여는 각각의 연속 투여에 대해 상이한 바이러스를 사용하여 수행되고, 그리하여 이전에 투여된 바이러스 벡터에 대한 가능한 면역 반응으로 인한 효능의 감소를 피한다. 예를 들어, AAV8 캡시드를 포함하는 바이러스 벡터의 제1 투여를 수행할 수 있고, 이후에 AAV9 캡시드를 포함하는 벡터의 투여를 후속할 수 있거나, AAV와 비관련된 바이러스, 예컨대 레트로바이러스 또는 렌티바이러스 벡터의 투여가 후속될 수도 있다.

본 발명에 따라서, 치료는 치유, 완화 또는 예방 효과를 포함할 수 있다. 따라서, 치료적 및 예방적 치료는 특정 당원 축적병의 증상의 경감 또는 특정한 당원 축적병의 발생 위험성의 예방 또는 아니면 감소를 포함한다. 용어 "예방적"은 특정 병태의 개시 또는 중증도의 감소로서 간주될 수 있다. "예방적"은 또한 이전에 병태로 진단된 환자에서 특정한 병태의 재발 예방을 포함한다. "치료적"은 또한 존재하는 병태의 중증도를 감소시킬 수 있다. 본 명세서에서 용어 '치료'는 동물, 특히 포유동물, 보다 특히 인간 대상체에게 이득이 될 수 있는 임의의 양생법을 의미하고자 사용된다.

본 발명은 또한 본 발명의 핵산 분자 또는 핵산 구성체를 이를 필요로 하는 환자의 단리된 세포, 예를 들어 단리된 조혈 줄기 세포에 도입시키는 단계, 및 이를 필요로 하는 상기 환자에게 상기 세포를 도입시키는 단계를 포함하는, 당원 축적병의 치료를 위한 생체외 유전자 요법 방법에 관한 것이다. 이러한 양상의 특정한 구체예에서, 핵산 분자 또는 구성체는 상기 정의된 바와 같은 벡터에 의해 세포에 도입된다. 특정 구체예에서, 벡터는 통합성 바이러스 벡터이다. 추가의 특정 구체예에서, 바이러스 벡터는 레트로바이러스 벡터, 예컨대 렌바이러스 벡터이다. 예를 들어, 문헌 [van Til et al., 2010, Blood, 115(26), p. 5329]에 개시된 바와 같은 렌티바이러스 벡터가 본 발명의 방법의 실시에서 사용될 수 있다.

본 발명은 또한 약물로서 사용을 위한 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다.

본 발명은 또한 GAA 유전자의 돌연변이에 의해 초래되는 질환을 치료하기 위한 방법, 특히, 폼페 병을 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다. 본 발명은 더 나아가서 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다. 본 발명의 키메라 GAA 폴리펩티드는 효소 대체 요법 (ERT)에서 사용을 위해, 예컨대 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII 및 가장 특히 GSDII 중 하나의 효소 대체 요법에서 사용을 위해, 이를 필요로 하는 환자에게 투여될 수 있다.

본 발명은 또한 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하는데 유용한 약물의 제조에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 용도에 관한 것이다.

실시예

본 발명은 하기 실험 실시예 및 첨부된 도면을 참조하여 보다 상세하게 설명된다. 이들 실시예는 단지 예시의 목적으로 제공되고, 제한하려는 의도가 아니다.

재료 및 방법

GAA 활성

GAA 활성은 증류수 중 냉동 조직 샘플의 균질화 후에 측정하였다. 50-100 mg의 조직을 칭량하고 균질화시키고 나서, 20분 동안 10000 x g에서 원심분리하였다. 반응물은 96웰 플레이트에서 10 μl의 상청액 및 20 μl의 기질 - 4MUα-D-글루코시드를 사용해 설정하였다. 반응 혼합물을 37℃에서 1시간 동안 인큐베이션시킨 후, 150 μl의 소듐 카보네이트 완충액 pH 10.5을 첨가하여 중단시켰다. 449 nm (발광) 및 360 nm (여기)에서 EnSpire 알파 플레이트 판독기 (Perkin-Elmer)를 사용하여, 개별 반응 혼합물로부터 방출된 형광발광성 4MU를 측정하기 위해 표준 곡선 (0-2500 pmol/μl의 4MU)이 사용되었다. 청징된 상청액의 단백질 함량은 BCA (Thermo Fisher Scientific)를 통해 정량하였다. GAA 활성을 계산하기 위해서, 방출된 4MU 농도를 샘플 단백질 농도로 나누었고 활성은 nmol/hour/mg 단백질로서 기록하였다.

글리코겐 함량

글리코겐 ?량은 상기에 기술된 바와 같이 수득된 조직 균질물의 아스퍼질러스 니거 (Aspergillus Niger) 아밀로글루코시다제에 의한 전체 분해 후 방출된 포도당으로서 간접적으로 측정되었다. 반응물은 20 μl의 조직 균질물 및 55 μl의 증류수로 96웰 플레이트에서 설정되었다. 샘플은 5분 동안 95℃에서 인큐베이션시킨 후 4℃에서 냉각시켰다. 25 μl의 아밀로글루코시다제 (0.1 M 포타슘 아세테이트 pH5.5에 1:50으로 희석)가 각 샘플에 첨가되었다. 아밀로글루코시다제가 없는 대조군 반응물도 역시 각 샘플에 대해 설정되었다. 샘플 및 대조군 반응물 둘 모두는 37℃에서 90분 동안 인큐베이션되었다. 반응은 샘플을 5분 동안 95℃에서 인큐베이션시켜서 중단되었다. 방출된 포도당은 포도당 어세이 키트 (Sigma-Aldrich)를 사용하여 540 nm에서 EnSpire 알파 플레이트 판독기 (Perkin-Elmer)를 사용하여 흡광도를 측정하여 결정되었다.

체적변동기록법 (Plethysmography)

플로우-쓰로우 (0.5 L/분) 체적변동기록법 (EMKA technologies)을 사용하여 대조군 및 Gaa-/- 마우스에서 호흡 패턴을 측정하였다. 투명한 플렉시글라스 챔버를 데이타 수집 전에 기지의 기류 및 압력 신호로 보정하였다. 신호는 IOX2 소프트웨어 (EMKA technologies)를 사용하여 분석하였다. 다음의 변수들을 측정하였다: 호흡 빈도, 1회 호흡량 및 분간 환기량. 환기량 데이타는 5-분 빈으로 수집하였다. 5분은 챔버에 대한 순응을 가능하게 한다. 순응 및 데이타 획득 둘 모두의 경우에, 마우스는 정상 산소 호흡하였다 (21% O₂, 79% N₂).

마우스 실험

Gaa -/- 마우스는 엑손 6의 표적화 파괴에 의해 생성시켰고 C57BL/6J/129X1/SvJ 백그라운드로 유지되었다 (Raben N. et al 1998). 벡터는 0.2 mL의 부피로 꼬리 정맥을 통해서 전달되었다. 혈청 샘플은 분비된 hGAA의 수준을 모니터링하기 위해 매월 수집되었다. PBS-주사된 영향받은 동물 및 야생형 한배새끼가 대조군으로서 사용되었다.

항-hGAA 항체 결정

Maxisorp 96 웰 플레이트 (Thermo Fisher Scientific)는 카보네이트 완충액 중 Myozime® 단백질로 4℃에서 밤새 코팅시켰다. 래트 재조합 IgG의 표준 곡선 (Sigma Aldrich)은 1 μg/mL로부터 시작하여 7회 2배 희석으로 웰에 코딩하였다. 차단 후, 혈장 샘플을 플레이트에 첨가하였고 1시간 동안 37℃에서 인큐베이션시켰다. 검출은 3,3',5,5'-테트라메틸벤지딘 기질 (BD Biosciences)을 웰에 첨가하여 수행하였고, H₂SO₄로 반응을 차단시킨 후 Enspire 플레이트 판독기 (Perkin Elmer) 상에 450 및 570 nm (백그라운드 감산용)에서 발색을 측정하였다.

NHP 실험

수컷 사이노몰거스 마카크를 스테인레스강 케이지에 수용하였고 12시간 명암 주기로 유지시켰다. 모든 마카크는 실험 시작 전에 < 1:5의 중화 항체 역가를 가졌다. 2E12 vg/kg 용량의 AAV8-hAAT-sp7-Δ8-hGAAco1을 대복재 정맥을 통해서 주입하였다. 혈액 샘플은 대퇴정맥을 통한 주사 전 12일 및 주사 후 30일에 채혈하였다. 전혈은 EDTA 함유 튜브에 채혈하였고 원심분리하여 혈청을 분리시켰다. 벡터 투여 후 3개월에 모든 마카크를 안락사시켰다. 동물들은 먼저 케타민/덱스메데토미딘의 혼합물로 마취시키고 나서 IV 주사되는 소듐 펜토바비탈을 사용해 안락사시켰다. 조직을 즉시 수집하였고 액체 질소에서 동결시켰다.

웨스턴 블롯 분석

전체 균질물을 동결된 근육으로부터 수득하였다. 단백질 농도는 제조사의 지시서에 따라서, Pierce BCA 단백질 어세이 (Thermo Fisher Scientific)를 통해 추출물에서 결정하였다. 웨스턴 블롯은 항 hGAA 항체 (Abcam)를 사용해 수행하였다. 항-튜불린 항체 (Sigma Aldrich)를 로딩 대조군으로서 사용하였다.

결과

폼페 병에 대한 현행 유전자 대체 요법을 개선시키고자 하는 노력으로, 우리는 야생형 신호 펩티드 (본 명세서에서 sp1로 표시됨)를 hGAA의 서열 최적화된 서열 (SEQ ID NO: 13)의 상이한 신호 펩티드 (sp2 내지 8, 표 4에 기술됨)로 교체시켜 이의 분비성이 증가되도록 hGAA 서열을 조작하였다.

표 4

우리는 간세포암 세포 (Huh-7)를 신호 펩티드 1 내지 8과 융합된 코돈 최적화된 hGAA (hGAAco)를 발현하는 플라스미드와 함께 GFP 또는 야생형 hGAA (hGAA; SEQ ID NO: 37)를 발현하는 플라스미드로 형질감염시켰다. 형질감염 후 48시간에, 성장 배지를 hGAA의 존재에 대해서 분석하였다. 특히 효율적인 신호 펩티드를 보유한 구성체 중 오직 4개만이 GFP-형질감염된 세포를 통해서 나타나는 음성 대조군에서 관찰된 것보다 유의하게 더 높은 hGAA의 분비 수준을 야기시켰다 (도 1A). 신호 펩티드 sp2, sp6, sp7 및 sp8을 보유하는 hGAA 키메라 단백질을 발현하는 구성체는 배지에서 더 높은 수준의 hGAA를 분비하였다 (GFP 대비 p < 0.05).

다음으로 우리는 삼중 형질감염 및 세슘 클로라이드 정제를 통해서 제조된 AAV8 벡터에 이들 구성체를 패키징하였고 그들을 야생형 C57BL/6J 마우스에게 주사하였다. 이어서 우리는 신호 펩티드 sp1, 2, 3, 7 및 8 (도 1B)이 사용된 구성체에 대해 생체 내 GAA 혈청 수준을 비교하였다. hGAAco를 발현하는 AAV8 벡터 1E12 vg/kg의 주사 후 1개월에 우리는 PBS 주사된 마우스와 비교하여 유의하게 더 높은 수준의 순환형 hGAA를 관찰하였다. 흥미롭게도, 순환형 hGAA의 수준은 sp2, 7 및 8과 융합된 hGAAco를 발현하는 벡터로 처치된 마우스에서 유의하게 더 높았다. 놀랍게도, 생체 내에서 sp2 구성체에 의해 획득된 분비 수준은 sp7- 및 sp8- 조작된 hGAA에서 측정된 것보다 유의하게 낮았다 (도 1B). 이들 데이타를 함께 취합하면 간에서 효율적으로 분비된 단백질로부터 유래된 신호 펩티드로 야생형 신호 펩티드의 치환이 생체 내에서 hGAA의 순환 수준을 증가시키는 효과적인 전략이라는 것을 의미한다. 게다가, sp7 및 8 신호 펩티드로 생체 내에서 수득된 예상치 않은 결과들은 모든 신호 펩티드가 생체 내에서 균등하게 효율적이지는 않고, 신호 펩티드 sp7 및 sp8이 sp1 및 sp2와 비교하여 생체 내에서 우수한 분비 효능을 유발시킨다는 것을 의미한다.

다음으로 질환의 동물 모델, GAA -/- 마우스에서 이러한 발견들을 확증하였다. 이 마우스 모델은 근력 손상 및 수명 감소를 초래하는, 상이한 장기 내 글리코겐 축적과 함께, 근육 내 효소의 잔류 활성이 존재하지 않았다.

GAA-/- 마우스에서 폼페 병 표현형의 구제에서 상이한 벡터의 유효성을 비교하기 위해서, 우리는 2E12 vg/kg의 hGAAco를 발현하는 벡터 및 신호 펩티드 sp2, 7 및 8과 융합된 조작된 형태의 주사의 효과를 장기간 동안 추적하였다. 주사 후 3개월에, 우리는 고도로 효율적인 신호 펩티드 sp2, 7 및 8을 보유하는 hGAAco를 발현하는 AAV8을 주사한 후 유의하게 증가된 순환형 hGAA를 관찰하였다 (도 2A). 특히, sp7 신호 펩티드가 융합된 hGAAco는 다른 2종의 구성체에서 관찰된 것보다 유의하게 더 높은 순환 hGAA의 수준을 야기시켰다. 이 실험에서 장기간의 추적조사는 GAA -/- 마우스의 생존을 추정할 수 있게 하였다. 마우스는 4개월령에 주사되었고 이후에 6개월 동안 추적조사되었다. 이 기간 동안 PBS 주사된 그룹에서 8/10 GAA-/- 마우스가 폐사된 반면 hGAAco 발현 구성체가 처치된 GAA-/- 동물 및 야생형 동물에서 단지 1/45 폐사가 기록되었다. 이러한 결과의 통계적 유의성 (도 2B)은 분비 수준과 독립적으로 모든 hGAAco 발현 벡터의 처치가 GAA -/- 마우스에서 관찰된 치명적인 표현형을 구제한다는 것을 의미한다. 이 마우스 모델에서 보고된 다른 표현형은 호흡 기능의 감소이다. 특히, 감소된 1회 호흡량이 보고되었고 (DeRuisseau et al PNAS 2008) 이러한 감소는 신경계에서 글리코겐의 축적에 기인한다는 것이 입증되었다. 신경계에서 글리코겐 수준의 구제는 혈관-뇌 장벽을 관통하는 hGAA의 능력에 의존적이고 이 단백질의 순환 수준에 직접적으로 의존한다는 것이 다른 리소솜 축적 질병에서 입증되었다 (Polito et al Hum. Mol. Genet. 2010, Cho et al Orph. J. of Rare Dis. 2015). 그러므로, 우리는 GAA -/- 마우스의 1회 호흡량에 대한 hGAA의 장기간, 높은 순환 수준의 효과를 평가하였다. 주사 후 3개월에, 유의하지는 않지만 (p = 0.104), GAA -/- 마우스는 감소된 1회 호흡량을 보인데 반해 sp7이 처치된 마우스는 WT 마우스에서 관찰된 것과 매우 유사한 1회 호흡량을 보였다 (p = 0.974) (도 2C, 좌측). 주사 후 6개월에, 오직 2마리의 GAA -/- 마우스가 생존하였고 그들은 덜 심각한 호흡 표현형을 갖는 것으로 나타났다. 역시, sp7 hGAAco로 처치된 마우스는 WT 동물에서 관찰된 것과 유사한 1회 호흡량을 가졌다 (p= 0.969) (도 2C, 우측). 중요하게, sp1 및 sp7 hGAAco가 처치된 마우스에서 측정된 1회 호흡량 간 통계적으로 유의한 편차 (p = 0.041)가 확인되어, sp7-GAA 처치된 마우스에서 보다 두드러진 개선이 확인되었다. 이들 데이타를 취합하면, sp7 신호 펩티드가 융합된 hGAAco를 발현하는 AAV8이 형질도입된 간은 GAA-/- 마우스에서 호흡기 기능의 완전한 표현형 교정을 수반하는 혈중 hGAA의 우수한 수준을 야기한다는 것을 의미한다.

다음으로 높은 수준의 순환형 hGAA가 골격근에서 글리코겐 축적을 구제하는지 여부를 검증하였다. 우리는 상기 기술된 바와 같이 주사된 마우스의 사두근에서 hGAA 활성을 측정하였다. hGAA 발현 벡터의 주사는 WT 동물에서 관찰된 것과 비슷한 수준으로 사두근 내 hGAA 활성의 증가를 야기시켰다 (도 3A). 사두근에서 글리코겐의 측정은 GAA -/- 마우스가 WT 동물보다 ∼20배 더 많이 글리코겐을 축적시킨다는 것을 의미한다 (p = 3.5E-6). 이러한 축적은 hGAA 발현 벡터의 처치로 반전되며 (GAA-/- 대비 p < 0.05), sp7가 있는 경우에 야생형 동물의 수준과 구별되지 않는, 최저 글리코겐 수준을 보였다 (WT 대비 p = 0.898) (도 3B).

효율적인 신호 펩티드와 hGAA의 융합이 생체 내에서 이의 분비를 개선시키고 질환의 표현형 보정을 증가시키는 것을 검증하기 위해서, 우리는 GAA -/- 마우스에게 저용량의 벡터를 주사하였고, 표현형의 생화학적 교정을 평가하였다. 신호 펩티드 1, 7 및 8과 융합된 hGAAco를 발현하는 벡터 6E11 vg/kg의 주사 후 3개월에, 우리는 순환형 hGAA를 측정하였다. 특히 sp 7 및 8은 PBS-처치 마우스와 비교하여 혈청에서 검출가능한 분비된 hGAA의 3배 증가를 야기하였다 (도 4A). 우리는 처치된 동물 및 대조군 유래 조직의 생화학적 분석을 수행하여 hGAAco를 발현하는 AAV8 벡터의 치료적 효과를 더욱 조사하였다. 우리는 상기에 기술된 바와 같이 처치된 GAA -/- 마우스의 심장, 횡격막 및 사두근에서 글리코겐 함량을 평가하였다. 특히, 우리는 hGAAco 발현 벡터로 처치 후 조직 내에서 hGAA의 고수준을 관찰하였고 (데이타는 도시하지 않음) 이것은 고려된 모든 조직에서 글리코겐 함량의 유의한 감소와 관련되었다 (도 4B-D). 특히, 심장 (도 4B)에서 고도로 효율적인 신호 펩티드 sp7 및 8을 보유하는 벡터로 처치 후 측정된 글리코겐의 수준은 영향받지 않은 야생형 동물에서 관찰된 것과 구별되지 않았다 (야생형 대비 각각 p = 0.983 및 0.996). 중요하게, sp7 및 sp8 벡터 둘 모두를 처치 후 관찰된 수준은 PBS-주사되거나 또는 야생형 hGAaco 발현 벡터 (sp1로 표시)로 처치된 GAA -/- 동물과 비교하여 유의하게 감소되었다.

우리는 우리의 벡터가 형질도입된 간이 이식유전자에 대해서 체액성 반응을 유도하였는지 여부를 검사하였다. 마우스는 간 특이적 프로모터의 전사 제어 하에서 sp2, sp7 또는 sp8과 융합된 Δ8-hGAAco1 또는 천연 sp1 신호 펩티드 (co)를 갖는 hGAAco1을 발현하는 AAV8 벡터가 정맥내 주사되었다. 결과는 도 5에 나타내었다. 항상성 프로모터의 전사 제어 하에서 Δ8-hGAAco1을 발현하는 AAV가 근육내로 주사된 Gaa-/-는 매우 높은 수준의 전체 IgG (∼150 μg/mL)를 보인데 반해서, 일반적으로 간에서 동일한 단백질을 발현하는 벡터는 더 낮은 수준의 체액성 반응을 보였다. 흥미롭게도, sp1 hGAAco1 (co) 발현 벡터가 주사된 마우스는 양쪽 용량에서 검출가능한 수준의 항체를 보였는데 반해서, 조작된 높은 분비 벡터가 주사된 마우스는 검출불가한 IgG 수준을 가졌다. 이들 데이타는 간에서 이식유전자의 발현이 말초 관용의 유도에 필수적이라는 것을 의미하고, 또한 그들은 효율적인 신호 펩티드와의 융합으로 획득된 hGAA의 높은 순환 수준이 단백질 그 자체에 대한 체액성 반응의 감소를 유도한다는 지표를 제공한다.

마우스 실험에서 선택된 최고 수행 벡터를 2마리의 인간외 영장류 (NHP, 마카카 파시쿨라리스 (Macaca Fascicularis) 종)에게 주사하여 근육에서 우리 벡터의 분비 및 흡수 효능을 검증하였다. 우리는 2마리 원숭이에게 2E12 vg/kg의 AAV8-hAAT-sp7-Δ8-hGAAco1을 주사하였다. 주사 후 1개월에 우리는 특이적 항-hGAA 항체를 사용한 웨스턴 블롯을 통해서 2마리 동물의 혈청에서 hGAA의 수준을 측정하였다. 우리는 2마리 원숭이에서 hGAA의 것과 호환되는 크기의 분명한 밴드를 관찰하였다. 이 밴드는 벡터 주사 전 12일에 수득된 혈청 샘플에서는 존재하지 않았고, 따라서 우리의 검출 방법의 특이도가 확증되었다 (도 6A). 주사 후 3개월에 우리는 동물들을 희생시켰고 조직을 수득하여 혈류 중 간에서 분비된 hGAA가 근육에 의해 효율적으로 흡수되었는지를 검증하였다. 우리는 2마리 원숭이의 이두근 및 횡격막으로부터 수득된 전체 용해물 상에서 hGAA에 특이적인 항체를 사용하여 웨스턴을 수행하였다. 흥미롭게 우리는 역시 혈류에서 최고 수준의 hGAA를 보여준 2번 동물에서 분명한 밴드를 관찰할 수 있었다 (도 6B). 또한, 1번 동물에서 우리는 분석된 양쪽 근육의 hGAA의 것과 일관된 분자량의 보다 희미한 밴드를 관찰할 수 있었다. 이들 데이타는 AAV8-hAAT-sp7-Δ8-hGAAco1 벡터가 NHP의 간에서 효율적으로 형질도입된다는 것을 의미한다. 또한 그들은 혈류에서 분비된 단백질이 근육에서 효율적으로 흡수되고 이러한 흡수는 혈액에서 측정된 hGAA의 수준과 관련된다는 것을 입증한다.

우리는 상이한 GAA 형태 (모두 코돈 최적화됨): 1. 천연 sp1 GAA 신호 펩티드를 포함하는 천연 GAA (co), 2. 이종성 sp7 또는 sp8 신호 펩티드를 함유하는 조작된 GAA (sp7-co, sp8-co)가 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 더욱 수행하였다. 이 분석은 천연 GAA (co)와 비교하여 조작된 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보여주었다 (도 7). 흥미롭게, 대신 세포내 GAA 활성이 조작된 형태와 비교하여 천연 GAA (co)를 사용시 유의하게 더 높았고, 이것은 천연 GAA가 주로 세포 내에서 유지된다는 것을 의미한다.

우리는 또한 GSDIII의 마우스 모델에서 마우스 실험에서 선택된 최고 수행 벡터 (AAV8-hAAT-sp7-Δ8-hGAAco1)의 효과를 결정하였다. 우리는 글리코겐 탈분지 효소 (GDE)에 대한 넉아웃 마우스 모델을 개발하였다. 이러한 모델은 제III형 당원 축적병 (GSDIII)이 걸린 인간에서 관찰된 질병의 표현형을 요약한다. 특히 GDE 활성이 완전하게 결여된 GDE -/- 마우스는 근력 손상을 가지며 상이한 조직에서 글리코겐이 축적된다. 흥미롭게 그들은 또한 간에서 글리코겐이 축적되는데 이것은 역시 인간에서도 확인된다. 여기서 우리는 간에서 sp7-Δ8-hGAA의 과발현이 GDE -/- 마우스에서 관찰된 글리코겐 축적을 구제하는지 여부를 검사하였다. 우리는 GDE-/- 마우스에게 1E11 또는 1E12 vg/마우스의 AAV8-hAAT-sp7-Δ8-hGAAco1을 주사하였다. 대조군으로서 야생형 (WT) 및 GDE -/- 마우스에게 PBS를 동시에 주사하였다. 벡터 투여 후 3개월에, 마우스를 희생시켰고 간에서 글리코겐의 수준을 정량하였다. 그 결과는 도 8에 기록되어 있다. 이미 보고된 바와 같이 (Pagliarani 등 및 우리의 모델), GDE -/- 마우스는 야생형 동물과 비교시 글리코겐이 5배 더 많게 간에서 글리코겐 축적의 유의한 증가를 보였다 (p=1.3E-7). 놀랍게도, 1E11 및 1E12 vg/마우스의 AAV8-hAAT-sp7-Δ8-hGAAco1 벡터 처치는 글리코겐 함량의 통계적으로 유의한 감소를 유도하였다 (각각 p=4.5E-5 및 1.4E-6). 중요하게, AAV8-hAAT-sp7-Δ8-hGAAco1 벡터가 주사된 마우스의 간에서 측정된 글리코겐의 수준은 특히 최고 용량에서 야생형 동물에서 측정된 것과 구별되지 않았다 (1E11 용량 코호트의 경우 p = 0.053 및 1E12 용량 코호트의 경우 0.244).

우리는 상이한 GAA 형태 (모두 코돈-최적화됨): 1. 천연 sp1 GAA 신호 펩티드 (co)를 포함하는 천연 GAA, 2. 이종성 sp7 신호 펩티드 (sp7-co)를 함유하는 조작된 GAA, 및 3. 다양한 수의 아미노산의 결실 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co 및 sp7-Δ62-co로서, 여기서 SEQ ID NO: 5의 처음 N-말단 아미노산의 8, 29, 42, 47 및 62가 각각 결실됨)이 후속되는 이종성 sp7 신호 펩티드를 함유하는 조작된 GAA가 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 수행하였다. 분석은 양쪽의 조작된 비결실 GAA (sp7-co) 및 천연 GAA (co)와 비교하여 Δ8, Δ29, Δ42 및 Δ43 GAA 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보여주었다 (도 9). 대신에 유의하게 더 낮은 GAA 활성이 다른 조작된 GAA 형태 [결실된 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실된 (sp7-co)]와 비교하여 Δ47 및 Δ62 GAA 형태로 형질감염된 세포의 배지에서 관찰되었다. 흥미롭게, (도 10) 세포내 GAA 활성은 생산적 결실 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실 형태 (sp7-co) 간에 차이가 없어서 그들이 모두 세포내에서 효율적으로 생산되어 프로세싱된다는 것을 의미한다. 대신 세포내 GAA 활성은 sp7-Δ47-co 및 sp7-Δ62-co 형태의 경우에 매우 낮았고 모든 다른 조작된 형태 [결실된 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실된 (sp7-co)]와 비교시 유의하게 낮았다.

우리는 또한 상이한 GAA 형태 (모두 코돈 최적화됨): 1. 천연 sp1 GAA 신호 펩티드 (co)를 포함하는 천연 GAA, 2. 이종성 sp6 또는 sp8 신호 펩티드 (sp6-co, sp8-co)를 함유하는 조작된 GAA, 및 3. 8 아미노산 (sp6-Δ8-co, sp8-Δ8-co)의 결실이 후속되는 이종성 sp6 또는 sp8 신호 펩티드를 함유하는 조작된 GAA로 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 수행하였다. 분석은 (도 11) i. 그들의 개별적인 조작된 비결실된 GAA 형태 (sp6-co 또는 sp8-co); 및 ii. 천연 GAA (co)와 비교하여 Δ8 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보였다. 흥미롭게, 세포내 GAA 활성은 모든 조작된 GAA 형태 (결실 및 비결실 둘 모두) 간에 차이가 없어서 그들이 모두 세포내에서 효율적으로 생산되어 프로세싱된다는 것을 의미한다 (세포 용해물 패널). 대신에 세포내 GAA 활성은 조작된 형태와 비교하여 천연 GAA (co)를 사용하여 유의하게 더 높았고, 천연 GAA가 주로 세포 내에서 유지된다는 것을 의미한다.

<110> GENETHON et al. <120> ACID-ALPHA GLUCOSIDASE VARIANTS AND USES THEREOF <130> B2298PC00 <160> 54 <170> PatentIn version 3.3 <210> 1 <211> 2859 <212> DNA <213> homo sapiens <400> 1 atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60 ttggcaaccg cagcgctcct ggggcacatc ctactccatg atttcctgct ggttccccga 120 gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180 agcagaccag ggccccggga tgcccaggca caccccgggc ggccgcgagc agtgcccaca 240 cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300 gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360 cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420 ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480 cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540 ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600 cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660 atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720 tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780 gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840 cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900 ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960 gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020 atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080 ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140 accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200 cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260 ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320 atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380 ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440 tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500 gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560 gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620 ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680 agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740 atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800 tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860 tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920 ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980 tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040 ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100 ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160 gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220 gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280 gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340 gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400 gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460 gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520 atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580 gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640 aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700 ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760 gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820 ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859 <210> 2 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> sp7 <400> 2 Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr 1 5 10 15 Phe Gly <210> 3 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> sp6 <400> 3 Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val 1 5 10 15 Leu Ser Ser Val Cys Val Ala Leu Gly 20 25 <210> 4 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> sp8 <400> 4 Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala 1 5 10 15 Gly Asp Arg Ala Ser Ser 20 <210> 5 <211> 925 <212> PRT <213> Artificial Sequence <220> <223> hGAAwt w/o sp <400> 5 Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser 1 5 10 15 Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly 20 25 30 Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro 35 40 45 Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp 50 55 60 Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly 65 70 75 80 Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly 85 90 95 Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu 100 105 110 Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr 115 120 125 Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val 130 135 140 Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala 145 150 155 160 Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Arg 165 170 175 Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly 180 185 190 Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr 195 200 205 Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser 210 215 220 Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu 225 230 235 240 Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu 245 250 255 Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu 260 265 270 Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser 275 280 285 Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg 290 295 300 Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro 305 310 315 320 Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met 325 330 335 Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser 340 345 350 Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His 355 360 365 Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg 370 375 380 Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met 385 390 395 400 Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp 405 410 415 Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp 420 425 430 Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro 435 440 445 Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr 450 455 460 Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His 465 470 475 480 Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser 485 490 495 Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu 500 505 510 Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala 515 520 525 Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu 530 535 540 His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu 545 550 555 560 Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe 565 570 575 Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser 580 585 590 Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn 595 600 605 Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly 610 615 620 Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe 625 630 635 640 Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu 645 650 655 Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu 660 665 670 Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln 675 680 685 Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe 690 695 700 Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly 705 710 715 720 Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val 725 730 735 Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro 740 745 750 Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu 755 760 765 Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu 770 775 780 Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln 785 790 795 800 Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu 805 810 815 Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp 820 825 830 Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln 835 840 845 Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg 850 855 860 Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu 865 870 875 880 Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val 885 890 895 Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val 900 905 910 Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys 915 920 925 <210> 6 <211> 441 <212> DNA <213> Artificial Sequence <220> <223> HBB2 intron <400> 6 gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60 cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120 gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180 atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240 aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300 ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360 tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420 tggcccatca ctttggcaaa g 441 <210> 7 <211> 441 <212> DNA <213> modified HBB2 intron <400> 7 gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60 cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120 gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180 atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240 aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300 ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360 tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420 tggcccatca ctttggcaaa g 441 <210> 8 <211> 1438 <212> DNA <213> Artificial Sequence <220> <223> FIX intron <400> 8 ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60 gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120 acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180 atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240 tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300 aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360 tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420 ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480 aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540 cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600 ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660 tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720 agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780 tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840 aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900 accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960 cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020 tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080 agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140 tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200 agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260 cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320 aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380 aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438 <210> 9 <211> 1438 <212> DNA <213> Artificial Sequence <220> <223> modified FIX intron <400> 9 ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60 gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120 acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180 atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240 tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300 aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360 tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420 ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480 aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540 cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600 ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660 tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720 agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780 tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840 aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900 accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960 cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020 tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080 agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140 tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200 agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260 cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320 aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380 aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438 <210> 10 <211> 881 <212> DNA <213> Artificial Sequence <220> <223> chicken beta-globin intron <400> 10 gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60 gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120 tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180 aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420 gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480 cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540 tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600 ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660 cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720 gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780 cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840 gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881 <210> 11 <211> 881 <212> DNA <213> Artificial Sequence <220> <223> modified chicken beta-globin intron <400> 11 gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60 gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120 tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180 aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420 gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480 cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540 tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600 ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660 cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720 gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780 cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840 gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881 <210> 12 <211> 952 <212> PRT <213> homo sapiens <400> 12 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly 930 935 940 Glu Gln Phe Leu Val Ser Trp Cys 945 950 <210> 13 <211> 2778 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1 w/o sp <400> 13 ggccatatcc tgctgcacga ctttctacta gtgcccagag agctgagcgg cagctctccc 60 gtgctggaag aaacacaccc tgcccatcag cagggcgcct ctagacctgg acctagagat 120 gcccaggccc accccggcag acctagagct gtgcctaccc agtgtgacgt gccccccaac 180 agcagattcg actgcgcccc tgacaaggcc atcacccagg aacagtgcga ggccagaggc 240 tgctgctaca tccctgccaa gcagggactg cagggcgctc agatgggaca gccctggtgc 300 ttcttcccac cctcctaccc cagctacaag ctggaaaacc tgagcagcag cgagatgggc 360 tacaccgcca ccctgaccag aaccaccccc acattcttcc caaaggacat cctgaccctg 420 cggctggacg tgatgatgga aaccgagaac cggctgcact tcaccatcaa ggaccccgcc 480 aatcggagat acgaggtgcc cctggaaacc ccccacgtgc actctagagc ccccagccct 540 ctgtacagcg tggaattcag cgaggaaccc ttcggcgtga tcgtgcggag acagctggat 600 ggcagagtgc tgctgaacac caccgtggcc cctctgttct tcgccgacca gttcctgcag 660 ctgagcacca gcctgcccag ccagtacatc acaggactgg ccgagcacct gagccccctg 720 atgctgagca catcctggac ccggatcacc ctgtggaaca gggatctggc ccctacccct 780 ggcgccaatc tgtacggcag ccaccctttc tacctggccc tggaagatgg cggatctgcc 840 cacggagtgt ttctgctgaa ctccaacgcc atggacgtgg tgctgcagcc tagccctgcc 900 ctgtcttgga gaagcacagg cggcatcctg gatgtgtaca tctttctggg ccccgagccc 960 aagagcgtgg tgcagcagta tctggatgtc gtgggctacc ccttcatgcc cccttactgg 1020 ggcctgggat tccacctgtg cagatggggc tactccagca ccgccatcac cagacaggtg 1080 gtggaaaaca tgaccagagc ccacttccca ctggatgtgc agtggaacga cctggactac 1140 atggacagca gacgggactt caccttcaac aaggacggct tccgggactt ccccgccatg 1200 gtgcaggaac tgcatcaggg cggcagacgg tacatgatga tcgtggatcc cgccatcagc 1260 tcctctggcc ctgccggctc ttacagaccc tacgacgagg gcctgcggag aggcgtgttc 1320 atcaccaacg agacaggcca gcccctgatc ggcaaagtgt ggcctggcag cacagccttc 1380 cccgacttca ccaatcctac cgccctggct tggtgggagg acatggtggc cgagttccac 1440 gaccaggtgc ccttcgacgg catgtggatc gacatgaacg agcccagcaa cttcatccgg 1500 ggcagcgagg atggctgccc caacaacgaa ctggaaaatc ccccttacgt gcccggcgtc 1560 gtgggcggaa cactgcaggc cgctacaatc tgtgccagca gccaccagtt tctgagcacc 1620 cactacaacc tgcacaacct gtacggcctg accgaggcca ttgccagcca ccgcgctctc 1680 gtgaaagcca gaggcacacg gcccttcgtg atcagcagaa gcacctttgc cggccacggc 1740 agatacgccg gacattggac tggcgacgtg tggtcctctt gggagcagct ggcctctagc 1800 gtgcccgaga tcctgcagtt caatctgctg ggcgtgccac tcgtgggcgc cgatgtgtgt 1860 ggcttcctgg gcaacacctc cgaggaactg tgtgtgcggt ggacacagct gggcgccttc 1920 taccctttca tgagaaacca caacagcctg ctgagcctgc cccaggaacc ctacagcttt 1980 agcgagcctg cacagcaggc catgcggaag gccctgacac tgagatacgc tctgctgccc 2040 cacctgtaca ccctgtttca ccaggcccat gtggccggcg agacagtggc cagacctctg 2100 tttctggaat tccccaagga cagcagcacc tggaccgtgg accatcagct gctgtgggga 2160 gaggctctgc tgattacccc agtgctgcag gcaggcaagg ccgaagtgac cggctacttt 2220 cccctgggca cttggtacga cctgcagacc gtgcctgtgg aagccctggg atctctgcct 2280 ccacctcctg ccgctcctag agagcctgcc attcactctg agggccagtg ggtcacactg 2340 cctgcccccc tggataccat caacgtgcac ctgagggccg gctacatcat accactgcag 2400 ggacctggcc tgaccaccac cgagtctaga cagcagccaa tggccctggc cgtggccctg 2460 accaaaggcg gagaagctag gggcgagctg ttctgggacg atggcgagag cctggaagtg 2520 ctggaaagag gcgcctatac ccaagtgatc ttcctggccc ggaacaacac catcgtgaac 2580 gagctggtgc gcgtgacctc tgaaggcgct ggactgcagc tgcagaaagt gaccgtgctg 2640 ggagtggcca cagcccctca gcaggtgctg tctaatggcg tgcccgtgtc caacttcacc 2700 tacagccccg acaccaaggt gctggacatc tgcgtgtcac tgctgatggg agagcagttt 2760 ctggtgtcct ggtgctga 2778 <210> 14 <211> 2778 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2 w/o sp <400> 14 ggacacatcc tgctgcacga cttcctgttg gtgcctagag agctgagcgg atcatcccca 60 gtgctggagg agactcatcc tgctcaccaa cagggagctt ccagaccagg accgagagac 120 gcccaagccc atcctggtag accaagagct gtgcctaccc aatgcgacgt gccacccaac 180 tcccgattcg actgcgcgcc agataaggct attacccaag agcagtgtga agccagaggt 240 tgctgctaca tcccagcgaa gcaaggattg caaggcgccc aaatgggaca accttggtgt 300 ttcttccccc cttcgtaccc atcatataaa ctcgaaaacc tgtcctcttc ggaaatgggt 360 tatactgcca ccctcaccag aactactcct actttcttcc cgaaagacat cttgaccttg 420 aggctggacg tgatgatgga gactgaaaac cggctgcatt tcactatcaa agatcctgcc 480 aatcggcgat acgaggtccc tctggaaacc cctcacgtgc actcacgggc tccttctccg 540 ctttactccg tcgaattctc tgaggaaccc ttcggagtga tcgttagacg ccagctggat 600 ggtagagtgc tgttgaacac tactgtggcc ccacttttct tcgctgacca gtttctgcaa 660 ctgtccactt ccctgccatc ccagtacatt actggactcg ccgaacacct gtcgccactg 720 atgctctcga cctcttggac tagaatcact ttgtggaaca gagacttggc ccctactccg 780 ggagcaaatc tgtacggaag ccaccctttt tacctggcgc tcgaagatgg cggatccgct 840 cacggagtgt tcctgctgaa tagcaacgca atggacgtgg tgctgcaacc ttcccctgca 900 ctcagttgga gaagtaccgg gggtattctg gacgtgtaca tcttcctcgg accagaaccc 960 aagagcgtgg tgcagcaata tctggacgtg gtcggatacc cttttatgcc tccttactgg 1020 ggactgggat tccacctttg ccgttggggc tactcatcca ccgccattac cagacaggtg 1080 gtggagaata tgaccagagc ccacttccct ctcgacgtgc agtggaacga tctggactat 1140 atggactccc ggagagattt caccttcaac aaggacgggt tccgcgattt tcccgcgatg 1200 gttcaagagc tccaccaggg tggtcgaaga tatatgatga tcgtcgaccc agccatttcg 1260 agcagcggac ccgctggatc ttatagacct tacgacgaag gccttaggag aggagtgttc 1320 atcacaaacg agactggaca gcctttgatc ggtaaagtgt ggcctggatc aaccgccttt 1380 cctgacttta ccaatcccac tgccttggct tggtgggagg acatggtggc cgaattccac 1440 gaccaagtcc cctttgatgg aatgtggatc gatatgaacg aaccaagcaa ttttatcaga 1500 ggttccgaag acggttgccc caacaacgaa ctggaaaacc ctccttatgt gcccggagtc 1560 gtgggcggaa cattacaggc cgcgactatt tgcgccagca gccaccaatt cctgtccact 1620 cactacaacc tccacaacct ttatggatta accgaagcta ttgcaagtca cagggctctg 1680 gtgaaggcta gagggactag gccctttgtg atctcccgat ccacctttgc cggacacggg 1740 agatacgccg gtcactggac tggtgacgtg tggagctcat gggaacaact ggcctcctcc 1800 gtgccggaaa tcttacagtt caaccttctg ggtgtccctc ttgtcggagc agacgtgtgt 1860 gggtttcttg gtaacacctc cgaggaactg tgtgtgcgct ggactcaact gggtgcattc 1920 tacccattca tgagaaacca caactccttg ctgtccctgc cacaagagcc ctactcgttc 1980 agcgagcctg cacaacaggc tatgcggaag gcactgaccc tgagatacgc cctgcttcca 2040 cacttataca ctctcttcca tcaagcgcat gtggcaggag aaaccgttgc aaggcctctt 2100 ttccttgaat tccccaagga ttcctcgact tggacggtgg atcatcagct gctgtgggga 2160 gaagctctgc tgattactcc agtgttgcaa gccggaaaag ctgaggtgac cggatacttt 2220 ccgctgggaa cctggtacga cctccagact gtccctgttg aagcccttgg atcactgcct 2280 ccgcctccgg cagctccacg cgaaccagct atacattccg agggacagtg ggttacatta 2340 ccagctcctc tggacacaat caacgtccac ttaagagctg gctacattat ccctctgcaa 2400 ggaccaggac tgactacgac cgagagcaga cagcagccaa tggcactggc tgtggctctg 2460 accaagggag gggaagctag aggagaactc ttctgggatg atggggagtc ccttgaagtg 2520 ctggaaagag gcgcttacac tcaagtcatt ttccttgcac ggaacaacac cattgtgaac 2580 gaattggtgc gagtgaccag cgaaggagct ggacttcaac tgcagaaggt cactgtgctc 2640 ggagtggcta ccgctcctca gcaagtgctg tcgaatggag tccccgtgtc aaactttacc 2700 tactcccctg acactaaggt gctcgacatt tgcgtgtccc tcctgatggg agagcagttc 2760 cttgtgtcct ggtgttga 2778 <210> 15 <211> 397 <212> DNA <213> Artificial Sequence <220> <223> hAAT promoter <400> 15 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360 cagcttcagg caccaccact gacctgggac agtgaat 397 <210> 16 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> ApoE control region <400> 16 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg g 321 <210> 17 <211> 2808 <212> DNA <213> Artificial Sequence <220> <223> sp7+hGAAco1-delta-8 <400> 17 atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcctacta 60 gtgcccagag agctgagcgg cagctctccc gtgctggaag aaacacaccc tgcccatcag 120 cagggcgcct ctagacctgg acctagagat gcccaggccc accccggcag acctagagct 180 gtgcctaccc agtgtgacgt gccccccaac agcagattcg actgcgcccc tgacaaggcc 240 atcacccagg aacagtgcga ggccagaggc tgctgctaca tccctgccaa gcagggactg 300 cagggcgctc agatgggaca gccctggtgc ttcttcccac cctcctaccc cagctacaag 360 ctggaaaacc tgagcagcag cgagatgggc tacaccgcca ccctgaccag aaccaccccc 420 acattcttcc caaaggacat cctgaccctg cggctggacg tgatgatgga aaccgagaac 480 cggctgcact tcaccatcaa ggaccccgcc aatcggagat acgaggtgcc cctggaaacc 540 ccccacgtgc actctagagc ccccagccct ctgtacagcg tggaattcag cgaggaaccc 600 ttcggcgtga tcgtgcggag acagctggat ggcagagtgc tgctgaacac caccgtggcc 660 cctctgttct tcgccgacca gttcctgcag ctgagcacca gcctgcccag ccagtacatc 720 acaggactgg ccgagcacct gagccccctg atgctgagca catcctggac ccggatcacc 780 ctgtggaaca gggatctggc ccctacccct ggcgccaatc tgtacggcag ccaccctttc 840 tacctggccc tggaagatgg cggatctgcc cacggagtgt ttctgctgaa ctccaacgcc 900 atggacgtgg tgctgcagcc tagccctgcc ctgtcttgga gaagcacagg cggcatcctg 960 gatgtgtaca tctttctggg ccccgagccc aagagcgtgg tgcagcagta tctggatgtc 1020 gtgggctacc ccttcatgcc cccttactgg ggcctgggat tccacctgtg cagatggggc 1080 tactccagca ccgccatcac cagacaggtg gtggaaaaca tgaccagagc ccacttccca 1140 ctggatgtgc agtggaacga cctggactac atggacagca gacgggactt caccttcaac 1200 aaggacggct tccgggactt ccccgccatg gtgcaggaac tgcatcaggg cggcagacgg 1260 tacatgatga tcgtggatcc cgccatcagc tcctctggcc ctgccggctc ttacagaccc 1320 tacgacgagg gcctgcggag aggcgtgttc atcaccaacg agacaggcca gcccctgatc 1380 ggcaaagtgt ggcctggcag cacagccttc cccgacttca ccaatcctac cgccctggct 1440 tggtgggagg acatggtggc cgagttccac gaccaggtgc ccttcgacgg catgtggatc 1500 gacatgaacg agcccagcaa cttcatccgg ggcagcgagg atggctgccc caacaacgaa 1560 ctggaaaatc ccccttacgt gcccggcgtc gtgggcggaa cactgcaggc cgctacaatc 1620 tgtgccagca gccaccagtt tctgagcacc cactacaacc tgcacaacct gtacggcctg 1680 accgaggcca ttgccagcca ccgcgctctc gtgaaagcca gaggcacacg gcccttcgtg 1740 atcagcagaa gcacctttgc cggccacggc agatacgccg gacattggac tggcgacgtg 1800 tggtcctctt gggagcagct ggcctctagc gtgcccgaga tcctgcagtt caatctgctg 1860 ggcgtgccac tcgtgggcgc cgatgtgtgt ggcttcctgg gcaacacctc cgaggaactg 1920 tgtgtgcggt ggacacagct gggcgccttc taccctttca tgagaaacca caacagcctg 1980 ctgagcctgc cccaggaacc ctacagcttt agcgagcctg cacagcaggc catgcggaag 2040 gccctgacac tgagatacgc tctgctgccc cacctgtaca ccctgtttca ccaggcccat 2100 gtggccggcg agacagtggc cagacctctg tttctggaat tccccaagga cagcagcacc 2160 tggaccgtgg accatcagct gctgtgggga gaggctctgc tgattacccc agtgctgcag 2220 gcaggcaagg ccgaagtgac cggctacttt cccctgggca cttggtacga cctgcagacc 2280 gtgcctgtgg aagccctggg atctctgcct ccacctcctg ccgctcctag agagcctgcc 2340 attcactctg agggccagtg ggtcacactg cctgcccccc tggataccat caacgtgcac 2400 ctgagggccg gctacatcat accactgcag ggacctggcc tgaccaccac cgagtctaga 2460 cagcagccaa tggccctggc cgtggccctg accaaaggcg gagaagctag gggcgagctg 2520 ttctgggacg atggcgagag cctggaagtg ctggaaagag gcgcctatac ccaagtgatc 2580 ttcctggccc ggaacaacac catcgtgaac gagctggtgc gcgtgacctc tgaaggcgct 2640 ggactgcagc tgcagaaagt gaccgtgctg ggagtggcca cagcccctca gcaggtgctg 2700 tctaatggcg tgcccgtgtc caacttcacc tacagccccg acaccaaggt gctggacatc 2760 tgcgtgtcac tgctgatggg agagcagttt ctggtgtcct ggtgctga 2808 <210> 18 <211> 2829 <212> DNA <213> Artificial Sequence <220> <223> sp6+hGAAco1-delta-8 <400> 18 atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60 tgtgtggccc tgggcctact agtgcccaga gagctgagcg gcagctctcc cgtgctggaa 120 gaaacacacc ctgcccatca gcagggcgcc tctagacctg gacctagaga tgcccaggcc 180 caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 240 gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 300 atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 360 ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 420 accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 480 gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 540 tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 600 gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 660 ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 720 agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 780 acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 840 ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 900 tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 960 agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 1020 gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 1080 ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 1140 atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1200 agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1260 ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1320 cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1380 gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1440 accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1500 cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1560 gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1620 acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1680 ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1740 agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1800 ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1860 atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1920 ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1980 atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 2040 gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 2100 accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 2160 ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2220 ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2280 acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2340 gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2400 ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2460 ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2520 ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2580 ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2640 cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2700 acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2760 gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2820 tggtgctga 2829 <210> 19 <211> 2820 <212> DNA <213> Artificial Sequence <220> <223> sp8+hGAAco1-delta-8 <400> 19 atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60 agcagcctac tagtgcccag agagctgagc ggcagctctc ccgtgctgga agaaacacac 120 cctgcccatc agcagggcgc ctctagacct ggacctagag atgcccaggc ccaccccggc 180 agacctagag ctgtgcctac ccagtgtgac gtgcccccca acagcagatt cgactgcgcc 240 cctgacaagg ccatcaccca ggaacagtgc gaggccagag gctgctgcta catccctgcc 300 aagcagggac tgcagggcgc tcagatggga cagccctggt gcttcttccc accctcctac 360 cccagctaca agctggaaaa cctgagcagc agcgagatgg gctacaccgc caccctgacc 420 agaaccaccc ccacattctt cccaaaggac atcctgaccc tgcggctgga cgtgatgatg 480 gaaaccgaga accggctgca cttcaccatc aaggaccccg ccaatcggag atacgaggtg 540 cccctggaaa ccccccacgt gcactctaga gcccccagcc ctctgtacag cgtggaattc 600 agcgaggaac ccttcggcgt gatcgtgcgg agacagctgg atggcagagt gctgctgaac 660 accaccgtgg cccctctgtt cttcgccgac cagttcctgc agctgagcac cagcctgccc 720 agccagtaca tcacaggact ggccgagcac ctgagccccc tgatgctgag cacatcctgg 780 acccggatca ccctgtggaa cagggatctg gcccctaccc ctggcgccaa tctgtacggc 840 agccaccctt tctacctggc cctggaagat ggcggatctg cccacggagt gtttctgctg 900 aactccaacg ccatggacgt ggtgctgcag cctagccctg ccctgtcttg gagaagcaca 960 ggcggcatcc tggatgtgta catctttctg ggccccgagc ccaagagcgt ggtgcagcag 1020 tatctggatg tcgtgggcta ccccttcatg cccccttact ggggcctggg attccacctg 1080 tgcagatggg gctactccag caccgccatc accagacagg tggtggaaaa catgaccaga 1140 gcccacttcc cactggatgt gcagtggaac gacctggact acatggacag cagacgggac 1200 ttcaccttca acaaggacgg cttccgggac ttccccgcca tggtgcagga actgcatcag 1260 ggcggcagac ggtacatgat gatcgtggat cccgccatca gctcctctgg ccctgccggc 1320 tcttacagac cctacgacga gggcctgcgg agaggcgtgt tcatcaccaa cgagacaggc 1380 cagcccctga tcggcaaagt gtggcctggc agcacagcct tccccgactt caccaatcct 1440 accgccctgg cttggtggga ggacatggtg gccgagttcc acgaccaggt gcccttcgac 1500 ggcatgtgga tcgacatgaa cgagcccagc aacttcatcc ggggcagcga ggatggctgc 1560 cccaacaacg aactggaaaa tcccccttac gtgcccggcg tcgtgggcgg aacactgcag 1620 gccgctacaa tctgtgccag cagccaccag tttctgagca cccactacaa cctgcacaac 1680 ctgtacggcc tgaccgaggc cattgccagc caccgcgctc tcgtgaaagc cagaggcaca 1740 cggcccttcg tgatcagcag aagcaccttt gccggccacg gcagatacgc cggacattgg 1800 actggcgacg tgtggtcctc ttgggagcag ctggcctcta gcgtgcccga gatcctgcag 1860 ttcaatctgc tgggcgtgcc actcgtgggc gccgatgtgt gtggcttcct gggcaacacc 1920 tccgaggaac tgtgtgtgcg gtggacacag ctgggcgcct tctacccttt catgagaaac 1980 cacaacagcc tgctgagcct gccccaggaa ccctacagct ttagcgagcc tgcacagcag 2040 gccatgcgga aggccctgac actgagatac gctctgctgc cccacctgta caccctgttt 2100 caccaggccc atgtggccgg cgagacagtg gccagacctc tgtttctgga attccccaag 2160 gacagcagca cctggaccgt ggaccatcag ctgctgtggg gagaggctct gctgattacc 2220 ccagtgctgc aggcaggcaa ggccgaagtg accggctact ttcccctggg cacttggtac 2280 gacctgcaga ccgtgcctgt ggaagccctg ggatctctgc ctccacctcc tgccgctcct 2340 agagagcctg ccattcactc tgagggccag tgggtcacac tgcctgcccc cctggatacc 2400 atcaacgtgc acctgagggc cggctacatc ataccactgc agggacctgg cctgaccacc 2460 accgagtcta gacagcagcc aatggccctg gccgtggccc tgaccaaagg cggagaagct 2520 aggggcgagc tgttctggga cgatggcgag agcctggaag tgctggaaag aggcgcctat 2580 acccaagtga tcttcctggc ccggaacaac accatcgtga acgagctggt gcgcgtgacc 2640 tctgaaggcg ctggactgca gctgcagaaa gtgaccgtgc tgggagtggc cacagcccct 2700 cagcaggtgc tgtctaatgg cgtgcccgtg tccaacttca cctacagccc cgacaccaag 2760 gtgctggaca tctgcgtgtc actgctgatg ggagagcagt ttctggtgtc ctggtgctga 2820 2820 <210> 20 <211> 4300 <212> DNA <213> Artificial Sequence <220> <223> construct: sp7+hGAAco1-delta-8 <400> 20 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360 gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420 acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480 cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540 gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600 gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660 aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720 agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780 cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840 tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900 acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960 gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020 taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080 agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140 gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200 acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260 ctttggcaaa gcacgcgtgc caccatggcc tttctgtggc tgctgagctg ttgggccctg 1320 ctgggcacca ccttcggcct actagtgccc agagagctga gcggcagctc tcccgtgctg 1380 gaagaaacac accctgccca tcagcagggc gcctctagac ctggacctag agatgcccag 1440 gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 1500 ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 1560 tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 1620 ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 1680 gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 1740 gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 1800 agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 1860 agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 1920 gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 1980 accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 2040 agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 2100 aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 2160 gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 2220 tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 2280 gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 2340 ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 2400 aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 2460 agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 2520 gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 2580 ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 2640 aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 2700 ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 2760 gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 2820 gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 2880 ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 2940 aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 3000 gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 3060 gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 3120 gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 3180 ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 3240 ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 3300 cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 3360 tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 3420 gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 3480 ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 3540 ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 3600 cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 3660 cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 3720 ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 3780 ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 3840 agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 3900 gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 3960 gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 4020 cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 4080 tcctggtgct gactcgagag atctaccggt gaattcaccg cgggtttaaa ctgtgccttc 4140 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4200 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4260 tcattctatt ctggggggtg gggtgggggc tagctctaga 4300 <210> 21 <211> 4321 <212> DNA <213> Artificial Sequence <220> <223> construct: sp6+hGAAco1-delta-8 <400> 21 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360 gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420 acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480 cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540 gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600 gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660 aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720 agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780 cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840 tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900 acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960 gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020 taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080 agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140 gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200 acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260 ctttggcaaa gcacgcgtgc caccatgcct ccacctagaa caggcagagg cctgctgtgg 1320 ctgggcctgg tgctgtctag tgtgtgtgtg gccctgggcc tactagtgcc cagagagctg 1380 agcggcagct ctcccgtgct ggaagaaaca caccctgccc atcagcaggg cgcctctaga 1440 cctggaccta gagatgccca ggcccacccc ggcagaccta gagctgtgcc tacccagtgt 1500 gacgtgcccc ccaacagcag attcgactgc gcccctgaca aggccatcac ccaggaacag 1560 tgcgaggcca gaggctgctg ctacatccct gccaagcagg gactgcaggg cgctcagatg 1620 ggacagccct ggtgcttctt cccaccctcc taccccagct acaagctgga aaacctgagc 1680 agcagcgaga tgggctacac cgccaccctg accagaacca cccccacatt cttcccaaag 1740 gacatcctga ccctgcggct ggacgtgatg atggaaaccg agaaccggct gcacttcacc 1800 atcaaggacc ccgccaatcg gagatacgag gtgcccctgg aaacccccca cgtgcactct 1860 agagccccca gccctctgta cagcgtggaa ttcagcgagg aacccttcgg cgtgatcgtg 1920 cggagacagc tggatggcag agtgctgctg aacaccaccg tggcccctct gttcttcgcc 1980 gaccagttcc tgcagctgag caccagcctg cccagccagt acatcacagg actggccgag 2040 cacctgagcc ccctgatgct gagcacatcc tggacccgga tcaccctgtg gaacagggat 2100 ctggccccta cccctggcgc caatctgtac ggcagccacc ctttctacct ggccctggaa 2160 gatggcggat ctgcccacgg agtgtttctg ctgaactcca acgccatgga cgtggtgctg 2220 cagcctagcc ctgccctgtc ttggagaagc acaggcggca tcctggatgt gtacatcttt 2280 ctgggccccg agcccaagag cgtggtgcag cagtatctgg atgtcgtggg ctaccccttc 2340 atgccccctt actggggcct gggattccac ctgtgcagat ggggctactc cagcaccgcc 2400 atcaccagac aggtggtgga aaacatgacc agagcccact tcccactgga tgtgcagtgg 2460 aacgacctgg actacatgga cagcagacgg gacttcacct tcaacaagga cggcttccgg 2520 gacttccccg ccatggtgca ggaactgcat cagggcggca gacggtacat gatgatcgtg 2580 gatcccgcca tcagctcctc tggccctgcc ggctcttaca gaccctacga cgagggcctg 2640 cggagaggcg tgttcatcac caacgagaca ggccagcccc tgatcggcaa agtgtggcct 2700 ggcagcacag ccttccccga cttcaccaat cctaccgccc tggcttggtg ggaggacatg 2760 gtggccgagt tccacgacca ggtgcccttc gacggcatgt ggatcgacat gaacgagccc 2820 agcaacttca tccggggcag cgaggatggc tgccccaaca acgaactgga aaatccccct 2880 tacgtgcccg gcgtcgtggg cggaacactg caggccgcta caatctgtgc cagcagccac 2940 cagtttctga gcacccacta caacctgcac aacctgtacg gcctgaccga ggccattgcc 3000 agccaccgcg ctctcgtgaa agccagaggc acacggccct tcgtgatcag cagaagcacc 3060 tttgccggcc acggcagata cgccggacat tggactggcg acgtgtggtc ctcttgggag 3120 cagctggcct ctagcgtgcc cgagatcctg cagttcaatc tgctgggcgt gccactcgtg 3180 ggcgccgatg tgtgtggctt cctgggcaac acctccgagg aactgtgtgt gcggtggaca 3240 cagctgggcg ccttctaccc tttcatgaga aaccacaaca gcctgctgag cctgccccag 3300 gaaccctaca gctttagcga gcctgcacag caggccatgc ggaaggccct gacactgaga 3360 tacgctctgc tgccccacct gtacaccctg tttcaccagg cccatgtggc cggcgagaca 3420 gtggccagac ctctgtttct ggaattcccc aaggacagca gcacctggac cgtggaccat 3480 cagctgctgt ggggagaggc tctgctgatt accccagtgc tgcaggcagg caaggccgaa 3540 gtgaccggct actttcccct gggcacttgg tacgacctgc agaccgtgcc tgtggaagcc 3600 ctgggatctc tgcctccacc tcctgccgct cctagagagc ctgccattca ctctgagggc 3660 cagtgggtca cactgcctgc ccccctggat accatcaacg tgcacctgag ggccggctac 3720 atcataccac tgcagggacc tggcctgacc accaccgagt ctagacagca gccaatggcc 3780 ctggccgtgg ccctgaccaa aggcggagaa gctaggggcg agctgttctg ggacgatggc 3840 gagagcctgg aagtgctgga aagaggcgcc tatacccaag tgatcttcct ggcccggaac 3900 aacaccatcg tgaacgagct ggtgcgcgtg acctctgaag gcgctggact gcagctgcag 3960 aaagtgaccg tgctgggagt ggccacagcc cctcagcagg tgctgtctaa tggcgtgccc 4020 gtgtccaact tcacctacag ccccgacacc aaggtgctgg acatctgcgt gtcactgctg 4080 atgggagagc agtttctggt gtcctggtgc tgactcgaga gatctaccgg tgaattcacc 4140 gcgggtttaa actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 4200 ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 4260 atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggg ctagctctag 4320 a 4321 <210> 22 <211> 4312 <212> DNA <213> Artificial Sequence <220> <223> sp8+hGAAco1-delta-8 <400> 22 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360 gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420 acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480 cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540 gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600 gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660 aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720 agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780 cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840 tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900 acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960 gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020 taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080 agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140 gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200 acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260 ctttggcaaa gcacgcgtgc caccatggcc agcagactga ccctgctgac actccttctg 1320 ctgctgctgg ccggcgatag agccagcagc ctactagtgc ccagagagct gagcggcagc 1380 tctcccgtgc tggaagaaac acaccctgcc catcagcagg gcgcctctag acctggacct 1440 agagatgccc aggcccaccc cggcagacct agagctgtgc ctacccagtg tgacgtgccc 1500 cccaacagca gattcgactg cgcccctgac aaggccatca cccaggaaca gtgcgaggcc 1560 agaggctgct gctacatccc tgccaagcag ggactgcagg gcgctcagat gggacagccc 1620 tggtgcttct tcccaccctc ctaccccagc tacaagctgg aaaacctgag cagcagcgag 1680 atgggctaca ccgccaccct gaccagaacc acccccacat tcttcccaaa ggacatcctg 1740 accctgcggc tggacgtgat gatggaaacc gagaaccggc tgcacttcac catcaaggac 1800 cccgccaatc ggagatacga ggtgcccctg gaaacccccc acgtgcactc tagagccccc 1860 agccctctgt acagcgtgga attcagcgag gaacccttcg gcgtgatcgt gcggagacag 1920 ctggatggca gagtgctgct gaacaccacc gtggcccctc tgttcttcgc cgaccagttc 1980 ctgcagctga gcaccagcct gcccagccag tacatcacag gactggccga gcacctgagc 2040 cccctgatgc tgagcacatc ctggacccgg atcaccctgt ggaacaggga tctggcccct 2100 acccctggcg ccaatctgta cggcagccac cctttctacc tggccctgga agatggcgga 2160 tctgcccacg gagtgtttct gctgaactcc aacgccatgg acgtggtgct gcagcctagc 2220 cctgccctgt cttggagaag cacaggcggc atcctggatg tgtacatctt tctgggcccc 2280 gagcccaaga gcgtggtgca gcagtatctg gatgtcgtgg gctacccctt catgccccct 2340 tactggggcc tgggattcca cctgtgcaga tggggctact ccagcaccgc catcaccaga 2400 caggtggtgg aaaacatgac cagagcccac ttcccactgg atgtgcagtg gaacgacctg 2460 gactacatgg acagcagacg ggacttcacc ttcaacaagg acggcttccg ggacttcccc 2520 gccatggtgc aggaactgca tcagggcggc agacggtaca tgatgatcgt ggatcccgcc 2580 atcagctcct ctggccctgc cggctcttac agaccctacg acgagggcct gcggagaggc 2640 gtgttcatca ccaacgagac aggccagccc ctgatcggca aagtgtggcc tggcagcaca 2700 gccttccccg acttcaccaa tcctaccgcc ctggcttggt gggaggacat ggtggccgag 2760 ttccacgacc aggtgccctt cgacggcatg tggatcgaca tgaacgagcc cagcaacttc 2820 atccggggca gcgaggatgg ctgccccaac aacgaactgg aaaatccccc ttacgtgccc 2880 ggcgtcgtgg gcggaacact gcaggccgct acaatctgtg ccagcagcca ccagtttctg 2940 agcacccact acaacctgca caacctgtac ggcctgaccg aggccattgc cagccaccgc 3000 gctctcgtga aagccagagg cacacggccc ttcgtgatca gcagaagcac ctttgccggc 3060 cacggcagat acgccggaca ttggactggc gacgtgtggt cctcttggga gcagctggcc 3120 tctagcgtgc ccgagatcct gcagttcaat ctgctgggcg tgccactcgt gggcgccgat 3180 gtgtgtggct tcctgggcaa cacctccgag gaactgtgtg tgcggtggac acagctgggc 3240 gccttctacc ctttcatgag aaaccacaac agcctgctga gcctgcccca ggaaccctac 3300 agctttagcg agcctgcaca gcaggccatg cggaaggccc tgacactgag atacgctctg 3360 ctgccccacc tgtacaccct gtttcaccag gcccatgtgg ccggcgagac agtggccaga 3420 cctctgtttc tggaattccc caaggacagc agcacctgga ccgtggacca tcagctgctg 3480 tggggagagg ctctgctgat taccccagtg ctgcaggcag gcaaggccga agtgaccggc 3540 tactttcccc tgggcacttg gtacgacctg cagaccgtgc ctgtggaagc cctgggatct 3600 ctgcctccac ctcctgccgc tcctagagag cctgccattc actctgaggg ccagtgggtc 3660 acactgcctg cccccctgga taccatcaac gtgcacctga gggccggcta catcatacca 3720 ctgcagggac ctggcctgac caccaccgag tctagacagc agccaatggc cctggccgtg 3780 gccctgacca aaggcggaga agctaggggc gagctgttct gggacgatgg cgagagcctg 3840 gaagtgctgg aaagaggcgc ctatacccaa gtgatcttcc tggcccggaa caacaccatc 3900 gtgaacgagc tggtgcgcgt gacctctgaa ggcgctggac tgcagctgca gaaagtgacc 3960 gtgctgggag tggccacagc ccctcagcag gtgctgtcta atggcgtgcc cgtgtccaac 4020 ttcacctaca gccccgacac caaggtgctg gacatctgcg tgtcactgct gatgggagag 4080 cagtttctgg tgtcctggtg ctgactcgag agatctaccg gtgaattcac cgcgggttta 4140 aactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 4200 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 4260 tctgagtagg tgtcattcta ttctgggggg tggggtgggg gctagctcta ga 4312 <210> 23 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> sp3 <400> 23 Met Leu Leu Leu Ser Ala Leu Leu Leu Gly Leu Ala Phe Gly Tyr Ser 1 5 10 15 <210> 24 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> sp4 <400> 24 Met Leu Leu Ser Phe Ala Leu Leu Leu Gly Leu Ala Leu Gly Tyr Ser 1 5 10 15 <210> 25 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> sp5 <400> 25 Met Leu Leu Glu His Ala Leu Leu Leu Gly Leu Ala His Gly Tyr Ser 1 5 10 15 <210> 26 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> sp7 <400> 26 atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggc 54 <210> 27 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> sp6 <400> 27 atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60 tgtgtggccc tgggc 75 <210> 28 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> sp8 <400> 28 atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60 agcagc 66 <210> 29 <211> 917 <212> PRT <213> Artificial Sequence <220> <223> hGAA-delta-8 <400> 29 Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val Leu Glu Glu 1 5 10 15 Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp 20 25 30 Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp 35 40 45 Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr 50 55 60 Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln 65 70 75 80 Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro 85 90 95 Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly 100 105 110 Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp 115 120 125 Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu 130 135 140 His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu 145 150 155 160 Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val 165 170 175 Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp 180 185 190 Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp 195 200 205 Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly 210 215 220 Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg 225 230 235 240 Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu 245 250 255 Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala 260 265 270 His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln 275 280 285 Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val 290 295 300 Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu 305 310 315 320 Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe 325 330 335 His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val 340 345 350 Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn 355 360 365 Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp 370 375 380 Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly 385 390 395 400 Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro 405 410 415 Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe 420 425 430 Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly 435 440 445 Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp 450 455 460 Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met 465 470 475 480 Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp 485 490 495 Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val 500 505 510 Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln 515 520 525 Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu 530 535 540 Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro 545 550 555 560 Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly 565 570 575 His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser 580 585 590 Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly 595 600 605 Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val 610 615 620 Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn 625 630 635 640 Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala 645 650 655 Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro 660 665 670 His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val 675 680 685 Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr 690 695 700 Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val 705 710 715 720 Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr 725 730 735 Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro 740 745 750 Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln 755 760 765 Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg 770 775 780 Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu 785 790 795 800 Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly 805 810 815 Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val 820 825 830 Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn 835 840 845 Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu 850 855 860 Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln 865 870 875 880 Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp 885 890 895 Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe 900 905 910 Leu Val Ser Trp Cys 915 <210> 30 <211> 883 <212> PRT <213> Artificial Sequence <220> <223> hGAA-delta-42 <400> 30 Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro 1 5 10 15 Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu 20 25 30 Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu 35 40 45 Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr 50 55 60 Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr 65 70 75 80 Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu 85 90 95 Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe 100 105 110 Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr 115 120 125 Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe 130 135 140 Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg 145 150 155 160 Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe 165 170 175 Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala 180 185 190 Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr 195 200 205 Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly 210 215 220 Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly 225 230 235 240 Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser 245 250 255 Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile 260 265 270 Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val 275 280 285 Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu 290 295 300 Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu 305 310 315 320 Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu 325 330 335 Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe 340 345 350 Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg 355 360 365 Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly 370 375 380 Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr 385 390 395 400 Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr 405 410 415 Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp 420 425 430 Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile 435 440 445 Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys 450 455 460 Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly 465 470 475 480 Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu 485 490 495 Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile 500 505 510 Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val 515 520 525 Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp 530 535 540 Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro 545 550 555 560 Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp 565 570 575 Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp 580 585 590 Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu 595 600 605 Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln 610 615 620 Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu 625 630 635 640 Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg 645 650 655 Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp 660 665 670 His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln 675 680 685 Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr 690 695 700 Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro 705 710 715 720 Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val 725 730 735 Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly 740 745 750 Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg 755 760 765 Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala 770 775 780 Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu 785 790 795 800 Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile 805 810 815 Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu 820 825 830 Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu 835 840 845 Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys 850 855 860 Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val 865 870 875 880 Ser Trp Cys <210> 31 <211> 2778 <212> DNA <213> hGAAwt w/o sp <400> 31 gggcacatcc tactccatga tttcctgctg gttccccgag agctgagtgg ctcctcccca 60 gtcctggagg agactcaccc agctcaccag cagggagcca gcagaccagg gccccgggat 120 gcccaggcac accccgggcg gccgcgagca gtgcccacac agtgcgacgt cccccccaac 180 agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 240 tgttgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 300 ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 360 tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 420 cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 480 aacaggcgct acgaggtgcc cttggagacc ccgcatgtcc acagccgggc accgtcccca 540 ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcgccg gcagctggac 600 ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 660 ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 720 atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 780 ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 840 cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 900 cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 960 aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1020 ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1080 gtggagaaca tgaccagggc ccacttcccc ctggacgtcc agtggaacga cctggactac 1140 atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1200 gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 1260 agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 1320 atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 1380 cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 1440 gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcagg 1500 ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 1560 gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 1620 cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 1680 gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 1740 cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 1800 gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 1860 ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 1920 taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 1980 agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2040 cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2100 ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2160 gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 2220 cccttgggca catggtacga cctgcagacg gtgccagtag aggcccttgg cagcctccca 2280 cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 2340 ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 2400 ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 2460 accaagggtg gggaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 2520 ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 2580 gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 2640 ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 2700 tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 2760 ctcgtcagct ggtgttag 2778 <210> 32 <211> 2754 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1-delta-8 w/o sp <400> 32 ctactagtgc ccagagagct gagcggcagc tctcccgtgc tggaagaaac acaccctgcc 60 catcagcagg gcgcctctag acctggacct agagatgccc aggcccaccc cggcagacct 120 agagctgtgc ctacccagtg tgacgtgccc cccaacagca gattcgactg cgcccctgac 180 aaggccatca cccaggaaca gtgcgaggcc agaggctgct gctacatccc tgccaagcag 240 ggactgcagg gcgctcagat gggacagccc tggtgcttct tcccaccctc ctaccccagc 300 tacaagctgg aaaacctgag cagcagcgag atgggctaca ccgccaccct gaccagaacc 360 acccccacat tcttcccaaa ggacatcctg accctgcggc tggacgtgat gatggaaacc 420 gagaaccggc tgcacttcac catcaaggac cccgccaatc ggagatacga ggtgcccctg 480 gaaacccccc acgtgcactc tagagccccc agccctctgt acagcgtgga attcagcgag 540 gaacccttcg gcgtgatcgt gcggagacag ctggatggca gagtgctgct gaacaccacc 600 gtggcccctc tgttcttcgc cgaccagttc ctgcagctga gcaccagcct gcccagccag 660 tacatcacag gactggccga gcacctgagc cccctgatgc tgagcacatc ctggacccgg 720 atcaccctgt ggaacaggga tctggcccct acccctggcg ccaatctgta cggcagccac 780 cctttctacc tggccctgga agatggcgga tctgcccacg gagtgtttct gctgaactcc 840 aacgccatgg acgtggtgct gcagcctagc cctgccctgt cttggagaag cacaggcggc 900 atcctggatg tgtacatctt tctgggcccc gagcccaaga gcgtggtgca gcagtatctg 960 gatgtcgtgg gctacccctt catgccccct tactggggcc tgggattcca cctgtgcaga 1020 tggggctact ccagcaccgc catcaccaga caggtggtgg aaaacatgac cagagcccac 1080 ttcccactgg atgtgcagtg gaacgacctg gactacatgg acagcagacg ggacttcacc 1140 ttcaacaagg acggcttccg ggacttcccc gccatggtgc aggaactgca tcagggcggc 1200 agacggtaca tgatgatcgt ggatcccgcc atcagctcct ctggccctgc cggctcttac 1260 agaccctacg acgagggcct gcggagaggc gtgttcatca ccaacgagac aggccagccc 1320 ctgatcggca aagtgtggcc tggcagcaca gccttccccg acttcaccaa tcctaccgcc 1380 ctggcttggt gggaggacat ggtggccgag ttccacgacc aggtgccctt cgacggcatg 1440 tggatcgaca tgaacgagcc cagcaacttc atccggggca gcgaggatgg ctgccccaac 1500 aacgaactgg aaaatccccc ttacgtgccc ggcgtcgtgg gcggaacact gcaggccgct 1560 acaatctgtg ccagcagcca ccagtttctg agcacccact acaacctgca caacctgtac 1620 ggcctgaccg aggccattgc cagccaccgc gctctcgtga aagccagagg cacacggccc 1680 ttcgtgatca gcagaagcac ctttgccggc cacggcagat acgccggaca ttggactggc 1740 gacgtgtggt cctcttggga gcagctggcc tctagcgtgc ccgagatcct gcagttcaat 1800 ctgctgggcg tgccactcgt gggcgccgat gtgtgtggct tcctgggcaa cacctccgag 1860 gaactgtgtg tgcggtggac acagctgggc gccttctacc ctttcatgag aaaccacaac 1920 agcctgctga gcctgcccca ggaaccctac agctttagcg agcctgcaca gcaggccatg 1980 cggaaggccc tgacactgag atacgctctg ctgccccacc tgtacaccct gtttcaccag 2040 gcccatgtgg ccggcgagac agtggccaga cctctgtttc tggaattccc caaggacagc 2100 agcacctgga ccgtggacca tcagctgctg tggggagagg ctctgctgat taccccagtg 2160 ctgcaggcag gcaaggccga agtgaccggc tactttcccc tgggcacttg gtacgacctg 2220 cagaccgtgc ctgtggaagc cctgggatct ctgcctccac ctcctgccgc tcctagagag 2280 cctgccattc actctgaggg ccagtgggtc acactgcctg cccccctgga taccatcaac 2340 gtgcacctga gggccggcta catcatacca ctgcagggac ctggcctgac caccaccgag 2400 tctagacagc agccaatggc cctggccgtg gccctgacca aaggcggaga agctaggggc 2460 gagctgttct gggacgatgg cgagagcctg gaagtgctgg aaagaggcgc ctatacccaa 2520 gtgatcttcc tggcccggaa caacaccatc gtgaacgagc tggtgcgcgt gacctctgaa 2580 ggcgctggac tgcagctgca gaaagtgacc gtgctgggag tggccacagc ccctcagcag 2640 gtgctgtcta atggcgtgcc cgtgtccaac ttcacctaca gccccgacac caaggtgctg 2700 gacatctgcg tgtcactgct gatgggagag cagtttctgg tgtcctggtg ctga 2754 <210> 33 <211> 2652 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1-delta-42 w/o sp <400> 33 gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 60 ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 120 tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 180 ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 240 gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 300 gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 360 agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 420 agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 480 gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 540 accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 600 agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 660 aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 720 gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 780 tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 840 gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 900 ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 960 aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 1020 agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 1080 gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 1140 ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 1200 aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 1260 ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 1320 gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 1380 gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 1440 ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 1500 aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 1560 gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 1620 gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 1680 gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 1740 ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 1800 ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 1860 cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 1920 tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 1980 gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 2040 ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 2100 ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 2160 cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 2220 cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 2280 ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 2340 ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 2400 agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 2460 gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 2520 gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 2580 cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 2640 tcctggtgct ga 2652 <210> 34 <211> 2754 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2-delta-8 <400> 34 ctgttggtgc ctagagagct gagcggatca tccccagtgc tggaggagac tcatcctgct 60 caccaacagg gagcttccag accaggaccg agagacgccc aagcccatcc tggtagacca 120 agagctgtgc ctacccaatg cgacgtgcca cccaactccc gattcgactg cgcgccagat 180 aaggctatta cccaagagca gtgtgaagcc agaggttgct gctacatccc agcgaagcaa 240 ggattgcaag gcgcccaaat gggacaacct tggtgtttct tccccccttc gtacccatca 300 tataaactcg aaaacctgtc ctcttcggaa atgggttata ctgccaccct caccagaact 360 actcctactt tcttcccgaa agacatcttg accttgaggc tggacgtgat gatggagact 420 gaaaaccggc tgcatttcac tatcaaagat cctgccaatc ggcgatacga ggtccctctg 480 gaaacccctc acgtgcactc acgggctcct tctccgcttt actccgtcga attctctgag 540 gaacccttcg gagtgatcgt tagacgccag ctggatggta gagtgctgtt gaacactact 600 gtggccccac ttttcttcgc tgaccagttt ctgcaactgt ccacttccct gccatcccag 660 tacattactg gactcgccga acacctgtcg ccactgatgc tctcgacctc ttggactaga 720 atcactttgt ggaacagaga cttggcccct actccgggag caaatctgta cggaagccac 780 cctttttacc tggcgctcga agatggcgga tccgctcacg gagtgttcct gctgaatagc 840 aacgcaatgg acgtggtgct gcaaccttcc cctgcactca gttggagaag taccgggggt 900 attctggacg tgtacatctt cctcggacca gaacccaaga gcgtggtgca gcaatatctg 960 gacgtggtcg gatacccttt tatgcctcct tactggggac tgggattcca cctttgccgt 1020 tggggctact catccaccgc cattaccaga caggtggtgg agaatatgac cagagcccac 1080 ttccctctcg acgtgcagtg gaacgatctg gactatatgg actcccggag agatttcacc 1140 ttcaacaagg acgggttccg cgattttccc gcgatggttc aagagctcca ccagggtggt 1200 cgaagatata tgatgatcgt cgacccagcc atttcgagca gcggacccgc tggatcttat 1260 agaccttacg acgaaggcct taggagagga gtgttcatca caaacgagac tggacagcct 1320 ttgatcggta aagtgtggcc tggatcaacc gcctttcctg actttaccaa tcccactgcc 1380 ttggcttggt gggaggacat ggtggccgaa ttccacgacc aagtcccctt tgatggaatg 1440 tggatcgata tgaacgaacc aagcaatttt atcagaggtt ccgaagacgg ttgccccaac 1500 aacgaactgg aaaaccctcc ttatgtgccc ggagtcgtgg gcggaacatt acaggccgcg 1560 actatttgcg ccagcagcca ccaattcctg tccactcact acaacctcca caacctttat 1620 ggattaaccg aagctattgc aagtcacagg gctctggtga aggctagagg gactaggccc 1680 tttgtgatct cccgatccac ctttgccgga cacgggagat acgccggtca ctggactggt 1740 gacgtgtgga gctcatggga acaactggcc tcctccgtgc cggaaatctt acagttcaac 1800 cttctgggtg tccctcttgt cggagcagac gtgtgtgggt ttcttggtaa cacctccgag 1860 gaactgtgtg tgcgctggac tcaactgggt gcattctacc cattcatgag aaaccacaac 1920 tccttgctgt ccctgccaca agagccctac tcgttcagcg agcctgcaca acaggctatg 1980 cggaaggcac tgaccctgag atacgccctg cttccacact tatacactct cttccatcaa 2040 gcgcatgtgg caggagaaac cgttgcaagg cctcttttcc ttgaattccc caaggattcc 2100 tcgacttgga cggtggatca tcagctgctg tggggagaag ctctgctgat tactccagtg 2160 ttgcaagccg gaaaagctga ggtgaccgga tactttccgc tgggaacctg gtacgacctc 2220 cagactgtcc ctgttgaagc ccttggatca ctgcctccgc ctccggcagc tccacgcgaa 2280 ccagctatac attccgaggg acagtgggtt acattaccag ctcctctgga cacaatcaac 2340 gtccacttaa gagctggcta cattatccct ctgcaaggac caggactgac tacgaccgag 2400 agcagacagc agccaatggc actggctgtg gctctgacca agggagggga agctagagga 2460 gaactcttct gggatgatgg ggagtccctt gaagtgctgg aaagaggcgc ttacactcaa 2520 gtcattttcc ttgcacggaa caacaccatt gtgaacgaat tggtgcgagt gaccagcgaa 2580 ggagctggac ttcaactgca gaaggtcact gtgctcggag tggctaccgc tcctcagcaa 2640 gtgctgtcga atggagtccc cgtgtcaaac tttacctact cccctgacac taaggtgctc 2700 gacatttgcg tgtccctcct gatgggagag cagttccttg tgtcctggtg ttga 2754 <210> 35 <211> 2652 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2-delta-42 <400> 35 gcccatcctg gtagaccaag agctgtgcct acccaatgcg acgtgccacc caactcccga 60 ttcgactgcg cgccagataa ggctattacc caagagcagt gtgaagccag aggttgctgc 120 tacatcccag cgaagcaagg attgcaaggc gcccaaatgg gacaaccttg gtgtttcttc 180 cccccttcgt acccatcata taaactcgaa aacctgtcct cttcggaaat gggttatact 240 gccaccctca ccagaactac tcctactttc ttcccgaaag acatcttgac cttgaggctg 300 gacgtgatga tggagactga aaaccggctg catttcacta tcaaagatcc tgccaatcgg 360 cgatacgagg tccctctgga aacccctcac gtgcactcac gggctccttc tccgctttac 420 tccgtcgaat tctctgagga acccttcgga gtgatcgtta gacgccagct ggatggtaga 480 gtgctgttga acactactgt ggccccactt ttcttcgctg accagtttct gcaactgtcc 540 acttccctgc catcccagta cattactgga ctcgccgaac acctgtcgcc actgatgctc 600 tcgacctctt ggactagaat cactttgtgg aacagagact tggcccctac tccgggagca 660 aatctgtacg gaagccaccc tttttacctg gcgctcgaag atggcggatc cgctcacgga 720 gtgttcctgc tgaatagcaa cgcaatggac gtggtgctgc aaccttcccc tgcactcagt 780 tggagaagta ccgggggtat tctggacgtg tacatcttcc tcggaccaga acccaagagc 840 gtggtgcagc aatatctgga cgtggtcgga taccctttta tgcctcctta ctggggactg 900 ggattccacc tttgccgttg gggctactca tccaccgcca ttaccagaca ggtggtggag 960 aatatgacca gagcccactt ccctctcgac gtgcagtgga acgatctgga ctatatggac 1020 tcccggagag atttcacctt caacaaggac gggttccgcg attttcccgc gatggttcaa 1080 gagctccacc agggtggtcg aagatatatg atgatcgtcg acccagccat ttcgagcagc 1140 ggacccgctg gatcttatag accttacgac gaaggcctta ggagaggagt gttcatcaca 1200 aacgagactg gacagccttt gatcggtaaa gtgtggcctg gatcaaccgc ctttcctgac 1260 tttaccaatc ccactgcctt ggcttggtgg gaggacatgg tggccgaatt ccacgaccaa 1320 gtcccctttg atggaatgtg gatcgatatg aacgaaccaa gcaattttat cagaggttcc 1380 gaagacggtt gccccaacaa cgaactggaa aaccctcctt atgtgcccgg agtcgtgggc 1440 ggaacattac aggccgcgac tatttgcgcc agcagccacc aattcctgtc cactcactac 1500 aacctccaca acctttatgg attaaccgaa gctattgcaa gtcacagggc tctggtgaag 1560 gctagaggga ctaggccctt tgtgatctcc cgatccacct ttgccggaca cgggagatac 1620 gccggtcact ggactggtga cgtgtggagc tcatgggaac aactggcctc ctccgtgccg 1680 gaaatcttac agttcaacct tctgggtgtc cctcttgtcg gagcagacgt gtgtgggttt 1740 cttggtaaca cctccgagga actgtgtgtg cgctggactc aactgggtgc attctaccca 1800 ttcatgagaa accacaactc cttgctgtcc ctgccacaag agccctactc gttcagcgag 1860 cctgcacaac aggctatgcg gaaggcactg accctgagat acgccctgct tccacactta 1920 tacactctct tccatcaagc gcatgtggca ggagaaaccg ttgcaaggcc tcttttcctt 1980 gaattcccca aggattcctc gacttggacg gtggatcatc agctgctgtg gggagaagct 2040 ctgctgatta ctccagtgtt gcaagccgga aaagctgagg tgaccggata ctttccgctg 2100 ggaacctggt acgacctcca gactgtccct gttgaagccc ttggatcact gcctccgcct 2160 ccggcagctc cacgcgaacc agctatacat tccgagggac agtgggttac attaccagct 2220 cctctggaca caatcaacgt ccacttaaga gctggctaca ttatccctct gcaaggacca 2280 ggactgacta cgaccgagag cagacagcag ccaatggcac tggctgtggc tctgaccaag 2340 ggaggggaag ctagaggaga actcttctgg gatgatgggg agtcccttga agtgctggaa 2400 agaggcgctt acactcaagt cattttcctt gcacggaaca acaccattgt gaacgaattg 2460 gtgcgagtga ccagcgaagg agctggactt caactgcaga aggtcactgt gctcggagtg 2520 gctaccgctc ctcagcaagt gctgtcgaat ggagtccccg tgtcaaactt tacctactcc 2580 cctgacacta aggtgctcga catttgcgtg tccctcctga tgggagagca gttccttgtg 2640 tcctggtgtt ga 2652 <210> 36 <211> 925 <212> PRT <213> Artificial Sequence <220> <223> variant hGAAwt w/o sp <400> 36 Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser 1 5 10 15 Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly 20 25 30 Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro 35 40 45 Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp 50 55 60 Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly 65 70 75 80 Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly 85 90 95 Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu 100 105 110 Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr 115 120 125 Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val 130 135 140 Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala 145 150 155 160 Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg 165 170 175 Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly 180 185 190 Val Ile Val His Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr 195 200 205 Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser 210 215 220 Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu 225 230 235 240 Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu 245 250 255 Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu 260 265 270 Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser 275 280 285 Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg 290 295 300 Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro 305 310 315 320 Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met 325 330 335 Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser 340 345 350 Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His 355 360 365 Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg 370 375 380 Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met 385 390 395 400 Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp 405 410 415 Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp 420 425 430 Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro 435 440 445 Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr 450 455 460 Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His 465 470 475 480 Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser 485 490 495 Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu 500 505 510 Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala 515 520 525 Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu 530 535 540 His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu 545 550 555 560 Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe 565 570 575 Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser 580 585 590 Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn 595 600 605 Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly 610 615 620 Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe 625 630 635 640 Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu 645 650 655 Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu 660 665 670 Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln 675 680 685 Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe 690 695 700 Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly 705 710 715 720 Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val 725 730 735 Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro 740 745 750 Ile Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu 755 760 765 Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu 770 775 780 Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln 785 790 795 800 Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu 805 810 815 Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp 820 825 830 Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln 835 840 845 Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg 850 855 860 Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu 865 870 875 880 Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val 885 890 895 Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val 900 905 910 Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys 915 920 925 <210> 37 <211> 952 <212> PRT <213> homo sapiens <400> 37 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly 930 935 940 Glu Gln Phe Leu Val Ser Trp Cys 945 950 <210> 38 <211> 952 <212> PRT <213> homo sapiens <400> 38 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly 930 935 940 Glu Gln Phe Leu Val Ser Trp Cys 945 950 <210> 39 <211> 957 <212> PRT <213> homo sapiens <400> 39 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Ala Arg Gly Pro Arg Val Leu Asp Ile Cys Val 930 935 940 Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys 945 950 955 <210> 40 <211> 952 <212> PRT <213> homo sapiens <400> 40 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Leu Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly 930 935 940 Glu Gln Phe Leu Val Ser Trp Cys 945 950 <210> 41 <211> 896 <212> PRT <213> Artificial Sequence <220> <223> hGAA-delta-29 <400> 41 Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro 1 5 10 15 Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser 20 25 30 Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu 35 40 45 Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala 50 55 60 Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr 65 70 75 80 Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu 85 90 95 Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg 100 105 110 Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys 115 120 125 Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val 130 135 140 His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu 145 150 155 160 Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu 165 170 175 Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu 180 185 190 Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu 195 200 205 Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn 210 215 220 Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro 225 230 235 240 Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu 245 250 255 Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu 260 265 270 Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly 275 280 285 Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr 290 295 300 Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp 305 310 315 320 Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr 325 330 335 Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met 340 345 350 Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe 355 360 365 Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met 370 375 380 Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg 385 390 395 400 Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr 405 410 415 Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro 420 425 430 Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala 435 440 445 Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn 450 455 460 Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn 465 470 475 480 Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu 485 490 495 Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His 500 505 510 Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His 515 520 525 Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg 530 535 540 Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp 545 550 555 560 Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu 565 570 575 Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly 580 585 590 Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu 595 600 605 Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu 610 615 620 Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg 625 630 635 640 Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu 645 650 655 Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe 660 665 670 Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu 675 680 685 Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys 690 695 700 Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln 705 710 715 720 Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala 725 730 735 Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro 740 745 750 Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile 755 760 765 Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro 770 775 780 Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu 785 790 795 800 Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala 805 810 815 Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu 820 825 830 Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val 835 840 845 Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly 850 855 860 Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp 865 870 875 880 Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys 885 890 895 <210> 42 <211> 882 <212> PRT <213> Artificial Sequence <220> <223> hGAA-delta-43 <400> 42 His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro 1 5 10 15 Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln 20 25 30 Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln 35 40 45 Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro 50 55 60 Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala 65 70 75 80 Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr 85 90 95 Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr 100 105 110 Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro 115 120 125 His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser 130 135 140 Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val 145 150 155 160 Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu 165 170 175 Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu 180 185 190 His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu 195 200 205 Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser 210 215 220 His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val 225 230 235 240 Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro 245 250 255 Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe 260 265 270 Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val 275 280 285 Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys 290 295 300 Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn 305 310 315 320 Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp 325 330 335 Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg 340 345 350 Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr 355 360 365 Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser 370 375 380 Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn 385 390 395 400 Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala 405 410 415 Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met 420 425 430 Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp 435 440 445 Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro 450 455 460 Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly 465 470 475 480 Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser 485 490 495 Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala 500 505 510 Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile 515 520 525 Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr 530 535 540 Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu 545 550 555 560 Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val 565 570 575 Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr 580 585 590 Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu 595 600 605 Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala 610 615 620 Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr 625 630 635 640 Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro 645 650 655 Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His 660 665 670 Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala 675 680 685 Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp 690 695 700 Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro 705 710 715 720 Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr 725 730 735 Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr 740 745 750 Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln 755 760 765 Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg 770 775 780 Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg 785 790 795 800 Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val 805 810 815 Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln 820 825 830 Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser 835 840 845 Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val 850 855 860 Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser 865 870 875 880 Trp Cys <210> 43 <211> 878 <212> PRT <213> Artificial Sequence <220> <223> hGAA-delta-47 <400> 43 Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe 1 5 10 15 Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg 20 25 30 Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met 35 40 45 Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu 50 55 60 Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg 65 70 75 80 Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp 85 90 95 Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro 100 105 110 Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser 115 120 125 Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe 130 135 140 Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr 145 150 155 160 Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr 165 170 175 Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro 180 185 190 Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp 195 200 205 Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr 210 215 220 Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn 225 230 235 240 Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp 245 250 255 Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu 260 265 270 Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe 275 280 285 Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr 290 295 300 Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala 305 310 315 320 His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser 325 330 335 Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala 340 345 350 Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val 355 360 365 Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr 370 375 380 Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln 385 390 395 400 Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe 405 410 415 Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe 420 425 430 His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro 435 440 445 Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu 450 455 460 Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala 465 470 475 480 Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn 485 490 495 Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala 500 505 510 Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr 515 520 525 Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp 530 535 540 Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe 545 550 555 560 Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu 565 570 575 Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala 580 585 590 Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln 595 600 605 Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala 610 615 620 Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His 625 630 635 640 Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu 645 650 655 Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp 660 665 670 Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu 675 680 685 Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val 690 695 700 Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg 705 710 715 720 Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro 725 730 735 Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu 740 745 750 Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala 755 760 765 Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe 770 775 780 Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr 785 790 795 800 Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val 805 810 815 Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val 820 825 830 Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro 835 840 845 Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys 850 855 860 Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys 865 870 875 <210> 44 <211> 2754 <212> DNA <213> Artificial Sequence <220> <223> hGAAwt-delta-8 <400> 44 ctgctggttc cccgagagct gagtggctcc tccccagtcc tggaggagac tcacccagct 60 caccagcagg gagccagcag accagggccc cgggatgccc aggcacaccc cgggcggccg 120 cgagcagtgc ccacacagtg cgacgtcccc cccaacagcc gcttcgattg cgcccctgac 180 aaggccatca cccaggaaca gtgcgaggcc cgcggctgtt gctacatccc tgcaaagcag 240 gggctgcagg gagcccagat ggggcagccc tggtgcttct tcccacccag ctaccccagc 300 tacaagctgg agaacctgag ctcctctgaa atgggctaca cggccaccct gacccgtacc 360 acccccacct tcttccccaa ggacatcctg accctgcggc tggacgtgat gatggagact 420 gagaaccgcc tccacttcac gatcaaagat ccagctaaca ggcgctacga ggtgcccttg 480 gagaccccgc atgtccacag ccgggcaccg tccccactct acagcgtgga gttctccgag 540 gagcccttcg gggtgatcgt gcgccggcag ctggacggcc gcgtgctgct gaacacgacg 600 gtggcgcccc tgttctttgc ggaccagttc cttcagctgt ccacctcgct gccctcgcag 660 tatatcacag gcctcgccga gcacctcagt cccctgatgc tcagcaccag ctggaccagg 720 atcaccctgt ggaaccggga ccttgcgccc acgcccggtg cgaacctcta cgggtctcac 780 cctttctacc tggcgctgga ggacggcggg tcggcacacg gggtgttcct gctaaacagc 840 aatgccatgg atgtggtcct gcagccgagc cctgccctta gctggaggtc gacaggtggg 900 atcctggatg tctacatctt cctgggccca gagcccaaga gcgtggtgca gcagtacctg 960 gacgttgtgg gatacccgtt catgccgcca tactggggcc tgggcttcca cctgtgccgc 1020 tggggctact cctccaccgc tatcacccgc caggtggtgg agaacatgac cagggcccac 1080 ttccccctgg acgtccagtg gaacgacctg gactacatgg actcccggag ggacttcacg 1140 ttcaacaagg atggcttccg ggacttcccg gccatggtgc aggagctgca ccagggcggc 1200 cggcgctaca tgatgatcgt ggatcctgcc atcagcagct cgggccctgc cgggagctac 1260 aggccctacg acgagggtct gcggaggggg gttttcatca ccaacgagac cggccagccg 1320 ctgattggga aggtatggcc cgggtccact gccttccccg acttcaccaa ccccacagcc 1380 ctggcctggt gggaggacat ggtggctgag ttccatgacc aggtgccctt cgacggcatg 1440 tggattgaca tgaacgagcc ttccaacttc atcaggggct ctgaggacgg ctgccccaac 1500 aatgagctgg agaacccacc ctacgtgcct ggggtggttg gggggaccct ccaggcggcc 1560 accatctgtg cctccagcca ccagtttctc tccacacact acaacctgca caacctctac 1620 ggcctgaccg aagccatcgc ctcccacagg gcgctggtga aggctcgggg gacacgccca 1680 tttgtgatct cccgctcgac ctttgctggc cacggccgat acgccggcca ctggacgggg 1740 gacgtgtgga gctcctggga gcagctcgcc tcctccgtgc cagaaatcct gcagtttaac 1800 ctgctggggg tgcctctggt cggggccgac gtctgcggct tcctgggcaa cacctcagag 1860 gagctgtgtg tgcgctggac ccagctgggg gccttctacc ccttcatgcg gaaccacaac 1920 agcctgctca gtctgcccca ggagccgtac agcttcagcg agccggccca gcaggccatg 1980 aggaaggccc tcaccctgcg ctacgcactc ctcccccacc tctacacact gttccaccag 2040 gcccacgtcg cgggggagac cgtggcccgg cccctcttcc tggagttccc caaggactct 2100 agcacctgga ctgtggacca ccagctcctg tggggggagg ccctgctcat caccccagtg 2160 ctccaggccg ggaaggccga agtgactggc tacttcccct tgggcacatg gtacgacctg 2220 cagacggtgc cagtagaggc ccttggcagc ctcccacccc cacctgcagc tccccgtgag 2280 ccagccatcc acagcgaggg gcagtgggtg acgctgccgg cccccctgga caccatcaac 2340 gtccacctcc gggctgggta catcatcccc ctgcagggcc ctggcctcac aaccacagag 2400 tcccgccagc agcccatggc cctggctgtg gccctgacca agggtgggga ggcccgaggg 2460 gagctgttct gggacgatgg agagagcctg gaagtgctgg agcgaggggc ctacacacag 2520 gtcatcttcc tggccaggaa taacacgatc gtgaatgagc tggtacgtgt gaccagtgag 2580 ggagctggcc tgcagctgca gaaggtgact gtcctgggcg tggccacggc gccccagcag 2640 gtcctctcca acggtgtccc tgtctccaac ttcacctaca gccccgacac caaggtcctg 2700 gacatctgtg tctcgctgtt gatgggagag cagtttctcg tcagctggtg ttag 2754 <210> 45 <211> 2691 <212> DNA <213> Artificial Sequence <220> <223> hGAAwt-delta-29 <400> 45 cagcagggag ccagcagacc agggccccgg gatgcccagg cacaccccgg gcggccgcga 60 gcagtgccca cacagtgcga cgtccccccc aacagccgct tcgattgcgc ccctgacaag 120 gccatcaccc aggaacagtg cgaggcccgc ggctgttgct acatccctgc aaagcagggg 180 ctgcagggag cccagatggg gcagccctgg tgcttcttcc cacccagcta ccccagctac 240 aagctggaga acctgagctc ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc 300 cccaccttct tccccaagga catcctgacc ctgcggctgg acgtgatgat ggagactgag 360 aaccgcctcc acttcacgat caaagatcca gctaacaggc gctacgaggt gcccttggag 420 accccgcatg tccacagccg ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag 480 cccttcgggg tgatcgtgcg ccggcagctg gacggccgcg tgctgctgaa cacgacggtg 540 gcgcccctgt tctttgcgga ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat 600 atcacaggcc tcgccgagca cctcagtccc ctgatgctca gcaccagctg gaccaggatc 660 accctgtgga accgggacct tgcgcccacg cccggtgcga acctctacgg gtctcaccct 720 ttctacctgg cgctggagga cggcgggtcg gcacacgggg tgttcctgct aaacagcaat 780 gccatggatg tggtcctgca gccgagccct gcccttagct ggaggtcgac aggtgggatc 840 ctggatgtct acatcttcct gggcccagag cccaagagcg tggtgcagca gtacctggac 900 gttgtgggat acccgttcat gccgccatac tggggcctgg gcttccacct gtgccgctgg 960 ggctactcct ccaccgctat cacccgccag gtggtggaga acatgaccag ggcccacttc 1020 cccctggacg tccagtggaa cgacctggac tacatggact cccggaggga cttcacgttc 1080 aacaaggatg gcttccggga cttcccggcc atggtgcagg agctgcacca gggcggccgg 1140 cgctacatga tgatcgtgga tcctgccatc agcagctcgg gccctgccgg gagctacagg 1200 ccctacgacg agggtctgcg gaggggggtt ttcatcacca acgagaccgg ccagccgctg 1260 attgggaagg tatggcccgg gtccactgcc ttccccgact tcaccaaccc cacagccctg 1320 gcctggtggg aggacatggt ggctgagttc catgaccagg tgcccttcga cggcatgtgg 1380 attgacatga acgagccttc caacttcatc aggggctctg aggacggctg ccccaacaat 1440 gagctggaga acccacccta cgtgcctggg gtggttgggg ggaccctcca ggcggccacc 1500 atctgtgcct ccagccacca gtttctctcc acacactaca acctgcacaa cctctacggc 1560 ctgaccgaag ccatcgcctc ccacagggcg ctggtgaagg ctcgggggac acgcccattt 1620 gtgatctccc gctcgacctt tgctggccac ggccgatacg ccggccactg gacgggggac 1680 gtgtggagct cctgggagca gctcgcctcc tccgtgccag aaatcctgca gtttaacctg 1740 ctgggggtgc ctctggtcgg ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag 1800 ctgtgtgtgc gctggaccca gctgggggcc ttctacccct tcatgcggaa ccacaacagc 1860 ctgctcagtc tgccccagga gccgtacagc ttcagcgagc cggcccagca ggccatgagg 1920 aaggccctca ccctgcgcta cgcactcctc ccccacctct acacactgtt ccaccaggcc 1980 cacgtcgcgg gggagaccgt ggcccggccc ctcttcctgg agttccccaa ggactctagc 2040 acctggactg tggaccacca gctcctgtgg ggggaggccc tgctcatcac cccagtgctc 2100 caggccggga aggccgaagt gactggctac ttccccttgg gcacatggta cgacctgcag 2160 acggtgccag tagaggccct tggcagcctc ccacccccac ctgcagctcc ccgtgagcca 2220 gccatccaca gcgaggggca gtgggtgacg ctgccggccc ccctggacac catcaacgtc 2280 cacctccggg ctgggtacat catccccctg cagggccctg gcctcacaac cacagagtcc 2340 cgccagcagc ccatggccct ggctgtggcc ctgaccaagg gtggggaggc ccgaggggag 2400 ctgttctggg acgatggaga gagcctggaa gtgctggagc gaggggccta cacacaggtc 2460 atcttcctgg ccaggaataa cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga 2520 gctggcctgc agctgcagaa ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc 2580 ctctccaacg gtgtccctgt ctccaacttc acctacagcc ccgacaccaa ggtcctggac 2640 atctgtgtct cgctgttgat gggagagcag tttctcgtca gctggtgtta g 2691 <210> 46 <211> 2691 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1-delta-29 <400> 46 cagcagggcg cctctagacc tggacctaga gatgcccagg cccaccccgg cagacctaga 60 gctgtgccta cccagtgtga cgtgcccccc aacagcagat tcgactgcgc ccctgacaag 120 gccatcaccc aggaacagtg cgaggccaga ggctgctgct acatccctgc caagcaggga 180 ctgcagggcg ctcagatggg acagccctgg tgcttcttcc caccctccta ccccagctac 240 aagctggaaa acctgagcag cagcgagatg ggctacaccg ccaccctgac cagaaccacc 300 cccacattct tcccaaagga catcctgacc ctgcggctgg acgtgatgat ggaaaccgag 360 aaccggctgc acttcaccat caaggacccc gccaatcgga gatacgaggt gcccctggaa 420 accccccacg tgcactctag agcccccagc cctctgtaca gcgtggaatt cagcgaggaa 480 cccttcggcg tgatcgtgcg gagacagctg gatggcagag tgctgctgaa caccaccgtg 540 gcccctctgt tcttcgccga ccagttcctg cagctgagca ccagcctgcc cagccagtac 600 atcacaggac tggccgagca cctgagcccc ctgatgctga gcacatcctg gacccggatc 660 accctgtgga acagggatct ggcccctacc cctggcgcca atctgtacgg cagccaccct 720 ttctacctgg ccctggaaga tggcggatct gcccacggag tgtttctgct gaactccaac 780 gccatggacg tggtgctgca gcctagccct gccctgtctt ggagaagcac aggcggcatc 840 ctggatgtgt acatctttct gggccccgag cccaagagcg tggtgcagca gtatctggat 900 gtcgtgggct accccttcat gcccccttac tggggcctgg gattccacct gtgcagatgg 960 ggctactcca gcaccgccat caccagacag gtggtggaaa acatgaccag agcccacttc 1020 ccactggatg tgcagtggaa cgacctggac tacatggaca gcagacggga cttcaccttc 1080 aacaaggacg gcttccggga cttccccgcc atggtgcagg aactgcatca gggcggcaga 1140 cggtacatga tgatcgtgga tcccgccatc agctcctctg gccctgccgg ctcttacaga 1200 ccctacgacg agggcctgcg gagaggcgtg ttcatcacca acgagacagg ccagcccctg 1260 atcggcaaag tgtggcctgg cagcacagcc ttccccgact tcaccaatcc taccgccctg 1320 gcttggtggg aggacatggt ggccgagttc cacgaccagg tgcccttcga cggcatgtgg 1380 atcgacatga acgagcccag caacttcatc cggggcagcg aggatggctg ccccaacaac 1440 gaactggaaa atccccctta cgtgcccggc gtcgtgggcg gaacactgca ggccgctaca 1500 atctgtgcca gcagccacca gtttctgagc acccactaca acctgcacaa cctgtacggc 1560 ctgaccgagg ccattgccag ccaccgcgct ctcgtgaaag ccagaggcac acggcccttc 1620 gtgatcagca gaagcacctt tgccggccac ggcagatacg ccggacattg gactggcgac 1680 gtgtggtcct cttgggagca gctggcctct agcgtgcccg agatcctgca gttcaatctg 1740 ctgggcgtgc cactcgtggg cgccgatgtg tgtggcttcc tgggcaacac ctccgaggaa 1800 ctgtgtgtgc ggtggacaca gctgggcgcc ttctaccctt tcatgagaaa ccacaacagc 1860 ctgctgagcc tgccccagga accctacagc tttagcgagc ctgcacagca ggccatgcgg 1920 aaggccctga cactgagata cgctctgctg ccccacctgt acaccctgtt tcaccaggcc 1980 catgtggccg gcgagacagt ggccagacct ctgtttctgg aattccccaa ggacagcagc 2040 acctggaccg tggaccatca gctgctgtgg ggagaggctc tgctgattac cccagtgctg 2100 caggcaggca aggccgaagt gaccggctac tttcccctgg gcacttggta cgacctgcag 2160 accgtgcctg tggaagccct gggatctctg cctccacctc ctgccgctcc tagagagcct 2220 gccattcact ctgagggcca gtgggtcaca ctgcctgccc ccctggatac catcaacgtg 2280 cacctgaggg ccggctacat cataccactg cagggacctg gcctgaccac caccgagtct 2340 agacagcagc caatggccct ggccgtggcc ctgaccaaag gcggagaagc taggggcgag 2400 ctgttctggg acgatggcga gagcctggaa gtgctggaaa gaggcgccta tacccaagtg 2460 atcttcctgg cccggaacaa caccatcgtg aacgagctgg tgcgcgtgac ctctgaaggc 2520 gctggactgc agctgcagaa agtgaccgtg ctgggagtgg ccacagcccc tcagcaggtg 2580 ctgtctaatg gcgtgcccgt gtccaacttc acctacagcc ccgacaccaa ggtgctggac 2640 atctgcgtgt cactgctgat gggagagcag tttctggtgt cctggtgctg a 2691 <210> 47 <211> 2691 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2-delta-29 <400> 47 caacagggag cttccagacc aggaccgaga gacgcccaag cccatcctgg tagaccaaga 60 gctgtgccta cccaatgcga cgtgccaccc aactcccgat tcgactgcgc gccagataag 120 gctattaccc aagagcagtg tgaagccaga ggttgctgct acatcccagc gaagcaagga 180 ttgcaaggcg cccaaatggg acaaccttgg tgtttcttcc ccccttcgta cccatcatat 240 aaactcgaaa acctgtcctc ttcggaaatg ggttatactg ccaccctcac cagaactact 300 cctactttct tcccgaaaga catcttgacc ttgaggctgg acgtgatgat ggagactgaa 360 aaccggctgc atttcactat caaagatcct gccaatcggc gatacgaggt ccctctggaa 420 acccctcacg tgcactcacg ggctccttct ccgctttact ccgtcgaatt ctctgaggaa 480 cccttcggag tgatcgttag acgccagctg gatggtagag tgctgttgaa cactactgtg 540 gccccacttt tcttcgctga ccagtttctg caactgtcca cttccctgcc atcccagtac 600 attactggac tcgccgaaca cctgtcgcca ctgatgctct cgacctcttg gactagaatc 660 actttgtgga acagagactt ggcccctact ccgggagcaa atctgtacgg aagccaccct 720 ttttacctgg cgctcgaaga tggcggatcc gctcacggag tgttcctgct gaatagcaac 780 gcaatggacg tggtgctgca accttcccct gcactcagtt ggagaagtac cgggggtatt 840 ctggacgtgt acatcttcct cggaccagaa cccaagagcg tggtgcagca atatctggac 900 gtggtcggat acccttttat gcctccttac tggggactgg gattccacct ttgccgttgg 960 ggctactcat ccaccgccat taccagacag gtggtggaga atatgaccag agcccacttc 1020 cctctcgacg tgcagtggaa cgatctggac tatatggact cccggagaga tttcaccttc 1080 aacaaggacg ggttccgcga ttttcccgcg atggttcaag agctccacca gggtggtcga 1140 agatatatga tgatcgtcga cccagccatt tcgagcagcg gacccgctgg atcttataga 1200 ccttacgacg aaggccttag gagaggagtg ttcatcacaa acgagactgg acagcctttg 1260 atcggtaaag tgtggcctgg atcaaccgcc tttcctgact ttaccaatcc cactgccttg 1320 gcttggtggg aggacatggt ggccgaattc cacgaccaag tcccctttga tggaatgtgg 1380 atcgatatga acgaaccaag caattttatc agaggttccg aagacggttg ccccaacaac 1440 gaactggaaa accctcctta tgtgcccgga gtcgtgggcg gaacattaca ggccgcgact 1500 atttgcgcca gcagccacca attcctgtcc actcactaca acctccacaa cctttatgga 1560 ttaaccgaag ctattgcaag tcacagggct ctggtgaagg ctagagggac taggcccttt 1620 gtgatctccc gatccacctt tgccggacac gggagatacg ccggtcactg gactggtgac 1680 gtgtggagct catgggaaca actggcctcc tccgtgccgg aaatcttaca gttcaacctt 1740 ctgggtgtcc ctcttgtcgg agcagacgtg tgtgggtttc ttggtaacac ctccgaggaa 1800 ctgtgtgtgc gctggactca actgggtgca ttctacccat tcatgagaaa ccacaactcc 1860 ttgctgtccc tgccacaaga gccctactcg ttcagcgagc ctgcacaaca ggctatgcgg 1920 aaggcactga ccctgagata cgccctgctt ccacacttat acactctctt ccatcaagcg 1980 catgtggcag gagaaaccgt tgcaaggcct cttttccttg aattccccaa ggattcctcg 2040 acttggacgg tggatcatca gctgctgtgg ggagaagctc tgctgattac tccagtgttg 2100 caagccggaa aagctgaggt gaccggatac tttccgctgg gaacctggta cgacctccag 2160 actgtccctg ttgaagccct tggatcactg cctccgcctc cggcagctcc acgcgaacca 2220 gctatacatt ccgagggaca gtgggttaca ttaccagctc ctctggacac aatcaacgtc 2280 cacttaagag ctggctacat tatccctctg caaggaccag gactgactac gaccgagagc 2340 agacagcagc caatggcact ggctgtggct ctgaccaagg gaggggaagc tagaggagaa 2400 ctcttctggg atgatgggga gtcccttgaa gtgctggaaa gaggcgctta cactcaagtc 2460 attttccttg cacggaacaa caccattgtg aacgaattgg tgcgagtgac cagcgaagga 2520 gctggacttc aactgcagaa ggtcactgtg ctcggagtgg ctaccgctcc tcagcaagtg 2580 ctgtcgaatg gagtccccgt gtcaaacttt acctactccc ctgacactaa ggtgctcgac 2640 atttgcgtgt ccctcctgat gggagagcag ttccttgtgt cctggtgttg a 2691 <210> 48 <211> 2652 <212> DNA <213> Artificial Sequence <220> <223> hGAAwt-delta-42 <400> 48 gcacaccccg ggcggccgcg agcagtgccc acacagtgcg acgtcccccc caacagccgc 60 ttcgattgcg cccctgacaa ggccatcacc caggaacagt gcgaggcccg cggctgttgc 120 tacatccctg caaagcaggg gctgcaggga gcccagatgg ggcagccctg gtgcttcttc 180 ccacccagct accccagcta caagctggag aacctgagct cctctgaaat gggctacacg 240 gccaccctga cccgtaccac ccccaccttc ttccccaagg acatcctgac cctgcggctg 300 gacgtgatga tggagactga gaaccgcctc cacttcacga tcaaagatcc agctaacagg 360 cgctacgagg tgcccttgga gaccccgcat gtccacagcc gggcaccgtc cccactctac 420 agcgtggagt tctccgagga gcccttcggg gtgatcgtgc gccggcagct ggacggccgc 480 gtgctgctga acacgacggt ggcgcccctg ttctttgcgg accagttcct tcagctgtcc 540 acctcgctgc cctcgcagta tatcacaggc ctcgccgagc acctcagtcc cctgatgctc 600 agcaccagct ggaccaggat caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg 660 aacctctacg ggtctcaccc tttctacctg gcgctggagg acggcgggtc ggcacacggg 720 gtgttcctgc taaacagcaa tgccatggat gtggtcctgc agccgagccc tgcccttagc 780 tggaggtcga caggtgggat cctggatgtc tacatcttcc tgggcccaga gcccaagagc 840 gtggtgcagc agtacctgga cgttgtggga tacccgttca tgccgccata ctggggcctg 900 ggcttccacc tgtgccgctg gggctactcc tccaccgcta tcacccgcca ggtggtggag 960 aacatgacca gggcccactt ccccctggac gtccagtgga acgacctgga ctacatggac 1020 tcccggaggg acttcacgtt caacaaggat ggcttccggg acttcccggc catggtgcag 1080 gagctgcacc agggcggccg gcgctacatg atgatcgtgg atcctgccat cagcagctcg 1140 ggccctgccg ggagctacag gccctacgac gagggtctgc ggaggggggt tttcatcacc 1200 aacgagaccg gccagccgct gattgggaag gtatggcccg ggtccactgc cttccccgac 1260 ttcaccaacc ccacagccct ggcctggtgg gaggacatgg tggctgagtt ccatgaccag 1320 gtgcccttcg acggcatgtg gattgacatg aacgagcctt ccaacttcat caggggctct 1380 gaggacggct gccccaacaa tgagctggag aacccaccct acgtgcctgg ggtggttggg 1440 gggaccctcc aggcggccac catctgtgcc tccagccacc agtttctctc cacacactac 1500 aacctgcaca acctctacgg cctgaccgaa gccatcgcct cccacagggc gctggtgaag 1560 gctcggggga cacgcccatt tgtgatctcc cgctcgacct ttgctggcca cggccgatac 1620 gccggccact ggacggggga cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca 1680 gaaatcctgc agtttaacct gctgggggtg cctctggtcg gggccgacgt ctgcggcttc 1740 ctgggcaaca cctcagagga gctgtgtgtg cgctggaccc agctgggggc cttctacccc 1800 ttcatgcgga accacaacag cctgctcagt ctgccccagg agccgtacag cttcagcgag 1860 ccggcccagc aggccatgag gaaggccctc accctgcgct acgcactcct cccccacctc 1920 tacacactgt tccaccaggc ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg 1980 gagttcccca aggactctag cacctggact gtggaccacc agctcctgtg gggggaggcc 2040 ctgctcatca ccccagtgct ccaggccggg aaggccgaag tgactggcta cttccccttg 2100 ggcacatggt acgacctgca gacggtgcca gtagaggccc ttggcagcct cccaccccca 2160 cctgcagctc cccgtgagcc agccatccac agcgaggggc agtgggtgac gctgccggcc 2220 cccctggaca ccatcaacgt ccacctccgg gctgggtaca tcatccccct gcagggccct 2280 ggcctcacaa ccacagagtc ccgccagcag cccatggccc tggctgtggc cctgaccaag 2340 ggtggggagg cccgagggga gctgttctgg gacgatggag agagcctgga agtgctggag 2400 cgaggggcct acacacaggt catcttcctg gccaggaata acacgatcgt gaatgagctg 2460 gtacgtgtga ccagtgaggg agctggcctg cagctgcaga aggtgactgt cctgggcgtg 2520 gccacggcgc cccagcaggt cctctccaac ggtgtccctg tctccaactt cacctacagc 2580 cccgacacca aggtcctgga catctgtgtc tcgctgttga tgggagagca gtttctcgtc 2640 agctggtgtt ag 2652 <210> 49 <211> 2649 <212> DNA <213> Artificial Sequence <220> <223> hGAAwt-delta-43 <400> 49 caccccgggc ggccgcgagc agtgcccaca cagtgcgacg tcccccccaa cagccgcttc 60 gattgcgccc ctgacaaggc catcacccag gaacagtgcg aggcccgcgg ctgttgctac 120 atccctgcaa agcaggggct gcagggagcc cagatggggc agccctggtg cttcttccca 180 cccagctacc ccagctacaa gctggagaac ctgagctcct ctgaaatggg ctacacggcc 240 accctgaccc gtaccacccc caccttcttc cccaaggaca tcctgaccct gcggctggac 300 gtgatgatgg agactgagaa ccgcctccac ttcacgatca aagatccagc taacaggcgc 360 tacgaggtgc ccttggagac cccgcatgtc cacagccggg caccgtcccc actctacagc 420 gtggagttct ccgaggagcc cttcggggtg atcgtgcgcc ggcagctgga cggccgcgtg 480 ctgctgaaca cgacggtggc gcccctgttc tttgcggacc agttccttca gctgtccacc 540 tcgctgccct cgcagtatat cacaggcctc gccgagcacc tcagtcccct gatgctcagc 600 accagctgga ccaggatcac cctgtggaac cgggaccttg cgcccacgcc cggtgcgaac 660 ctctacgggt ctcacccttt ctacctggcg ctggaggacg gcgggtcggc acacggggtg 720 ttcctgctaa acagcaatgc catggatgtg gtcctgcagc cgagccctgc ccttagctgg 780 aggtcgacag gtgggatcct ggatgtctac atcttcctgg gcccagagcc caagagcgtg 840 gtgcagcagt acctggacgt tgtgggatac ccgttcatgc cgccatactg gggcctgggc 900 ttccacctgt gccgctgggg ctactcctcc accgctatca cccgccaggt ggtggagaac 960 atgaccaggg cccacttccc cctggacgtc cagtggaacg acctggacta catggactcc 1020 cggagggact tcacgttcaa caaggatggc ttccgggact tcccggccat ggtgcaggag 1080 ctgcaccagg gcggccggcg ctacatgatg atcgtggatc ctgccatcag cagctcgggc 1140 cctgccggga gctacaggcc ctacgacgag ggtctgcgga ggggggtttt catcaccaac 1200 gagaccggcc agccgctgat tgggaaggta tggcccgggt ccactgcctt ccccgacttc 1260 accaacccca cagccctggc ctggtgggag gacatggtgg ctgagttcca tgaccaggtg 1320 cccttcgacg gcatgtggat tgacatgaac gagccttcca acttcatcag gggctctgag 1380 gacggctgcc ccaacaatga gctggagaac ccaccctacg tgcctggggt ggttgggggg 1440 accctccagg cggccaccat ctgtgcctcc agccaccagt ttctctccac acactacaac 1500 ctgcacaacc tctacggcct gaccgaagcc atcgcctccc acagggcgct ggtgaaggct 1560 cgggggacac gcccatttgt gatctcccgc tcgacctttg ctggccacgg ccgatacgcc 1620 ggccactgga cgggggacgt gtggagctcc tgggagcagc tcgcctcctc cgtgccagaa 1680 atcctgcagt ttaacctgct gggggtgcct ctggtcgggg ccgacgtctg cggcttcctg 1740 ggcaacacct cagaggagct gtgtgtgcgc tggacccagc tgggggcctt ctaccccttc 1800 atgcggaacc acaacagcct gctcagtctg ccccaggagc cgtacagctt cagcgagccg 1860 gcccagcagg ccatgaggaa ggccctcacc ctgcgctacg cactcctccc ccacctctac 1920 acactgttcc accaggccca cgtcgcgggg gagaccgtgg cccggcccct cttcctggag 1980 ttccccaagg actctagcac ctggactgtg gaccaccagc tcctgtgggg ggaggccctg 2040 ctcatcaccc cagtgctcca ggccgggaag gccgaagtga ctggctactt ccccttgggc 2100 acatggtacg acctgcagac ggtgccagta gaggcccttg gcagcctccc acccccacct 2160 gcagctcccc gtgagccagc catccacagc gaggggcagt gggtgacgct gccggccccc 2220 ctggacacca tcaacgtcca cctccgggct gggtacatca tccccctgca gggccctggc 2280 ctcacaacca cagagtcccg ccagcagccc atggccctgg ctgtggccct gaccaagggt 2340 ggggaggccc gaggggagct gttctgggac gatggagaga gcctggaagt gctggagcga 2400 ggggcctaca cacaggtcat cttcctggcc aggaataaca cgatcgtgaa tgagctggta 2460 cgtgtgacca gtgagggagc tggcctgcag ctgcagaagg tgactgtcct gggcgtggcc 2520 acggcgcccc agcaggtcct ctccaacggt gtccctgtct ccaacttcac ctacagcccc 2580 gacaccaagg tcctggacat ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc 2640 tggtgttag 2649 <210> 50 <211> 2649 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1-delta-43 <400> 50 caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 60 gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 120 atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 180 ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 240 accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 300 gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 360 tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 420 gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 480 ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 540 agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 600 acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 660 ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 720 tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 780 agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 840 gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 900 ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 960 atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1020 agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1080 ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1140 cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1200 gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1260 accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1320 cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1380 gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1440 acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1500 ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1560 agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1620 ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1680 atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1740 ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1800 atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 1860 gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 1920 accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 1980 ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2040 ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2100 acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2160 gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2220 ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2280 ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2340 ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2400 ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2460 cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2520 acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2580 gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2640 tggtgctga 2649 <210> 51 <211> 2649 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2-delta-43 <400> 51 catcctggta gaccaagagc tgtgcctacc caatgcgacg tgccacccaa ctcccgattc 60 gactgcgcgc cagataaggc tattacccaa gagcagtgtg aagccagagg ttgctgctac 120 atcccagcga agcaaggatt gcaaggcgcc caaatgggac aaccttggtg tttcttcccc 180 ccttcgtacc catcatataa actcgaaaac ctgtcctctt cggaaatggg ttatactgcc 240 accctcacca gaactactcc tactttcttc ccgaaagaca tcttgacctt gaggctggac 300 gtgatgatgg agactgaaaa ccggctgcat ttcactatca aagatcctgc caatcggcga 360 tacgaggtcc ctctggaaac ccctcacgtg cactcacggg ctccttctcc gctttactcc 420 gtcgaattct ctgaggaacc cttcggagtg atcgttagac gccagctgga tggtagagtg 480 ctgttgaaca ctactgtggc cccacttttc ttcgctgacc agtttctgca actgtccact 540 tccctgccat cccagtacat tactggactc gccgaacacc tgtcgccact gatgctctcg 600 acctcttgga ctagaatcac tttgtggaac agagacttgg cccctactcc gggagcaaat 660 ctgtacggaa gccacccttt ttacctggcg ctcgaagatg gcggatccgc tcacggagtg 720 ttcctgctga atagcaacgc aatggacgtg gtgctgcaac cttcccctgc actcagttgg 780 agaagtaccg ggggtattct ggacgtgtac atcttcctcg gaccagaacc caagagcgtg 840 gtgcagcaat atctggacgt ggtcggatac ccttttatgc ctccttactg gggactggga 900 ttccaccttt gccgttgggg ctactcatcc accgccatta ccagacaggt ggtggagaat 960 atgaccagag cccacttccc tctcgacgtg cagtggaacg atctggacta tatggactcc 1020 cggagagatt tcaccttcaa caaggacggg ttccgcgatt ttcccgcgat ggttcaagag 1080 ctccaccagg gtggtcgaag atatatgatg atcgtcgacc cagccatttc gagcagcgga 1140 cccgctggat cttatagacc ttacgacgaa ggccttagga gaggagtgtt catcacaaac 1200 gagactggac agcctttgat cggtaaagtg tggcctggat caaccgcctt tcctgacttt 1260 accaatccca ctgccttggc ttggtgggag gacatggtgg ccgaattcca cgaccaagtc 1320 ccctttgatg gaatgtggat cgatatgaac gaaccaagca attttatcag aggttccgaa 1380 gacggttgcc ccaacaacga actggaaaac cctccttatg tgcccggagt cgtgggcgga 1440 acattacagg ccgcgactat ttgcgccagc agccaccaat tcctgtccac tcactacaac 1500 ctccacaacc tttatggatt aaccgaagct attgcaagtc acagggctct ggtgaaggct 1560 agagggacta ggccctttgt gatctcccga tccacctttg ccggacacgg gagatacgcc 1620 ggtcactgga ctggtgacgt gtggagctca tgggaacaac tggcctcctc cgtgccggaa 1680 atcttacagt tcaaccttct gggtgtccct cttgtcggag cagacgtgtg tgggtttctt 1740 ggtaacacct ccgaggaact gtgtgtgcgc tggactcaac tgggtgcatt ctacccattc 1800 atgagaaacc acaactcctt gctgtccctg ccacaagagc cctactcgtt cagcgagcct 1860 gcacaacagg ctatgcggaa ggcactgacc ctgagatacg ccctgcttcc acacttatac 1920 actctcttcc atcaagcgca tgtggcagga gaaaccgttg caaggcctct tttccttgaa 1980 ttccccaagg attcctcgac ttggacggtg gatcatcagc tgctgtgggg agaagctctg 2040 ctgattactc cagtgttgca agccggaaaa gctgaggtga ccggatactt tccgctggga 2100 acctggtacg acctccagac tgtccctgtt gaagcccttg gatcactgcc tccgcctccg 2160 gcagctccac gcgaaccagc tatacattcc gagggacagt gggttacatt accagctcct 2220 ctggacacaa tcaacgtcca cttaagagct ggctacatta tccctctgca aggaccagga 2280 ctgactacga ccgagagcag acagcagcca atggcactgg ctgtggctct gaccaaggga 2340 ggggaagcta gaggagaact cttctgggat gatggggagt cccttgaagt gctggaaaga 2400 ggcgcttaca ctcaagtcat tttccttgca cggaacaaca ccattgtgaa cgaattggtg 2460 cgagtgacca gcgaaggagc tggacttcaa ctgcagaagg tcactgtgct cggagtggct 2520 accgctcctc agcaagtgct gtcgaatgga gtccccgtgt caaactttac ctactcccct 2580 gacactaagg tgctcgacat ttgcgtgtcc ctcctgatgg gagagcagtt ccttgtgtcc 2640 tggtgttga 2649 <210> 52 <211> 2637 <212> DNA <213> Artificial Sequence <220> <223> hGAAwt-delta-47 <400> 52 ccgcgagcag tgcccacaca gtgcgacgtc ccccccaaca gccgcttcga ttgcgcccct 60 gacaaggcca tcacccagga acagtgcgag gcccgcggct gttgctacat ccctgcaaag 120 caggggctgc agggagccca gatggggcag ccctggtgct tcttcccacc cagctacccc 180 agctacaagc tggagaacct gagctcctct gaaatgggct acacggccac cctgacccgt 240 accaccccca ccttcttccc caaggacatc ctgaccctgc ggctggacgt gatgatggag 300 actgagaacc gcctccactt cacgatcaaa gatccagcta acaggcgcta cgaggtgccc 360 ttggagaccc cgcatgtcca cagccgggca ccgtccccac tctacagcgt ggagttctcc 420 gaggagccct tcggggtgat cgtgcgccgg cagctggacg gccgcgtgct gctgaacacg 480 acggtggcgc ccctgttctt tgcggaccag ttccttcagc tgtccacctc gctgccctcg 540 cagtatatca caggcctcgc cgagcacctc agtcccctga tgctcagcac cagctggacc 600 aggatcaccc tgtggaaccg ggaccttgcg cccacgcccg gtgcgaacct ctacgggtct 660 caccctttct acctggcgct ggaggacggc gggtcggcac acggggtgtt cctgctaaac 720 agcaatgcca tggatgtggt cctgcagccg agccctgccc ttagctggag gtcgacaggt 780 gggatcctgg atgtctacat cttcctgggc ccagagccca agagcgtggt gcagcagtac 840 ctggacgttg tgggataccc gttcatgccg ccatactggg gcctgggctt ccacctgtgc 900 cgctggggct actcctccac cgctatcacc cgccaggtgg tggagaacat gaccagggcc 960 cacttccccc tggacgtcca gtggaacgac ctggactaca tggactcccg gagggacttc 1020 acgttcaaca aggatggctt ccgggacttc ccggccatgg tgcaggagct gcaccagggc 1080 ggccggcgct acatgatgat cgtggatcct gccatcagca gctcgggccc tgccgggagc 1140 tacaggccct acgacgaggg tctgcggagg ggggttttca tcaccaacga gaccggccag 1200 ccgctgattg ggaaggtatg gcccgggtcc actgccttcc ccgacttcac caaccccaca 1260 gccctggcct ggtgggagga catggtggct gagttccatg accaggtgcc cttcgacggc 1320 atgtggattg acatgaacga gccttccaac ttcatcaggg gctctgagga cggctgcccc 1380 aacaatgagc tggagaaccc accctacgtg cctggggtgg ttggggggac cctccaggcg 1440 gccaccatct gtgcctccag ccaccagttt ctctccacac actacaacct gcacaacctc 1500 tacggcctga ccgaagccat cgcctcccac agggcgctgg tgaaggctcg ggggacacgc 1560 ccatttgtga tctcccgctc gacctttgct ggccacggcc gatacgccgg ccactggacg 1620 ggggacgtgt ggagctcctg ggagcagctc gcctcctccg tgccagaaat cctgcagttt 1680 aacctgctgg gggtgcctct ggtcggggcc gacgtctgcg gcttcctggg caacacctca 1740 gaggagctgt gtgtgcgctg gacccagctg ggggccttct accccttcat gcggaaccac 1800 aacagcctgc tcagtctgcc ccaggagccg tacagcttca gcgagccggc ccagcaggcc 1860 atgaggaagg ccctcaccct gcgctacgca ctcctccccc acctctacac actgttccac 1920 caggcccacg tcgcggggga gaccgtggcc cggcccctct tcctggagtt ccccaaggac 1980 tctagcacct ggactgtgga ccaccagctc ctgtgggggg aggccctgct catcacccca 2040 gtgctccagg ccgggaaggc cgaagtgact ggctacttcc ccttgggcac atggtacgac 2100 ctgcagacgg tgccagtaga ggcccttggc agcctcccac ccccacctgc agctccccgt 2160 gagccagcca tccacagcga ggggcagtgg gtgacgctgc cggcccccct ggacaccatc 2220 aacgtccacc tccgggctgg gtacatcatc cccctgcagg gccctggcct cacaaccaca 2280 gagtcccgcc agcagcccat ggccctggct gtggccctga ccaagggtgg ggaggcccga 2340 ggggagctgt tctgggacga tggagagagc ctggaagtgc tggagcgagg ggcctacaca 2400 caggtcatct tcctggccag gaataacacg atcgtgaatg agctggtacg tgtgaccagt 2460 gagggagctg gcctgcagct gcagaaggtg actgtcctgg gcgtggccac ggcgccccag 2520 caggtcctct ccaacggtgt ccctgtctcc aacttcacct acagccccga caccaaggtc 2580 ctggacatct gtgtctcgct gttgatggga gagcagtttc tcgtcagctg gtgttag 2637 <210> 53 <211> 2637 <212> DNA <213> Artificial Sequence <220> <223> hGAAco1-delta-47 <400> 53 cctagagctg tgcctaccca gtgtgacgtg ccccccaaca gcagattcga ctgcgcccct 60 gacaaggcca tcacccagga acagtgcgag gccagaggct gctgctacat ccctgccaag 120 cagggactgc agggcgctca gatgggacag ccctggtgct tcttcccacc ctcctacccc 180 agctacaagc tggaaaacct gagcagcagc gagatgggct acaccgccac cctgaccaga 240 accaccccca cattcttccc aaaggacatc ctgaccctgc ggctggacgt gatgatggaa 300 accgagaacc ggctgcactt caccatcaag gaccccgcca atcggagata cgaggtgccc 360 ctggaaaccc cccacgtgca ctctagagcc cccagccctc tgtacagcgt ggaattcagc 420 gaggaaccct tcggcgtgat cgtgcggaga cagctggatg gcagagtgct gctgaacacc 480 accgtggccc ctctgttctt cgccgaccag ttcctgcagc tgagcaccag cctgcccagc 540 cagtacatca caggactggc cgagcacctg agccccctga tgctgagcac atcctggacc 600 cggatcaccc tgtggaacag ggatctggcc cctacccctg gcgccaatct gtacggcagc 660 caccctttct acctggccct ggaagatggc ggatctgccc acggagtgtt tctgctgaac 720 tccaacgcca tggacgtggt gctgcagcct agccctgccc tgtcttggag aagcacaggc 780 ggcatcctgg atgtgtacat ctttctgggc cccgagccca agagcgtggt gcagcagtat 840 ctggatgtcg tgggctaccc cttcatgccc ccttactggg gcctgggatt ccacctgtgc 900 agatggggct actccagcac cgccatcacc agacaggtgg tggaaaacat gaccagagcc 960 cacttcccac tggatgtgca gtggaacgac ctggactaca tggacagcag acgggacttc 1020 accttcaaca aggacggctt ccgggacttc cccgccatgg tgcaggaact gcatcagggc 1080 ggcagacggt acatgatgat cgtggatccc gccatcagct cctctggccc tgccggctct 1140 tacagaccct acgacgaggg cctgcggaga ggcgtgttca tcaccaacga gacaggccag 1200 cccctgatcg gcaaagtgtg gcctggcagc acagccttcc ccgacttcac caatcctacc 1260 gccctggctt ggtgggagga catggtggcc gagttccacg accaggtgcc cttcgacggc 1320 atgtggatcg acatgaacga gcccagcaac ttcatccggg gcagcgagga tggctgcccc 1380 aacaacgaac tggaaaatcc cccttacgtg cccggcgtcg tgggcggaac actgcaggcc 1440 gctacaatct gtgccagcag ccaccagttt ctgagcaccc actacaacct gcacaacctg 1500 tacggcctga ccgaggccat tgccagccac cgcgctctcg tgaaagccag aggcacacgg 1560 cccttcgtga tcagcagaag cacctttgcc ggccacggca gatacgccgg acattggact 1620 ggcgacgtgt ggtcctcttg ggagcagctg gcctctagcg tgcccgagat cctgcagttc 1680 aatctgctgg gcgtgccact cgtgggcgcc gatgtgtgtg gcttcctggg caacacctcc 1740 gaggaactgt gtgtgcggtg gacacagctg ggcgccttct accctttcat gagaaaccac 1800 aacagcctgc tgagcctgcc ccaggaaccc tacagcttta gcgagcctgc acagcaggcc 1860 atgcggaagg ccctgacact gagatacgct ctgctgcccc acctgtacac cctgtttcac 1920 caggcccatg tggccggcga gacagtggcc agacctctgt ttctggaatt ccccaaggac 1980 agcagcacct ggaccgtgga ccatcagctg ctgtggggag aggctctgct gattacccca 2040 gtgctgcagg caggcaaggc cgaagtgacc ggctactttc ccctgggcac ttggtacgac 2100 ctgcagaccg tgcctgtgga agccctggga tctctgcctc cacctcctgc cgctcctaga 2160 gagcctgcca ttcactctga gggccagtgg gtcacactgc ctgcccccct ggataccatc 2220 aacgtgcacc tgagggccgg ctacatcata ccactgcagg gacctggcct gaccaccacc 2280 gagtctagac agcagccaat ggccctggcc gtggccctga ccaaaggcgg agaagctagg 2340 ggcgagctgt tctgggacga tggcgagagc ctggaagtgc tggaaagagg cgcctatacc 2400 caagtgatct tcctggcccg gaacaacacc atcgtgaacg agctggtgcg cgtgacctct 2460 gaaggcgctg gactgcagct gcagaaagtg accgtgctgg gagtggccac agcccctcag 2520 caggtgctgt ctaatggcgt gcccgtgtcc aacttcacct acagccccga caccaaggtg 2580 ctggacatct gcgtgtcact gctgatggga gagcagtttc tggtgtcctg gtgctga 2637 <210> 54 <211> 2637 <212> DNA <213> Artificial Sequence <220> <223> hGAAco2-delta-47 <400> 54 ccaagagctg tgcctaccca atgcgacgtg ccacccaact cccgattcga ctgcgcgcca 60 gataaggcta ttacccaaga gcagtgtgaa gccagaggtt gctgctacat cccagcgaag 120 caaggattgc aaggcgccca aatgggacaa ccttggtgtt tcttcccccc ttcgtaccca 180 tcatataaac tcgaaaacct gtcctcttcg gaaatgggtt atactgccac cctcaccaga 240 actactccta ctttcttccc gaaagacatc ttgaccttga ggctggacgt gatgatggag 300 actgaaaacc ggctgcattt cactatcaaa gatcctgcca atcggcgata cgaggtccct 360 ctggaaaccc ctcacgtgca ctcacgggct ccttctccgc tttactccgt cgaattctct 420 gaggaaccct tcggagtgat cgttagacgc cagctggatg gtagagtgct gttgaacact 480 actgtggccc cacttttctt cgctgaccag tttctgcaac tgtccacttc cctgccatcc 540 cagtacatta ctggactcgc cgaacacctg tcgccactga tgctctcgac ctcttggact 600 agaatcactt tgtggaacag agacttggcc cctactccgg gagcaaatct gtacggaagc 660 cacccttttt acctggcgct cgaagatggc ggatccgctc acggagtgtt cctgctgaat 720 agcaacgcaa tggacgtggt gctgcaacct tcccctgcac tcagttggag aagtaccggg 780 ggtattctgg acgtgtacat cttcctcgga ccagaaccca agagcgtggt gcagcaatat 840 ctggacgtgg tcggataccc ttttatgcct ccttactggg gactgggatt ccacctttgc 900 cgttggggct actcatccac cgccattacc agacaggtgg tggagaatat gaccagagcc 960 cacttccctc tcgacgtgca gtggaacgat ctggactata tggactcccg gagagatttc 1020 accttcaaca aggacgggtt ccgcgatttt cccgcgatgg ttcaagagct ccaccagggt 1080 ggtcgaagat atatgatgat cgtcgaccca gccatttcga gcagcggacc cgctggatct 1140 tatagacctt acgacgaagg ccttaggaga ggagtgttca tcacaaacga gactggacag 1200 cctttgatcg gtaaagtgtg gcctggatca accgcctttc ctgactttac caatcccact 1260 gccttggctt ggtgggagga catggtggcc gaattccacg accaagtccc ctttgatgga 1320 atgtggatcg atatgaacga accaagcaat tttatcagag gttccgaaga cggttgcccc 1380 aacaacgaac tggaaaaccc tccttatgtg cccggagtcg tgggcggaac attacaggcc 1440 gcgactattt gcgccagcag ccaccaattc ctgtccactc actacaacct ccacaacctt 1500 tatggattaa ccgaagctat tgcaagtcac agggctctgg tgaaggctag agggactagg 1560 ccctttgtga tctcccgatc cacctttgcc ggacacggga gatacgccgg tcactggact 1620 ggtgacgtgt ggagctcatg ggaacaactg gcctcctccg tgccggaaat cttacagttc 1680 aaccttctgg gtgtccctct tgtcggagca gacgtgtgtg ggtttcttgg taacacctcc 1740 gaggaactgt gtgtgcgctg gactcaactg ggtgcattct acccattcat gagaaaccac 1800 aactccttgc tgtccctgcc acaagagccc tactcgttca gcgagcctgc acaacaggct 1860 atgcggaagg cactgaccct gagatacgcc ctgcttccac acttatacac tctcttccat 1920 caagcgcatg tggcaggaga aaccgttgca aggcctcttt tccttgaatt ccccaaggat 1980 tcctcgactt ggacggtgga tcatcagctg ctgtggggag aagctctgct gattactcca 2040 gtgttgcaag ccggaaaagc tgaggtgacc ggatactttc cgctgggaac ctggtacgac 2100 ctccagactg tccctgttga agcccttgga tcactgcctc cgcctccggc agctccacgc 2160 gaaccagcta tacattccga gggacagtgg gttacattac cagctcctct ggacacaatc 2220 aacgtccact taagagctgg ctacattatc cctctgcaag gaccaggact gactacgacc 2280 gagagcagac agcagccaat ggcactggct gtggctctga ccaagggagg ggaagctaga 2340 ggagaactct tctgggatga tggggagtcc cttgaagtgc tggaaagagg cgcttacact 2400 caagtcattt tccttgcacg gaacaacacc attgtgaacg aattggtgcg agtgaccagc 2460 gaaggagctg gacttcaact gcagaaggtc actgtgctcg gagtggctac cgctcctcag 2520 caagtgctgt cgaatggagt ccccgtgtca aactttacct actcccctga cactaaggtg 2580 ctcgacattt gcgtgtccct cctgatggga gagcagttcc ttgtgtcctg gtgttga 2637

Claims

신호 펩티드 모이어티 및 기능성 GAA 모이어티, 특히 부모 GAA의 절두 형태에 상응하는 GAA 모이어티를 포함하는, 기능성 키메라 GAA 단백질을 코딩하는 핵산 분자로서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4, 바람직하게 SEQ ID NO: 2로 이루어진 군에서 선택되는 아미노산 서열을 갖는 것인 핵산 분자.
제1항에 있어서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 절두되고, 상기 GAA 모이어티는 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 40, 41, 42, 43, 44, 45 또는 46개의 연속되는 아미노산이 절두되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8, 42 또는 43개의 연속되는 아미노산이 절두된 것인 핵산 분자.
제1항 또는 제2항에 있어서, 상기 GAA 모이어티는 부모 GAA와 비교하여 이의 N-말단부에서 8개의 연속되는 아미노산이 절두된 것인 핵산 분자.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 부모 GAA는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 인간 GAA 폴리펩티드인 핵산 분자.
제1항 내지 제4항 중 어느 한 항에 있어서, 생체 내에서 키메라 GAA의 발현을 개선시키고/시키거나 이에 대한 면역 관용을 개선시키도록 최적화된 뉴클레오티드 서열, 특히 SEQ ID NO: 13 또는 14로 표시된 뉴클레오티드 서열인 핵산 분자.
제1항 내지 제5항 중 어느 한 항에 있어서, 하기 서열의 조합으로 생성되는 뉴클레오티드 서열을 포함하는 것인 핵산 분자:
제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자를 포함하는 핵산 구성체로서, 프로모터, 예컨대 바람직하게 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터로 이루어진 군에서 선택되는 간-특이적 프로모터에 작동적으로 연결된 상기 핵산 분자를 포함하는 발현 카세트이고, 상기 핵산 구성체는 임의로 인트론, 특히 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론, 닭 베타-글로빈 인트론 및 SV40 인트론으로 이루어진 군에서 선택되는 인트론을 더 포함하고, 상기 인트론은 임의로 변형된 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론, 또는 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론인 핵산 구성체.
제7항에 있어서, 바람직하게 순서대로, 인핸서; 인트론; 프로모터, 특히 간-특이적 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 폴리아데닐화 신호를 포함하는 핵산 구성체로서, 구성체는 바람직하게, 순서대로, ApoE 제어 영역; HBB2 인트론, 특히 변형된 HBB2 인트론; hAAT 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 소 성장 호르몬 폴리아데닐화 신호를 포함하고, 상기 핵산 구성체는 보다 특히 SEQ ID NO: 20, 21 또는 22의 뉴클레오티드 서열 또는 제6항에 표시된 조합 중 어느 하나로부터 생성되는 뉴클레오티드 서열을 포함하는 것인 핵산 구성체.
제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자 또는 핵산 구성체를 포함하는 벡터로서, 바이러스 벡터, 바람직하게 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터, 또는 AAV 벡터, 예컨대 단일-가닥 또는 이중-가닥 자기-상보성 AAV 벡터, 바람직하게 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖거나 또는 키메라 캡시드를 갖는 AAV 벡터이고, AAV 벡터는 보다 특히 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 보다 특히 AAV8 캡시드를 갖는 것인 벡터.
제1항 내지 제6항 중 어느 한 항의 핵산 분자, 제7항 또는 제8항의 핵산 구성체 또는 제9항의 벡터로 형질전환된 세포로서, 세포는 특히 간 세포 또는 근육 세포인 세포.
신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드로서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되고, 특히 GAA 모이어티는 부모 GAA 폴리펩티드의 절두 형태, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 결실되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 20, 27, 28, 29, 30, 31, 41, 42, 43, 44, 45 또는 45개, 보다 특히 6, 7, 8, 9, 10, 20, 41, 42, 43 또는 44개의 연속되는 아미노산이 결실된 GAA 모이어티이고, GAA 모이어티는 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질의 절두 형태인 키메라 GAA 폴리펩티드.
제11항에 있어서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8, 29, 42 또는 43개의 연속되는 아미노산이 절두되고, 보다 특히 부모 GAA 폴리펩티드와 비교하여, 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질과 비교하여, 이의 N-말단부에서 8개 또는 42개, 특히 8개의 연속되는 아미노산이 절두된 것인 키메라 GAA 폴리펩티드.
제11항 또는 제12항에 있어서, 하기 서열의 조합으로부터 생성되는 아미노산 서열을 포함하는 것인 키메라 GAA 폴리펩티드:
약학적으로 허용가능한 담체에, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드를 포함하는 약학 조성물.
약물로서 사용을 위한, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드.
당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하기 위한 방법에서 사용을 위한, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드.