KR20230003492A

KR20230003492A - 고셔병 치료용 베타-글루코세레브로시다아제 변이체

Info

Publication number: KR20230003492A
Application number: KR1020227037779A
Authority: KR
Inventors: 앤토니 에이치 퓨테르만; 이스라엘 실만; 조엘 엘 수쓰만; 사렐 프레이쉬만; 에이디 골든즈웨이그; 사르카 포코르나; 야코브 에이샤니; 올가 케르손스키
Original assignee: 예다 리서치 앤드 디벨럽먼트 캄파니 리미티드
Priority date: 2020-03-29
Filing date: 2021-03-29
Publication date: 2023-01-06
Also published as: CN115348884A; BR112022019510A2; IL296696A; WO2021199039A1; AU2021245409A1; EP4126226A1; CA3174917A1; US20230132790A1; JP2023519934A

Abstract

유전적으로 변형된 인간 베타-글루코세레브로시다아제(GCase)가 개시된다. SEQ ID NO: 2와 적어도 85% 동일한 아미노산 서열을 포함하고; 좌표 L34P, K224N/G, T369E 및 N370D에서 돌연변이를 포함하며(여기서 좌표는 SEQ ID NO: 2에 해당함); 및 당지질 글루코실세라마이드(GlcCer)의 가수분해를 촉매할 수 있는, 유전자 변형된 GCase. 유전적으로 변형된 GCase를 포함하는 약학적 조성물 및 이를 사용하는 치료 방법이 또한 개시되어 있다.

Description

고셔병 치료용 베타-글루코세레브로시다아제 변이체

관련 출원

본 출원은 2020년 3월 29일에 출원된 이스라엘 출원 번호 273684 및 2020년 7월 9일에 출원된 미국 가특허 출원 번호 63/049,685의 우선권 이익을 주장하고, 그 내용은 전체적으로 참조로 본원에 포함된다.

서열목록

2021년 3월 29일에 생성되고 81,406바이트로 구성된 86504SequenceListing.txt라는 제목의 ASCII 파일이 본 출원의 제출과 동시에 제출되어 본원에 참조로 포함된다.

본 발명은, 이의 일부 구현예에서, β-글루코세레브로시다아제(GCase)의 변이체에 관한 것이고, 배타적이지는 않지만 보다 상세하게는 고셔병을 포함하는 β-글루코세레브로시다아제 결핍 질환의 치료를 위한 이의 용도에 관한 것이다.

리소좀 축적 장애(LSD)는 약 50가지의 다른 유전 질환을 포함한다. 이는 리소좀 효소 또는 수송체의 결핍으로 인해 발생하며, 분해되지 않은 대사산물의 리소좀 내에 축적을 초래한다. LSD 중에서 고셔병(GD)이 가장 널리 퍼져 있다; 이는 GBA1 유전자의 돌연변이로 인해 발생한다. GBA1 유전자는 당지질 대사의 중간체인 글루코실세라마이드(GlcCer, 글루코세레브로사이드로 명명)의 베타-글루코시드 결합을 가수분해에 의해 절단하는데 필요한 글루코실세라미다제 활성을 갖는 리소좀 효소인 베타-글루코세레브로시다아제(산 베타-글루코시다제, D-글루코실-N-아실스핑고신 글루코하이드롤라제 또는 GCase라고도 함)를 코딩한다. 결과적으로 세포는 많은 양의 GlcCer를 축적하고 결국 사멸한다.

임상적 관점에서 GD는 발병 연령과 신경계 침범 징후에 따라 세 가지 하위 유형으로 나눌 수 있다. 이 질병의 가장 흔한 형태인 1형 GD의 주요 증상은 비장 및 간 비대, 빈혈, 혈소판 감소증 및 골격 병변이다. GD(nGD)의 신경병성 형태인 2형 및 3형 GD는 신경학적 증상의 발병 시간 및 진행 속도에 따라 분류된다. 급성 신경병증 형태인 2형의 환자는 일반적으로 생후 6개월 이전에 신경학적 이상을 나타내고 2-4세에 사망하는 소아를 지칭한다. 아급성, 만성 신경병증 형태인 3형의 환자는 2형에서 관찰된 것과 유사한 증상을 나타내지만 더 늦게 발병하고 심각하다.

1형 GD 환자는 일반적으로 효소 대체 요법(ERT)으로 치료한다. GD 표적 ERT(태반 유래 제품)의 첫 번째 약물인 세라다제(Ceredase)®(Alglucerase)는 1991년 FDA 승인을 받았으나, 1995년에 승인된 이미글루세라제(Cerezyme®); 2010년에 승인된 벨라글루세라제 알파(VPRIV®); 및 2012년에 승인된 탈리글루세라제 알파(Elelyso®)을 포함한 재조합 DNA 기술로 만들어진 유사 약물의 승인으로 시장에서 철수되었다. 이러한 치료법은 GD에 대한 치료법이 아니다. 즉, 근본적인 유전적 결함을 교정하지 않는다. 따라서 치료의 이점을 얻으려면 증상이 있는 환자가 평생 동안 ERT를 계속해야 한다.

앞서 언급한 ERT 치료 외에도 2002년에 승인된 경구용 소분자인 미글루스타트(OGT 918, N-butyl-deoxynojirimycin)(Zavesca®)는 GD 치료를 위한 기질 감소 요법(SRT)을 제공한다. 자베스카(Zavesca)®는 신체가 생성하는 GSL의 양을 감소시켜 신체 전반에 걸쳐 유해한 글리코핑고지질(GSL) 축적을 줄인다. 또한 2014년에 승인된 엘리글루스타트(Cerdelga®)도 GD 치료에 사용되는 소분자이다. 세르델가(Cerdelga)®는 글루코실세라마이드 합성효소의 억제에 의해 작용하는 것으로 여겨진다.

1형 GD에 대한 미글루스타트의 후향적 분석은 (세포 내 글루코실세라마이드 축적에 대한 하나 이상의 작용 기전을 사용함으로써) 병용 요법이 GD 환자에게 더 나은 질병 제어를 제공할 수 있고 ERT 및 미글루스타트 모두의 감소된 용량으로 수용 가능한 삶의 질을 제공할 수 있다[Machaczka M. et al., Upsala Journal of Medical Sciences (2012) 117, 28-34].

발명의 요약

본 발명의 일부 구현예의 측면에 따르면, (i) SEQ ID NO: 2와 적어도 85% 동일한 아미노산 서열을 포함하고; 및 (ii) 좌표 L34P, K224N/G, T369E 및 N370D에서 돌연변이(여기서 좌표는 SEQ ID NO: 2에 해당함)를 포함하며; 및 (iii) 당지질 글루코실세라마이드(GlcCer)의 가수분해를 촉매할 수 있는, 유전적으로 변형된 인간 β-글루코세레브로시다아제(GCase)를 제공한다.

본 발명의 일부 구현예의 측면에 따르면, 본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase를 코딩하는 핵산 서열을 포함하는 단리된 폴리뉴클레오티드가 제공된다.

본 발명의 일부 구현예의 측면에 따르면, 본 발명의 일부 구현예의 단리된 폴리뉴클레오티드, 및 세포에서 핵산 서열의 발현을 지시하기 위한 시스-작용 조절 요소를 포함하는 핵산 작제물이 제공된다.

본 발명의 일부 구현예의 측면에 따르면, 본 발명의 일부 구현예의 폴리뉴클레오타이드, 또는 본 발명의 일부 구현예의 작제물을 포함하는 단리된 세포가 제공된다.

본 발명의 일부 구현예의 측면에 따르면, 활성 성분으로서 본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase, 본 발명의 일부 구현예의 단리된 폴리뉴클레오타이드, 본 발명의 일부 구현예의 작제물, 또는 본 발명의 일부 구현예의 세포, 및 약학적으로 허용되는 담체 또는 희석제를 포함하는 약학적 조성물이 제공된다.

본 발명의 일부 구현예의 측면에 따르면, 본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase, 발명의 일부 구현예의 단리된 폴리뉴클레오티드, 본 발명의 일부 구현예의 작제물, 또는 본 발명의 일부 구현예의 세포의 치료 유효량을 대상체에 투여함으로써 대상체에서 β-글루코세레브로시다아제 결핍증과 관련된 질환을 치료하는 것을 포함하는, 치료가 필요한 대상체에 β-글루코세레브로시다아제 결핍과 관련된 질환을 치료하는 방법을 제공한다.

본 발명의 일부 구현예의 측면에 따르면, 치료를 필요로 하는 대상체에 β-글루코세레브로시다아제 결핍과 관련된 질병 치료용으로, 본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase, 본 발명의 일부 구현예의 단리된 폴리뉴클레오티드, 본 발명의 일부 구현예의 작제물, 또는 본 발명의 일부 구현예의 세포의 치료적 유효량을 제공한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: H145K/R, I204K, E222K, T334F/Y/K 및/또는 L372N 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 및/또는 H495R 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: I130T, A168S 및/또는 D263N 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: R211N 및/또는 K303R 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 및/또는 L420M/I 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: V78I, A95K, V191M, A322D, V343T, M361E, S364A, H374W, T410E, H451N 및/또는 L480I 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: H162K, S181A, T297S, M335F, K346H, S431A, S465D 및/또는 A476D 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: R47K, L51R, Q70H, L91I, G115E, A124G, D140N/G, S196T 및/또는 V437S 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 돌연변이: T36Q, S38A, Q143E, T183A, L185M, T272S, H274K, N275D, L286S, K293Q, E300R, K321E, V376T, K408R, Q440E, M450Q 및/또는 I483V 중 적어도 하나를 추가로 포함하며,여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 좌표 D127, F128, W179, N234, E235, Y244, F246, Q284, Y313, E340, S345, W381, N396의 아미노산은 변형되지 않으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

본 발명의 일부 구현예에 따르면, 아미노산 서열은 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 및 27로 이루어진 군에서 선택된 서열과 동일하다.

본 발명의 일부 구현예에 따르면, 아미노산 서열은 SEQ ID NO: 14에 기재된 바와 같다.

본 발명의 일부 구현예에 따르면, 아미노산 서열은 SEQ ID NO: 22에 기재된 바와 같다.

본 발명의 일부 구현예에 따르면, 아미노산 서열은 SEQ ID NO: 27에 기재된 바와 같다.

본 발명의 일부 구현예에 따르면, 유전자 변형된 인간 GCase는 인공 기질 p-니트로페닐-β-D-글루코피라노사이드(p-NP-Glc)의 가수분해를 촉매할 수 있다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 적어도 약 0.2 x 10⁶k_cat/K_m (M^-1min^-1) 만큼 GlcCer의 가수분해를 촉매할 수 있다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 적어도 약 0.5 x 10⁶k_cat/K_m (M^-1min^-1)만큼 GlcCer의 가수분해를 촉매할 수 있다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 적어도 약 1.5 x 10⁶k_cat/K_m (M^-1min^-1)만큼 GlcCer의 가수분해를 촉매할 수 있다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 GCase 폴리펩티드와 비교하여 5-20℃ 더 높은 온도 범위 하에 열적 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 야생형 폴리펩티드와 비교하여 5-20℃ 더 높은 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 야생형 GCase 폴리펩티드와 비교하여 적어도 5℃ 더 높은 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 야생형 GCase 폴리펩티드와 비교하여 적어도 10℃ 더 높은(예, 적어도 12℃ 더 높은) 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 세레자임(Cerezyme)® 폴리펩티드와 비교하여 5-20℃ 더 높은 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에 세레자임® 폴리펩티드와 비교하여 적어도 10℃ 더 높은(예, 적어도 11℃ 더 높은) 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 조건 하에서 세레자임® 폴리펩티드와 비교하여 적어도 15℃ 더 높은(예, 적어도 17℃ 더 높은) 온도 범위 하에 열 안정성을 포함한다.

본 발명의 일부 구현예에 따르면, 유전적으로 변형된 인간 GCase는 동일한 배양 조건 하에서 야생형 폴리펩티드와 비교하여 진핵 세포에서 2배 이상 더 높은 세포내 발현 수준을 포함한다.

본 발명의 일부 구현예에 따르면, 유전자 변형된 인간 GCase는 동일한 배양 조건 하에서 분비되지 않는 야생형 폴리펩티드와 비교하여 진핵 세포로부터 분비된다.

본 발명의 일부 구현예에 따르면, 단리된 폴리뉴클레오티드는 SEQ ID NO: 3, 5, 7, 9, 11, 13, 17, 19, 21, 23 또는 26에 기재된 핵산 서열을 포함한다.

본 발명의 일부 구현예에 따르면, 시스-작용 조절 요소는 프로모터를 포함한다.

본 발명의 일부 구현예에 따르면, β-글루코세레브로시다아제 결핍과 관련된 질병은 고셔병이다.

본 발명의 일부 구현예에 따르면, 대상체는 인간이다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술적 용어 및/또는 과학적 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 같은 의미를 가진다. 본 명세서에 기재되는 방법 및 재료와 유사 또는 동등한 방법 및 재료를 본 발명의 실시 또는 시험에 사용할 수 있지만, 예시적인 방법 및/또는 재료가 하기에 기술된다. 모순될 경우에는 정의를 포함한 본 특허 명세서가 우선한다. 또한, 재료, 방법 및 실시예는 예시에 불과하며 반드시 제한하려는 의도는 아니다.

본 발명의 원리 및 작용은 도면 및 첨부된 설명을 참조하여 더 잘 이해될 수 있다.

본 발명의 적어도 하나의 구현예를 상세히 설명하기 전에, 본 발명은 하기 설명에 기재되거나 실시예에 의해 예시된 세부사항으로의 적용이 반드시 제한되는 것은 아님을 이해해야 한다. 본 발명은 다른 실시예가 가능하거나 다양한 방식으로 실시 또는 수행될 수 있다. 또한, 본 명세서에 사용된 어구 및 용어는 설명을 위한 것이며 제한하는 것으로 간주되어서는 안 됨을 이해해야 한다.

GD는 β-글루코세레브로시다아제(GCase)의 기능적 결핍으로 인해 발생하는 유전적 리소좀 축적 장애로, 다발성 장기 기능 장애를 초래한다. GCase는 글루코세레브로사이드를 세라마이드와 글루코오스로 가수분해하는 것을 촉매한다. GD에서 효소 결핍은 고셔 세포(조직 대식세포)의 리소좀 구획에 과도한 글루코세레브로사이드의 축적을 초래하고 내장 조직(간, 비장 및 골수)에 이러한 세포의 축적을 초래한다.

GD 환자는 일반적으로 효소 대체 요법(ERT)으로 치료된다. 세 가지 효소는 ERT에 의한 GD의 치료를 위해 상업적으로 이용 가능하다. 여기에는 이미글루세라제(Cerezyme®), 벨라글루세라제 알파(VPRIV®) 및 탈리글루세라제 알파(Elelyso®)가 포함된다. 현재 ERT 치료와 관련된 한 가지 단점은 효소의 생체내 생체활성이 바람직하지 않게 낮다는 것이다. 이는 예를 들어 낮은 열 안정성, 낮은 흡수, 기질이 축적되는 특정 세포의 리소좀에 대한 감소된 표적화 및/또는 리소좀의 짧은 기능적 생체내 반감기 때문이다.

본 발명을 실시하는 동안, 본 발명자들은 (야생형 인간 GCase와 비교하여) 효소 활성을 유지하면서 개선된 특성, 즉 (야생형 인간 GCase에 비해) 더 높은 발현 수준, (야생형 인간 GCase 및/또는 Cerezyme®에 비해) 더 높은 열 안정성을 포함하는 고셔병의 ERT를 위한 새로운 GCase를 생성하였다. 구체적으로, 본 발명자들은 예를 들어, PCT/IL2016/050812 및 Goldenzweig A. et al., Mol. 셀. (2016) 63: 337-346에 기술된, PROSS 알고리즘을 사용하여 GCase의 6가지 새로운 폴리펩티드 변이체를 생성하으며, 이는 본원에 참조로 포함된다(디자인 2-7, 즉 D2-7, SEQ ID NO: 4, 6, 8, 10, 12 및 14에 각각 제시됨, 도 1A 참조). 이들 GCase 변이체 중 4개인, D2, D4, D6 및 D7은 E. coli에서 발현되었고 합성 기질인 p-NP-Glc에 대한 효소 활성을 나타내는 것으로 나타났다(데이터는 표시되지 않음). 재조합 인간 글루코실세라미다제(WT 인간 GCase, SEQ ID NO: 2로 기재) 및 30개의 돌연변이를 보유하는 D7 변이체(SEQ ID NO: 14로 기재)는 단백질 글리코실화를 할 수 있는 인간 배아 신장 세포(HEK293T 세포)에서 추가로 발현되었다. 도 2B-C에 도시된 바와 같이, D7 GCase는 WT hGCase와 비교하여 더 높은 세포내 발현 수준을 나타낸 반면, D7 GCase만이 HEK293T 세포로부터 분비되었다. 열 안정성과 관련하여, D7 GCase는 pH 6.1 및 pH 7.4에서 Cerezyme®에 비해 각각 약 11 ℃ 및 약 20 ℃ 더 높은 열 안정성을 나타냈으며, pH 6.1에서 야생형 인간 GCase와 비교하여 약 7 ℃ 더 높은 열 안정성을 나타냈다 (아래 표 1 참조). 효소 활성과 관련하여, D7 GCase 및 WT hGCase는 유사한 kcat/Km 값을 가졌다 (아래 표 2 참조). 종합하면, GCase의 새로운 변이체(D2-7 GCase)는 야생형 인간 GCase와 비교하여 효소 활성을 유지하면서 더 높은 발현 수준과 더 높은 열적 안정성을 부여받았으며, Cerezyme®에 비해 더 높은 열적 안정성을 부여받았다. 따라서, 이들은 GD 치료를 위한 효소 대체 요법(ERT)에 사용하기 위한 유망한 새로운 가능성을 제공한다.

본 발명자들은 PROSS 알고리즘을 사용하여 GCase의 4개의 새로운 폴리펩타이드 변이체를 추가로 생성하였다(디자인 13-16, 즉, D13-16, 각각 SEQ ID NO: 18, 20, 22 및 27에 기재됨). GCase 변이체 D13, D14, D15 및 D16을 HEK293T 세포에서 발현시키고, 배양 배지에서 분리하고, 형광 표지된 GCase 유사체(NBD 글루코실세라마이드(d18:1/6:0)(C6NBD GlcCer))를 사용하여 효소 활성에 대해 테스트하였다. 효소 활성이 가장 높은 디자인, 즉 변이체 D15 및 D16 GCase를 추가 특성화에 사용하였다. 하기 실시예 6 및 9에서 명백한 바와 같이, 변이체 D15 및 D16 GCase는 pH 6.1에서 Cerezyme®과 비교할 때 17-20 ℃ 만큼 더 높은 열 안정성을 나타냈다. 또한, GCase의 천연 기질(C6NBD GlcCer) 및 합성 기질(p-NP-Glc) 모두에 의해 측정된 효소 활성은 Cerezyme® 및 변이체 D15 및 D16에 대해 유사하였다(아래 실시예 7 및 10 참조).

따라서, 본 발명의 일 측면에 따르면, (i) SEQ ID NO: 2와 적어도 85% 동일한 아미노산 서열을 포함하고; 및 (ii) 좌표 L34P, K224N/G, T369E 및 N370D에서 돌연변이(여기서 좌표는 SEQ ID NO: 2에 해당함)를 포함하며; 및 (iii) 당지질 글루코실세라마이드(GlcCer)의 가수분해를 촉매할 수 있는, 유전자 변형 인간 β-글루코세레브로시다아제(GCase)를 제공한다.

본원에 사용된 용어 글루코실세라미다제, 산 베타-글루코시다제, D-글루코실-N-아실스핑고신 글루코하이드롤라제, GCase 또는 GBA로도 지칭되는 "베타-글루코세레브로시다아제" 또는 "글루코세레브로시다아제"(EC 3.2.1.45) 용어는 글루코실세라미다제 활성을 갖는 효소를 지칭한다. 글루코실세라미다제 활성으로 본 발명의 이러한 측면의 β-글루코세레브로시다아제(GCase)는 글루코실세라마이드/GlcCer(당지질 대사의 중간체)의 세라마이드 및 글루코스로의 가수분해를 촉매하는 인간 GCase이다.

일 구현예에 따르면, 변형이 수행되는 단백질은 SEQ ID NO: 2에 기재된 서열을 포함한다.

일 구현예에 따르면, 변형이 수행되는 단백질은 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 서열을 포함한다.

SEQ ID NO: 2에 기재된 서열은 SEQ ID NO: 2에 도달하도록 아미노산 위치 495에서 인간 야생형 GCase와 비교하여 하나의 변형을 포함, 즉, 인간 야생형 GCase의 위치 495에 있는 아르기닌(R)이 히스티딘으로 대체하는 것으로 이해될 것이다. GCase의 효소 활성은 이 변형에 의해 영향을 받지 않는다.

특정 구현예에 따르면, 인간 GCase 단백질의 서열은 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 바와 같다. SEQ ID NO: 2와 SEQ ID NO: 25(인간) 사이의 돌연변이 위치는 동일하다.

본원에 사용된 GCase의 "촉매 도메인"이라는 용어는 글루코실세라마이드/GlcCer의 가수분해를 촉매화하는데 관여하는 아미노산 잔기를 지칭한다. 촉매 도메인의 3D 구조가 활성 부위를 형성하므로 GCase가 올바르게 폴딩되어야 활성화된다. 예를 들어, GCase의 촉매 도메인은 SEQ ID NO: 2 또는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN)의 아미노산 좌표 D127, F128, W179, N234, E235, Y244, F246, Q284, Y313, E340, S345, W381, N396을 포함한다.

본 명세서에 사용된 용어 "글리코실화 부위"는 글리코시드 사슬이 번역 후 부착되고 이의 존재가 효소의 활성을 향상시키는 GCase의 아스파라긴 잔기를 지칭한다. 인간 GCase에는 N19, N59, N146, N270 및 N462의 5개의 후보 사이트가 있다. N462는 일반적으로 사용되지 않는다. 이전에 Berg-Fussman과 동료들(Berg-Fussman, Grace, Ionnou & Grabowski [1993] J Biol Chem 268:14861-14866)에 의해 이러한 아스파라긴이 글루타민으로 돌연변이되어 글리코실화를 방지하는 경우 GCase 활성이 유의하게 완전히는 아니지만 줄어들었다. 글리코시드 사슬은 다양하지만(발현된 다양한 재조합 형태에서), 근위 당은 여러 만노스 잔기가 부착된 N-아실글루코사민 모이어티이다.

일 구현예에 따르면, 유전적으로 변형된 인간 GCase(변이체 또는 폴리펩티드로도 명명)는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 84% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 85% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 86% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 88% 동일한 아미노산 서열을 포함한다

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 90% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 95% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 96% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 97% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 98% 동일한 아미노산 서열을 포함한다

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 2 또는 SEQ ID NO: 25와 적어도 99% 동일한 아미노산 서열을 포함한다.

상동성(예, 퍼센트 상동성, 서열 동일성 + 서열 유사성)은 쌍별 서열 정렬을 계산하는 임의의 상동성 비교 소프트웨어를 사용하여 결정될 수 있다.

본원에 사용된 2개의 핵산 또는 폴리펩티드 서열의 맥락에서 "서열 동일성" 또는 "동일성"은 정렬될 때 동일한 2개의 서열 내의 잔기에 대한 언급을 포함한다. 서열 동일성의 백분율이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이하다는 것이 인지되며, 여기서 아미노산 잔기가 유사한 화학적 특성(예, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 대체되므로 분자의 기능적 특성을 변경하지 않는다. 서열이 보존적 치환에서 상이한 경우, 치환의 보존적 성질을 수정하기 위해 서열 동일성 퍼센트를 상향 조정할 수 있다. 이러한 보존적 치환에 의해 상이한 서열은 "서열 유사성" 또는 "유사성"을 갖는 것으로 간주된다. 이러한 조정을 위한 수단은 당업자에게 잘 알려져 있다. 일반적으로 여기에는 보존적 치환을 전체 불일치가 아닌 부분적 불일치로 점수화하여 서열 동일성 백분율을 증가시키는 것이 포함된다. 따라서 예를 들어 동일한 아미노산에 1점을 부여하고 비보존적 치환에 0점을 부여하는 경우, 보존적 치환에는 0과 1 사이의 점수가 주어진다. 보존적 치환의 점수는 예를 들어, Henikoff S 및 Henikoff JG의 알고리즘에 따라 계산된다 [Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. U.S.A. 1992, 89(22): 10915-9].

동일성(예, 상동성 퍼센트)은 예를 들어 기본 매개변수를 사용하는 것과 같이 NCBI(National Center of Biotechnology Information)의 BlastN 소프트웨어를 비롯한 임의의 상동성 비교 소프트웨어를 사용하여 결정할 수 있다.

본 발명의 일부 구현예에 따르면, 동일성은 전체적 동일성, 즉 본 발명의 전체 아미노산 또는 핵산 서열에 대한 동일성이며 이의 일부에 대해서는 동일성이 아니다.

본 발명의 일부 구현예에 따르면, 용어 "상동성" 또는 "상동성"은 2개 이상의 핵산 서열의 동일성; 또는 2개 이상의 아미노산 서열의 동일성; 또는 하나 이상의 핵산 서열에 대한 아미노산 서열의 동일성을 지칭한다.

본 발명의 일부 구현예에 따르면, 상동성은 전체적인 상동성, 즉, 본 발명의 전체 아미노산 또는 핵산 서열에 대한 상동성이며 이의 일부에 대한 상동성은 아니다. 2개 이상의 서열 사이의 상동성 또는 동일성의 정도는 다양한 공지된 서열 비교 도구를 사용하여 결정할 수 있다. 다음은 본 발명의 일부 구현예와 함께 사용될 수 있는 이러한 도구에 대한 비제한적인 설명이다.

쌍별 전체 정렬은 S. B. Needleman 및 C. D. Wunsch("A general method applicable to the search of similarities in the amino acid sequence of two proteins" Journal of Molecular Biology, 1970, pages 443-53, volume 48)에 의해 정의되었다.

폴리펩티드 서열에서 시작하여 폴리뉴클레오티드 서열과 비교할 때 OneModel FramePlus 알고리즘 [Halperin, E., Faigler, S. and Gill-More, R. (1999) - FramePlus: aligning DNA to protein sequences. Bioinformatics, 15, 867-873) (biocceleration(dot)com/Products(dot)html에서 사용 가능)을 사용할 수 있다.

폴리뉴클레오티드 서열로 시작하여 다른 폴리뉴클레오티드 서열과 비교할 때 EMBOSS-6.0.1 Needleman-Wunsch 알고리즘(emboss(dot)sourceforge(dot)net/apps/cvs/emboss/apps/needle(dot)html에서 사용 가능)을 수행할 수 있다.

일부 구현예에 따르면, 상동성 정도의 결정은 (단백질-단백질 비교 또는 뉴클레오티드-뉴클레오티드 비교를 위해) 스미스-워터만 알고리즘을 사용하는 것을 추가로 필요로 한다.

본 발명의 일부 구현예에 따르면, 전체적 상동성은 관심 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 전체적 상동성(예, 전체 서열에 대한 80% 전체적 상동성)을 수행하기 전에, 관심 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 국부적 상동성(예, 서열 길이의 60%에 걸쳐 60% 동일성)에 의해 미리 선택된 서열에서 수행한다. 예를 들어, 상동 서열은 첫 번째 단계의 필터로 Blastp 및 tBlastn 알고리즘을 사용하고 두 번째 단계의 경우 바늘(EMBOSS 패키지) 또는 Frame+ 알고리즘 정렬과 함께 BLAST 소프트웨어를 사용하여 선택한다. 국소적 동일성(Blast 정렬)은 전체적 정렬 단계에 대한 필터로만 사용되기 때문에 시퀀스 길이의 60% 범위에서 매우 허용적인 컷오프- 60% 동일성으로 정의된다. 이 특정 구현예에서(국소적 동일성이 사용될 때), Blast 패키지의 디폴트 필터링은 (파라미터 "-F F"를 설정함으로써) 사용되지 않는다. 두 번째 단계에서 상동체는 핵심 유전자 폴리펩타이드 서열에 대해 적어도 80%의 전체적 동일성을 기반으로 정의된다.

본 발명의 일부 구현예에 따르면, GCase 폴리펩티드는 길이가 470-520개 아미노산이다.

본 발명의 일부 구현예에 따르면, GCase 폴리펩티드는 길이가 480-510개 아미노산이다.

본 발명의 일부 구현예에 따르면, GCase 폴리펩티드는 길이가 490-510개 아미노산이다.

본 발명의 일부 구현예에 따르면, GCase 폴리펩타이드는 길이가 495-500개 아미노산이다.

특정 구현예에 따르면, GCase 폴리펩타이드는 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504 또는 505개의 아미노산 잔기를 포함하는 아미노산 서열을 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 497개의 아미노산 잔기를 포함하는 아미노산 서열을 포함한다.

본원에 사용된 용어 "폴리펩티드"는 폴리펩티드를 고도로 발현가능하게 하는 변형을 포함하고, 동물 또는 인간 신체 내에서 인비트로 및 인비보 모두에서 보다 안정하거나 천연 GCase 서열, 즉 SEQ ID NO: 2 또는 SEQ ID NO: 25과 비교하여 세포 내로 더 침투할 수 있도록 하는 변형을 포함한다.

이러한 변형은 N 말단 변형, C 말단 변형, 폴리펩티드 결합 변형, 백본 변형 및 잔기 변형을 포함하지만, 이에 제한되지 않는다. 펩티드 모방 화합물의 제조 방법은 당업계에 잘 알려져 있으며, 예를 들어 문헌 Quantitative Drug Design, C.A. Ramsden Gd., Chapter 17.2, F. Choplin Pergamon Press(1992)는 본원에 완전히 설명된 것처럼 참조로 포함되어 명시되어 있다. 이와 관련하여 추가 세부사항은 아래에 제공된다.

"단리된"이라는 용어는 예를 들어, 인체와 같은 자연 환경에서 적어도 부분적으로 분리된 것을 의미한다. 일 구현예에 따르면, 단리된 폴리펩티드는 본질적으로 오염된 세포 성분, 예컨대 탄수화물, 지질, 또는 자연에서 폴리펩티드와 관련된 기타 단백질성 불순물이 없는 것이다. 그러나, 용어 "단리된"은 이량체 또는 대안적으로 글리코실화된 또는 유도체화된 형태와 같은 대안적인 물리적 형태의 동일한 폴리펩티드의 존재를 배제하지 않는다.

"아미노산" 또는 "아미노산"이라는 용어는 20개의 자연 발생 아미노산; 예를 들어, 히드록시프롤린, 포스포세린 및 포스포트레오닌을 포함하는 생체내 번역 후 종종 변형되는 아미노산; 및 2-아미노아디프산, 히드록실리신, 이소데스모신, 노르-발린, 노르-류신 및 오르니틴을 포함하나 이에 제한되지 않는 기타 특이한 아미노산을 포함하는 것으로 이해된다.

일 구현예에 따르면, 아미노산은 "동등한 아미노산 잔기"이다. 등등한 아미노산 잔기는 폴리펩티드의 구조 및/또는 기능성(예, 글루코실세라마이드/GlcCer의 가수분해를 촉매하는 능력)을 실질적으로 변경하지 않으면서 폴리펩티드의 또 다른 아미노산 잔기를 대체할 수 있는 아미노산 잔기를 지칭한다. 따라서 동등한 아미노산은 측쇄의 부피, 측쇄 극성(극성 또는 비극성), 소수성(소수성 또는 친수성), pH(산성, 중성 또는 염기성) 및 탄소 분자의 측쇄 구성(방향족/지방족)과 같은 유사한 특성을 갖는다. 따라서 "동등한 아미노산 잔기"는 "보존적 아미노산 치환"으로 간주될 수 있다.

"동등한 아미노산 치환"이라는 용어의 의미 내에서 하나의 아미노산은 아래에 표시된 아미노산 그룹 내에서 다른 것으로 치환될 수 있다:

i) 극성 측쇄를 갖는 아미노산(Asp, Glu, Lys, Arg, His, Asn, Gln, Ser, Thr, Tyr, Cys);

ii) 비극성 측쇄를 갖는 아미노산(Gly, Ala, Val, Leu, Ile, Phe, Trp, Pro, Met);

iii) 비극성 지방족 측쇄를 갖는 아미노산(Gly, Ala, Val, Leu, Ile);

iv) 고리형 측쇄를 갖는 아미노산(Phe, Tyr, Trp, His, Pro);

v) 방향족 측쇄를 갖는 아미노산(Phe, Tyr, Trp);

vi) 산성 측쇄를 갖는 아미노산(Asp, Glu);

vii) 염기성 측쇄를 갖는 아미노산(Lys, Arg, His);

viii) 아미드 측쇄를 갖는 아미노산(Asn, Gln);

ix) 하이드록시 측쇄를 갖는 아미노산(Ser, Thr);

x) 황-함유 측쇄를 갖는 아미노산(Cys, Met);

xi) 중성의 약한 소수성 아미노산(Pro, Ala, Gly, Ser, Thr);

xii) 친수성 아미노산(Arg, Asn, Asp, Glu, Gln, His, Lys, Ser, Thr, Tyr);및

xiii) 소수성 아미노산(Ala, Cys, Gly, Ile, Leu, Met, Phe, Pro, Trp, Val).

xiv) 하전된 아미노산(Arg, Lys, Asp, Glu)

본 발명의 폴리펩티드는 펩티드가 가용성 형태일 것을 요구하는 치료제에 이용되기 때문에, 본 발명의 일부 구현예의 폴리펩티드는 바람직하게 하이드록실-함유 측쇄로 인해 폴리펩티드의 용해도를 증가시킬 수 있는 세린을 포함하나 이에 제한되지 않는 하나 이상의 비천연 또는 천연 극성 아미노산을 포함한다.

특정 구현예에 따르면, GCase 변이체의 아미노산 서열은 돌연변이, 예를 들어 SEQ ID NO: 2와 비교하여 치환을 포함한다.

특정 구현예에 따르면, GCase 변이체의 아미노산 서열은 돌연변이, 예를 들어 SEQ ID NO: 25와 비교하여 치환을 포함한다.

구현예에 따르면, 돌연변이(들)는 SEQ ID NO: 25에 있다.

본 발명의 일부 구현예의 폴리펩타이드는 변형된 영역이 촉매 도메인의 일부가 아닌, 예를 들어 (위에서 논의된) 활성 부위를 형성하는 촉매 도메인의 3D 구조 또는 글리코실화 부위, 즉 SEQ ID NO:2 또는 SEQ ID NO:25의 3D 구조를 변형시키지 않는 한, 본 명세서에 기재된 돌연변이를 포함할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO:2 또는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 4-80, 4-75, 4-70, 4-60, 4-50, 4-45, 4-40, 4-35, 4-30, 4-25, 4-20, 4-15, 4-10, 4-5, 6-80, 6-75, 6-70, 6-60, 6-50, 6-40, 6-35, 6-30, 6-25, 6-20, 6-15, 6-10, 9-80, 9-75, 9-70, 9-60, 9-50, 9-40, 9-35, 9-30, 9-25, 9-20, 9-15, 9-10, 12-80, 12-75, 12-70, 12-60, 12-50, 12-40, 12-35, 12-30, 12-25, 12-20, 12-15, 16-80, 16-75, 16-70,16-60, 16-50, 16-40, 16-35, 16-30, 16-25, 16-20, 19-80, 19-75, 19-70,19-60, 19-50, 19-40, 19-35, 19-30, 19-25, 19-20, 21-80, 21-75, 21-70, 21-60, 21-50, 21-45, 21-40, 21-35, 21-30, 21-25, 25-80, 25-75, 25-70, 25-60, 25-50, 25-45, 25-40, 25-35, 25-30, 30-80, 30-75, 30-70, 30-60, 30-50, 30-45, 30-40, 30-35, 40-80, 40-70, 40-60, 40-50, 50-80, 50-70, 50-55, 55-60, 60-70 또는 70-80개의 돌연변이를 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO:2 또는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79 또는 80개 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 4개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 9개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 16개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 15개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 제시된 아미노산 서열에 19개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 18개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 21개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 20개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 30개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 29개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 36개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 35개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 ㅍ된 아미노산 서열에 46개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 45개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 56개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 55개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 2에 기재된 아미노산 서열에 73개의 돌연변이를 포함한다.

특정 구현예에 따르면, GCase 폴리펩타이드는 SEQ ID NO: 25(UniProtKB - P04062(GLCM_HUMAN))에 기재된 아미노산 서열에 72개의 돌연변이를 포함한다.

상기 논의된 바와 같이, 본 발명의 일부 구현예의 GCase 폴리펩티드는 돌연변이 L34P, K224N/G, T369E 및 N370D를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 아미노산 좌표는 수동으로 수행될 수 있는 아미노산 서열 정렬에 의해 또는 FASTA, L-ALIGN 및 단백질 Blast와 같은 특정 생물정보학 도구를 사용하여 당업자에 의해 조정될 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H145K/R, I204K, E222K, T334F/Y/K 또는 L372N 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩타이드는 H145K/R, I204K, E222K, T334F/Y/K 또는 L372N의 돌연변이 중 2개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩타이드는 돌연변이 H145K/R 및 I204K; H145K/R 및 E222K; H145K/R 및 T334F/Y/K; H145K/R 및 L372N; I204K 및 E222K; I204K 및 T334F/Y/K; I204K 및 L372N; E222K 및 T334F/Y/K; E222K 및 L372N; 또는 T334F/Y/K 및 L372N를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩타이드는 돌연변이: H145K/R, I204K, E222K, T334F/Y/K 또는 L372N 중 3개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: H145K/R, I204K 및 E222K; H145K/R, I204K 및 T334F/Y/K; H145K/R, I204K 및 L372N; H145K/R, E222K 및 T334F/Y/K; H145K/R, E222K 및 L372N; H145K/R, T334F/Y/K 및 L372N; I204K, E222K 및 T334F/Y/K; I204K, E222K 및 L372N; I204K, T334F/Y/K 및 L372N; 또는 E222K, T334F/Y/K 및 L372N를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H145K/R, I204K, E222K, T334F/Y/K 또는 L372N 중 4개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: I204K, E222K, T334F/Y/K 및 L372N; H145K/R, E222K, T334F/Y/K 및 L372N; H145K/R, I204K, T334F/Y/K 및 L372N; H145K/R, I204K, E222K 및 L372N; 또는 H145K/R, I204K, E222K 및 T334F/Y/K를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H145K/R, I204K, E222K, T334F/Y/K 및 L372N 모두를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H145K/R, I204K, E222K, K224N/G, T334F/Y/K, T369E, N370D 및 L372N 모두를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

특정 구현예에 따르면, SEQ ID NO: 2의 H495R 변형은 SEQ ID NO: 2의 단일 아르기닌(R)을 히스티딘(H) 변형으로 바꾼다 (즉, SEQ ID NO: 25에 기재된 WT 서열로 돌아간다).

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 2개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: N102D/E 및 L165Q; N102D/E 및 Q226T; N102D/E 및 L241I; N102D/E 및 S242P; N102D/E 및 K473W; N102D/E 및 H495R; L165Q 및 Q226T; L165Q 및 L241I; L165Q 및 S242P; L165Q 및 K473W; L165Q 및 H495R; Q226T 및 L241I; Q226T 및 S242P; Q226T 및 K473W; Q226T 및 H495R; L241I 및 S242P; L241I 및 K473W; L241I 및 H495R; S242P 및 K473W; S242P 및 H495R; 또는 K473W 및 H495R를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 3개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드 돌연변이: N102D/E, L165Q 및 Q226T; N102D/E, L165Q 및 L241I; N102D/E, L165Q 및 S242P; N102D/E, L165Q 및 K473W; N102D/E, L165Q 및 H495R; N102D/E, Q226T 및 L241I; N102D/E, Q226T 및 S242P; N102D/E, Q226T 및 K473W; N102D/E, Q226T 및 H495R; N102D/E, L241I 및 S242P; N102D/E, L241I 및 K473W; N102D/E, L241I 및 H495R; N102D/E, S242P 및 K473W; N102D/E, S242P 및 H495R; N102D/E, K473W 및 H495R; L165Q, Q226T 및 L241I; L165Q, Q226T 및 S242P; L165Q, Q226T 및 K473W; L165Q, Q226T 및 H495R; L165Q, L241I 및 S242P; L165Q, L241I 및 K473W; L165Q, L241I 및 H495R; L165Q, S242P 및 K473W; L165Q, S242P 및 H495R; L165Q, K473W 및 H495R; Q226T, L241I 및 S242P; Q226T, L241I 및 K473W; Q226T, L241I 및 H495R; Q226T, S242P 및 K473W; Q226T, S242P 및 H495R; L241I, S242P 및 K473W; L241I, S242P 및 H495R; 또는 S242P, K473W 및 H495R를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 4개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드 돌연변이: N102D/E, L165Q, Q226T 및 L241I; N102D/E, L165Q, Q226T 및 S242P; N102D/E, L165Q, Q226T 및 K473W; N102D/E, L165Q, Q226T 및 H495R; N102D/E, Q226T, L241I 및 S242P; N102D/E, Q226T, L241I 및 K473W; N102D/E, Q226T, L241I 및 H495R; N102D/E, L241I, S242P 및 K473W; N102D/E, L241I, S242P 및 H495R; N102D/E, S242P, K473W 및 H495R; L165Q, Q226T, L241I 및 S242P; L165Q, Q226T, L241I 및 K473W; L165Q, Q226T, L241I 및 H495R; L165Q, L241I, S242P 및 K473W; L165Q, L241I, S242P 및 H495R; L165Q, S242P, K473W 및 H495R; Q226T, L241I, S242P 및 K473W; Q226T, L241I, S242P 및 H495R; 또는 L241I, S242P, K473W 및 H495R를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 5개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드 돌연변이: N102D/E, Q226T, L241I, S242P 및 K473W; N102D/E, Q226T, L241I, S242P 및 H495R; N102D/E, Q226T, L241I, K473W 및 H495R; N102D/E, Q226T, S242P, K473W 및 H495R; N102D/E, L241I, S242P, K473W 및 H495R; N102D/E, L165Q, S242P, K473W 및 H495R; N102D/E, L165Q, L241I, K473W 및 H495R; N102D/E, L165Q, L241I, S242P 및 H495R; N102D/E, L165Q, L241I, S242P 및 K473W; N102D/E, L165Q, Q226T, K473W 및 H495R; N102D/E, L165Q, Q226T, S242P 및 H495R; N102D, L165Q, Q226T, S242P 및 K473W; N102D, L165Q, Q226T, L241I 및 H495R; N102D/E, L165Q, Q226T, L241I 및 K473W; Q226T, L241I, S242P, K473W 및 H495R; L165Q, L241I, S242P, K473W 및 H495R; L165Q, Q226T, S242P, K473W 및 H495R; L165Q, Q226T, L241I, K473W 및 H495R; L165Q, Q226T, L241I, S242P 및 H495R; 또는 L165Q, Q226T, L241I, S242P 및 K473W를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 또는 H495R 중 6개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드 돌연변이: N102D/E, Q226T, L241I, S242P, K473W 및 H495R; N102D/E, L165Q, L241I, S242P, K473W 및 H495R; N102D/E, L165Q, Q226T, S242P, K473W 및 H495R; N102D/E, L165Q, Q226T, L241I, K473W 및 H495R; N102D/E, L165Q, Q226T, L241I, S242P 및 H495R; N102D/E, L165Q, Q226T, L241I, S242P 및 K473W; 또는 L165Q, Q226T, L241I, S242P, K473W 및 H495R을 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 및 H495R 모두를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, N102D/E, H145K/R, L165Q, I204K, E222K, K224N/G, Q226T, L241I, S242P, T334F/Y/K, N3760D, L372N, K473W 및 H495R 모두를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 I130T, A168S 또는 D263N 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 I130T, A168S 또는 D263N 중 2개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

따라서, 예를 들어, GCase 폴리펩티드는 돌연변이 I130T 및 A168S; I130T 및 D263N; 또는 A168S 및 D263N를 추가로 포함할 수 있고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: I130T, A168S 및 D263N 모두를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, N102D/E, I130T, H145K/R, L165Q, A168S, I204K, E222K, K224N/G, Q226T, L241I, S232P, T/34 K, T369E, N370D, L372N, K473W 및 H495R 모두를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: R211N 또는 K303R 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 R211N 및 K303R 둘 다를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, N102D/E, I130T, H145K/R, L165Q, A168S, I204K, R211N, E222K, K224N/G, Q226T, L231I, S264 T334F/Y/K, T369E, N370D, L372N, K473W 및 H495R 모두를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 2개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: H60W 및 L103N/E/R; H60W 및 Q166A; H60W 및 H274R; H60W 및 N333D; H60W 및 N386D; H60W 및 R395K; H60W 및 I406T/A; H60W 및 L420M/I; L103N/E/R 및 Q166A; L103N/E/R 및 H274R; L103N/E/R 및 N333D; L103N/E/R 및 N386D; L103N/E/R 및 R395K; L103N/E/R 및 I406T/A; L103N/E/R 및 L420M/I; Q166A 및 H274R; Q166A 및 N333D; Q166A 및 N386D; Q166A 및 R395K; Q166A 및 I406T/A; Q166A 및 L420M/I; H274R 및 N333D; H274R 및 N386D; H274R 및 R395K; H274R 및 I406T/A; H274R 및 L420M/I; N333D 및 N386D; N333D 및 R395K; N333D 및 I406T/A; N333D 및 L420M/I; N386D 및 R395K; N386D 및 I406T/A; N386D 및 L420M/I; R395K 및 I406T/A; R395K 및 L420M/I; 또는 I406T/A 및 L420M/I를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 3개를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩타이드는 돌연변이: H60W, L103N/E/R 및 Q166A; H60W, L103N/E/R 및 H274R; H60W, L103N/E/R 및 N333D; H60W, L103N/E/R 및 N386D; H60W, L103N/E/R 및 R395K; H60W, L103N/E/R 및 I406T/A; H60W, L103N/E/R 및 L420M/I; H60W, Q166A 및 H274R; H60W, Q166A 및 N333D; H60W, Q166A 및 N386D; H60W, Q166A 및 R395K; H60W, Q166A 및 I406T/A; H60W, Q166A 및 L420M/I; H60W, H274R 및 N333D; H60W, H274R 및 N386D; H60W, H274R 및 R395K; H60W, H274R 및 I406T/A; H60W, H274R 및 L420M/I; H60W, N333D 및 N386D; H60W, N333D 및 R395K; H60W, N333D 및 I406T/A; H60W, N333D 및 L420M/I; H60W, N386D 및 R395K; H60W, N386D 및 I406T/A; H60W, N386D 및 L420M/I; H60W, R395K 및 I406T/A; H60W, R395K 및 L420M/I; H60W, I406T/A 및 L420M/I; L103N/E/R, Q166A 및 H274R; L103N/E/R, Q166A 및 N333D; L103N/E/R, Q166A 및 N386D; L103N/E/R, Q166A 및 R395K; L103N/E/R, Q166A 및 I406T/A; L103N/E/R, Q166A 및 L420M/I; L103N/E/R, H274R 및 N333D; L103N/E/R, H274R 및 N386D; L103N/E/R, H274R 및 R395K; L103N/E/R, H274R 및 I406T/A; L103N/E/R, H274R 및 L420M/I; L103N/E/R, N333D 및 N386D; L103N/E/R, N333D 및 R395K; L103N/E/R, N333D 및 I406T/A; L103N/E/R, N333D 및 L420M/I; L103N/E/R, N386D 및 R395K; L103N/E/R, N386D 및 I406T/A; L103N/E/R, N386D 및 L420M/I; L103N/E/R, R395K 및 I406T/A; L103N/E/R, R395K 및 L420M/I; L103N/E/R, I406T/A 및 L420M/I; Q166A, H274R 및 N333D; Q166A, H274R 및 N386D; Q166A, H274R 및 R395K; Q166A, H274R 및 I406T/A; Q166A, H274R 및 L420M/I; Q166A, N333D 및 N386D; Q166A, N333D 및 R395K; Q166A, N333D 및 I406T/A; Q166A, N333D 및 L420M/I; Q166A, N386D 및 R395K; Q166A, N386D 및 I406T/A; Q166A, N386D 및 L420M/I; Q166A, R395K 및 I406T/A; Q166A, R395K 및 L420M/I; H274R, N333D 및 N386D; H274R, N333D 및 R395K; H274R, N333D 및 I406T/A; H274R, N333D 및 L420M/I; H274R, N386D 및 R395K; H274R, N386D 및 I406T/A; H274R, N386D 및 L420M/I; H274R, R395K 및 I406T/A; H274R, R395K 및 L420M/I; H274R, I406T/A 및 L420M/I; N333D, N386D 및 R395K; N333D, N386D 및 I406T/A; N333D, N386D 및 L420M/I; N333D, R395K 및 I406T/A; N333D, R395K 및 L420M/I; N333D, I406T/A 및 L420M/I; N386D, R395K 및 I406T/A; N386D, R395K 및 L420M/I; N386D, I406T/A 및 L420M/I; 또는 R395K, I406T/A 및 L420M/I를 추가로 포함할 수 있고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 4개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A 및 H274R; H60W, L103N/E/R, Q166A 및 N333D; H60W, L103N/E/R, Q166A 및 N386D; H60W, L103N/E/R, Q166A 및 R395K; H60W, L103N/E/R, Q166A 및 I406T/A; H60W, L103N/E/R, Q166A 및 L420M/I; H60W, Q166A, H274R 및 N333D; H60W, Q166A, H274R 및 N386D; H60W, Q166A, H274R 및 R395K; H60W, Q166A, H274R 및 I406T/A; H60W, Q166A, H274R 및 L420M/I; H60W, Q166A, N333D 및 N386D; H60W, Q166A, N333D 및 R395K; H60W, Q166A, N333D 및 I406T/A; H60W, Q166A, N333D 및 L420M/I; H60W, Q166A, N386D 및 R395K; H60W, Q166A, N386D 및 I406T/A; H60W, Q166A, N386D 및 L420M/I; H60W, Q166A, R395K 및 I406T/A; H60W, Q166A, R395K 및 L420M/I; H60W, Q166A, I406T/A 및 L420M/I; H60W, H274R, N333D 및 N386D; H60W, H274R, N333D 및 R395K; H60W, H274R, N333D 및 I406T/A; H60W, H274R, N333D 및 L420M/I; H60W, N333D, N386D 및 R395K; H60W, N333D, N386D 및 I406T/A; H60W, N333D, N386D 및 L420M/I; H60W, N386D, R395K 및 I406T/A; H60W, N386D, R395K 및 L420M/I; H60W, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R 및 N333D; L103N/E/R, Q166A, H274R 및 N386D; L103N/E/R, Q166A, H274R 및 R395K; L103N/E/R, Q166A, H274R 및 I406T/A; L103N/E/R, Q166A, H274R 및 L420M/I; L103N/E/R, H274R, N333D 및 N386D; L103N/E/R, H274R, N333D 및 R395K; L103N/E/R, H274R, N333D 및 I406T/A; L103N/E/R, H274R, N333D 및 L420M/I; L103N/E/R, N333D, N386D 및 R395K; L103N/E/R, N333D, N386D 및 I406T/A; L103N/E/R, N333D, N386D 및 L420M/I; L103N/E/R, N386D, R395K 및 I406T/A; L103N/E/R, N386D, R395K 및 L420M/I; L103N/E/R, R395K, I406T/A 및 L420M/I; 또는 N386D, R395K, I406T/A 및 L420M/I를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 5개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R 및 N333D; H60W, L103N/E/R, Q166A, H274R 및 N386D; H60W, L103N/E/R, Q166A, H274R 및 R395K; H60W, L103N/E/R, Q166A, H274R 및 I406T/A; H60W, L103N/E/R, Q166A, H274R 및 L420M/I; H60W, Q166A, H274R, N333D 및 N386D; H60W, Q166A, H274R, N333D 및 R395K; H60W, Q166A, H274R, N333D 및 I406T/A; H60W, Q166A, H274R, N333D 및 L420M/I; H60W, H274R, N333D, N386D 및 R395K; H60W, H274R, N333D, N386D 및 I406T/A; H60W, H274R, N333D, N386D 및 L420M/I; H60W, N333D, N386D, R395K 및 I406T/A; H60W, N333D, N386D, R395K 및 L420M/I; H60W, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D 및 N386D; L103N/E/R, Q166A, H274R, N333D 및 R395K; L103N/E/R, Q166A, H274R, N333D 및 I406T/A; L103N/E/R, Q166A, H274R, N333D 및 L420M/I; L103N/E/R, H274R, N333D, N386D 및 R395K; L103N/E/R, H274R, N333D, N386D 및 I406T/A; L103N/E/R, H274R, N333D, N386D 및 L420M/I; L103N/E/R, N333D, N386D, R395K 및 I406T/A; L103N/E/R, N333D, N386D, R395K 및 L420M/I; L103N/E/R, N386D, R395K, I406T/A 및 L420M/I; Q166A, H274R, N333D, N386D 및 R395K; Q166A, H274R, N333D, N386D 및 I406T/A; Q166A, H274R, N333D, N386D 및 L420M/I; Q166A, N333D, N386D, R395K 및 I406T/A; Q166A, N333D, N386D, R395K 및 L420M/I; Q166A, N386D, R395K, I406T/A 및 L420M/I; H274R, N333D, N386D, R395K 및 I406T/A; H274R, N333D, N386D, R395K 및 L420M/I; 또는 N333D, N386D, R395K, I406T/A 및 L420M/I를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 6개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D 및 N386D; H60W, L103N/E/R, Q166A, H274R, N333D 및 R395K; H60W, L103N/E/R, Q166A, H274R, N333D 및 I406T/A; H60W, L103N/E/R, Q166A, H274R, N333D 및 L420M/I; H60W, Q166A, H274R, N333D, N386D 및 R395K; H60W, Q166A, H274R, N333D, N386D 및 I406T/A; H60W, Q166A, H274R, N333D, N386D 및 L420M/I; H60W, H274R, N333D, N386D, R395K 및 I406T/A; H60W, H274R, N333D, N386D, R395K 및 L420M/I; H60W, N333D, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D, N386D 및 R395K; L103N/E/R, Q166A, H274R, N333D, N386D 및 I406T/A; L103N/E/R, Q166A, H274R, N333D, N386D 및 L420M/I; L103N/E/R, H274R, N333D, N386D, R395K 및 I406T/A; L103N/E/R, H274R, N333D, N386D, R395K 및 L420M/I; L103N/E/R, N333D, N386D, R395K, I406T/A 및 L420M/I; Q166A, H274R, N333D, N386D, R395K 및 I406T/A; Q166A, H274R, N333D, N386D, R395K 및 L420M/I; 또는 H274R, N333D, N386D, R395K, I406T/A 및 L420M/I를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 7개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩타이드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D 및 R395K; H60W, L103N/E/R, Q166A, H274R, N333D, N386D 및 I406T/A; H60W, L103N/E/R, Q166A, H274R, N333D, N386D 및 L420M/I; H60W, Q166A, H274R, N333D, N386D, R395K 및 I406T/A; H60W, Q166A, H274R, N333D, N386D, R395K 및 L420M/I; H60W, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D, N386D, R395K 및 I406T/A; L103N/E/R, Q166A, H274R, N333D, N386D, R395K 및 L420M/I; L103N/E/R, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, N333D, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N386D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D, R395K, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D, N386D, I406T/A 및 L420M/I; L103N/E/R, Q166A, H274R, N333D, N386D, R395K 및 L420M/I; 또는 Q166A, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 또는 L420M/I 중 8개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다. 따라서, 예를 들어, GCase 폴리펩타이드는 돌연변이: L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I; H60W, Q166A, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I; H60W, L103N/E/R, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I; H60W, L103N/E/R, Q166A, N333D, N386D, R395K, I406T/A 및 L420M/I; H60W, L103N/E/R, Q166A, H274R, N386D, R395K, I406T/A 및 L420M/I; H60W, L103N/E/R, Q166A, H274R, N333D, R395K, I406T/A 및 L420M/I; H60W, L103N/E/R, Q166A, H274R, N333D, N386D, I406T/A 및 L420M/I; H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K 및 L420M/I; H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K 및 I406T/A를 추가로 포함할 수 있으며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 및 L420M/I 모두를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H60W, N102D, L103N, I130T, H145K/R, L165Q, Q166A, A168S, I204K, R211N, E222K, K224N, Q226T, L241I, S242P, D263N, H274R, K303R, N333D, T334F/Y, T369E, N370D, L372N, N386D, R395K, I406T, L420M, K473W, H495R 중 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 29개를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H60W, N102D, L103N, I130T, H145K/R, L165Q, Q166A, A168S, I204K, R211N, E222K, K224N, Q226T, L241I, S242P, D263N, H274R, K303R, N333D, T334F/Y, T369E, N370D, L372N, N386D, R395K, I406T, L420M, K473W 및 H495R 모두를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 V78I, A95K, V191M, A322D, V343T, M361E, S364A, H374W, T410E, H451N 또는 L480I 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 V78I, A95K, V191M, A322D, V343T, M361E, S364A, H374W, T410E, H451N 또는 L480I 중 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: V78I, A95K, V191M, A322D, V343T, M361E, S364A, H374W, T410E, H451N 및 L480I 모두를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H60W, V78I, A95K, N102E, L103E, I130T, H145K/R, L165Q, Q166A, A168S, V191M, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, A322D, T334K, V343T, M361E, S364A, T369E, N370D, L372N, H374W, I406A, T410E, L420I, H451N, K473W, L480I 및/또는 H495R 중 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H60W, V78I, A95K, N102E, L103E, I130T, H145K/R, L165Q, Q166A, A168S, V191M, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, A322D, T334K, V343T, M361E, S364A, T369E, N370D, L372N, H374W, I406A, T410E, L420I, H451N, K473W, L480I 및 H495R 모두를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H162K, S181A, T297S, M335F, K346H, S431A, S465D 또는 A476D 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 H162K, S181A, T297S, M335F, K346H, S431A, S465D 또는 A476D 중 적어도 2, 3, 4, 5, 6 또는 7개의 돌연변이를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: H162K, S181A, T297S, M335F, K346H, S431A, S465D 및 A476D 모두를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이 L34P, H60W, V78I, A95K, N102E, L103E, I130T, H145K/R, H162K, L165Q, Q166A, A168S, S181A, V191M, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T297S, A322D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, N386D, R395K, I406A, T410E, L420I, S431A, H451N, S465D, K473W, A476D, L480I 및/또는 H495R 중 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 또는 45개를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, H60W, V78I, A95K, N102E, L103E, I130T, H145K/R, H162K, L165Q, Q166A, A168S, S181A, V191M, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T297S, A322D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, N386D, R395K, I406A, T410E, L420I, S431A, H451N, S465D, K473W, A476D, L480I 및 H495R를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: R47K, L51R, Q70H, L91I, G115E, A124G, D140N/G, S196T, 또는 V437S 중 적어도 하나를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 R47K, L51R, Q70H, L91I, G115E, A124G, D140N/G, S196T 또는 V437S의 돌연변이 중 적어도 2, 3, 4, 5, 6, 7 또는 8개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: R47K, L51R, Q70H, L91I, G115E, A124G, D140N/G, S196T 및 V437S 모두를 추가로 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, R47K, L51R, H60W, Q70H, V78I, L91I, A95K, N102E, L103E, G115E, A124G, I130T, D140N/G, H145K/R, H162K, L165Q, Q166A, A168S, S181A, V191M, S196T, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T297S, A322D, N333D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, N386D, R395K, I406A, T410E, L420M, S431A, V437S, H451N, S465D, K473W, A476D, L480I 및/또는 H495R 중 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54 또는 55개를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, R47K, L51R, H60W, Q70H, V78I, L91I, A95K, N102E, L103E, G115E, A124G, I130T, D140N/G, H145K/R, H162K, L165Q, Q166A, A168S, S181A, V191M, S196T, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T297S, A322D, N333D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, N386D, R395K, I406A, T410E, L420M, S431A, V437S, H451N, S465D, K473W, A476D, L480I 및 H495R 모두를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: T36Q, S38A, Q143E, T183A, L185M, T272S, H274K, N275D, L286S, K293Q, E300R, K321E, V376T, K408R, Q440E, M450Q 및/또는 I483V 중 적어도 하나를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: T36Q, S38A, Q143E, T183A, L185M, T272S, H274K, N275D, L286S, K293Q, E300R, K321E, V376T, K408R, Q440E, M450Q 및/또는 I483V 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: T36Q, S38A, Q143E, T183A, L185M, T272S, H274K, N275D, L286S, K293Q, E300R, K321E, V376T, K408R, Q440E, M450Q 및/또는 I483V 모두를 추가로 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, T36Q, S38A, R47K, L51R, H60W, Q70H, V78I, L91I, A95K, N102E, L103R, G115E, A124G, I130T, D140G, Q143E, H145R, H162K, L165Q, Q166A, A168S, S181A, T183A, L185M, V191M, S196T, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T272S, H274K, N275D, L286S, K293Q, T297S, E300R, K321E, A322D, N333D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, V376T, N386D, R395K, I406A, K408R, T410E, L420M, S431A, V437S, Q440E, M450Q, H451N, S465D, K473W, A476D, L480I, I483V 및 H495R 중 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71 또는 72개를 포함하고, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

일 구현예에 따르면, GCase 폴리펩티드는 돌연변이: L34P, T36Q, S38A, R47K, L51R, H60W, Q70H, V78I, L91I, A95K, N102E, L103R, G115E, A124G, I130T, D140G, Q143E, H145R, H162K, L165Q, Q166A, A168S, S181A, T183A, L185M, V191M, S196T, I204K, R211N, E222K, K224G, Q226T, L241I, S242P, D263N, T272S, H274K, N275D, L286S, K293Q, T297S, E300R, K321E, A322D, N333D, T334K, M335F, V343T, K346H, M361E, S364A, T369E, N370D, L372N, H374W, V376T, N386D, R395K, I406A, K408R, T410E, L420M, S431A, V437S, Q440E, M450Q, H451N, S465D, K473W, A476D, L480I, I483V 및 H495R 모두를 포함하며, 여기서 좌표는 SEQ ID NO: 2에 해당한다.

위에서 언급했듯이 효소의 촉매 도메인의 아미노산은 변형되지 않는다.

일 구현예에 따르면, GCase 폴리펩타이드의 좌표 D127, F128, W179, N234, E235, Y244, F246, Q284, Y313, E340, S345, W381, N396에 있는 아미노산 중 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개(여기서 좌표는 SEQ ID NO: 2에 해당함)은 변형되지 않는다.

일 구현예에 따르면, GCase 폴리펩티드의 하기 좌표 D127, F128, W179, N234, E235, Y244, F246, Q284, Y313, E340, S345, W381, N396 모두에서 아미노산(여기서 좌표는 SEQ ID NO: 2에 해당함)은 변형되지 않는다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 및 27로 이루어진 군에서 선택된 서열과 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 이러한 결정은 다음과 같을 수 있다. 예를 들어 NCBI의 표준 단백질-단백질 BLAST[blastp] 소프트웨어를 사용하여 수행한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 85% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 90% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 95% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 96% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 97% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 98% 동일한 아미노산 서열을 포함한다.

특정 구현예에 따르면, 유전적으로 변형된 인간 GCase는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 또는 27과 적어도 99% 동일한 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 및 27로 이루어진 군에서 선택된 서열과 동일한 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 14와 적어도 95% 동일한 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 14에 기재된 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 22와 적어도 95% 동일한 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 22에 기재된 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 27과 적어도 95% 동일한 아미노산 서열을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 SEQ ID NO: 27에 기재된 아미노산 서열을 포함한다.

본 발명의 일부 구현예의 폴리펩티드는 폴리펩티드 합성 분야의 당업자에게 공지된 임의의 기술에 의해 합성될 수 있다. 일 구현예에 따르면, 본 발명의 폴리펩티드는 재조합 DNA 기술을 사용하여 합성될 수 있다.

재조합 기술을 사용하여 본 발명의 폴리펩티드를 생성하는 것이 바람직하다. 이러한 재조합 기술은 Bitter et al., (1987) Methods in Enzymol. 153:516-544, Studier et al. (1990) Methods in Enzymol. 185:60-89, Brisson et al. (1984) Nature 310:511-514, Takamatsu et al. (1987) EMBO J. 6:307-311, Coruzzi et al. (1984) EMBO J. 3:1671-1680 and Brogli et al., (1984) Science 224:838-843, Gurley et al. (1986) Mol. Cell. Biol. 6:559-565 및 Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463에 기술되어 있다.

재조합 기술을 사용하여 본 발명의 폴리펩타이드를 생산하기 위해, 본 발명의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드는 하기에 추가로 기술되는 바와 같이, 숙주 세포에서 구성적 또는 유도성 전사를 지시하기에 적합한 시스-조절(예를 들어, 프로모터) 서열의 전사 제어 하에 폴리뉴클레오타이드 서열을 포함하는 핵산 발현 작제물에 연결된다.

본 개시는 또한 유전적으로 변형된 인간 GCase 폴리펩티드를 코딩하는 핵산 서열을 제공한다.

본 명세서에 사용된 "단리된 폴리뉴클레오티드"라는 문구는 RNA 서열, 상보적 폴리뉴클레오타이드 서열(cDNA), 게놈 폴리뉴클레오타이드 서열 및/또는 복합 폴리뉴클레오타이드 서열(예, 위의 조합)의 형태로 분리되어 제공되는 단일 또는 이중 가닥 핵산 서열을 의미한다.

본 발명의 폴리펩타이드를 발현하기 위한 예시적인 폴리뉴클레오타이드 서열은 SEQ ID NO: 3, 5, 7, 9, 11, 13, 17, 19, 21, 23 또는 26에 기재되어 있다.

삽입된 코딩 서열의 전사 및 번역에 필요한 요소를 함유하는 것 외에, 본 발명의 발현 작제물은 또한 발현된 폴리펩티드의 안정성, 생산, 정제, 수율 또는 감소된 독성을 향상시키도록 조작된 서열(즉, 태그)을 포함할 수 있다. 이러한 융합 단백질은 친화성 크로마토그래피에 의해 융합 단백질이 용이하게 단리될 수 있도록 설계될 수 있고; 예를 들어, 이종 단백질에 대해 특이적인 컬럼에 고정화. 절단 부위가 펩티드 모이어티와 이종 단백질 사이에 조작된 경우, 절단 부위를 파괴하는 적절한 효소 또는 제제로 처리함으로써 크로마토그래피 컬럼으로부터 펩티드를 방출할 수 있다 [예, Booth et al. (1988) Immunol. Lett. 19:65-70; 및 Gardella et al., (1990) J. Biol. Chem. 265:15854-15859 참조].

다양한 원핵 또는 진핵 세포가 폴리펩티드 코딩 서열을 발현하기 위한 숙주-발현 시스템으로서 사용될 수 있다.

원핵 세포는 폴리펩티드 코딩 서열을 함유하는 재조합 박테리오파지 DNA, 플라스미드 DNA 또는 코스미드 DNA 발현 벡터로 형질전환된 박테리아와 같은 미생물을 포함하지만 이에 제한되지 않는다.

진핵 세포는 단세포 및 다세포 유기체를 포함하나 이에 제한되지 않는 진핵 유기체의 임의의 세포를 포함한다. 단세포 진핵생물 유기체는 효모, 원생동물, 점균류 및 조류를 포함하지만 이에 제한되지는 않는다. 다세포 진핵 생물은 동물(예, 포유류, 곤충, 무척추동물, 선충류, 조류, 어류, 파충류 및 갑각류), 식물, 진균 및 조류(예, 갈조류, 홍조류, 녹조류)를 포함하지만 이에 제한되지 않는다.

일 구현예에 따르면, 세포는 식물 세포이다.

식물 세포는 임의의 식물 조직, 예를 들어 과일, 꽃, 뿌리, 잎, 배, 배아 세포 현탁액, 캘러스 또는 묘목 조직으로부터 유래될 수 있다.

일 구현예에 따르면, 진핵 세포는 식물의 세포가 아니다.

일 구현예에 따르면, 진핵 세포는 동물 세포이다.

일 구현예에 따르면, 진핵 세포는 척추동물의 세포이다.

일 구현예에 따르면, 진핵 세포는 무척추 동물의 세포이다.

특정 구현예에 따르면, 무척추동물 세포는 곤충, 달팽이, 조개, 문어, 불가사리, 성게, 해파리 및 벌레의 세포이다.

특정 구현예에 따르면, 무척추동물 세포는 갑각류의 세포이다. 예시적인 갑각류는 새우, 새우, 게, 바닷가재 및 가재를 포함하지만 이에 제한되지는 않는다.

특정 구현예에 따르면, 무척추동물 세포는 어류의 세포이다. 예시적인 물고기는 연어, 참치, 명태, 메기, 대구, 해덕, 농어, 틸라피아, 북극 곤들매기 및 잉어를 포함하지만 이에 제한되지 않는다

포유동물 발현 시스템은 또한 본 발명의 폴리펩티드를 발현하는데 사용될 수 있다. GCase 폴리펩타이드 폴리펩타이드의 글리코실화를 할 수 있는 세포 시스템이 유리하다.

일 구현예에 따르면, 진핵 세포는 포유동물 세포이다.

특정 구현예에 따르면, 포유동물 세포는 설치류, 토끼, 돼지, 염소, 반추동물(예, 소, 양, 영양, 사슴, 기린), 개, 고양이, 말 및 인간이 아닌 영장류와 같은 (이에 제한되지 않는) 비인간 유기체의 세포이다.

특정 구현예에 따르면, 진핵 세포는 인간의 세포이다.

일 구현예에 따르면, 진핵 세포는 1차 세포, 세포주, 체세포, 생식 세포, 줄기 세포, 배아 줄기 세포, 성체 줄기 세포, 조혈 줄기 세포, 중간엽 줄기 세포, 유도 만능 줄기 세포(iPS), 배우자 세포, 접합체 세포, 배반포 세포, 배아, 태아 및/또는 공여자 세포이다.

특정 구현예에 따르면, 세포는 인간 배아 세포이다.

특정 구현예에 따르면, 세포는 인간 배아 신장 세포이다.

특정 구현예에 따르면, 세포는 HEK293T 세포이다.

특정 구현예에 따르면, 세포는 단백질 글리코실화(즉, 변형된 인간 GCase)가 가능하다.

진핵 세포는 폴리펩티드 코딩 서열을 함유하는 재조합 발현 벡터로 형질전환될 수 있다. 예를 들어, 폴리펩티드 코딩 서열을 함유하는 재조합 효모 발현 벡터로 형질전환된 효모; 재조합 바이러스 발현 벡터(예, 콜리플라워 모자이크 바이러스, CaMV, 담배 모자이크 바이러스, TMV)로 감염되거나 폴리펩티드 코딩 서열을 함유하는 Ti 플라스미드와 같은 재조합 플라스미드 발현 벡터로 형질전환된 식물 세포 시스템.

어떤 경우든, 형질전환된 세포는 다량의 재조합 폴리펩타이드의 발현을 허용하는 효과적인 조건 하에서 배양된다. 효과적인 배양 조건에는 단백질 생산을 허용하는 효과적인 배지, 생물반응기, 온도, pH 및 산소 조건이 포함되지만 이에 제한되지는 않는다. 유효 배지는 본 발명의 재조합 폴리펩티드를 생산하기 위해 세포가 배양되는 임의의 배지를 의미한다. 이러한 배지는 일반적으로 동화 가능한 탄소, 질소 및 인산염 공급원과 적절한 염, 미네랄, 금속 및 비타민과 같은 기타 영양소를 갖는 수용액을 포함한다. 본 발명의 세포는 통상적인 발효 생물반응기, 진탕 플라스크, 시험관, 미세역가 접시 및 페트리 플레이트에서 배양될 수 있다. 배양은 재조합 세포에 적합한 온도, pH 및 산소 함량에서 수행될 수 있다. 이러한 배양 조건은 당업자의 전문 지식 범위 내에 있다.

생산에 사용되는 벡터 및 숙주 시스템에 따라, 본 발명의 생성된 단백질은 재조합 세포 내에 남을 수 있거나; 발효 배지로 분비될 수 있거나; E. coli의 주변 세포질 공간과 같은 두 세포막 사이의 공간으로 분비될 수 있거나; 또는 세포 또는 바이러스 막의 외부 표면에 유지될 수 있다.

본 발명의 일부 구현예의 GCase 폴리펩티드는 야생형 인간 GCase와 비교하여 세포(예, 상기 논의된 숙주 발현 시스템)로부터 더 높은 발현 수준 및/또는 더 높은 분비 수준을 갖는다.

"야생형"이라는 용어는 예를 들어 SEQ ID NO: 2 또는 SEQ ID NO: 25에 기재된 바와 같이, 인간 글루코실세라미다제(인간 GCase)를 의미한다.

일 구현예에 따르면, 더 높은 발현 수준 및/또는 더 높은 분비 수준은 (예, 동일한 배양 조건 하에서) 야생형 인간 GCase와 비교하여 약 5-25 %, 10-50 %, 10-100 %, 20-90 %, 25-75 %, 30-80 %, 40-50 %, 50-60 %, 60-70 %, 70-80 % 90-99 % 또는 95-100 %이다.

일 구현예에 따르면, 더 높은 발현 수준 및/또는 더 높은 분비 수준은 (예, 동일한 배양 조건 하에서) 야생형 인간 GCase와 비교하여 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상이다.

일 구현예에 따르면, GCase 폴리펩티드는 아래 논의되는 바와 같이 동일한 배양 조건(예, HEK293T 세포)에서 야생형 인간 GCase와 비교하여 진핵 세포에서 약 1.3-5배(예, 3배) 더 높은 세포내 발현 수준을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 아래 논의되는 바와 같이 동일한 배양 조건 하에서 분비되지 않는 야생형 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 분비된다.

발현 수준을 평가하는 방법은 아래에서 설명된다.

일정 시간 배양 후 재조합 단백질을 회수한다. "재조합 단백질을 회수한다"는 표현은 단백질을 포함하는 전체 발효 배지를 수집하는 것을 의미하며, 분리 또는 정제의 추가적인 단계를 의미할 필요는 없다. 본 발명의 단백질은 친화성 크로마토그래피, 이온 교환 크로마토그래피, 여과, 전기영동, 소수성 상호작용 크로마토그래피, 겔 여과 크로마토그래피, 역상 크로마토그래피, 콘카나발린 A 크로마토그래피, 크로마토포커싱 및 차등 가용화와 같지만, 이에 제한되지 않는 다양한 표준 단백질 정제 기술을 사용하여 정제할 수 있다.

GCase 변이체 폴리펩티드가 생성되는 방법에 관계없이 유전자 변형 인간 GCase는 인간 GCase의 촉매 활성을 유지한다. 또한, 유전적으로 변형된 인간 GCase는 증가된 열 안정성을 포함한다. GCase 폴리펩타이드의 지속적인 촉매 활성과 함께 더 높은 발현 수준 및 열 안정성은 효소 대체 요법(ERT), 특히 고셔병(아래에서 논의됨) 치료에 유리하다.

아래 실시예 섹션에서 논의된 바와 같이(아래 실시예 4, 7 및 10 참조), GCase 변이체 D7, D15 및 D16은 각각 야생형 GCase 및 Cerezyme®과 비교할 때 유사한 효소 활성을 포함한다(표 2, 4 및 6 참조).

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(즉, 동일한 실험 조건, 예를 들어 동일한 완충액, 온도, pH 등) 하에서 야생형 GCase와 유사하게 GlcCer의 가수분해를 촉매할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 약 0.1 - 2.5 x 10⁶ kcat/Km(M^-1min^-1), 예, 0.15 - 2.0 x 10⁶ kcat/Km(M^-1min^-1)만큼 GlcCer, 예, 인공 기질 p-nitrophenyl-β-D-glucopyranoside(p-NP-Glc)의 가수분해를 촉매할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 적어도 약 0.1 x 10⁶ kcat/Km(M^-1min^-1)만큼 GlcCer, 예, 인공 기질 p-nitrophenyl-β-D-glucopyranoside(p-NP-Glc)의 가수분해를 촉매할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 적어도 약 0.2 x 10⁶ kcat/Km(M^-1min^-1)만큼 GlcCer, 예, 인공 기질 p-nitrophenyl-β-D-glucopyranoside(p-NP-Glc)의 가수분해를 촉매할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 적어도 약 0.3 x 10⁶ kcat/Km(M^-1min^-1)만큼 GlcCer, 예, 인공 기질 p-nitrophenyl-β-D-glucopyranoside(p-NP-Glc)의 가수분해를 촉매할 수 있다.

일 구현예에 따르면, GCase 폴리펩티드는 적어도 약 0.5 x 10⁶ kcat/Km(M^-1min^-1)만큼 GlcCer, 예 인공 기질 p-nitrophenyl-β-D-glucopyranoside(p-NP-Glc)의 가수분해를 촉매할 수 있다.

특정 구현예에 따르면, GCase 폴리펩타이드는 적어도 약 1.0 x 10⁶ kcat/Km(M^-1min^-1)만큼 p-NP-Glc의 가수분해를 촉매할 수 있다.

특정 구현예에 따르면, GCase 폴리펩타이드는 적어도 약 1.5 x 10⁶ kcat/Km(M^-1min^-1)만큼 p-NP-Glc의 가수분해를 촉매할 수 있다.

특정 구현예에 따르면, GCase 폴리펩타이드는 적어도 약 1.6 x 10⁶ kcat/Km(M^-1min^-1)만큼 p-NP-Glc의 가수분해를 촉매할 수 있다.

특정 구현예에 따르면, GCase 폴리펩타이드는 적어도 약 1.7 x 10⁶ kcat/Km(M^-1min^-1)만큼 p-NP-Glc의 가수분해를 촉매할 수 있다.

특정 구현예에 따르면, GCase 폴리펩타이드는 적어도 약 1.8 x 10⁶ kcat/Km(M^-1min^-1)만큼 p-NP-Glc의 가수분해를 촉매할 수 있다.

본원에 기재된 GCase 폴리펩타이드의 촉매 효율을 측정하는 방법은 당업계에 공지되어 있으며, 예를 들어, 현장 활성 분석(예, 활성 효소를 함유하는 세포에 적용된 기질을 사용), 인비트로 활성 분석(여기서, 특정 효소의 활성은 세포에서 추출한 단백질 혼합물에서 측정함)을 포함한다. 예를 들어, 효소 활성 분석은 기질로 p-니트로페닐-β-D-글루코피라노사이드(p-NP-Glc)를 사용하여 수행할 수 있다 [Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308, 참조로 본원에 포함].

아래 실시예 섹션에서 논의된 바와 같이(아래 실시예 3, 6 및 9 참조), GCase 변이체 D7, D15 및 D16은 야생형 GCase 및 Cerezyme®에 비해 더 높은 열 안정성을 포함한다. 구체적으로, pH 6.1에서 D7 GCase는 야생형 GCase와 비교할 때 약 6-7℃, Cerezyme®과 비교할 때 약 11℃의 증가를 보였다(아래 표 1 참조). 동일한 pH 수준에서 D15 GCase는 야생형 GCase와 비교할 때 약 12-13 ℃의 상당한 증가를 보였고 Cerezyme®과 비교할 때 약 17 ℃의 상당한 증가를 보였다(아래 표 1 및 3 참조). 유사하게 D16 GCase는 Cerezyme®과 비교할 때 약 19 ℃의 상당한 증가를 보였다(아래 표 5 참조).

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드에 비해 3-22℃(예, 15-22℃, 10-20℃, 5-15℃, 7-13℃, 9-11℃) 더 높은 온도 범위에서 열 안정성을 포함한다.

야생형 폴리펩타이드에 비해 용어 "열 안정성" 또는 "증가된 열 안정성"은 GCase 폴리펩타이드가 증가된 열 안정성, 즉 증가하는 온도에 따른 변성에 저항하는 능력을 포함함을 의미한다. 원형 이색성, 시차 주사 열량계 및 표면 플라즈몬 공명을 포함하지만 이에 제한되지 않는 열 안정성을 정량화하는 표준 기술이 당업계에 공지되어 있다.

본원에 기술된 GCase 폴리펩타이드의 열 안정성을 측정하는 방법은 당업계에 공지되어 있으며, 예를 들어 Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308에서 논의된 바와 같은 효소 안정성 검정(본원에 참고로 포함됨)을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1) 하에서 야생형 폴리펩티드와 비교하여 적어도 약 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃, 10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃ 또는 25℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 5℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 7℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 9℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 11℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 13℃ 더 높은 온도 하에 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 15℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 야생형 폴리펩티드와 비교하여 약 17℃ 더 높은 온도 하에 열 안정성을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드에 비해 3-22℃(예, 15-22℃, 10-20℃, 5-15℃, 7-13℃, 9-11℃) 더 높은 온도 범위에서의 열 안정성을 포함한다.

이미글루세라아제라고도 하는 "Cerezyme®"이라는 용어는 효소 대체 요법을 위한 상용 약물이다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 적어도 약 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃, 10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃ 또는 25℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 5℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 7℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 9℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 11℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 13℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드드와 비교하여 약 15℃ 더 높은 온도 하에 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 17℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 6.1)에서 Cerezyme® 폴리펩티드와 비교하여 약 19℃ 더 높은 온도 하에 열 안정성을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드에 비해 15-25℃(예, 17-23℃, 19-23℃) 더 높은 온도에서의 열 안정성을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드와 비교하여 적어도 약 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 15 ℃, 16 ℃, 17 ℃, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃, 23 ℃, 24 ℃, 25 ℃, 26 ℃, 27 ℃, 28 ℃, 29 ℃ 또는 30 ℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드드와 비교하여 약 15℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드와 비교하여 약 17℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드와 비교하여 약 20℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드와 비교하여 약 22℃ 더 높은 온도에서의 열 안정성을 포함한다.

특정 구현예에 따르면, GCase 폴리펩티드는 동일한 조건(예, pH 7.4)에서 Cerezyme® 폴리펩티드와 비교하여 약 25℃ 더 높은 온도에서의 열 안정성을 포함한다.

상기 언급한 바와 같이, GCase 폴리펩타이드는 진핵 세포로부터 고도로 발현되고 분비된다. 진핵 세포에서의 발현은 GCase 활성에 필수적인 GCase의 글리코실화를 가능하게 한다.

또 다른 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 분비되지 않는 야생형 폴리펩티드와 비교하여 진핵 세포로부터 분비된다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 약 1.5-10배(예, 약 1.5-2배, 약 2-3배, 약 3-4배, 약 4-5배, 약 5-6배, 약 6-7배, 약 8-9배, 약 9-10배) 더 많이 분비된다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 약 3배 더 많이 분비된다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 약 5배 더 많이 분비된다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 GCase에 비교하여 진핵 세포(예, HEK293T 세포)로부터 약 10배 더 많이 분비된다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 인간 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 약 1.3-5배(예, 약 1.3~2배, 약 1.3~3배, 약 2~3배, 약 2~4배, 약 3~4배, 약 4~5배) 더 높은 세포내 발현 수준을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 인간 GCase와 비교하여 진핵 세포로부터 적어도 약 1.3배 더 높은 세포내 발현 수준을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 인간 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 적어도 약 2배 더 높은 세포내 발현 수준을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 인간 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 적어도 약 3배 더 높은 세포내 발현 수준을 포함한다.

일 구현예에 따르면, GCase 폴리펩티드는 동일한 배양 조건에서 야생형 인간 GCase와 비교하여 진핵 세포(예, HEK293T 세포)로부터 적어도 약 4배 더 높은 세포내 발현 수준을 포함한다.

본원에 사용된 "발현 수준" 및 "발현 수준"이라는 문구는 생물학적 샘플(예, 진핵 세포)에서 유전자 발현 및/또는 유전자 생성물 활성의 정도를 지칭한다.

발현 수준은 임의의 절대 단위 또는 정규화된 단위(대조군 참조의 알려진 발현 수준에 대해)로 결정할 수 있다는 점에 유의해야 한다.

일 구현예에 따르면, 진핵 세포로부터의 GCase 폴리펩타이드의 분비 수준은 동일한 배양 조건에서 야생형 폴리펩타이드의 분비 수준과 비교하여 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 더 높을 수 있다.

일 구현예에 따르면, 진핵 세포에서 GCase 폴리펩타이드의 세포내 발현 수준은 동일한 배양 조건에서 야생형 폴리펩타이드의 발현 수준과 비교하여 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 더 높을 수 있다.

특정 구현예에 따르면, 발현량은 RNA 및/또는 단백질 검출 방법을 사용하여 측정된다.

세포에서 발현된 RNA의 수준을 검출하는 방법의 비제한적인 예로는 노던 블롯 분석, RT-PCR 분석, RNA 제자리 혼성화 염색, 및 제자리 RT-PCR 염색을 포함한다.

세포에서 특정 단백질 분자의 수준 및/또는 활성을 검출하는 방법의 비제한적인 예로는 효소 결합 면역흡착 분석(ELISA), 웨스턴 블롯 분석, 면역침전(IP), 방사선 면역분석(RIA), 형광 활성화 세포 분류(FACS), 면역조직화학 분석, 현장 활성 분석(예, 활성 효소를 포함하는 세포에 적용된 기질 사용), 인비트로 활성 분석(특정 효소의 활성이 세포에서 추출된 단백질 혼합물에서 측정됨) 및 분자량 기반 접근법을 포함한다. 분비된 단백질의 발현 수준을 검출하고자 하는 경우, ELISA 분석은 세포가 배양된 세포 배지(즉, 세포 분비물을 포함함)에서 수행될 수 있다.

일 구현예에 따르면, (상기 논의된 바와 같이) 적어도 하나의 외인성 폴리뉴클레오티드 또는 작제물을 포함하는 단리된 세포가 제공된다.

일 구현예에 따르면, (상기 논의된 바와 같이) 단리된 세포는 진핵 세포이다.

일부 구현예의 유전적으로 변형된 인간 GCase, 일부 구현예의 단리된 폴리뉴클레오티드, 일부 구현예의 작제물, 또는 본 발명의 일부 구현예의 세포는 유기체 그 자체로, 또는 적합한 담체 또는 부형제와 혼합된 약학적 조성물로 투여될 수 있다.

본원에 사용된 "약학적 조성물"은 생리학적으로 적합한 담체 및 부형제와 같은 다른 화학 성분과 함께 본원에 기재된 활성 성분 중 하나 이상의 제제를 지칭한다. 약학적 조성물의 목적은 유기체에 대한 화합물의 투여를 용이하게 하는 것이다.

본원에서 "활성 성분"이라는 용어는 생물학적 효과를 나타내는 유전자 변형 인간 GCase를 의미한다.

이하, 혼용될 수 있는 "생리학적으로 허용되는 담체" 및 "약학적으로 허용되는 담체"라는 용어는 유기체에 현저한 자극을 일으키지 않고 투여된 화합물의 생물학적 활성 및 특성을 저해하지 않는 담체 또는 희석제를 지칭한다. 이 문구 아래에 보조제가 포함된다.

본원에서 용어 "부형제"는 활성 성분의 투여를 더욱 용이하게 하기 위해 약학적 조성물에 첨가되는 불활성 물질을 의미한다. 부형제의 예는 탄산칼슘, 인산칼슘, 다양한 당 및 유형의 전분, 셀룰로오스 유도체, 젤라틴, 식물성 오일 및 폴리에틸렌 글리콜을 포함하지만 이에 제한되지는 않는다.

약물의 제형화 및 투여를 위한 기술은 펜실베이니아 이스턴, Mack Publishing Co.,“Remington’s Pharmaceutical Sciences,” 최신판에서 찾을 수 있으며, 이는 참조로 본원에 포함된다.

적절한 투여 경로는 예를 들어 경구, 직장, 경점막, 특히 비강, 장 또는 근육내, 피하 및 골수내 주사 뿐만 아니라 척수강내, 직접적인 심실내, 심장내, 예를 들어 우심실 또는 좌심실강내, 총관상동맥 내로, 정맥내, 복강내, 비강내 또는 안구내 주사를 포함하는 비경구 전달을 포함할 수 있다.

중추신경계(CNS)에 약물을 전달하기 위한 기존의 접근 방식은 다음과 같다: 신경외과 전략(예, 뇌내 주사 또는 뇌실내 주입); 다음 중 하나를 이용하려는 시도에서 제제의 분자 조작(예, 내피 세포 표면 분자에 친화성을 갖는 수송 펩티드를 그 자체로 BBB를 횡단할 수 없는 제제와 조합하여 포함하는 키메라 융합 단백질의 생산) BBB의 내인성 수송 경로; 제제의 지질 용해도를 증가시키도록 설계된 약리학적 전략(예, 지질 또는 콜레스테롤 담체에 대한 수용성 제제의 접합); 및 고삼투압 중단에 의한 BBB 무결성의 일시적인 중단(만니톨 용액을 경동맥에 주입하거나 안지오텐신 펩티드와 같은 생물학적 활성제를 사용하여 발생).

그러나 이러한 각 전략에는 침습적 수술 절차와 관련된 고유한 위험, 내인성 수송 시스템에 고유한 제한에 의해 부과되는 크기 제한, 포함된 키메라 분자의 전신 투여와 관련된 잠재적으로 바람직하지 않은 생물학적 부작용과 같은 제한이 있다. CNS 외부에서 활성화될 수 있는 운반체 모티프와 BBB가 중단된 뇌 영역 내에서 가능한 뇌 손상 위험이 있어 최적의 전달 방법이 아니다.

대안적으로, 예를 들어 환자의 조직 영역 내로 직접 약학적 조성물의 주사를 통해 전신적 방식보다는 국소적으로 약학적 조성물을 투여할 수 있다.

본 발명의 일부 구현예의 약학적 조성물은 예를 들어 통상적인 혼합, 용해, 과립화, 당의정 제조, 부양, 유화, 캡슐화, 포획 또는 동결건조 공정에 의해 당업계에 널리 공지된 공정에 의해 제조될 수 있다. 따라서, 본 발명의 일부 구현예에 따라 사용하기 위한 약학적 조성물은 활성 성분을 약학적으로 사용될 수 있는 제제로 가공하는 것을 용이하게 하는 부형제 및 보조제를 포함하는 하나 이상의 생리학적으로 허용되는 담체를 사용하여 통상적인 방식으로 제형화될 수 있다. 적절한 제형은 선택한 투여 경로에 따라 다르다. 주사용으로, 약학적 조성물의 활성 성분은 수용액, 바람직하게 행크 용액, 링거 용액 또는 생리학적 염 완충액과 같은 생리학적으로 적합한 완충액으로 제형화될 수 있다. 경점막 투여의 경우, 투과되는 장벽에 적합한 침투제가 제제에 사용된다. 이러한 침투제는 일반적으로 당업계에 공지되어 있다.

경구 투여용으로, 약학적 조성물은 활성 화합물을 당업계에 널리 공지된 약학적으로 허용되는 담체와 조합하여 용이하게 제형화될 수 있다. 이러한 담체는 약학적 조성물이 환자에 의한 경구 섭취를 위해 정제, 환제, 당의정, 캡슐, 액체, 겔, 시럽, 슬러리, 현탁액 등으로 제형화될 수 있게 한다. 경구용 약리학적 제제는 고체 부형제를 사용하여 임의로 생성된 혼합물을 분쇄하고 원하는 경우 적합한 보조제를 첨가한 후 과립 혼합물을 가공하여 정제 또는 당의정 코어를 수득할 수 있다. 적합한 부형제는 특히 충전제, 예컨대 락토스, 수크로스, 만니톨 또는 소르비톨을 포함하는 당류; 옥수수 전분, 밀 전분, 쌀 전분, 감자 전분, 젤라틴, 트라가칸트 검, 메틸 셀룰로오스, 히드록시프로필메틸-셀룰로오스, 나트륨 카르보메틸셀룰로오스와 같은 셀룰로오스 제제; 및/또는 폴리비닐피롤리돈(PVP)과 같은 생리학적으로 허용되는 중합체이다. 원하는 경우, 가교된 폴리비닐 피롤리돈, 한천, 또는 알긴산 또는 알긴산나트륨과 같은 이들의 염과 같은 붕해제가 첨가될 수 있다.

당의정 코어에는 적절한 코팅이 필요하다. 이를 위해, 아라비아 검, 활석, 폴리비닐 피롤리돈, 카보폴 겔, 폴리에틸렌 글리콜, 이산화티타늄, 래커 용액 및 적합한 유기 용매 또는 용매 혼합물을 임의로 함유할 수 있는 농축된 당 용액이 사용될 수 있다. 활성 화합물 투여량의 다양한 조합을 식별하거나 특성화하기 위해 염료 또는 안료를 정제 또는 당의정 코팅에 첨가할 수 있다. 경구로 사용될 수 있는 약학적 조성물은 젤라틴으로 만들어진 푸시-핏 캡슐 뿐만 아니라 젤라틴 및 글리세롤 또는 소르비톨과 같은 가소제로 만들어진 연질 밀봉 캡슐을 포함한다. 푸시-핏 캡슐은 락토스와 같은 충전제, 전분과 같은 결합제, 활석 또는 마그네슘 스테아레이트와 같은 윤활제 및 임의로 안정화제와 혼합된 활성 성분을 함유할 수 있다.

연질 캡슐에서 활성 성분은 지방 오일, 액체 파라핀 또는 액체 폴리에틸렌 글리콜과 같은 적절한 액체에 용해되거나 현탁될 수 있다. 또한 안정제를 첨가할 수 있다. 경구 투여를 위한 모든 제형은 선택한 투여 경로에 적합한 용량이어야 한다.

협측 투여(buccal administration)용으로, 조성물은 통상적인 방식으로 제형화된 정제 또는 로젠지의 형태를 취할 수 있다.

비강 흡입에 의한 투여의 경우, 본 발명의 일부 구현예에 따라 사용하기 위한 활성 성분은 적합한 추진제, 예를 들어 디클로로디플루오로메탄, 트리클로로플루오로메탄, 디클로로-테트라플루오로에탄 또는 이산화탄소. 가압 에어로졸의 경우, 투여 단위는 계량된 양을 전달하기 위한 밸브를 제공함으로써 결정될 수 있다. 예를 들어, 디스펜서에 사용하기 위한 젤라틴의 캡슐 및 카트리지는 화합물의 분말 혼합물과 락토스 또는 전분과 같은 적합한 분말 베이스를 함유하여 제형화될 수 있다.

본원에 기재된 약학적 조성물은, 예를 들어 볼루스 주사 또는 연속 주입에 의한 비경구 투여용으로 제형화될 수 있다. 주사용 제제는 단위 투여 형태, 예를 들어 앰플 또는 임의로 첨가된 방부제와 함께 다중 투여 용기로 제공될 수 있다. 조성물은 유성 또는 수성 비히클 중의 현탁액, 용액 또는 에멀젼일 수 있고, 현탁제, 안정화제 및/또는 분산제와 같은 제제화제를 함유할 수 있다. 비경구 투여용 약학적 조성물은 수용성 형태의 활성 제제의 수용액을 포함한다. 추가로, 활성 성분의 현탁액은 적절한 유성 또는 수성 주사 현탁액으로 제조될 수 있다. 적합한 친유성 용매 또는 비히클은 참기름과 같은 지방 오일, 또는 에틸 올레에이트, 트리글리세리드 또는 리포솜과 같은 합성 지방산 에스테르를 포함한다. 수성 주사 현탁액에는 나트륨 카르복시메틸 셀룰로오스, 소르비톨 또는 덱스트란과 같이 현탁액의 점도를 증가시키는 물질이 포함될 수 있다. 임의로, 현탁액은 또한 고농축 용액의 제조를 가능하게 하는 활성 성분의 용해도를 증가시키는 적합한 안정제 또는 제제를 함유할 수 있다.

또한, 활성 성분은 사용 전에 적합한 비히클, 예를 들어, 살균되고 발열원이 없는 수계 용액과 함께 구성하기 위한 분말 형태일 수 있다. 본 발명의 일부 구현예의 약학적 조성물은 또한 예를 들어 코코아 버터 또는 기타 글리세리드와 같은 통상적인 좌약 기제를 사용하여 좌제 또는 정체 관장제와 같은 직장 조성물로 제제화될 수 있다.

본 발명의 일부 구현예와 관련하여 사용하기에 적합한 약학적 조성물은 활성 성분이 의도된 목적을 달성하기에 효과적인 양으로 함유된 조성물을 포함한다. 보다 구체적으로, 치료적 유효량은 장애(예, 고셔병)의 증상을 예방, 완화 또는 개선하거나 치료되는 대상의 생존을 연장하는데 효과적인 활성 성분(유전자 변형 인간 GCase)의 양을 의미한다.

치료적 유효량의 결정은 특히 본원에 제공된 상세한 개시내용에 비추어 당업자의 능력 범위 내에 있다.

본 발명의 방법에 사용되는 임의의 제제에 대해, 치료적 유효량 또는 용량은 인비트로 및 세포 배양 검정으로부터 초기에 추정될 수 있다. 예를 들어, 원하는 농도 또는 역가를 달성하기 위해 용량을 동물 모델에서 제형화할 수 있다. 이러한 정보는 사람에게 유용한 용량을 보다 정확하게 결정하는데 사용할 수 있다. 예를 들어, Farfel-Becker et al. [Farfel-Becker, Vitner 및 Futerman, Dis Model Mech. (2011) 4(6): 746-752]에서 논의된 고셔병에 대한 동물 모델을 활용하는 것과 같이 GCase 활성의 인비보 또는 인비트로 분석을 사용할 수 있다.

본원에 기재된 활성 성분의 독성 및 치료 효능은 인비트로, 세포 배양물 또는 실험 동물에서 표준 제약 절차에 의해 결정될 수 있다. 이러한 인비트로 및 세포 배양 분석 및 동물 연구에서 얻은 데이터는 인간에서 사용하기 위한 용량 범위를 공식화하는데 사용할 수 있다. 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 달라질 수 있다. 정확한 제형, 투여 경로 및 투여량은 환자의 상태를 고려하여 개별 의사가 선택할 수 있다 (예, Fingl, et al., 1975, "The Pharmacological Basis of Therapeutics", Ch. 1 p.1 참조).

투여량 및 투여 간격은 생물학적 효과(최소 유효 농도, MEC)를 유도하거나 억제하기에 충분한 양의 활성 성분을 제공하기 위해 개별적으로 조정될 수 있다. MEC는 각 준비에 따라 다르지만 인비트로 데이터에서 추정할 수 있다. MEC를 달성하는 데 필요한 용량은 개인의 특성과 투여 경로에 따라 다르다. 검출 분석을 사용하여 혈장 농도를 결정할 수 있다.

치료할 상태의 중증도 및 반응성에 따라, 투여는 단일 또는 복수 투여일 수 있으며, 치료 과정은 수일 내지 수주 또는 치료가 이루어지거나 질병 상태의 감소가 달성될 때까지 지속된다. 투여될 조성물의 양은 물론 치료되는 대상, 고통의 중증도, 투여 방식, 처방 의사의 판단 등에 따라 달라질 것이다.

본 발명의 일부 구현예의 조성물은 원하는 경우 활성 성분을 함유하는 하나 이상의 단위 투여 형태를 함유할 수 있는 FDA 승인 키트와 같은 팩 또는 디스펜서 장치로 제공될 수 있다. 팩은 예를 들어 블리스터 팩과 같은 금속 또는 플라스틱 호일을 포함할 수 있다. 팩 또는 디스펜서 장치에는 투여 지침이 포함될 수 있다. 팩 또는 디스펜서는 의약품의 제조, 사용 또는 판매를 규제하는 정부 기관에서 규정한 형식으로 용기와 관련된 고지에 의해 수용될 수도 있다. 또는 수의학. 예를 들어, 이러한 통지는 미국 식품의약국(FDA)에서 처방약에 대해 승인한 라벨 또는 승인된 제품 삽입에 대한 것일 수 있다. 상용성 약학적 담체로 제형화된 본 발명의 제제를 포함하는 조성물은 또한 제조되고, 적절한 용기에 배치될 수 있고, 상기에 추가로 상세히 기재된 바와 같이 지시된 상태의 치료를 위해 라벨링될 수 있다.

키트는 고셔병을 치료하기 위한 또 다른 치료적 조성물, 예를 들어 기질 감소 요법(SRT)을 위한 약제을 추가로 포함할 수 있음이 이해될 것이다.

본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase, 이를 코딩하는 폴리뉴클레오타이드, 이들의 발현에 사용되는 발현 작제물, 또는 본 발명의 일부 구현예의 세포는 β-글루코세레브로시다아제 결핍증과 관련된 질환의 치료를 필요로 하는 대상체의 치료에 사용될 수 있다.

본원에 사용된 용어 "치료하는" 및 "치료"는 병태의 진행을 폐지, 실질적으로 억제, 감속 또는 역전시키거나, 병태의 임상 증상의 출현을 실질적으로 지연시키거나, 병태의 임상 증상을 실질적으로 개선하거나, 병태의 임상 증상의 출현을 실질적으로 예방하는 것을 지칭한다. 본원에 사용된 용어 "치료하는"은 병태에 걸린 환자의 생존을 연장하거나 사망을 지연시키는 것을 추가로 지칭한다.

본 명세서에 사용된 바와 같이, 본 명세서에서 상호교환적으로 사용되는 "대상체" 및 "필요로 하는 대상체"라는 문구는 병리를 앓고 있는 포유동물, 바람직하게는 임의의 연령 또는 성별의 인간을 지칭한다. 이 용어는 병리학을 개발할 위험이 있는 개인을 포함한다. 대상체는 예를 들어 신생아, 유아, 청소년, 청소년, 성인 및 노인을 포함할 수 있다. .

일 구현예에 따르면, 대상체는 GBA 유전자와 관련된 질병으로 진단되었다.

일 구현예에 따르면, 대상체는 감소된 β-글루코세레브로시다아제 수준 및/또는 활성과 관련된 질병으로 진단되었다.

일 구현예에 따르면, 대상체는 β-글루코세레브로시다아제 결핍과 관련된 질환으로 진단받았다.

β-글루코세레브로시다아제 결핍과 관련된 예시적인 질병은 고셔병, GBA-관련 파킨슨병, 루이소체를 동반한 GBA-관련 치매, 및 GBA-관련 다계통 위축을 포함하지만 이에 제한되지 않는다.

특정 구현예에 따르면, β-글루코세레브로시다아제 결핍과 관련된 질병은 고셔병이다.

본원에 상호교환적으로 사용되는 용어 "고셰병", "고셔병" 또는 "GD"는 세포, 특히 단핵 세포 계통의 세포에 글루코실세라마이드(GlcCer, 글루코세레브로사이드라고도 함)의 축적을 특징으로 하는 리소좀 축적 질환(LSD)을 지칭한다. 글루코실세라마이드는 비장, 간, 신장, 폐, 뇌 및 골수에 축적될 수 있다. 이 질병은 일반적으로 글루코실세라미드/GlcCer의 가수분해를 촉매하는 데 필요한 글루코실세라미다제 활성을 갖는 리소좀 효소인 글루코세레브로시다아제 효소(베타-글루코시다제, D-글루코실-N-아실스핑고신 글루코하이드롤라제, GCD 또는 GCase로도 알려짐, EC 3.2.1.45)의 결핍으로 인해 발생한다.

GD는 질병의 특정 증상에 따라 신경병증 및 비신경병증의 두 가지 주요 유형으로 나뉜다. 비신경병증성 질환에서는 대부분의 장기와 조직이 관련될 수 있지만 뇌는 관련되지 않는다. 신경병성 질환(nGD)에서는 뇌도 관여한다.

1형(또는 비신경병증형, GD1)은 가장 흔한 형태의 질병으로, 약 50,000명 중 1명꼴로 발생한다. 이는 Ashkenazi 유대인 유산의 사람들 사이에서 가장 자주 발생한다. 증상은 초기 또는 성인기에 시작될 수 있으며 간 비대 및 비장 비대('간비종대'로 통칭); 비장이 파열되어 추가적인 합병증을 유발할 수 있다. 비장 비대 및 골수 대체는 빈혈, 혈소판 감소증 및 백혈구 감소증을 유발한다. 골격 약화와 뼈 질환이 광범위할 수 있다. 뇌는 병리학적으로 영향을 받지 않지만 폐 및 드물게 신장 장애가 있을 수 있다. 이 그룹의 환자는 일반적으로 혈소판 수치가 낮기 때문에 쉽게 멍이 들고 적혈구 수가 적기 때문에 피로를 경험한다. 질병 발병 및 중증도에 따라 GD 1형 환자는 성인기까지 잘 살 수 있다. 일부 환자는 경미한 형태의 질병이 있거나 증상을 나타내지 않을 수 있다.

본원에 사용된 신경병증 GD(nGD)는 2형 및 3형 GD를 모두 포함한다. 급성 영아 신경병성 GD라고도 하는 GD 2형은 일반적으로 출생 후 6개월 이내에 시작되며 100,000명 중 1명꼴의 발병률을 보인다. 증상으로는 간과 비장 비대, 광범위하고 진행성인 뇌 손상, 안구 운동 장애, 경련, 발작, 사지 경직, 빨고 삼키는 능력이 부족하다. 영향을 받는 어린이는 보통 2세에 사망한다.

만성 신경병성 GD라고도 하는 GD 3형은 아동기 또는 심지어 성인기에 언제든지 시작될 수 있으며 100,000명 중 1명꼴로 발생한다. 급성 또는 2형 버전에 비해 천천히 진행되지만 신경학적 증상이 더 경미한 것이 특징이다. GD 3형은 유형 3b 및 3a라는 두 가지 변형으로 나뉜다. 3b형은 대규모 간과 비장의 초기 발병을 가지며 환자는 또한 폐의 직접적인 침범 및 급속하게 진행되는 골 질환을 경험할 수 있다. 주요 증상으로는 비장 및/또는 간 비대, 발작, 협응 불량, 골격 이상, 안구 운동 장애, 빈혈을 포함한 혈액 장애 및 호흡기 문제가 있다. 환자는 종종 10대 초반과 성인기까지 산다.

특정 구현예에 따르면, GD는 1형이다.

일 구현예에 따르면, 본 발명의 일부 구현예의 유전적으로 변형된 인간 GCase는 효소 대체 요법에 사용된다.

본원에 사용된 "효소 대체 요법(ERT)"은 β-글루코세레브로시다아제(GCase)의 외인성 투여를 지칭한다.

특정 구현예에 따르면, 유전자 변형 인간 GCase 치료는 기질 감소 요법제와 조합된다.

본원에 사용된 용어 "기질 감소 요법(SRT) 제제"는 GCase의 천연 기질, 즉 글루코실세라마이드(또는 GL1)의 합성을 억제하는 제제(예, 소분자)를 지칭한다. 건강 규제 기관에서 승인한 여러 버전의 SRT가 시중에 나와 있다. 예로는 Miglustat(Zavesca.RTM.) 및 Eliglustat Tartrate가 포함되지만 이에 제한되지 않는다.

본 출원으로부터 만료되는 특허 기간 동안 많은 관련 SRT가 개발될 것으로 예상되며 SRT라는 용어의 범위는 그러한 모든 새로운 기술을 선험적으로 포함하도록 의도된다.

본원에서 사용된 용어 "약"은 ± 10%를 의미한다.

용어 "포함하다", "포함하는", "함유하다", "함유하는", "가지는" 및 이들의 접합체는 "포함하지만 이에 제한되지 않는"을 의미한다.

"~로 구성된"이라는 용어는 "포함하고 제한되는"을 의미한다.

"~로 본질적으로 이루어진"이라는 용어는 조성물, 방법 또는 구조는 추가 성분, 단계 및/또는 부분을 포함할 수 있지만, 추가 성분, 단계 및/또는 부분이 청구된 조성물, 방법 또는 구조의 기본 및 신규 특성을 실질적으로 변경하지 않는 경우에만 가능함을 의미한다.

본 명세서에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 참조를 포함한다. 예를 들어, 용어 "화합물" 또는 "적어도 하나의 화합물"은 이들의 혼합물을 포함하는 복수의 화합물을 포함할 수 있다.

본 출원 전반에 걸쳐, 본 발명의 다양한 실시예는 범위 형식으로 제시될 수 있다. 범위 형식의 설명은 단지 편의와 간결함을 위한 것이며 본 발명의 범위에 대한 융통성 없는 제한으로 해석되어서는 안 된다는 것을 이해해야 한다. 따라서 범위에 대한 설명은 가능한 모든 하위 범위와 해당 범위 내의 개별 수치를 구체적으로 공개한 것으로 간주되어야 한다. 예를 들어, 1에서 6과 같은 범위에 대한 설명은 해당 범위 내의 개별 숫자, 예 1, 2, 3, 4, 5, 6 뿐만 아니라 구체적으로 1에서 3, 1에서 4, 1에서 5, 2에서 4, 2에서 6, 3에서 6까지와 같은 하위 범위를 공개한 것으로 간주되어야 한다.

수치 범위가 본 명세서에 표시될 때마다, 이는 표시된 범위 내의 임의의 인용된 숫자(분수 또는 정수)를 포함하는 것을 의미한다. 제1 표시된 수 및 제2 표시된 수의 "범위/~사이 범위"라는 문구 및 제1 표시된 수"로부터" 제2 표시된 수 "~까지"의 "범위/~사이 범위"는 본원에서 상호교환가능하게 사용되며, 제1 및 제2 표시된 수와 그 사이의 모든 분수 및 정수를 포함하는 것을 의미한다.

본 명세서에 사용된 용어 "방법"은 주어진 작업을 수행하기 위한 방식, 수단, 기술 및 절차를 의미하며, 여기에는 화학, 약리, 생물학, 생화학 및 의료 분야의 종사자에게 알려져 있거나 알려진 방식에서 쉽게 개발된 방식, 수단, 기술 및 절차가 포함되지만 이에 제한되지는 않는다.

명료함을 위해 별도의 구현예와 관련하여 설명된 본 발명의 특정 특징은 단일 구현예에서 조합하여 제공될 수도 있음이 이해된다. 반대로, 간결함을 위해 단일 구현예의 맥락에서 설명된 본 발명의 다양한 특징은 또한 개별적으로 또는 임의의 적절한 하위 조합으로 또는 본 발명의 임의의 다른 설명된 구현예에서 적절하게 제공될 수 있다. 다양한 구현예와 관련하여 설명된 특정 특징은 구현예가 이러한 요소 없이 작동하지 않는 경우를 제외하고는 이러한 구현예의 필수 특징으로 간주되지 않는다.

위에서 기술되고 하기 청구범위 섹션에서 청구된 바와 같은 본 발명의 다양한 구현예 및 양태는 하기 실시예에서 실험적 뒷받침된다.

본 출원에 개시된 임의의 서열 식별 번호는 해당 SEQ ID NO가 DNA 서열 형식 또는 RNA 서열 형식으로만 표현되더라도, 서열 번호가 언급된 문맥에 따라 DNA 서열 또는 RNA 서열을 지칭할 수 있는 것으로 이해된다. 예를 들어, SEQ ID NO: 1은 DNA 서열 형식으로 표현되지만(예, 티민를 T로 표기), GCase 핵산 서열에 해당하는 DNA 서열 또는 RNA 분자 핵산 서열의 RNA 서열을 나타낼 수 있다. 유사하게, 일부 서열은 설명되는 분자의 실제 유형에 따라 RNA 서열 형식(예, 우라실에 대해 U를 인용)으로 표현되지만, 이는 dsRNA를 포함하는 RNA 분자의 서열 또는 제시된 RNA 서열에 상응하는 DNA 분자의 서열을 지칭할 수 있다. 여하튼, 임의의 대체물과 함께 개시된 서열을 갖는 DNA 및 RNA 분자 모두가 구상된다.

본 발명의 일부 실시예는 첨부된 도면을 참조하여 단지 예로서 본 명세서에서 설명된다. 이제 도면을 구체적으로 참조하면, 도시된 특정 사항은 예로서 그리고 본 발명의 실시예의 예시적인 논의를 위한 것임을 강조한다. 이와 관련하여, 도면과 함께 작성된 설명은 본 발명의 실시예가 실시될 수 있는 방법을 당업자에게 명백하게 한다.
도면에서:
도 1A는 야생형(WT, SEQ ID NO: 2, 세레자임®, 사노피 젠자임에 의해 제시된 바와 같은 단일 R495H 돌연변이를 포함함) 및 변이체 D2-D7 GCase(SEQ ID NO: 4, 6, 8, 10, 12 및 14 각각에 기재됨)의 아미노산 서열을 나타낸다. 효소의 활성 부위 잔기는 각 서열에 밑줄이 그어져 있다. PROSS에 의해 D2-D7 GCase 변이체의 서열에 도입된 모든 돌연변이는 굵게 강조 표시된다.
도 1B는 야생형(WT) 및 변이체 D7 GCase의 아미노산 서열을 나타낸다. GCase WT의 완전한 아미노산 서열은 상단 행(SEQ ID NO: 2)에 표시되고, PROSS에 의해 D7 서열에 도입된 돌연변이는 하단 행(SEQ ID NO: 14)에 표시된다.
도 2A는 HEK293T 세포에서 GCase 발현에 사용된 pCDNA3.1 벡터 내의 GCase 서열 위치의 개략도이다.
도 2B-2C는 WT 및 GCase 펠릿으로부터 분리된 GCase의 정제에 의해 얻어진 3개의 용출액 분획의 나트륨 도데실 설페이트/폴리아크릴아미드 겔 전기영동(SDS-PAGE)(도 2B) 및 FLAG 비드에서 정제된 분비된 GCase의 SDS-PAGE(도 2C)를 나타내는 사진이다. 참고로, D7 변이체만이 분비된 효소를 얻었다. 화살표는 질량 분석법(MS)에 의해 식별된 GCase 밴드의 위치를 나타낸다.
도 3A-B는 FLAG 비드를 사용한 1단계 정제 후 D7 GCase의 크기 배제 크로마토그래피(SEC)를 나타낸다. FLAG 펩타이드가 포함된 FLAG 비드에서 용출된 단백질 분획을 모아서 Superdex200 컬럼에 적용하였다. 단백질은 280 nm에서의 흡광도에 의해 모니터링되었다. 각 피크에 해당하는 분획을 모아 농축하고 SDS-PAGE로 분석하였다. 참고로 피크 1은 단량체 GCase에 해당한다.
도 4는 WT GCase(삼각형, 실선) 및 D7 GCase(원, 점선)에 대한 대표적인 Michaelis-Menten 플롯을 나타내는 그래프이다. 기질에서 생성물로의 전환율(y축)은 단백질 1μg/ml로 정규화된다.
도 5A는 야생형(WT, SEQ ID NO: 2) 및 변이체 D7, D13, D14 및 D15 GCase(각각 SEQ ID NO: 14, 18, 20 및 22에 제시됨)의 아미노산 서열을 나타낸다. 효소의 활성 부위 잔기는 각 서열에 밑줄이 그어져 있다. PROSS에 의해 D7, D13, D14 및 D15 GCase 변이체의 서열에 도입된 모든 돌연변이는 굵게 강조 표시된다.
도 5B는 야생형 GCase(상부서열, SEQ ID NO: 2로 기재) 및 PROSS 설계된 변이체 D15 GCase(하부 서열, SEQ ID NO: 22로 기재)의 아미노산 서열의 비교를 도시한다. 돌연변이된 아미노산은 굵게 강조 표시되고, 효소 촉매 부위에 해당하는 아미노산은 밑줄이 그어진다.
도 6은 p-NP-Glc를 기질로 사용하여 추정된 변이 D15 GCase(흰 원) 및 Cerezyme®(검정 원)의 비활성(specific activity)을 나타낸다. 활성은 기질 농도 0.4, 1.5 및 3mM p-NP-Glc로 결정되었다.
도 7은 야생형(WT, SEQ ID NO: 2, Cerezyme®, Sanofi Genzyme에 의해 제시된 단일 R495H 돌연변이를 포함함), 야생형(WT, SEQ ID NO: 25) 및 변이체 D7, D13, D14, D15 및 D16 GCase(각각 SEQ ID NO: 14, 18, 20, 22 및 27에 기재됨)의 아미노산 서열을 나타낸다. 효소의 활성 부위 잔기는 각 서열에 밑줄이 그어져 있다. PROSS에 의해 D7, D13, D14, D15 및 D16 GCase 변이체의 서열에 도입된 모든 돌연변이는 굵게 강조 표시된다.

실시예

이제 상기 설명과 함께 비제한적인 방식으로 본 발명을 예시하는 하기 실시예를 참조한다. 일반적으로, 본 명세서에서 사용된 명명법 및 본 발명에서 사용된 실험실 절차는 분자, 생화학적, 미생물학적 및 재조합 DNA 기술을 포함한다. 이러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, "Molecular Cloning: A laboratory Manual" Sambrook et al., (1989); "Current Protocols in Molecular Biology" Volumes I-III Ausubel, R. M., ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al. (eds) "Genome Analysis: A Laboratory Manual Series", Vols. 1-4, Cold Spring Harbor Laboratory Press, New York (1998); methodologies as set forth in U.S. Pat. Nos. 4,666,828; 4,683,202; 4,801,531; 5,192,659 and 5,272,057; "Cell Biology: A Laboratory Handbook", Volumes I-III Cellis, J. E., ed. (1994); "Current Protocols in Immunology" Volumes I-III Coligan J. E., ed. (1994); Stites et al. (eds), "Basic and Clinical Immunology" (8th Edition), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (eds), "Selected Methods in Cellular Immunology", W. H. Freeman and Co., New York (1980); available immunoassays are extensively described in the patent and scientific literature, see, for example, U.S. Pat. Nos. 3,791,932; 3,839,153; 3,850,752; 3,850,578; 3,853,987; 3,867,517; 3,879,262; 3,901,654; 3,935,074; 3,984,533; 3,996,345; 4,034,074; 4,098,876; 4,879,219; 5,011,771 and 5,281,521; "Oligonucleotide Synthesis" Gait, M. J., ed. (1984); "Nucleic Acid Hybridization" Hames, B. D., and Higgins S. J., eds. (1985); "Transcription and Translation" Hames, B. D., and Higgins S. J., Eds. (1984); "Animal Cell Culture" Freshney, R. I., ed. (1986); "Immobilized Cells and Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning" Perbal, B., (1984) and "Methods in Enzymology" Vol. 1-317, Academic Press; "PCR Protocols: A Guide To Methods And Applications", Academic Press, San Diego, CA (1990); Marshak et al., "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996)를 참조하시오; 이들 모두는 마치 여기에 완전히 설명된 것처럼 참조로 포함된다. 기타 일반 참조는 이 문서 전체에 제공된다. 그 안에 있는 절차는 당업계에 잘 알려진 것으로 믿어지며 독자의 편의를 위해 제공된다. 본원에 포함된 모든 정보는 참조로 여기에 포함된다.

일반 재료 및 실험 절차

재료

Dulbecco의 변형된 Eagle 배지 및 태아 소 혈청은 Gibco에서 입수하였다. 세포 배양을 위한 페니실린, 스트렙토마이신 및 피루브산 나트륨은 Biological Industries에서 구입하였다. 항-DYKDDDDK G1 친화성 수지, DYKDDDDK 펩타이드(SEQ ID NO: 16) 및 항-DYKDDDDK 태그 항체[HRP]는 GenScript에서 입수하였다. 니켈 비드는 Adar Biotech에서 입수하였다. Strep-Tactin®XT 4Flow high capacity resign, StrepMAB-Classic HRP(항-Strep) 항체 및 비오틴은 독일 IBA GmbH에서 구입하였다. 토끼에서 생산된 항-GCase(C-말단) 항체, 생쥐에서 생산된 모노클로날 항-폴리히스티딘-과산화효소 항체, 폴리에틸렌이민, 탈지 소 혈청 알부민, 프로테아제 억제제 칵테일, 데옥시리보뉴클레아제, Nonidet™ P 40 Substitute(NP-40) 및 p-니트로페닐-β-D-글루코피라노사이드는 모두 Sigma-Aldrich에서 구입하였다. SDS-PAGE 및 웨스턴 블롯팅 장비는 BioRad에서 제공하였다. CHO 세포에서 발현되는 재조합 인간 글루코실세라미다제(WT GCase)는 미국 미니애폴리스 소재 R&D Systems에서 입수하였다. Imiglucerase(Cerezyme®, Sanofi Genzyme)는 환자 치료 후 남은 것으로 얻었다.

보다 안정적인 형태의 GCase 생성

아래 실시예 섹션을 참조하시오.

E. coli 발현 및 GCase의 후속 정제

PROSS, 즉 D2, D4, D6, D7을 사용하여 서열이 생성된 인간 GCase의 야생형(WT) 및 4개의 돌연변이 변이체는 모두 E. coli에서 pET28-bd-SUMO [Zahradnik J. et al., FEBS J. (2019) 286: 3858-3873] 구축물로 발현되었으며 정제를 위한 N-말단 his-tag를 포함하였다. 발현된 GCase는 표준 Ni²⁺ 킬레이트 크로마토그래피를 사용하여 대장균 용해물로부터 분리되었고, 결합된 GCase는 SUMO 프로테아제를 사용하여 컬럼에서 방출되었다 [Frey S. 및 Gorlich D., J. Chromatogr. A. (2014) 1337: 95-105]. 단백질의 순도는 Coomassie blue(Instant blue, Expedeon)로 염색된 10% Tris-Glycine SDS-PAGE 젤에서 평가되었다. GCase는 항-GCase 및 항-his-tag 항체를 사용하는 웨스턴 블롯팅 및 질량 분석법(MS)에 의해 확인되었다.

진핵 세포의 세포 배양 및 형질감염

인간 GCase의 야생형(WT) 및 D7 변이체 DNA 서열은 정제를 위한 N-말단 FLAG 태그와 함께 pCDNA 3.1(Invitrogen) 벡터에 복제되었다(도 2A). HEK293T 세포는 10% 소태아 혈청, 100IU/ml 페니실린, 100㎍/ml 스트렙토마이신 및 110㎍/ml 피루브산나트륨이 보충된 둘베코의 변형된 이글 배지에서 배양되었다. 세포를 폴리에틸렌이민 시약과 10cm 배양 접시당 10㎍의 플라스미드를 사용하여 형질감염시켰다. 세포 및 성장 배지를 형질감염 36-48시간 후에 수집하였다.

GCase 정제

GCase는 항-DYKDDDDK affinity resign(FLAG 비드) 및 Strep-Tactin®XT resign(Strep 비드)을 사용하여 세포 펠렛 또는 성장 배지로부터 분리되었다. 성장 배지를 250ml 튜브로 옮기고 4 ℃에서 20분 동안 10,000g에서 원심분리하였다. 150mM NaCl/50mM Tris(pH 7.4) 중 200㎕의 FLAG 비드 또는 Strep 비드 현탁액을 성장 배지로 채워진 50ml 팔콘 튜브에 첨가하고, GCase를 구슬에 결합할 수 있도록 밤새 4 ℃에서 로테이터에 놓았다. 세포 펠릿은 1% NP-40, 프로테아제 억제제 칵테일(1:500) 및 데옥시리보뉴클레아제(1:200)를 함유하는 동일한 Tris 완충액에서 초음파 처리하여 용해되었다. 용해물을 16,000g에서 4 ℃에서 20분 동안 원심분리하였다. 펠렛을 버리고 FLAG 비드를 상등액에 첨가하였다(상등액 1-5 ml당 비드 현탁액 50-150 μl). 혼합물을 4℃에서 최소 2시간 동안 로테이터에 두었다. FLAG 또는 Strep 비드인 비드를 과량의 Tris 완충액으로 세척하였다. FLAG 태그를 포함하는 GCase는 시트르산나트륨 완충액에 용해된 DYKDDDDK 펩티드(FLAG 펩티드, SEQ ID NO: 16)를 용리 리간드로 사용하여 3개의 연속적인 용출 단계에서 경쟁적 용출에 의해 방출되었다 (10.4g 삼나트륨 시트르산, 1리터의 이중 증류수에 용해된 시트르산 수소이나트륨 3.6g, 187mM D-만니톨, 및 0.1%(v/v) ml Tween 80, pH는 시트르산을 사용하여 6.1로 조정됨). 1 l의 재증류수, 187 mM D-만니톨 및 0.1%(v/v) ml Tween 80, 시트르산을 사용하여 pH를 6.1로 조정하였다. 단백질을 추가로 정제하고 시트르산나트륨 완충액에 보관하였다. 용출된 분획을 합하고 분석용 Superdex 200 컬럼에서 크기 배제 크로마토그래피(SEC)를 거쳤다. 단량체 피크에 해당하는 분획을 수집하고 Amicon Ultracentrifugal 필터(10kDa 컷오프, Merck Millipore)에서 농축하였다. 280 nm에서의 흡광도로부터 단백질 농도를 결정하고, 흡광계수는 아미노산 서열 조성에 기초하여 계산하였다(ε_D7-GCase = 108 290 M^-1cm^-1; ε_WT-GCase = 95 800 M^-1cm^-1). 순도는 Coomassie blue(Instant blue, Expedeon)로 염색된 10% Tris-Glycine SDS-PAGE 젤에서 평가되었다. GCase는 항-GCase, 항-Strep 및 항-DYKDDDDK 항체를 사용한 웨스턴 블로팅과 질량 분석법(MS)에 의해 확인되었다.

시차 주사 형광 측정법

NanoDSF Prometheus NT.48 기기(NanoTemper, Germany)를 사용하여 시차 주사 형광 측정(DSF)을 수행하였다. 샘플을 20-95 ℃의 온도 범위에서 1℃/min 단계로 가열하였다. 티로신 및 트립토판의 형광 방출을 330 nm 및 350 nm에서 기록하였다. 데이터는 PR.ThermControl v2.1.1 기기(NanoTemper, Germany)를 사용하여 분석되었다. 용융 온도(Tm)는 형광 강도(FI) 비율 곡선의 변곡점으로 정의되었으며, 여기서 R(FI) = FI _350nm/FI _330nm이다.

합성 기질(p-NP-Glc)을 사용한 효소 활성 분석

기질로 p-니트로페놀-β-D-글루코피라노사이드(p-NP-Glc)를 사용하여 특정 효소 활성을 측정하였다. pH를 10으로 올려 반응을 중단시켰으며, 이 pH에서 방출된 p-니트로페놀은 완전히 이온화되고 405 nm에서 20,000 M^-1cm^-1의 몰 흡수를 나타내었다.

활성 분석은 Wei et al[Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308]에 의해 채택되었다. 간단히 말해서, 효소 표본(aliquot)을 pH 5.9, 60분 동안 25℃에서 0.1% BSA/0.125% 소듐 타우로콜레이트/0.162% Triton X-100/0.02% 소듐 아지드/0.1M 포타슘 포스페이트 내 0.2-4mM p-NP-Glc로 인큐베이션하였다. 반응이 1M 글리신 완충액(pH 10)에서 20-50배 희석하여 중단되었고, p-니트로페놀의 흡광도는 Agilent Cary 3500 분광광도계(Agilent Technologies, USA)를 사용하여 1 cm 큐벳에서 405 nm에서 측정되었다.흡광도 값을 p-니트로페놀 농도로 변환하고, Origin 소프트웨어(OriginLab)를 사용하여 Michaelis-Menten 플롯을 구성하고 피팅하였다. 피팅에서 얻은 V_max 값은 k _cat = V_max/c 방정식에 따라 kcat 값으로 변환되었으며, 여기서 c는 GCase 촉매 부위의 몰 농도이다.

C6NBD GlcCer를 사용한 효소 활성 분석

GCase(NBD 글루코실세라마이드(d18:1/6:0)(C₆NBD GlcCer))의 형광 표지된 천연 기질을 사용하여 효소 활성에 대해 변이체를 시험하였다.

단백질 제제를 37 ℃에서 5분 동안 50mM MES 완충액 pH 5.5에서 20μM C6-NBD-GlcCer, 20μM 탈지 BSA와 함께 인큐베이션하였다. 750 ㎕의 클로로포름/메탄올(1:2, v/v)을 첨가하여 반응을 종결시킨 후, 500 ㎕의 클로로포름과 730 ㎕의 이중 증류수를 첨가하였다. 샘플을 격렬하게 볼텍싱하고 2,000g에서 10분 동안 원심분리하였다. 상부상을 흡인하고 추출된 지질을 함유하는 하부상을 N₂ 스트림 하에 건조시켰다. 지질을 클로로포름/메탄올(9:1, v/v)에 재현탁하고 클로로포름/메탄올/9.8mM CaCl₂·2H₂O(65/30/8, v/v/v)를 전개 용매로 사용하여 TLC로 분리하였다. NBD 표지 지질은 Typhoon 9410 가변 모드 이미저를 사용하여 시각화하고 ImageQuantTL(GE Healthcare, Chalfont St Giles, UK)로 정량화하였다. 활성 값은 기질의 μmol이 1분 동안 효소 1mg에 의해 생성물(μmol.mg^-1.min^-1)로 전환하는 것으로 계산되었다.

실시예 1

PROSS-생성된 변이체

6개의 GCase 변이체(SEQ ID NO: 4, 6, 8, 10, 12 및 14에 각각 기재된 디자인 2-7, 즉 D2-7, 도 1A 참조)는 이미 여러 다른 단백질의 발현 수준 및 안정성 개선하는데 성공적으로 사용된 PROSS 알고리즘을 사용하여 디자인되었다 [PCT/IL2016/050812 및 Goldenzweig A. et al., Mol. Cell. (2016) 63: 337-346, 참고로 본원에 포함됨]. 이들 변이체 중 4개, D2, D4, D6 및 D7은 E. coli에서 발현되었고 합성 기질인 p-NP-Glc를 사용하여 효소 활성에 대해 테스트되었다(데이터는 표시되지 않음). WT GCase의 서열은 도 1B(SEQ ID NO: 2)에 나타냈으며, 아래 라인은 가장 많은 수, 즉 30개의 돌연변이를 보유하는 D7 변이체(SEQ ID NO: 14)에서 발생하는 돌연변이를 표시한다. 또한 가장 높은 효소 활성을 나타내는 작제물이다. 추가 작업을 위해 D7 변이체는 단백질 글리코실화를 할 수 있는 HEK293T 세포에서 발현되었다.

실시예 2

변이체 D7 GCase의 발현 및 정제

WT hGCase 및 D7 변이체 모두 HEK293T 세포에서 발현되었고, 세포 펠렛(세포내) 또는 배양 배지(분비)로부터 단리되었다. WT 및 D7 GCase는 모두 세포 내에서 발현되었지만 D7 변이체는 WT 보다 더 높은 발현을 보였다. 쿠마시 블루 염색을 사용하여 개별 준비에서 얻은 세 가지 용리액 분획의 SDS-PAGE를 도 2B 및 2C에 표시하고, GCase는 웨스턴 블랏팅 및 MS에 의해 주요 밴드(화살표로 표시)로 식별되었다. D7 GCase만 분비되었다. 분비된 D7 GCase의 고도로 정제된 제제는 FLAG 비드를 사용한 1단계 정제에 의해 얻어졌다(도 2C).

그 후, 샘플을 Superdex200 컬럼에 적용하였다. SEC는 분비된 D7 GCase의 상당한 올리고머화를 밝혀냈다(도 3A-B). 세포내 WT 및 D7 GCase에 대해서도 유사한 패턴이 관찰되었다. 약 15ml에서 최대 흡광도를 갖는 피크로서 분자량 마커로 컬럼을 보정하여 단량체의 위치를 설정하였다(피크 1, 도 3A-B). 단량체 피크는 또한 가장 높은 비활성을 갖는 분획으로 나타났다. 단량체에 해당하는 분획을 모아서 농축하고 안정성 및 활성 분석에 사용하였다. 다음에서 제시된 데이터는 분비된 분획으로부터 2단계 정제에 의해 얻은 D7 단량체에 관한 것이다. 분비된 WT GCase의 매우 낮은 수율로 인해, D7 GCase에 대해 얻은 데이터를 R&D Systems에서 얻은 CHO 세포에서 발현된 재조합 WT GCase 및 단일 Arg495His 치환이 있는 WT 서열을 보유하는 Sanofi Genzyme에서 생산한 Cerezyme®에 대한 유사한 데이터와 비교하였다.

실시예 3

변이체 D7 GCase의 열 안정성

D7 GCase의 용융 온도(Tm)는 DSF(Differential Scanning Fluorimetry)를 사용하여 측정되었다. DSF는 수성 환경에 노출되는 단백질 전개 시 티로신 및 트립토판 잔기의 형광 변화를 측정한다.

분석된 제제에 대한 평균 Tm 값은 하기 표 1에 기재되어 있다. D7 GCase에 대한 71.8 ± 2.4 ℃ 및 61.4 ± 1.9 ℃의 Tm 값은 각각 Tris 완충액(pH 7.4)과 시트르산염 완충액(pH 6.1)에서 측정되었다. D7 GCase는 WT GCase 보다 더 높은 열 안정성을 나타냈다. pH 7.4 및 pH 6.1에서 Cerezyme®과 비교할 때 안정성의 증가는 각각 약 20 ℃ 및 약 11 ℃였다. DSF를 사용하여 Cerezyme® 및 WT GCase에 대해 얻은 값은 이전에 보고된 Cerezyme®에 대해 시차 주사 열량계에 의해 얻은 Tm 값, 즉 pH 7.1에서 51.30 ± 0.02 ℃, pH 5.4에서 57.67 ± 0.04 ℃과 잘 일치하였다 [앞서 언급된 Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308].

표 1:

실시예 4

변이체 D7 GCase의 비활성

Michaelis-Menten 방정식을 실험 데이터에 맞추면 K_m및 kcat 값을 얻을 수 있다(아래 표 2, 대표적인 효소 동역학 데이터는 도 4에 나와 있음). 다양한 제제의 전체 촉매 효율은 이분자 속도 상수인 k_cat/K_m을 기준으로 비교되었다. 얻어진 데이터는 D7과 WT의 촉매 활성이 크게 다르지 않음을 보여주었으며, k_cat/K_m 값은 각각 0.28 x 10⁶ 및 0.27 x 10⁶ M^-1min^-1이었다. 따라서 이 데이터는 사용된 프로토콜과 인공 기질인 p-니트로페닐-β-D-글루코피라노사이드와의 비교 분석을 검증하였다.

표 2:

실시예 5

추가 PROSS-생성된 변이체

글루코실세라미다제(GCase)의 3가지 추가 변이체(D13, D14 및 D15)는 이전에 GCase(디자인 D7)를 비롯한 여러 다른 단백질의 발현 수준 및 안정성 개선에 성공적으로 사용된 PROSS 알고리즘을 사용하여 설계되었다[앞서 언급된 PCT/IL2016/050812 및 Goldenzweig A. et al., (2016) 참조하시오, 참고로 여기에 포함됨]. GCase 변이체 D13, D14 및 D15는 HEK293T 세포에서 발현되었고 배양 배지로부터 분리되었다. GCase 디자인의 고도로 정제된 제제는 FLAG 태그(DYKDDDDK 태그, SEQ ID NO: 16) 또는 TwinStrep® 태그(SEQ ID NO: 29)를 사용한 1단계 정제에 의해 얻어졌다. 모든 변이체는 GCase(NBD 글루코실세라마이드(d18:1/6:0)(C6NBD GlcCer))의 형광 표지된 유사체를 사용하여 효소 활성에 대해 테스트되었다(데이터는 표시되지 않음). 가장 높은 효소 활성을 갖는 디자인, 즉 변이체 D15 GCase(도 5A-B에 예시됨)를 추가 특성화에 사용하였다. 아래 논의된 바와 같이, 새로운 D15 GCase의 열적 안정성 및 효소 활성은 이전에 특성화된 D7 GCase 및 단일 Arg495His 치환을 갖는 WT 서열을 보유하는 Sanofi Genzyme에 의해 생산된 Cerezyme®과 비교되었다. 모든 효소는 187mM D-만니톨 및 0.1%(v/v) Tween 80, pH 6.1을 포함하는 나트륨/시트레이트 완충액에 용해된 4℃에 보관되었다.

실시예 6

변이체 D15 GCase의 열 안정성

D15 GCase의 용융 온도(Tm)는 DSF(Differential Scanning Fluorimetry)를 사용하여 측정되었다. DSF는 수성 환경에 노출되는 단백질 전개 시 티로신 및 트립토판 잔기의 형광 변화를 측정한다. (위에서 논의한 바와 같이) 실험은 시트레이트 완충액, pH 6.1에 용해된 효소로 수행되었다. D7 GCase는 이전에 Cerezyme®과 비교할 때 약 10 ℃ 더 높은 온도를 갖는 것으로 나타났다. 변이체 D15 GCase에 대해 용융 온도의 추가 증가가 관찰되었다. D15 GCase에 대해 측정된 평균 Tm 값은 Cerezyme®과 비교할 때 17 ℃ 더 높았으며, 이는 단백질 열 안정성의 실질적인 증가를 반영한다(아래 표 3). Cerezyme®에 대해 측정된 Tm 값은 pH 7.1에서 51.30 ± 0.02 ℃인 시차 주사 열량계로 얻은 이전에 보고된 Tm 값과 잘 일치하였다[앞서 언급된 Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308].

표 3:

실시예 7

변이체 D15 GCase의 비활성

비활성은 (i) (pH 5.5에서) GCase C6NBD GlcCer의 형광 표지된 천연 기질 사용 및 (ii) (pH 5.9에서) 인공 기질 p-니트로페닐-β-D-글루코피라노사이드(p-NP-Glc)(p-NP-Glc) 사용하는, 두 가지 접근법에 의해 측정되었다. 첫 번째 접근법에서는 기질과 생성물을 박층 크로마토그래피로 분리하고 NBD 형광으로 정량화하였다. 후자에서, 기질은 405 nm에서 생성된 p-니트로페닐의 흡수에 의해 분광학적으로 정량화되었다. 두 기질에 의해 측정된 비활성은 상업용 Cerezyme® 및 D15 GCase와 비슷하였다. 활성 값은 1분 동안 1mg의 효소에 의해 기질의 μmol이 생성물로 변하는 것으로 계산되었다 (μmol.mg^-1.min^-1; 하기 표 4A). 기질 농도는 C6NBD GlcCer 분석의 경우 20μM이고 p-NP-Glc 분석의 경우 0.4, 1.5 및 3mM이었다(도 6).

표 4A:

WT GCase, 상용 Cerezyme®, D7 GCase 및 D15 GCase의 효소 동역학을 비교하기 위해 추가 실험을 수행하였다. 측정된 데이터 포인트에 Michaelis-Menten 곡선을 피팅하여 p-니트로페닐-β-D-글루코피라노사이드(p-NP-Glc)에 대한 GCase 제제의 활성에 대한 운동 매개변수를 얻었다. 실험 데이터가 허용되어 K_m 및 k_cat 값을 얻었다(아래 표 4B). 다양한 제제의 전체 촉매 효율은 이분자 속도 상수인 k_cat/K_m을 기준으로 비교되었다. 얻은 데이터는 D15의 촉매 활성이 Cerezyme®의 촉매 활성과 비슷했으며, 이들의 k_cat/K_m 값은 각각 1.49 x 10⁶ M^-1min^-1및 1.53 x 10⁶ M^-1min^-1인 반면, D7의 촉매 활성은 k_cat/K_m 값은 각각 0.27 x 10⁶ M^-1min^-1 및 0.28 x 10⁶ M^-1min^-1인 WT GCase와 유사하였다.

표 4B:

실시예 8

추가 GCase 변이체 - D16

글루코실세라미다제 효소(GCase)의 추가 변이체(D16)는 이전에 GCase(디자인 D7 및 D15)를 비롯한 여러 다른 단백질의 발현 수준 및 안정성을 개선하기 위해 성공적으로 사용된 PROSS 알고리즘을 사용하여 디자인되었다 [앞서 언급된 Goldenzweig A. et al., (2016), 참조로 본원에 포함됨]. D16 GCase는 HEK 293T 세포에서 발현되었고 배양 배지에서 분리되었다. GCase 디자인의 고도로 정제된 제제는 TwinStrep® 태그(SEQ ID NO: 29)를 사용한 1단계 정제에 의해 얻어졌다.

아래 논의된 바와 같이, 새로운 D16 GCase의 열 안정성 및 효소 활성은 TwinStrep® 태그(SEQ ID NO: 29)를 사용하여 정제된 이전에 특성화된 D15 GCase 및 단일 Arg495His 치환을 갖는 WT 서열을 보유하는 Sanofi Genzyme에 의해 생산된 Cerezyme®과 비교되었다. 모든 효소는 187mM D-만니톨 및 0.1%(v/v) Tween 80, pH 6.1을 포함하는 나트륨/시트레이트 완충액에 용해된 4℃에 보관되었다.

실시예 9

변이체 D16 GCase의 열 안정성

GCase의 용융 온도(Tm)는 DSF(Differential Scanning Fluorimetry)를 사용하여 측정되었다. DSF는 수성 환경에 노출되는 단백질 전개 시 티로신 및 트립토판 잔기의 형광 변화를 측정한다.

실험은 시트레이트 완충액, pH 6.1(상기에 기술된 저장 완충액)에 용해된 효소로 수행되었다. 이전에 GCase D15에 대해 측정된 Tm 값은 Cerezyme®과 비교할 때 약 17 ℃ 더 높았으며, 이는 단백질 열 안정성의 실질적인 증가를 반영한다(위 표 3 및 아래 표 5). 새로운 GCase D16은 Tm이 GCase D15에 비해 2.5 ℃ 약간 증가하였다. 여기에서 Cerezyme®에 대해 측정된 Tm 값은 pH 7.1에서 시차 주사 열량측정법(51.30 ± 0.02℃)으로 얻은 이전에 보고된 Tm 값과 잘 일치하였다[앞서 언급된 Wei R.R. et al., J. Biol. Chem. (2011) 286: 299-308].

표 5:

실시예 10

변이체 D16 GCase의 비활성

인공 기질 p-니트로페닐-β-D-글루코피라노사이드(p-NP-Glc)(pH 5.9)를 사용하여 비활성을 측정하였다. 이 분석에서 기질은 405 nm에서 생성된 p-니트로페닐의 흡수에 의해 분광학적으로 정량화되었다. 기질 농도는 3mM이었다. 새로운 GCase D16 변이체의 특이적 효소 활성은 상업용 Cerezyme®에 대해 결정된 것 보다 높았고 GCase D15와 비슷하였다. 활성 값은 1분 동안 1mg의 효소에 의해 기질 μmol이 생성물로 변하는 것으로 계산되었다(μmol.mg^-1.min^-1; 아래 표 6).

표 6:

본 발명이 그 특정 실시예와 관련하여 설명되었지만, 많은 대안, 수정 및 변형이 당업자에게 명백할 것임이 명백하다. 따라서, 첨부된 특허청구범위의 정신과 넓은 범위에 속하는 이러한 모든 대안, 수정 및 변형을 포함하도록 의도된다.

본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조에 의해 본 명세서에 포함되는 것으로 구체적이고 개별적으로 표시된 것과 동일한 정도로 본 명세서에 전체적으로 포함된다. 또한, 본 출원에서 참조의 인용 또는 확인은 이러한 참조가 본 발명에 대한 선행 기술로 이용가능하다는 것을 인정하는 것으로 해석되어서는 안 된다. 섹션 제목이 사용되는 범위 내에서 반드시 제한적인 것으로 해석되어서는 안 된다. 또한, 본 출원의 우선권 문서(들)는 그 전체가 참조로 본원에 포함된다.

SEQUENCE LISTING <110> YEDA RESEARCH AND DEVELOPMENT CO. LTD. FUTERMAN, Anthony H. SILMAN, Israel SUSSMAN, Joel L. FLEISHMAN, Sarel GOLDENZWEIG, Adi POKORNA, Sarka ASHANI, Yaacov KHERSONSKY, Olga <120> VARIANTS OF BETA-GLUCOCEREBROSIDASE FOR USE IN TREATING GAUCHER DISEASE <130> 86504 <150> IL 273684 <151> 2020-03-29 <150> US 63/049,685 <151> 2020-07-09 <160> 29 <170> PatentIn version 3.5 <210> 1 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> NA sequence of WT Gcase (E.coli optimized codons) <400> 1 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc tgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 cagaacctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcatt cgcacctata cctatgcgga taccccggat 420 gattttcagc tgcataactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgctgcagct ggcgcagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata tttatcatca gacctgggcg cgctattttg tgaaatttct ggatgcgtat 660 gcggaacata aactgcagtt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 ctgagcggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcgatc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgaaat atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaaca ccatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattaccaac ctgctgtatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accattaaag atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcatcgcca gtaa 1494 <210> 2 <211> 497 <212> PRT <213> Artificial sequence <220> <223> AA sequence of WT Gcase <400> 2 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Lys 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp His Arg 485 490 495 Gln <210> 3 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 3 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc tgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 cagaacctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcatt cgcacctata cctatgcgga taccccggat 420 gattttcagc tgcataactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgctgcagct ggcgcagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata tttatcatca gacctgggcg cgctattttg tgaaatttct ggatgcgtat 660 gcggaacata aactgcagtt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 ctgagcggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcgatc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgaaat atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaaca ccatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgctgtatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accattaaag atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcatcgcca gtaa 1494 <210> 4 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 4 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Asn 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp His Arg 485 490 495 Gln <210> 5 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 5 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc cgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 cagaacctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcatt cgcacctata cctatgcgga taccccggat 420 gattttcagc tgcataactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgctgcagct ggcgcagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata tttatcatca gacctgggcg cgctattttg tgaaatttct ggatgcgtat 660 gcggaacata acctgcagtt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 ctgagcggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcgatc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgaaat atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaaca ccatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgctgtatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accattaaag atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcatcgcca gtaa 1494 <210> 6 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 6 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Asn 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Phe Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp His Arg 485 490 495 Gln <210> 7 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 7 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc cgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 caggatctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcatt cgcacctata cctatgcgga taccccggat 420 gattttcagc tgaaaaactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgcagcagct ggcgcagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata aatatcatca gacctgggcg cgctattttg tgaaatttct ggatgcgtat 660 gcgaaacata acctgacctt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 attccgggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcgatc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgaaat atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaact atatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgaactatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accatttggg atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcgccgcca gtaa 1494 <210> 8 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified ?glucocerebrosidase (GCase variant) <400> 8 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asp Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Gln Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Asn 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Tyr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 9 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 9 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc cgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa cgcagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 caggatctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcacc cgcacctata cctatgcgga taccccggat 420 gattttaaac tgaaaaactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgcagcagct gagccagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata aatatcatca gacctgggcg aactattttg tgaaatttct ggatgcgtat 660 gcgaaacata acctgacctt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 attccgggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcaacc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgcgct atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaact atatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgaactatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accatttggg atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcgccgcca gtaa 1494 <210> 10 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 10 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asp Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Gln Gln Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Asn 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Tyr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 11 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 11 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc cgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaaccat 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 caggatctgc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcacc cgcacctata cctatgcgga taccccggat 420 gattttcagc tgaaaaactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgcagcagct gagccagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata aatatcatca gacctgggcg aactattttg tgaaatttct ggatgcgtat 660 gcgaaacata acctgacctt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 attccgggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcaacc tgggcccgac cctggcgaac agcacccatc ataacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgcgct atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccgaact atatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgaactatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctgaaccc ggaaggcggc ccgaactggg tgcgcaactt tgtggatagc 1200 ccgattattg tggatattac caaagatacc ttttataaac agccgatgtt ttatcatctg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accatttggg atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcgccgcca gtaa 1494 <210> 12 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 12 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asp Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Gln Gln Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Asn 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Arg Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Tyr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 13 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> NA sequence of optimized ecoli D7 Gcase <400> 13 gcgcgcccgt gcattccgaa aagctttggc tatagcagcg tggtgtgcgt gtgcaacgcg 60 acctattgcg atagctttga tccgccgacc tttccggcgc cgggcacctt tagccgctat 120 gaaagcaccc gcagcggccg ccgcatggaa ctgagcatgg gcccgattca ggcgaactgg 180 accggcaccg gcctgctgct gaccctgcag ccggaacaga aatttcagaa agtgaaaggc 240 tttggcggcg cgatgaccga tgcggcggcg ctgaacattc tggcgctgag cccgccggcg 300 caggataacc tgctgaaaag ctattttagc gaagaaggca ttggctataa cattattcgc 360 gtgccgatgg cgagctgcga ttttagcacc cgcacctata cctatgcgga taccccggat 420 gattttcagc tgaaaaactt tagcctgccg gaagaagata ccaaactgaa aattccgctg 480 attcatcgcg cgcaggcgct gagccagcgc ccggtgagcc tgctggcgag cccgtggacc 540 agcccgacct ggctgaaaac caacggcgcg gtgaacggca aaggcagcct gaaaggccag 600 ccgggcgata aatatcatca gacctgggcg aactattttg tgaaatttct ggatgcgtat 660 gcgaaacata acctgacctt ttgggcggtg accgcggaaa acgaaccgag cgcgggcctg 720 attccgggct atccgtttca gtgcctgggc tttaccccgg aacatcagcg cgattttatt 780 gcgcgcaacc tgggcccgac cctggcgaac agcacccatc gcaacgtgcg cctgctgatg 840 ctggatgatc agcgcctgct gctgccgcat tgggcgaaag tggtgctgac cgatccggaa 900 gcggcgcgct atgtgcatgg cattgcggtg cattggtatc tggattttct ggcgccggcg 960 aaagcgaccc tgggcgaaac ccatcgcctg tttccggatt atatgctgtt tgcgagcgaa 1020 gcgtgcgtgg gcagcaaatt ttgggaacag agcgtgcgcc tgggcagctg ggatcgcggc 1080 atgcagtata gccatagcat tattgaagat ctgaactatc atgtggtggg ctggaccgat 1140 tggaacctgg cgctggatcc ggaaggcggc ccgaactggg tgaaaaactt tgtggatagc 1200 ccgattattg tggataccac caaagatacc ttttataaac agccgatgtt ttatcatatg 1260 ggccatttta gcaaatttat tccggaaggc agccagcgcg tgggcctggt ggcgagccag 1320 aaaaacgatc tggatgcggt ggcgctgatg catccggatg gcagcgcggt ggtggtggtg 1380 ctgaaccgca gcagcaaaga tgtgccgctg accatttggg atccggcggt gggctttctg 1440 gaaaccatta gcccgggcta tagcattcat acctatctgt ggcgccgcca gtaa 1494 <210> 14 <211> 497 <212> PRT <213> Artificial sequence <220> <223> AA sequence of D7 Gcase <400> 14 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn Trp Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asp Asn Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Gln Ala Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Asn 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His Arg Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Arg Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asp Tyr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asp Pro Glu Gly Gly Pro Asn Trp Val Lys Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Thr Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Met Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 15 <211> 24 <212> DNA <213> Artificial sequence <220> <223> NA sequence of FLAG peptide <400> 15 gactacaaag acgatgacga caag 24 <210> 16 <211> 8 <212> PRT <213> Artificial sequence <220> <223> AA sequence of FLAG peptide <400> 16 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 17 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 17 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ccggtacctt cagccgctat 120 gagagtacac gcagtgggcg acggatggag ctgagtatgg ggcccatcca ggctaattgg 180 acgggcacag gcctgctact gaccctgcag ccagaacaga agttccagaa aatcaaggga 240 tttggagggg ccatgacaga tgctgctgct ctcaacatcc ttaagctgtc accccctgcc 300 caagagaacc tacttaaatc gtacttctct gaagaaggaa tcggatataa catcatccgg 360 gtacccatgg ccagctgtga cttctccacc cgcacctaca cctatgcaga cacccctgat 420 gatttccagt tgaagaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attcaccgag cccaggcctt gagccagcgt cccgtttcac tccttgccag cccctggaca 540 tcacccactt ggctcaagac caatggagcg atgaatggga aggggtcact caagggacag 600 cccggagaca agtaccacca gacctgggcc aactactttg tgaagttcct ggatgcctat 660 gctaagcacg gcttaacctt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 atccccggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtaacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgac agacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagacaccc taggggagac acaccgcctg ttccccaaca agatgctctt tgcctcagag 1020 gcctgtaccg gctccaagtt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 gagcagtacg cccacagcat catcgaggac ctcaactact gggtggtcgg ctggaccgac 1140 tggaaccttg ccctgaaccc cgaaggagga cccaattggg tgcgtaactt tgtcgacagt 1200 cccatcattg tagacgccac caaggacgag ttttacaaac agcccatgtt ctaccacatc 1260 ggccacttca gcaagttcat tcctgagggc tcccagagag tggggctggt tgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg aaccccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct cctctaagga tgtgcctctt accatctggg atcctgctgt gggcttcatc 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 18 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 18 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn Trp Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Ile Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Lys Leu 85 90 95 Ser Pro Pro Ala Gln Glu Asn Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Gln Ala Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Met Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Gly 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Asp Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Lys Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Thr Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Glu Gln Tyr Ala His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr Trp Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ala Thr Lys Asp Glu Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Ile Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met Asn Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Ala Val Gly Phe Ile 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 19 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 19 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ccggtacctt cagccgctat 120 gagagtacac gcagtgggcg acggatggag ctgagtatgg ggcccatcca ggctaattgg 180 acgggcacag gcctgctact gaccctgcag ccagaacaga agttccagaa aatcaaggga 240 tttggagggg ccatgacaga tgctgctgct ctcaacatcc ttaagctgtc accccctgcc 300 caagagaacc tacttaaatc gtacttctct gaagaaggaa tcggatataa catcatccgg 360 gtacccatgg ccagctgtga cttctccacc cgcacctaca cctatgcaga cacccctgat 420 gatttccagt tgaagaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attaagcgag cccaggcctt gagccagcgt cccgtttcac tccttgccag cccctggaca 540 gcccccactt ggctcaagac caatggagcg atgaatggga aggggtcact caagggacag 600 cccggagaca agtaccacca gacctgggcc aactactttg tgaagttcct ggatgcctat 660 gctaagcacg gcttaacctt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 atccccggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtaacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgag cgacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagacaccc taggggagac acaccgcctg ttccccaaca agttcctctt tgcctcagag 1020 gcctgtaccg gctcccactt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 gagcagtacg cccacagcat catcgaggac ctcaactact gggtggtcgg ctggaccgac 1140 tggaaccttg ccctggaccc cgaaggagga cccaattggg tgaagaactt tgtcgacagt 1200 cccatcattg tagacgccac caaggacgag ttttacaaac agcccatgtt ctaccacatc 1260 ggccacttca gcaagttcat tcctgagggc gcccagagag tggggctggt tgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg aaccccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct ccgacaagga tgtgcctctt accatctggg atcctgacgt gggcttcatc 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 20 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 20 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn Trp Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Ile Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Lys Leu 85 90 95 Ser Pro Pro Ala Gln Glu Asn Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile Lys Arg Ala Gln Ala Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ala Pro Thr Trp Leu Lys Thr Asn Gly Ala Met Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Gly 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Ser Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Asp Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Lys Phe Leu 325 330 335 Phe Ala Ser Glu Ala Cys Thr Gly Ser His Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Glu Gln Tyr Ala His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr Trp Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asp Pro Glu Gly Gly Pro Asn Trp Val Lys Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ala Thr Lys Asp Glu Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Ile Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ala Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met Asn Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Asp Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Asp Val Gly Phe Ile 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 21 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 21 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ccggtacctt cagccgctat 120 gagagtacac gcagtgggaa gcggatggag aggagtatgg ggcccatcca ggctaattgg 180 acgggcacag gcctgctact gaccctgcac ccagaacaga agttccagaa aatcaaggga 240 tttggagggg ccatgacaga tgctgctgct atcaacatcc ttaagctgtc accccctgcc 300 caagaggagc tacttaaatc gtacttctct gaagaaggaa tcgagtataa catcatccgg 360 gtacccatgg gcagctgtga cttctccacc cgcacctaca cctatgcaga cacccctaac 420 gatttccagt tgaagaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attaagcgag cccaggcctt gagccagcgt cccgtttcac tccttgccag cccctggaca 540 gcccccactt ggctcaagac caatggagcg atgaatggga aggggaccct caagggacag 600 cccggagaca agtaccacca gacctgggcc aactactttg tgaagttcct ggatgcctat 660 gctaagcacg gcttaacctt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 atccccggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtaacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgag cgacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagacaccc taggggagac acaccgcctg ttccccgaca agttcctctt tgcctcagag 1020 gcctgtaccg gctcccactt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 gagcagtacg cccacagcat catcgaggac ctcaactact gggtggtcgg ctggaccgac 1140 tggaaccttg ccctggaccc cgaaggagga cccaattggg tgaagaactt tgtcgacagt 1200 cccatcattg tagacgccac caaggacgag ttttacaaac agcccatgtt ctaccacatg 1260 ggccacttca gcaagttcat tcctgagggc gcccagagag tggggctgag cgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg aaccccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct ccgacaagga tgtgcctctt accatctggg atcctgacgt gggcttcatc 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 22 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 22 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Lys Arg 35 40 45 Met Glu Arg Ser Met Gly Pro Ile Gln Ala Asn Trp Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu His Pro Glu Gln Lys Phe Gln Lys Ile Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Ile Asn Ile Leu Lys Leu 85 90 95 Ser Pro Pro Ala Gln Glu Glu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Glu Tyr Asn Ile Ile Arg Val Pro Met Gly Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asn Asp Phe Gln Leu 130 135 140 Lys Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile Lys Arg Ala Gln Ala Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ala Pro Thr Trp Leu Lys Thr Asn Gly Ala Met Asn 180 185 190 Gly Lys Gly Thr Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Gly 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Ser Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Asp Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asp Lys Phe Leu 325 330 335 Phe Ala Ser Glu Ala Cys Thr Gly Ser His Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Glu Gln Tyr Ala His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr Trp Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asp Pro Glu Gly Gly Pro Asn Trp Val Lys Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ala Thr Lys Asp Glu Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Met Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ala Gln 420 425 430 Arg Val Gly Leu Ser Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met Asn Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Asp Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Asp Val Gly Phe Ile 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 23 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> NA sequence of optimized human D7 Gcase <400> 23 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ccggtacctt cagccgctat 120 gagagtacac gcagtgggaa gcggatggag aggagtatgg ggcccatcca ggctaattgg 180 acgggcacag gcctgctact gaccctgcac ccagaacaga agttccagaa aatcaaggga 240 tttggagggg ccatgacaga tgctgctgct atcaacatcc ttaagctgtc accccctgcc 300 caagaggagc tacttaaatc gtacttctct gaagaaggaa tcgagtataa catcatccgg 360 gtacccatgg gcagctgtga cttctccacc cgcacctaca cctatgcaga cacccctaac 420 gatttccagt tgaagaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attaagcgag cccaggcctt gagccagcgt cccgtttcac tccttgccag cccctggaca 540 gcccccactt ggctcaagac caatggagcg atgaatggga aggggaccct caagggacag 600 cccggagaca agtaccacca gacctgggcc aactactttg tgaagttcct ggatgcctat 660 gctaagcacg gcttaacctt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 atccccggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtaacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgag cgacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagacaccc taggggagac acaccgcctg ttccccgaca agttcctctt tgcctcagag 1020 gcctgtaccg gctcccactt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 gagcagtacg cccacagcat catcgaggac ctcaactact gggtggtcgg ctggaccgac 1140 tggaaccttg ccctggaccc cgaaggagga cccaattggg tgaagaactt tgtcgacagt 1200 cccatcattg tagacgccac caaggacgag ttttacaaac agcccatgtt ctaccacatg 1260 ggccacttca gcaagttcat tcctgagggc gcccagagag tggggctgag cgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg aaccccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct ccgacaagga tgtgcctctt accatctggg atcctgacgt gggcttcatc 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 24 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> NA sequence of WT Gcase (human optimized codons) <400> 24 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ttggtacctt cagccgctat 120 gagagtacac gcagtgggcg acggatggag ctgagtatgg ggcccatcca ggctaatcac 180 acgggcacag gcctgctact gaccctgcag ccagaacaga agttccagaa agtgaaggga 240 tttggagggg ccatgacaga tgctgctgct ctcaacatcc ttgccctgtc accccctgcc 300 caaaatttgc tacttaaatc gtacttctct gaagaaggaa tcggatataa catcatccgg 360 gtacccatgg ccagctgtga cttctccatc cgcacctaca cctatgcaga cacccctgat 420 gatttccagt tgcacaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attcaccgag ccctgcagtt ggcccagcgt cccgtttcac tccttgccag cccctggaca 540 tcacccactt ggctcaagac caatggagcg gtgaatggga aggggtcact caagggacag 600 cccggagaca tctaccacca gacctgggcc agatactttg tgaagttcct ggatgcctat 660 gctgagcaca agttacagtt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 ttgagtggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtgacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgac agacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagccaccc taggggagac acaccgcctg ttccccaaca ccatgctctt tgcctcagag 1020 gcctgtgtgg gctccaagtt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 atgcagtaca gccacagcat catcacgaac ctcctgtacc atgtggtcgg ctggaccgac 1140 tggaaccttg ccctgaaccc cgaaggagga cccaattggg tgcgtaactt tgtcgacagt 1200 cccatcattg tagacatcac caaggacacg ttttacaaac agcccatgtt ctaccacctt 1260 ggccacttca gcaagttcat tcctgagggc tcccagagag tggggctggt tgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg catcccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct cctctaagga tgtgcctctt accatcaagg atcctgctgt gggcttcctg 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 25 <211> 497 <212> PRT <213> Artificial sequence <220> <223> AA sequence of WT Gcase <400> 25 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Lys 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 26 <211> 1494 <212> DNA <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 26 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ccggtcagtt cgcccgctat 120 gagagtacac gcagtgggaa gcggatggag aggagtatgg ggcccatcca ggctaattgg 180 acgggcacag gcctgctact gaccctgcac ccagaacaga agttccagaa aatcaaggga 240 tttggagggg ccatgacaga tgctgctgct atcaacatcc ttaagctgtc accccctgcc 300 caagagaggc tacttaaatc gtacttctct gaagaaggaa tcgagtataa catcatccgg 360 gtacccatgg gcagctgtga cttctccacc cgcacctaca cctatgcaga cacccctgac 420 gatttcgagt tgagaaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attaagcgag cccaggcctt gagccagcgt cccgtttcac tccttgccag cccctggaca 540 gcccccgcct ggatgaagac caatggagcg atgaatggga aggggaccct caagggacag 600 cccggagaca agtaccacca gacctgggcc aactactttg tgaagttcct ggatgcctat 660 gctaagcacg gcttaacctt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 atccccggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtaacc taggtcctac cctcgccaac agtagccaca aggacgtccg cctactcatg 840 ctggatgacc aacgcagcct gctgccccac tgggcacagg tggtactgag cgacccaaga 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 gaggacaccc taggggagac acaccgcctg ttccccgaca agttcctctt tgcctcagag 1020 gcctgtaccg gctcccactt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 gagcagtacg cccacagcat catcgaggac ctcaactact gggtgaccgg ctggaccgac 1140 tggaaccttg ccctggaccc cgaaggagga cccaattggg tgaagaactt tgtcgacagt 1200 cccatcattg tagacgccac cagggacgag ttttacaaac agcccatgtt ctaccacatg 1260 ggccacttca gcaagttcat tcctgagggc gcccagagag tggggctgag cgccagtgag 1320 aagaacgacc tggacgcagt ggcactgcag aaccccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct ccgacaagga tgtgcctctt accatctggg atcctgacgt gggcttcatc 1440 gagacagtgt cacctggcta ctccattcac acctacctgt ggcgtcgcca gtga 1494 <210> 27 <211> 497 <212> PRT <213> Artificial sequence <220> <223> genetically modified betta-glucocerebrosidase (GCase variant) <400> 27 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Pro Gly Gln Phe Ala Arg Tyr Glu Ser Thr Arg Ser Gly Lys Arg 35 40 45 Met Glu Arg Ser Met Gly Pro Ile Gln Ala Asn Trp Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu His Pro Glu Gln Lys Phe Gln Lys Ile Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Ile Asn Ile Leu Lys Leu 85 90 95 Ser Pro Pro Ala Gln Glu Arg Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Glu Tyr Asn Ile Ile Arg Val Pro Met Gly Ser Cys Asp Phe 115 120 125 Ser Thr Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Glu Leu 130 135 140 Arg Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile Lys Arg Ala Gln Ala Leu Ser Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ala Pro Ala Trp Met Lys Thr Asn Gly Ala Met Asn 180 185 190 Gly Lys Gly Thr Leu Lys Gly Gln Pro Gly Asp Lys Tyr His Gln Thr 195 200 205 Trp Ala Asn Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Lys His Gly 210 215 220 Leu Thr Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Ile Pro Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asn Leu Gly Pro Thr Leu Ala Asn Ser Ser 260 265 270 His Lys Asp Val Arg Leu Leu Met Leu Asp Asp Gln Arg Ser Leu Leu 275 280 285 Pro His Trp Ala Gln Val Val Leu Ser Asp Pro Arg Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Glu Asp Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asp Lys Phe Leu 325 330 335 Phe Ala Ser Glu Ala Cys Thr Gly Ser His Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Glu Gln Tyr Ala His Ser Ile Ile 355 360 365 Glu Asp Leu Asn Tyr Trp Val Thr Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asp Pro Glu Gly Gly Pro Asn Trp Val Lys Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ala Thr Arg Asp Glu Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Met Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ala Gln 420 425 430 Arg Val Gly Leu Ser Ala Ser Glu Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Gln Asn Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Asp Lys Asp Val Pro Leu Thr Ile Trp Asp Pro Asp Val Gly Phe Ile 465 470 475 480 Glu Thr Val Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 28 <211> 87 <212> DNA <213> Artificial sequence <220> <223> NA TwinStrep <400> 28 tggtcccacc cccagttcga gaagggcggc ggtagtggag ggggcggatc tggcggctca 60 gcttggagcc acccccagtt cgaaaag 87 <210> 29 <211> 29 <212> PRT <213> Artificial sequence <220> <223> AA TwinStrep <400> 29 Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys 20 25

Claims

(i) SEQ ID NO: 2와 적어도 85% 동일한 아미노산 서열을 포함하며; 그리고
(ii) 좌표 L34P, K224N/G, T369E 및 N370D에서 돌연변이를 포함하되, 여기서 좌표는 SEQ ID NO: 2에 해당하며; 그리고
(iii) 당지질 글루코실세라마이드(GlcCer)의 가수분해를 촉매할 수 있는,
유전적으로 변형된 인간 β-글루코세레브로시다아제(GCase).
제 1 항에 있어서,
돌연변이: H145K/R, I204K, E222K, T334F/Y/K 및/또는 L372N 중 적어도 하나를 추가로 포함하는, 유전적으로 변형된 인간 GCase.
제 1 항 또는 제 2 항에 있어서,
돌연변이: N102D/E, L165Q, Q226T, L241I, S242P, K473W 및/또는 H495R 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
돌연변이: I130T, A168S 및/또는 D263N 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
돌연변이: R211N 및/또는 K303R 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
돌연변이: H60W, L103N/E/R, Q166A, H274R, N333D, N386D, R395K, I406T/A 및/또는 L420M/I 중 적어도 하나를 추가로 포함하는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
돌연변이: V78I, A95K, V191M, A322D, V343T, M361E, S364A, H374W, T410E, H451N 및/또는 L480I 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
돌연변이: H162K, S181A, T297S, M335F, K346H, S431A, S465D 및/또는 A476D 중 적어도 하나를 추가로 포함하는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
돌연변이: R47K, L51R, Q70H, L91I, G115E, A124G, D140N/G, S196T 및/또는 V437S 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
돌연변이: T36Q, S38A, Q143E, T183A, L185M, T272S, H274K, N275D, L286S, K293Q, E300R, K321E, V376T, K408R, Q440E, M4503Q 및/또는 I483V 중 적어도 하나를 추가로 포함하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
좌표 D127, F128, W179, N234, E235, Y244, F246, Q284, Y313, E340, S345, W381, N396의 아미노산은 변형되지 않으며, 여기서 좌표는 SEQ ID NO: 2에 해당하는, 유전자 변형된 인간 GCase.
제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
상기 아미노산 서열은 SEQ ID NO: 4, 6, 8, 10, 12, 14, 18, 20, 22 및 27로 이루어진 군에서 선택된 서열과 동일한, 유전자 변형 인간 GCase.
제 12 항에 있어서,
상기 아미노산 서열은 SEQ ID NO: 14로 기재된, 유전자 변형 인간 GCase.
제 12 항에 있어서,
상기 아미노산 서열은 SEQ ID NO: 22로 기재된, 유전자 변형 인간 GCase.
제 12 항에 있어서,
상기 아미노산 서열은 SEQ ID NO: 27로 기재된, 유전자 변형 인간 GCase.
제 1 항 내지 제 15 항 중 어느 한 항에 있어서,
유전적으로 변형된 인간 GCase는 적어도 약 0.2 x 10⁶ k_cat/K_m(M^-1min^-1)만큼 GlcCer의 가수분해를 촉매할 수 있는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 16 항 중 어느 한 항에 있어서,
유전적으로 변형된 인간 GCase는 동일한 조건 하에 야생형 폴리펩티드와 비교하여 5-20℃ 더 높은 온도 범위에서의 열적 안정성을 포함하는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 17 항 중 어느 한 항에 있어서,
유전적으로 변형된 인간 GCase는 동일한 배양 조건 하에 야생형 폴리펩티드와 비교하여 진핵 세포에서 적어도 2배 더 높은 세포내 발현 수준을 포함하는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 18 항 중 어느 한 항에 있어서,
유전적으로 변형된 인간 GCase는 동일한 배양 조건 하에 분비되지 않는 야생형 폴리펩티드와 비교하여 진핵 세포로부터 분비되는, 유전적으로 변형된 인간 GCase.
제 1 항 내지 제 19 항 중 어느 한 항의 유전적으로 변형된 인간 GCase를 코딩하는 핵산 서열을 포함하는, 단리된 폴리뉴클레오티드.
제 20 항에 있어서,
SEQ ID NO: 3, 5, 7, 9, 11, 13, 17, 19, 21, 23 또는 26 중 어느 하나에 기재된 핵산 서열을 포함하는, 단리된 폴리뉴클레오티드.
제 20 항 또는 제 21 항의 단리된 폴리뉴클레오티드, 및 세포에서 상기 핵산 서열의 발현을 지시하기 위한 시스-작용 조절 요소를 포함하는, 핵산 작제물.
제 22 항에 있어서,
시스-작용 조절 요소는 프로모터를 포함하는, 핵산 작제물.
제 20 항 또는 제 21 항의 폴리뉴클레오티드, 또는 제 22 항 또는 제 23 항의 작제물을 포함하는, 단리된 세포.
활성 성분으로 제 1 항 내지 제 19 항 중 어느 한 항의 유전적으로 변형된 인간 GCase, 제 20 항 또는 제 21 항의 단리된 폴리뉴클레오티드, 제 22 항 또는 제 23 항의 작제물, 또는 제 24 항의 세포, 및 약학적으로 허용되는 담체 또는 희석제를 포함하는 약학적 조성물.
대상체에 제 1 항 내지 제 19 항 중 어느 한 항의 유전적으로 변형된 인간 GCase, 제 20 항 또는 제 21 항의 단리된 폴리뉴클레오티드, 제 22 항 또는 제 23 항의 작제물, 또는 제 24 항의 세포의 치료적 유효량을 투여함으로써 대상체에 β-글루코세레브로시다아제 결핍과 관련된 질환을 치료하는 단계를 포함하는, 이를 필요로 하는 대상체에 β-글루코세레브로시다아제 결핍과 관련된 질환을 치료하는 방법.
치료를 필요로 하는 대상체에 β-글루코세레브로시다아제 결핍과 관련된 질환 치료 용도로, 제 1 항 내지 제 19 항 중 어느 한 항의 유전적으로 변형된 인간 GCase, 제 20 항 또는 제 21 항의 단리된 폴리뉴클레오티드, 제 22 항 또는 제 23 항의 작제물, 또는 제 24 항의 세포의 치료적 유효량.
β-글루코세레브로시다아제 결핍과 관련된 질병은 고셔병인, 제 26 항의 방법, 또는 제 27 항의 용도로, 유전적으로 변형된 인간 GCase, 단리된 폴리뉴클레오티드, 작제물 또는 세포의 치료적 유효량.
대상체가 인간인 제 26 항 또는 제 28 항의 방법, 또는 제 27 항 또는 제 28 항의 사용하기 위한 유전적으로 변형된 인간 GCase, 단리된 폴리뉴클레오티드, 작제물 또는 세포의 치료적 유효량.