KR20230169989A

KR20230169989A - 단백질 발현을 위한 시스템 및 방법

Info

Publication number: KR20230169989A
Application number: KR1020237035002A
Authority: KR
Inventors: 바바라 머틴스; 토마스 폴리아드; 임레 메거
Original assignee: 익셉젠 인크.
Priority date: 2021-03-12
Filing date: 2022-03-11
Publication date: 2023-12-18
Also published as: EP4305176A1; AU2022235284A1; JP2024510215A; BR112023018404A2; CN117321209A; US20240141373A1; WO2022192694A1; MX2023010658A; CA3211755A1; IL305817A

Abstract

본 개시내용은 대상체에서 인핸서 단백질의 동시 발현을 통한, 표적 단백질의 개선된 발현을 위한 방법 및 조성물을 제공한다. 표적 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드 및 인핸서 단백질의 벡터 시스템을 투여하는 단계를 포함하는, 대상체에서 표적 단백질을 발현시키는 방법이 제공되며, 여기서 폴리뉴클레오타이드는 작동가능하게 연결되고, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L: leader) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV: herpes simplex virus) ICP27 단백질 및 랍도바이러스 매트릭스(M: matrix) 단백질로 이루어진 군으로부터 선택된다.

Description

단백질 발현을 위한 시스템 및 방법

관련 출원의 교차 참조

본 출원은 2021년 3월 12일에 출원된 미국 임시 특허 출원 번호 제63/160,672호의 우선권을 주장하며, 이의 내용은 그 전문이 본원에 참조로서 포함된다.

서열목록의 참조에 의한 통합

이와 함께 전자적으로 제출된 텍스트 파일의 내용은 전체적으로 본원에 참조로서 포함된다: 서열목록의 컴퓨터 판독가능한 형식 카피 (파일명: EXCI_002WO_SeqList_ST25, 파일 크기 405 킬로바이트).

배양에서 성장한 진핵 세포에서 단백질의 재조합 발현은 과학 연구 및 의학에 응용된다. 재조합적으로 생산된 단백질(예를 들어, 항체, 효소, G-단백질 결합 수용체(GPCR: G-protein coupled receptor), 분비 단백질, 이온 채널, 바이러스 단백질 및 성장 인자)은 제약 산업에서 신약 개발(예를 들어, 소분자 발견)을 위해, 치료제(예를 들어, 항체 및 기타 생물학적 약물)로서 및 분석 방법의 중요한 자산으로 사용된다. 제약 산업에서의 용도 외에도, 재조합적으로 생산된 포유류 단백질은 식품 산업(예를 들어, 소위 청정 육류 생산)에서 점점 더 많이 사용되고 있다. 많은 재조합 단백질의 경우 기능적 형태로 재조합 단백질의 발현을 달성하는 것은 여전히 어려운 일이다.

효모, 식물, 동물 및 인간과 같은 살아있는 유기체에서의 이식유전자 발현은 과학 연구 및 의학에 응용된다. 현대 치료제 분야는 효소나 항체와 같은 생물학적 제제의 생산에 초점을 맞추고 있다. 현재, 이 분야의 많은 치료제는 표적 대상체의 외부에서 생산되어 나중에 주입된다. 이 과정에는 올바른 발현 시스템을 찾고 의약품을 안정적이고 높은 수율로 생산하는 것과 같은 자체적인 과제가 있다. 새로운 치료제의 또 다른 신흥 분야는 폴리뉴클레오타이드를 투여하고 신체 자체 세포를 사용하여 최종 의약품을 생산함으로써 생체 시스템 내에서 유전자를 발현하는 것이다. 체내에서 생물학적 제제를 생산하는 데 따른 장점은 예를 들어, 고유한 번역 후 수정을 포함하여 많은 장점을 갖는다. 또한, 폴리뉴클레오타이드를 치료제로 사용함으로써 생물학적 제제의 생산 및 정제에 있어 많은 단점이 제거되어 저렴하고 확장 가능하며 안전하고 안정적인 의약품을 남길 수 있다. 이러한 형태의 약물 전달은 1990년대 초부터 연구되어 왔지만 치료적 성공은 거의 없었다. 살아있는 동물이나 인간 내에서의 이러한 약물의 생산 실패에 대한 많은 가설이 있지만 아직 해결책은 없다.

동물 또는 인간의 생체 내에서 재조합 단백질 및 생물학적 제제의 생산에 유용한 조성물 및 방법에 대한 미충족 요구가 여전히 존재한다.

도면의 간단한 설명

도 1은 진핵 세포에서 유전자 발현을 조절하는 6가지 예시적인 방식을 도시한다.

도 2a 내지 도 2x는 비제한적인 예시적인 작제물의 개략도이다: EG1, 도 2a; EG2, 도 2b; EG3 및 EG4, 도 2c; EG5, 도 2d; EG6, 도 2e; EG7, 도 2f; EG8, 도 2g; EG9, 도 2h; EG10 및 EG11, 도 2i; EG12 및 EG4, 도 2j; EG10, 도 2k; EG13, 도 2l; EG14, 도 2m; EG15, 도 2n; EG16, 도 2o; EG17, 도 2p; EG18, 도 2q; EG19, 도 2r; EG20, 도 2s; EG21, 도 2t; EG22, 도 2u; EG23, 도 2v; EG24, 도 2w; 및 EG25, 도 2x.

도 3a 내지 도 3d는 대조군 벡터 EG1과 비교하여 작제물 EG2(CMV-GFP-IRES-L)를 사용하여 발현된 GFP의 광학 및 형광 현미경 사진을 보여준다. 도 3a: EG1을 포함하는 세포의 광학 현미경 사진. 도 3b: EG1을 포함하는 세포의 형광 현미경 사진. 도 3c: EG2를 포함하는 세포의 광학 현미경 사진. 도 3d: EG2를 포함하는 세포의 형광 현미경 사진. EG2 작제물로부터 형광 GFP 단백질의 발현은 시스템의 생존 가능성을 나타낸다. EG1을 포함하는 세포(도 3b)와 비교하여 EG2를 포함하는 세포(도 3d)에서 유해한 과발현의 감소는 L-단백질의 도입에 의한 GFP 발현의 개선된 조절을 나타낸다. 도 3a 내지 도 3d에서 막대는 400 미크론을 나타낸다.

도 4a 내지 도 4d는 대조군 벡터 EG1과 비교하여 작제물 EG3 및 EG4(각각 T7-IRES-L-GFP 및 CMV-T7)를 사용하여 발현된 GFP의 광학 및 형광 현미경 사진을 보여준다. 도 4a: EG1을 포함하는 세포의 광학 현미경 사진. 도 4b: EG1을 포함하는 세포의 형광 현미경 사진. 도 4c: EG3+EG4를 포함하는 세포의 광학 현미경 사진. 도 4d: EG3+EG4를 포함하는 세포의 형광 현미경 사진. EG3+EG4 작제물로부터 형광 GFP 단백질의 발현은 시스템의 생존 가능성을 보여준다. EG1을 포함하는 세포(도 4b)와 비교하여 EG3+EG4를 포함하는 세포(도 4d)에서 발현의 감소는 L-단백질의 도입에 의한 GFP 발현의 개선된 조절을 보여준다. 도 4a 내지 도 4d에서 막대는 400미크론을 나타낸다.

도 5a 내지 도 5d는 작제물 EG10(CMV-[DRD1-GFP])(도 5a) 또는 EG8(CMV-[DRD1-GFP]-IRES-L)(도 5c)로부터의 DRD1-GFP 융합체의 형광 현미경을 보여준다. 작제물 EG10을 사용하는 DRD1-GFP는 발현되지만 수용체를 외막으로 수송하지 못하여 봉입체를 형성하게 된다(도 5b, 화살표). 작제물 EG8을 사용하는 DRD1-GFP는 발현되고 막 내로 안정적으로 수송되어 고품질의 외막에서 GPCR이 높은 수율로 생성된다(도 5d).

도 6a 및 도 6b는 작제물 EG10(CMV-[DRD1-GFP])(도 6a) 또는 EG12 및 EG4(각각 T7-IRES-L-DRD1-GFP 및 CMV-T7)(도 6b)로부터의 DRD1-GFP 융합체의 형광 현미경을 보여준다. EG10을 사용하는 DRD1-GFP는 발현되지만 수용체를 외막으로 수송하지 못하여 봉입체를 형성하게 된다(도 6a, 화살표). EG4와 조합된 EG12를 사용하는 DRD1-GFP는 발현되고 막 내로 안정적으로 수송되어 고품질의 외막에서 GPCR이 높은 수율로 생성된다(도 6b).

도 7은 항-CFTR 웨스턴 블롯을 보여준다. PCR 생성물 또는 벡터(점선 좌측)로서 전달된 L-단백질과 CFTR의 동시 발현은 수율을 감소시키지만 L-단백질의 동시 발현이 없는 CFTR의 대조군 발현과 비교하여 샘플이 더 균질하다(점선 우측).

도 8a 및 도 8b는 ITK의 His-tag 정제 결과를 보여준다. 도 8a는 His 태그를 사용하여 정제된 ITK 친화성의 SDS-PAGE를 보여준다. 레인: 레인 1, SeeBlue2 + 사전 염색; 레인 2, 500 ng GFP; 레인 3, 2 μg ITK; 레인 4, 5 μg ITK; 레인 5, 10 μg ITK. 도 8b는 도 8a의 SDS-PAGE 후 웨스턴 블롯 분석을 보여주는데, 화살표는 ITK의 단량체 및 이량체를 가리킨다.

도 9a는 CMV 프로모터 하의 루시퍼라제 유전자 작제물의 개략도를 보여준다. 도 9b는 도 9a에 도시된 작제물을 갖는 플라스미드의 맵(map)을 보여준다. 도 9c는 공유 CMV 프로모터 하에서 IRES 서열에 의해 연결된 루시퍼라제 리포터 유전자 및 EMCV L1 단백질의 개략도를 보여준다. 도 9d는 도 9c에 도시된 작제물을 갖는 플라스미드의 맵을 보여준다.

도 10은 생물발광 판독에 의해 측정된 루시퍼라제 발현을 보여준다. 도 9b에서 플라스미드의 사용은 처음에는 더 높은 루시퍼라제 발현을 나타내지만, 18일 이후에는 발현이 감소한다. 본원에 개시된 플라스미드(도 9d)의 사용은 장기간에 걸쳐 리포터 유전자의 안정적인 발현을 가능하게 한다.

도 11은 시간에 따른 생물발광 이미지를 보여준다. 주: 실험 중 시험군에서 동물 4의 주사가 수행되지 않았으므로 이 동물은 데이터 분석에서 제외되었다. 도 9b에서 플라스미드의 사용은 18일 이후에는 2마리의 개별 동물(동물 1 및 2)에서 발현의 손실을 포함하여 루시퍼라제를 매우 가변적으로 발현하게 된다. 본원에 개시된 플라스미드(도 9d)의 사용은 동물 간 변동성이 낮으면서 장기간에 걸쳐 리포터 유전자의 안정적인 발현을 가능하게 한다.

도 12는 루시퍼라제만을 발현하는 대표적인 마우스 및 인핸서 단백질의 존재 하에 루시퍼라제를 발현하는 대표적인 마우스에 대한 시간 경과에 따른 생물발광 이미지를 보여준다. 본원에 개시된 플라스미드(도 9d)의 사용은 장기간에 걸쳐 리포터 유전자의 안정적인 발현을 가능하게 한다.

도 13a는 CMV 프로모터 하에 아달리무맙 항체를 인코딩하는 핵산 서열을 갖는 플라스미드의 맵을 보여준다. 도 13b는 아달리무맙 항체를 인코딩하는 핵산 서열 및 공유된 CMV 프로모터 하에 IRES를 인코딩하는 핵산 서열에 의해 연결된 EMCV L1 단백질을 인코딩하는 유전자를 갖는 플라스미드의 맵을 보여준다.

도 14a는 EG140 대조군 플라스미드로부터 아달리무맙을 발현하는 HEK293T 세포의 광학 현미경 사진으로부터의 이미지(상단) 및 면역형광 실험으로부터의 이미지(하단)를 보여준다. 도 14b는 EG141 플라스미드로부터 L1 인핸서 단백질과 조합하여 아달리무맙을 발현하는 HEK293T 세포의 광학 현미경(상단)으로부터의 이미지 및 면역형광 실험으로부터의 이미지를 보여준다.

도 15는 EG140 또는 EG141로 일시적으로 형질감염된 HEK293T 세포의 상청액에서 아달리무맙의 존재를 검출하기 위해 수행된 ELISA 실험으로부터의 결과를 보여준다. 정제된 재조합 인간 항-TNFa 항체(NBP2-62567 Novus Biologicals)를 이 실험에서 양성 대조군으로 사용하였다.

도 16은 EG140 또는 EG141로 일시적으로 형질감염된 HEK293T 세포에 의해 분비된 아달리무맙에 대한 인간 TNF-알파의 결합을 검출하기 위해 수행된 ELISA 실험으로부터의 결과를 보여준다.

도 17은 루시퍼라제 리포터 검정으로부터의 결과를 보여준다. EG140 또는 EG141로 일시적으로 형질감염된 HEK293T 세포의 상층액에 있는 아달리무맙은 리포터 세포에서 루시퍼라제 발현의 TNF-알파 매개 활성화를 억제할 수 있다.

도 18a는 SDS PAGE로부터의 결과를 보여주며 도 18b는 EG140-형질감염된 세포 또는 EG-141 형질감염된 세포로부터 발현된 아달리무맙의 중쇄 및 경쇄를 도시하는 웨스턴 블롯 실험으로부터의 결과를 보여준다.

도 19는 반딧불이 루시퍼라제 단독(Fluc Std) 및 L 인핸서 단백질과 조합된 Fluc(Fluc EG)을 발현하는 플라스미드의 30 μg 피하 주사 후 생물발광 영상화의 로그 정량화를 보여준다.

도 20은 pAAVtransfer_Adalimumab(Std) 플라스미드 및 인핸서 단백질 플라스미드 pAAVtransfer_Adalimumab + L의 개략적 설계를 보여주며, 이는 5' 및 3' 역 말단 반복(ITR: inverted terminal repeat) 영역에 대한 아달리무맙 발현 카세트 및 인핸서 단백질 L의 위치를 나타낸다.

도 21은 pAAVtransfer_Adalimumab(Std) 플라스미드의 맵을 보여준다. 아달리무맙 발현 카세트는 AAV 전달 벡터의 5' 및 3' 역 말단 반복(ITR) 영역 사이에 위치된다.

도 22는 인핸서 단백질(EMCVgp1) pAAVtransfer_Adalimumab(EG) 플라스미드의 맵을 보여준다. 아달리무맙 발현 카세트는 AAV 전달 벡터의 5' 및 3' 역 말단 반복(ITR) 영역 사이에 위치된다.

도 23은 pAdalimumab, pAdalimumab + 인핸서 L, pAAVtransfer 아달리무맙 및 pAAVtransfer 아달리무맙 + 인핸서 L 플라스미드로 형질감염된 HEK293T 세포의 세포 배양 상층액 중 아달리무맙의 단백질 농도(ng/ml)를 보여준다. 세포 배양 상층액 중 아달리무맙 단백질 농도는 정량적 ELISA를 사용하여 측정되었다.

도 24는 HEK 이중 TNF-알파 리포터 세포 검정으로 측정된 분비된 아달리무맙 단백질 EC₅₀ 값을 보여준다. 상단, pAdalimumab_STD 플라스미드 및 인핸서 단백질 pAdalimumab_EG 플라스미드로 형질감염된 세포에서의 아달리무맙 EC₅₀. 하단, pAAVtransfer Adalimumab_STD 및 인핸서 L 단백질 pAAVtransfer Adalimumab_EG 플라스미드로 형질감염된 세포에서의 아달리무맙 EC₅₀. 표 4 및 표 5에는 이러한 결과가 요약되어 있다.

도 25는 분비된 아달리무맙 농도의 양과 인핸서 단백질 L이 결여된 각각의 대조군 벡터의 활성으로 정규화된 상대적인 아달리무맙 활성을 보여준다.

도 26a 및 도 26b는 아달리무맙 단독, AAV_Adalimumab_STD를 인코딩하는 재조합 AAV 벡터 및 인핸서 단백질 L, AAV_Adalimumab_EG로 마우스를 처리한 후 마우스 혈청 중 아달리무맙의 농도를 보여준다. 도 26a는 근육내 주사를 통해 투여된 AAV 벡터의 결과를 보여준다. 도 26b는 피하 주사를 통해 투여된 AAV 벡터의 결과를 보여준다.

도 27은 pGBA-NanoLuc_STD 및 인핸서 단백질 pGBA-NanoLuc_EG 플라스미드의 개략적 설계를 보여준다.

도 28a 및 도 28b는 각각 pGBA-NanoLuc_STD 플라스미드 및 인핸서 단백질(EMCVgp1) pGBA-NanoLuc_EG 플라스미드의 맵을 보여준다.

도 29는 HEK 293T 세포에서 발현된 pGBA-NanoLuc_STD 및 pGBA-NanoLuc_EG 작제물의 웨스턴 블롯 결과를 보여준다. pGBA-NanoLuc 단백질 키메라의 예상 크기는 대략 75 kDa이다.

도 30a 내지 도 30d는 pGBA-NanoLuc_STD 플라스미드 및 인핸서 단백질 pGBA-NanoLuc_EG 플라스미드로 형질감염 시 HEK293T 세포 용해물(각각 도 30a 및 도 30c) 및 상청액(각각 도 30b 및 도 30d)에서 리포터 단백질의 발현 및 GBA의 효소 활성을 보여준다. NanoLuc와 GBA 활성 둘 다의 총 발현은 인핸서 단백질 L의 부재 시 더 높다.

도 31은 NanoLuc 활성에 대해 정규화된 GBA-NanoLuc 키메라 단백질에서의 상대적인 GBA 활성을 보여준다. HEK293T 세포 용해물 및 상청액에서의 활성은 pGBA-NanoLuc_STD 플라스미드 및 인핸서 단백질 pGBA-NanoLuc_EG 플라스미드로 형질감염 시에 나타난다. 세포 배양 상층액에서 상대적인 GBA 활성은 인핸서 단백질 동시 발현으로 유의미하게 더 높으며, 이는 인핸서 단백질이 발현된 GBA 단백질의 품질을 증가시킨다는 것을 나타낸다.

도 32a 내지 도 32c는 지질 나노입자(LNP)로 제형화된 pGBA-NanoLuc_STD 플라스미드 및 인핸서 단백질 GBA-NanoLuc_EG 플라스미드로 처리된 Balb/c 마우스의 생물발광 영상화 결과를 보여준다. 도 32a 및 도 32b에서, 이미지는 각각 복위 자세와 앙와위 자세에서 촬영되었다. 도 32c 및 표 6은 루시퍼라제 활성의 평균 변동 계수(CV%)가 L 인핸서 단백질의 동시 발현 없이 더 높았다는 것을 나타낸다.

발명의 내용

본 발명자들은 특정 인핸서 단백질과 표적 단백질의 동시 발현이 재조합적으로 생성된 단백질의 발현 품질 및/또는 양을 개선하고/하거나 발현 기간을 연장시키며, 시험관 내, 생체 외 및 생체 내에서 관심 대상 유전자의 발현을 연장시킨다는 것을 인식하였다. 다양한 실시형태에서, 개시된 조성물 및 방법은 종래 기술에 비해 하기 장점 중 하나 이상을 나타낸다: (1) 진핵 세포주 또는 살아있는 대상체 내에서 표적 단백질의 단백질 발현(수율)을 증가시킨다; (2) 표적 단백질의 발현의 조절을 제어한다; (3) 감소된 바람직하지 않은 특성(예를 들어, 접힘 오류, 변경된 활성, 부정확한 번역 후 수정 및/또는 독성)을 보이는 표적 단백질을 발현한다; (4) 정확한 접힘 및/또는 재조합 단백질의 높은 수율을 증가시킨다; (5) 하류 활성화 경로의 성능을 향상시킨다(예를 들어, 세포에서의 GPCR 신호전달, 또는 생체 내 발현의 경우 발현된 항원에 대한 면역 시스템 반응); 및/또는 (6) 인핸서 단백질의 동시 발현은 표적 단백질의 기능성 및/또는 세포의 하류 대사에 영향을 미치지 않는다. 일부 실시형태는 이러한 장점을 전혀 나타내지 않거나, 일부 또는 전부를 나타내지 않는 바와 같이, 본 발명은 이러한 열거된 장점에 의해 제한되지 않는다.

한 양태에서, 본 개시내용은 진핵 세포에서 표적 단백질의 재조합 발현을 위한 시스템, 및 하나 이상의 벡터를 포함하는 생체 내 표적 단백질의 발현 방법을 제공한다. 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 갖는다. 인핸서 단백질은 핵세포질 수송(NCT: nucleocytoplasmic transport)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L: leader) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV: herpes simplex virus) ICP27 단백질, 및 랍도바이러스 매트릭스(M: matrix) 단백질로 이루어진 군으로부터 선택된다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

다른 양태에서, 본 개시내용은 표적 단백질의 발현을 위한 진핵 세포로서, 세포는 인핸서 단백질을 인코딩하는 외인성 폴리뉴클레오타이드를 포함하는, 진핵 세포를 제공한다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다. 외인성 폴리뉴클레오타이드는 프로모터(선택적으로 천연 프로모터 또는 외인성 프로모터)에 작동가능하게 연결된다. 또 다른 양태에서, 본 개시내용은 프로모터에 작동가능하게 연결된 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 이 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템을 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템(또는 벡터)을 진핵 세포 내로 도입함으로써 생성된 세포를 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템(또는 벡터)을 진핵 세포 내로 도입함으로써 발현된 단백질을 제공한다. 또 다른 양태에서, 본 개시내용은 표적 단백질을 인코딩하는 폴리뉴클레오타이드(프로모터에 작동가능하게 연결된 폴리뉴클레오타이드)를 진핵 세포 내로 도입하는 단계를 포함하는, 진핵 세포에서 표적 단백질을 발현시키는 방법을 제공한다. 이 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 활용한다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다.

다른 양태에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질로 대상체를 면역화시키는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 표지된 세포 또는 표지된 표적 단백질, 및 재조합 세포의 집단을 포함하는 용액으로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는, 용액을 제공하는 단계; 및 표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 검출함으로써 용액으로부터 하나 이상의 재조합 세포를 분류하는 단계를 포함하는, 세포 분류에 의한 항체 발견 방법을 제공한다. 추가 양태에서, 본 개시내용은 파지-디스플레이 라이브러리를 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질과 혼합하는 단계; 및 세포 또는 표적 단백질에 결합하는 파지-디스플레이 라이브러리의 구성원을 정제 및/또는 농축시키는 단계를 포함하는, 파지-디스플레이 라이브러리를 패닝(panning)하는 방법을 제공한다.

추가 양태 및 실시형태는 하기의 상세한 개시에 의해 제공된다. 본 발명은 이러한 요약에 의해 제한되지 않는다.

일부 실시형태에서, 하나 이상의 벡터를 포함하는 표적 단백질의 재조합 발현을 위한 시스템이 제공된다. 일부 실시형태에서, 발현은 진핵 세포에서 이루어진다. 일부 실시형태에서, 발현은 제자리(in situ), 생체 내 또는 생체 외에서 이루어진다. 일부 실시형태에서, 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 갖는다. 인핸서 단백질은 핵세포질 수송(NCT: nucleocytoplasmic transport)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L: leader) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M: matrix) 단백질로 이루어진 군으로부터 선택된다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

이론에 구애됨이 없이, 본 개시내용의 조성물 및 방법은 세포의 조절 메커니즘이 재조합 표적 단백질의 발현에 반응하여 활성화하는 것을 방지하고, 이것이 표적 단백질의 수율 및/또는 기능성을 향상시키는 것으로 여겨진다. 본 개시내용의 방법 및 시스템은 (1) 전사 개시의 억제, (2) 전사 종결 및 폴리아데닐화의 억제; (3) mRNA 프로세싱 및 스플라이싱의 억제, (4) mRNA 외수송(export)의 억제; (5) 번역 개시의 억제; 및 (6) 스트레스 반응을 포함하지만, 이에 제한되지 않는, 하나 이상의 세포 메커니즘을 억제하거나 방해할 수 있다(도 1).

다양한 실시형태에서, 본 개시내용의 조성물 및 방법은 인핸서 단백질, 예를 들어, L 단백질의 동시 발현을 통해 표적 단백질 발현을 개선할 수 있다. 본 개시내용의 조성물 및 방법과 연관된 개선된 표적 단백질 발현은 예를 들어 표적 단백질의 활성을 증가시키고, 발현 수준을 낮추고, 발현 기간을 증가시키고, 안정성을 증가시키고, 세포 또는 대상체에서 지속 기간을 증가시키고, 전달의 균일성을 증가시고, 분해를 감소시키고/시키거나 EC₅₀을 감소시킬 수 있다.

다양한 실시형태가 도 2a 내지 도 2y 및 표 1에 도시되어 있다. 일부 실시형태에서, 제1 벡터는 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하고, 제2 벡터는 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드를 포함한다. 다른 실시형태에서, 단일 벡터는 표적 단백질 및 인핸서 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 벡터는 표적 단백질과 인핸서 단백질 둘 다를 인코딩하는 단일 폴리뉴클레오타이드를 포함할 수 있다. 대안적으로, 하나 초과의 인핸서 단백질 및/또는 하나 초과의 표적 단백질이 벡터 또는 벡터들에 의해 인코딩된다.

정의

본원 및 첨부된 청구범위에서 사용되는, 단수 형태("a", "an" 및 "the")는 문맥 상 명백하게 다르게 지시되지 않는 한 복수의 참조를 포함한다. 따라서, 예를 들어, "단백질"에 대한 언급은 하나의 단백질 또는 그러한 단백질의 혼합물을 지칭할 수 있고, "방법"에 대한 언급은 당업자에게 알려진 동등한 단계 및/또는 방법, 등에 대한 언급을 포함한다.

본원에 사용되는, 용어 "약" 또는 "대략"은 수치 앞에 올 때 10% 범위의 플러스 또는 마이너스 값을 나타낸다. 예를 들어, "약 100"은 90과 110을 포함한다.

또한 본원에 사용되는, "및/또는"은 대안("또는")으로 해석될 때 조합의 부재뿐만 아니라, 연관된 나열 항목 중 하나 이상의 임의의 및 모든 가능한 조합을 지칭하고 포함한다.

본원에 사용되는, 뉴클레오타이드 서열은 달리 명시되지 않는 한 5'에서 3' 방향으로 나열되고, 아미노산 서열은 N-말단에서 C-말단 방향으로 나열된다.

용어 "핵산 서열", "핵산", "뉴클레오타이드", "뉴클레오타이드 서열" 및 "올리고뉴클레오타이드"는 상호교환적으로 사용된다. 이는 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드, 또는 이의 유사체 중 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭한다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있으며 알려지거나 알려지지 않은 임의의 기능을 수행할 수 있다. 하기는 폴리뉴클레오타이드의 비제한적인 예이다: 유전자 또는 유전자 단편의 인코딩 또는 비인코딩 영역, 연관 분석으로 정의된 유전자좌(좌위), 엑손, 인트론, 전령 RNA(mRNA), 전달 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의 서열의 단리된 DNA, 임의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머. 폴리뉴클레오타이드는 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 하나 이상의 수정된 뉴클레오타이드를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 수정은 중합체의 조립 전 또는 후에 부여될 수 있다. 뉴클레오타이드의 서열은 비(non)-뉴클레오타이드 성분에 의해 중단될 수 있다. 폴리뉴클레오타이드는 표지 성분과의 접합 등에 의해 중합 후에 추가로 수정될 수 있다.

"조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES: internal ribosomal entry site) 및 다른 발현 제어 요소(예를 들어, 폴리아데닐화 신호 및 폴리-U 서열과 같은 전사 종결 신호)를 포함한다. 조절 요소는 다양한 유형의 숙주 세포에서 뉴클레오타이드 서열의 구성적 발현을 지시하는 요소 및 특정 숙주 세포에서만 뉴클레오타이드 서열의 발현을 지시하는 요소(예를 들어, 조직 특이적 조절 서열)를 포함한다. 조직 특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특이적인 기관(예를 들어, 간, 췌장) 또는 특정 세포 유형(예를 들어, 림프구)과 같은 관심 대상의 원하는 조직에서 주로 발현을 지시할 수 있다. 조절 요소는 또한 세포 주기 의존적 또는 발달 단계 의존적 방식과 같은 시간 의존적 방식으로 발현을 지시할 수 있으며, 이는 또한 조직 또는 세포 유형에 특이적일 수도 있고 그렇지 않을 수도 있다. 일부 실시형태에서, 조절 요소는 pol I 프로모터, pol II 프로모터, pol III 프로모터 중 하나, 또는 이들의 조합일 수 있다. pol III 프로모터의 예는 U6 및 H1 프로모터를 포함하지만 이에 제한되지 않는다. pol II 프로모터의 예는 레트로바이러스 라우스(Rous) 육종 바이러스(RSV: retroviral Rous sarcoma virus) LTR 프로모터(선택적으로 RSV 인핸서 포함), 거대세포바이러스(CMV: cytomegalovirus) 프로모터(선택적으로 CMV 인핸서 포함), SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK: phosphoglycerol kinase) 프로모터 및 EF1α 프로모터를 포함하지만, 이에 제한되지 않는다. 또한 용어 "조절 요소"에는 인핸서 요소, 예를 들어 WPRE; CMV 인핸서; HTLV-I의 LTR에 있는 R-U5' 세그먼트; SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열이 포함된다.

"벡터"는 유전 물질을 표적 세포로 전달하는 데 사용된다. 벡터는 단일 가닥, 이중 가닥 또는 부분적으로 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하고 자유 말단은 포함하지 않는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 둘 다를 포함하는 핵산 분자; 및 당업계에 알려진 다른 다양한 종류의 폴리뉴클레오타이드를 포함하지만, 이에 제한되지 않는다. 벡터의 한 유형은 표준 분자 클로닝 기법에 의한 것과 같이 추가 DNA 세그먼트가 삽입될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 또 다른 유형의 벡터는 바이러스 유래 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 아데노바이러스, 렌티바이러스 및 아데노 연관 바이러스)로 포장하기 위해 벡터에 존재하는 바이러스 벡터이다. 실시형태에서, 바이러스 벡터는 복제 불능일 수 있다. 바이러스 벡터는 또한 숙주 세포로의 형질감염을 위해 바이러스에 의해 운반되는 폴리뉴클레오타이드를 포함한다. 특정 벡터는 그것이 도입되는 숙주 세포에서 자동복제가 가능하다(예를 들어, 박테리아 복제 원점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들어, 비(non)-에피솜 포유동물 벡터)는 숙주 세포 내로 도입 시 숙주 세포의 게놈에 통합되어 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 작동가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"로 지칭된다. 재조합 DNA 기법에 유용한 일반적인 발현 벡터는 종종 플라스미드의 형태이다.

용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 임의의 길이의 아미노산의 중합체를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 중합체는 선형 또는 분지형일 수 있고, 개질된 아미노산을 포함할 수 있으며, 비(non)-아미노산에 의해 중단될 수 있다. 이 용어는 또한; 예를 들어, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 개질된 아미노산 중합체를 포함한다. 본원에 사용되는, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 둘다, 및 아미노산 유사체 및 펩타이드 모방체를 포함하는 천연 및/또는 비천연 또는 합성 아미노산이 포함한다.

본원에 사용되는, 용어 "대상체"는 인간 및 다른 동물을 포함한다. 통상적으로, 대상체는 인간이다. 예를 들어, 대상체는 성인, 청소년, 아동(2세 내지 14세), 유아(1개월 내지 24개월), 또는 신생아(최대 1개월)일 수 있다. 일부 실시형태에서, 성인은 약 65세 이상, 또는 약 60세 이상의 노인이다. 일부 실시형태에서, 대상체는 임신한 여성 또는 임신을 계획하는 여성이다. 다른 실시형태에서, 대상체는 인간이 아니며; 예를 들어 인간이 아닌 영장류; 예를 들어 개코원숭이, 침팬지, 고릴라, 또는 마카크(macaque)이다. 다른 실시형태에서, 대상체는 개 또는 고양이와 같은 애완동물일 수 있다.

본원에 사용되는, "치료" 또는 "치료하는" 또는 "완화시키는" 또는 "개선하는"은 상호교환적으로 사용된다. 이들 용어는 치료적 이익 및/또는 예방적 이익을 포함하지만 이들로 제한되지 않는 유익한 또는 요망되는 결과를 수득하기 위한 접근법을 지칭한다. 치료적 이익은 치료 중인 하나 이상의 질병, 상태 또는 증상에 대한 치료학적으로 관련된 개선 또는 효과를 지칭한다. 예방적 이익을 위해, 조성물은 특정 질병, 상태 또는 증상이 발생할 위험이 있는 대상체, 또는 질병, 상태 또는 증상이 아직 나타나지 않았을 수 있더라도 질병의 하나 이상의 생리적 증상을 보고하는 대상체에게 조성물을 투여될 수 있다.

본원에 사용되는, "아달리무맙"은 HUMIRA™, MABURA™ 또는 EXEMPTIA™의 활성 약학 성분(API: active pharmaceutical ingredient), 또는 이의 기능적 변이체를 지칭한다. 따라서, 아달리무맙은 아달리무맙-adaz, 아달리무맙-adbm, 아달리무맙-afzb, 아달리무맙-atto, 아달리무맙-bwwd 또는 아달리무맙-fkjp를 지칭할 수 있다. 일부 실시형태에서, 아달리무맙은 그 전문이 본원에 참조로서 포함된 국제 공개 WO2011153477호에 따른 서열번호 137 내지 142의 CDR 중 임의의 것을 포함한다.

본원에 사용되는, 용어 "면역원", "항원" 및 "에피토프"는 면역 반응을 이끌어 낼 수 있는 당단백질을 포함한 단백질 및 펩타이드와 같은 물질을 지칭한다.

본원에 사용되는, 대상체에서의 "면역원성 반응"은 항원에 대한 체액성 및/또는 세포성 면역 반응의 대상체에서 발달하게 한다.

폴리뉴클레오타이드

본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 재조합 폴리뉴클레오타이드에 관한 것이다. 일부 실시형태에서, 발현은 진핵 세포에서 이루어진다. 일부 실시형태에서, 발현은 제자리, 생체 내 또는 생체 외에서 이루어진다. 일부 실시형태에서, 폴리뉴클레오타이드(또는 핵산 또는 핵산 분자)는 관심 대상의 하나 이상의 유전자를 포함할 수 있으며 본 개시내용의 조성물 및 방법을 사용하여 세포(예를 들어, 진핵 세포)에 전달된다. 본 개시내용의 폴리뉴클레오타이드는 DNA, RNA 및 DNA-RNA 하이브리드 분자를 포함할 수 있다. 일부 실시형태에서, 폴리뉴클레오타이드는 천연 공급원으로부터 단리되고; PCR 증폭, 시험관 내 전사 또는 화학적 합성과 같은 기법을 사용하여 시험관 내에서 제조되고; 예를 들어, 재조합 DNA 기술을 통해 생체 내에서 제조되고; 또는 임의의 적절한 방법으로 제조되거나 수득된다. 일부 실시형태에서, 폴리뉴클레오타이드는 임의의 모양(선형, 원형 등) 또는 토폴로지(topology)(단일 가닥, 이중 가닥, 선형, 원형, 슈퍼코일형, 비틀림, 흠집 등)를 갖는다. 폴리뉴클레오타이드는 또한 펩타이드 핵산(PNAS: peptide nucleic acid) 및 폴리펩타이드-핵산 접합체와 같은 핵산 유도체; 적어도 하나의 화학적으로 개질된 당 잔기, 백본, 뉴클레오타이드간 결합, 염기, 뉴클레오타이드, 뉴클레오사이드, 또는 뉴클레오타이드 유사체 또는 유도체, 또는 염기성 부위를 갖는 핵산; 뿐만 아니라 화학적으로 개질된 5' 또는 3' 말단을 갖는 핵산; 및 그러한 개질 중 2개 이상을 갖는 핵산을 포함할 수 있다. 폴리뉴클레오타이드에서 모든 연결이 동일할 필요는 없다.

폴리뉴클레오타이드의 예는 올리고뉴클레오타이드(RNA 간섭(RNAi)에 유용한 안티센스 올리고뉴클레오타이드, 리보자임 및 올리고뉴클레오타이드를 포함하지만 이에 제한되지 않음), 앱타머, 핵산, 인공 염색체, 클로닝 벡터 및 작제물, 발현 벡터 및 작제물, 유전자 치료 벡터 및 작제물, rRNA, tRNA, mRNA, mtRNA 및 tmRNA 등을 포함하지만, 이에 제한되지 않는다. 일부 실시형태에서, 폴리뉴클레오타이드는 시험관 내 전사(IVT: in vitro transcribed) mRNA이다. 일부 실시형태에서, 폴리뉴클레오타이드는 플라스미드이다.

폴리뉴클레오타이드는 상기 단백질의 아미노산 서열에 대응하는 아미노산 서열을 생성하기 위해 전사 및 번역(예를 들어, DNA→RNA→단백질) 또는 번역(RNA→단백질)될 수 있는 핵산 서열을 포함하는 경우 단백질을 "인코딩"한다고 말한다. 생체 내(예를 들어, 진핵 세포 내) 전사 및/또는 번역은 내인성 또는 외인성 효소에 의해 수행된다. 일부 실시형태에서, 본 개시내용의 폴리뉴클레오타이드의 전사는 진핵 세포의 내인성 중합효소 II(polII)에 의해 수행된다. 일부 실시형태에서, 외인성 RNA 중합효소는 동일하거나 상이한 벡터에 제공된다. 일부 실시형태에서, RNA 중합효소는 T3 RNA 중합효소, T5 RNA 중합효소, T7 RNA 중합효소 및 H8 RNA 중합효소로부터 선택된다.

본 개시내용에 따른 예시적인 폴리뉴클레오타이드는 표적 단백질을 인코딩하는 "제1 폴리뉴클레오타이드"; 인핸서 단백질을 인코딩하는 "제2 폴리뉴클레오타이드"; 및 하나 이상의 표적 단백질, 하나 이상의 인핸서 단백질 및/또는 하나 이상의 분리 요소를 인코딩하는 "코딩 폴리뉴클레오타이드"를 포함한다.

표적 단백질

본 개시내용에 따른 폴리뉴클레오타이드는 하나 이상의 표적 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 표적 단백질을 인코딩하는 핵산 서열을 관심 대상의 유전자("GOI: gene of interest")라고 지칭한다.

일부 실시형태에서, 단백질의 발현은 전통적인 발현 시스템에서 발현될 때 세포 독성을 유발할 수 있다. 일부 실시형태에서, 단백질은 전통적인 발현 시스템에서 발현 수율이 낮은 단백질이다. 일부 실시형태에서, 단백질의 발현 또는 품질은 전통적인 발현 시스템과 비교하여 개시된 방법에 따른 발현에 의해 유의미하게 개선된다. 일부 실시형태에서, 개시된 방법에 따른 표적 단백질의 발현은 전통적인 발현 시스템과 비교하여 숙주 세포에 대한 독성을 덜 유발한다. 일부 실시형태에서, 개시된 방법에 따른 표적 단백질의 발현은 숙주 세포에 독성을 유발하지 않는다.

표적 단백질은 제한되지 않으며, 발현을 원하는 임의의 단백질이 될 수 있다. 일부 실시형태에서, 표적 단백질은 바이러스 단백질이다. 일부 실시형태에서, 표적 단백질은 가용성 단백질, 분비 단백질(예를 들어 C-Inh 등) 또는 막 단백질이다. 표적 단백질은 임의의 단백질 또는 폴리펩타이드로부터 유래될 수 있다. 일부 실시형태에서, 표적 단백질은 하나 이상의 동물 단백질, 하나 이상의 인간 단백질, 하나 이상의 미생물 단백질, 하나 이상의 바이러스 단백질, 하나 이상의 진균 단백질 또는 이들의 조합으로부터 유래된다. 일부 실시형태에서, 표적 단백질은 대상체에서 면역원성 반응을 이끌어낼 수 있다. 일부 실시형태에서, 표적 단백질은 하나 이상의 항원을 갖는다.

일부 실시형태에서, 표적 단백질은 하나 이상의 단백질, 하나 이상의 단백질 도메인, 하나 이상의 이소형, 또는 키메라 단백질로 구성된다. 일부 실시형태에서, 단백질 도메인은 구조적 도메인, 기능적 도메인, 세포외 도메인, 또는 세포내 도메인이다. 일부 실시형태에서, 표적 단백질은 자연적으로 발생하는 대응물과 비교하여 변경된 활성 및/또는 변경된 순환 반감기를 갖는다. 예를 들어, 일부 실시형태에서, 표적 단백질은 단백질 A의 기능성 도메인과 단백질 B의 구조적 도메인으로 구성된 키메라 단백질이며, 여기서 키메라 단백질은 기능적 활성, 순환 반감기 및/또는 단백질 A 또는 단백질 B와 비교하여 우수한 다른 특성을 갖는다.

일부 실시형태에서, 표적 단백질은 항체; 항체 유사 분자; 수용체; 단일클론 항체; 항체 부분 또는 단편; 나노바디; 이중특이적 또는 다중특이적 항체; 또는 이중특이적 또는 다중특이적 항체 유사 분자이다. 일부 실시형태에서, 항체는 아달리무맙이다. 일부 실시형태에서, 항체는 압식시맙, 알렘투주맙, 알리로쿠맙, 아미반타맙, 아테졸리주맙, 아벨루맙, 바실릭시맙, 벨리무맙, 벤랄리주맙, 베바시주맙, 베즐로톡수맙, 블리나투모맙, 브렌툭시맙 베도틴, 브로달루맙, 브롤루시주맙, 부로수맙, 카나키누맙, 카플라시주맙, 카프로맙, 카투막소맙, 세미플리맙, 세르톨리주맙 페골, 세툭시맙, 크리잔리주맙, 다클리주맙, 다라투무맙, 데노수맙, 디누툭시맙, 두필루맙, 더발루맙, 에쿨리주맙, 엘로투주맙, 에마팔루맙, 에미시주맙, 엔포르투맙 베도틴, 엡티네주맙, 에레누맙, 에르투막소맙, 에타라시주맙, 에볼로쿠맙, 프레마네주맙, 갈카네주맙, 젬투주맙 오조가미신, 골리무맙, 구셀쿠맙, 이발리주맙, 이브리투모맙 티욱세탄, 이다루시주맙, 임시로맙, 인플릭시맙, 이노투주맙 오조가미신, 이필리무맙, 이사툭시맙, 이톨리주맙, 익세키주맙, 라나델루맙, 로키베트맙, 메폴리주맙, 모가물리주맙, 목세투모맙 파수도톡스, 나탈리주맙, 네시투무맙, 니모투주맙, 니볼루맙, 오빌톡사시맙, 오비누투주맙, 오크렐리주맙, 오파투무맙, 올라라투맙, 오말리주맙, 팔리비주맙, 파니투무맙, 펨브롤리주맙, 페르투주맙, 폴라투주맙 베도틴, 라코투모맙, 라무시루맙, 라니비주맙, 락시바쿠맙, 라불리주맙, 레슬리주맙, 리산키주맙, 리툭시맙, Rmab, 로모소주맙, 로벨리주맙, 루플리주맙, 사시투주맙 고비테칸, 사릴루맙, 세쿠키누맙, 실툭시맙, 탈케타맙, 테클리스타맙, 테프로투무맙, 틸드라키주맙, 토실리주맙, 토시투모맙, 트라스투주맙, 트라스투주맙 듀오카마진, 트라스투주맙 엠탄신, 우스테키누맙 및 베돌리주맙이다. 이러한 항체에 대한 폴리펩타이드 서열은 예를 들어 문헌[Raybould et al. (2020) Thera-SAbDab: the Therapeutic Structural Antibody Database. Nucleic Acids Res. 48(D1):gkz827]에 기재된 Thera-SAbDab 데이터베이스(opig.stats.ox.ac.uk에서)에서 공개적으로 이용가능하다.

일부 실시형태에서, 아달리무맙의 중쇄는 서열번호 132의 아미노산 서열을 갖는다. 일부 실시형태에서, 아달리무맙의 경쇄는 서열번호 133의 아미노산 서열을 갖는다. 일부 실시형태에서, 아달리무맙의 중쇄는 서열번호 134의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, 아달리무맙의 경쇄는 서열번호 135의 핵산 서열에 의해 인코딩된다.

일부 실시형태에서, 표적 단백질은 이중특이적 또는 다중특이적 항체; 또는 이중특이적 또는 다중특이적 항체 유사 분자이다. 일부 실시형태에서, 이중특이적 항체는 블리나투모맙 및 에미시주맙이다. 일부 실시형태에서, 표적 단백질은 예를 들어 블리나투모맙(MT103) 및 솔리토맙과 같은 이중특이적 T 세포 관여제(BiTE: bi-specific T-cell engager)이다. 일부 실시형태에서, 표적 단백질은 단백질 스캐폴드(예를 들어, 애드넥틴, 안티칼린, 아비머, 파이노머, 쿠니츠 도메인, 노틴(Knottin), 아피바디(Affibody) 또는 DARPin)에 기초한 결합 리간드 또는 결합제이다.

일부 실시형태에서, 표적 단백질은 혈액 단백질이다. 혈액 단백질의 비제한적인 예는 트랜스페린, t-PA, 히루딘, C1 에스테라제 억제제, 항트롬빈, 혈장 칼리크레인 억제제, 플라스민, 프로트롬빈 복합체, 보체 성분, 프리알부민(트랜스티레틴), 알파 1 항트립신, 알파-1-산 당단백질, 알파-1-태아단백질, 알파2-마크로글로불린, 감마 글로불린, 베타-2 마이크로글로불린, 합토글로빈, 세룰로플라스민, 보체 성분 3, 보체 성분 4, C-반응성 단백질(CRP: C-reactive protein), 지질단백질(킬로미크론, 초저밀도 지질단백질(VLDL: very low density lipoprotein), 저밀도 지질단백질(LDL: low density lipoprotein), 고밀도 지질단백질(HDL: high density lipoprotein)), 트랜스페린, 프로트롬빈, 만노스 결합 렉틴(MBL: mannose binding lectin), 알부민, 글로불린, 피브리노겐, 조절 인자 및 응고 인자, 예를 들어, 인자 I, 인자 II, 인자 III, 인자 IV, 인자 V, 인자 VI, 인자 VII, 인자 IX, 인자 X, 인자 XI, 인자 XII, 인자 XIII, 폰 빌레브란트 인자, 프리칼리크레인, 피츠제럴드 인자, 피브로넥틴, 항트롬빈 III, 헤파린 보조인자 II, 단백질 C, 단백질 S, 단백질 Z, 단백질 Z-관련 프로테아제 억제제, 플라스미노겐, 알파 2-항플라스민, 조직 플라스미노겐 활성화제, 유로키나제, 플라스미노겐 활성화제 억제제-1, 플라스미노겐 활성화제 억제제-2 및 암 응혈원을 포함한다. 일부 실시형태에서, 표적 단백질은 혈전용해제이다. 혈전용해제의 비제한적인 예는 에미나제(아니스트레플라제), 레타바제(레테플라제), 스트렙타제(스트렙토키나제, 카비키나제), 알테플라제, t-PA(악티바제를 포함하는 약물 종류), TNKase(테넥테플라제), 아보키나제 및 킨리틱(로키나제)을 포함한다.

일부 실시형태에서, 표적 단백질은 성장 인자이다. 성장 인자의 비제한적인 예는 에리스로포이에틴(EPO: erythropoietin), 인슐린 유사 성장 인자-1(IGF-1: insulin like growth factor-1), 과립구 집락 자극 인자(G-CSF: granulocyte colony-stimulating factor), 과립구-대식세포 집락 자극 인자(GM-GCF: granulocyte-macrophage colony-stimulating factor), 골 형태 형성 단백질-2(BMP-2: bone morphogenetic protein-2), 골 형태 형성 단백질-7(BMP-7), 각질세포 성장 인자(KGF: keratinocyte growth factor), 혈소판 유래 성장 인자(PDGF: platelet-derived growth factor), 아드레노메둘린(AM: adrenomedullin), 안지오포이에틴(Ang: angiopoietin), 자가분비 운동성 인자, 골 형태 형성 단백질(BMP), 섬모 신경영양 인자 패밀리(family), 섬모 신경 영양 인자(CNTF: ciliary neurotrophic factor), 백혈병 억제 인자(LIF: leukemia inhibitory factor), 인터류킨-6(IL-6), 집락 자극 인자, 대식세포 집락 자극 인자(M-CSF: macrophage colony-stimulating factor), 표피 성장 인자(EGF: epidermal growth factor), 에프린스 - 에프린 A1, 에프린 A2, 에프린 A3, 에프린 A4, 에프린 A5, 에프린 B1, 에프린 B2, 에프린 B3, 섬유아세포 성장 인자(FGF: fibroblast growth factor) 1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF 11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23의 각각, 소 태아 성장 호르몬(FBS: Foetal Bovine Somatotrophin), 리간드의 GDNF 패밀리, 신경교세포주 유래 신경영양인자(GDNF: glial cell line-derived neurotrophic factor), 뉴투린, 페르세핀, 아르테민, 성장 분화 인자-9(GDF9: growth differentiation factor-9), 간세포 성장 인자(HGF: hepatocyte growth factor), 간암 유래 성장 인자(HDGF: hepatoma-derived growth factor), 인슐린, 인슐린 유사 성장 인자, 인슐린 유사 성장 인자-1(IGF-1), 인슐린 유사 성장 인자-2(IGF-2), 인터류킨-1(IL-1: interleukin-1), IL-2, IL-3, IL-4, IL -5, IL-6, IL-7, 각질세포 성장 인자(KGF: keratinocyte growth factor), 이동 자극 인자(MSF), 간세포 성장 인자 유사 단백질(HGFLP: hepatocyte growth factor-like protein)로도 알려진 대식세포 자극 단백질(MSP), 미오스타틴(GDF-8), 뉴레귤린 1(NRG1) 뉴레귤린 2(NRG2), 뉴레귤린 3(NRG3), 뉴레귤린 4(NRG4), 뉴로트로핀, 뇌유래 신경영양 인자(BDNF: brain-derived neurotrophic factor), 신경 성장 인자(NGF: nerve growth factor), 뉴로트로핀-3(NT-3) 뉴로트로핀-4(NT-4), 태반성장인자(PGF: placental growth factor), 혈소판유래 성장 인자(PDGF), 레날라제(RNLS: renalase), T-세포 성장 인자(TCGF: T-cell growth factor), 트롬보포이에틴(TPO: thrombopoietin), 형질전환 성장 인자 알파(TGF-α: transforming growth factor alpha), 형질전환 성장 인자 베타(TGF-β: transforming growth factor beta), 혈관 내피 성장 인자(VEGF: vascular endothelial growth factor) 및 Wnt 신호전달 경로를 포함한다. 일부 실시형태에서, 표적 단백질은 호르몬이다. 호르몬의 비제한적인 예는 글루카곤 유사 펩타이드-1, 인슐린, 인간 성장 호르몬, 난포 자극 호르몬, 칼시토닌, 루트로핀, 글루카곤 유사 펩타이드-2, 렙틴, 부갑상선 호르몬, 융모성 생식선 자극 호르몬, 갑상선 자극 호르몬 및 글루카곤을 포함한다.

일부 실시형태에서, 표적 단백질은 효소이다. 효소의 비제한적인 예는 알파-글리코시다제, 글루코세레브로시다제, 이두로네이트-2-황산염, 알파-갈락토시다제, 요산염 산화효소, N-아세틸-갈락토시다제, 카르복시펩티다제, 히알루로니다제, DNA 분해효소, 아스파라기나제, 요산분해효소, 아데노신 데아미나제 및 다른 엔테로키나제, 사이클라제, 카스파제, 카텝신, 산화환원효소, 전이효소, 가수분해효소, 분해효소, 이성질화효소 및 연결효소를 포함한다. 본 조성물 및 방법의 사용을 통한 발현을 위한 표적 단백질은 효소 대체와 관련된 단백질, 예를 들어 아갈시다제 베타, 아갈시다제 알파, 이미글루세라제, 탈리굴세라제 알파, 벨라글루세라제 알파, 알글루세라제, 세벨리파제 알파, 라로니다제, 이두설파제, 엘로설파제 알파, 갈설파제, 알글루코시다제 알파, C3 억제제, 헐러 및 헌터 교정 인자를 포함한다. 일부 실시형태에서, 본 조성물 및 방법은 효소 생성에 사용된다. 이러한 효소는 임상 테스트 키트 또는 다른 진단 검정의 생성에 유용할 수 있다.

일부 실시형태에서, 표적 단백질은 막 단백질이다. 예시적인 막 단백질은 이온 채널, 간극 연접, 이온성 수용체, 수송체, 세포 표면 수용체와 같은 내재 막 단백질, 신호전달에 반응하여 막과 세포질 사이를 왕복하는 단백질 등을 포함한다. 일부 실시형태에서, 세포 표면 수용체는 G-단백질 결합 수용체(GPCR: G-protein coupled receptor), 티로신 키나제 수용체, 인테그린 등이다. 일부 실시형태에서, 세포 표면 수용체는 G-단백질 결합 수용체이다. 일부 실시형태에서, 표적 단백질은 7-(통과)-막횡단 도메인 수용체, 7-막횡단(7-TM: 7-transmembrane) 수용체, 헵타나선형 수용체, 뱀모양 수용체, 또는 G-단백질 연결 수용체(GPLR: G-protein linked receptor)이다. 일부 실시형태에서, 표적 단백질은 클래스(Class) A GPCR, 클래스 B GPCR, 클래스 C GPCR, 클래스 D GPCR, 클래스 E GPCR 또는 클래스 F GPCR이다. 일부 실시형태에서, 표적 단백질은 클래스 1 GPCR, 클래스 2 GPCR, 클래스 3 GPCR, 클래스 4 GPCR, 클래스 5 GPCR 또는 클래스 6 GPCR이다. 일부 실시형태에서, 표적 단백질은 로돕신-유사 GPCR, 세크레틴 수용체 패밀리 GPCR, 대사성 글루탐산염/페로몬 GPCR, 진균 교배 페로몬 수용체, 순환 AMP 수용체, 또는 프리즐드/스무든드(Frizzled/Smoothened) GPCR이다. 일부 실시형태에서, 세포 표면 수용체는 IL-1 수용체, IL-1Ra, 종양 괴사 인자 수용체(TNFR: tumor necrosis factor receptor), 또는 혈관 내피 성장 인자 수용체(VEGFR: vascular endothelial growth factor receptor)이다. 일부 실시형태에서, 표적 단백질은 수용체 모방체이다. 일부 실시형태에서, 표적 단백질은 Ras 단백질, Rac 단백질, Raf 단백질, Gα 서브유닛, 어레스틴, Src 단백질 및 다른 이펙터 단백질과 같은 신호전달에 반응하여 막과 세포질 사이를 왕복하는 단백질이다.

일부 실시형태에서, 표적 단백질은 뉴클레오시다제, NAD+ 뉴클레오시다제, 가수분해효소, 글리코실라제, N-글리코실 화합물을 가수분해하는 글리코실라제, NAD+ 글리코하이드롤라제, NADase, DPNase, DPN 가수분해효소, NAD 가수분해효소, 디포스포피리딘 뉴클레오시다제, 니코틴아미드 아데닌 디뉴클레오타이드 뉴클레오시다제, NAD 글리코하이드롤라제, NAD 뉴클레오시다제, 또는 니코틴아미드 아데닌 디뉴클레오타이드 글리코하이드롤라제이다. 일부 실시형태에서, 표적 단백질은 니코티네이트 및 니코틴아미드 대사 및 칼슘 신호전달 경로에 참여하는 효소이다.

일부 실시형태에서, 표적 단백질은 아바타셉트, 애플리버셉트, 아갈시다제 베타, 알비글루타이드, 알데스류킨, 알레파셉트, 알글루세라제, 알글루코시다제 알파, 알리스키렌, 알파-1-단백질분해효소 억제제, 알테플라제, 아나킨라, 안세스팀, 아니스트레플라제, 인간 탄저병 면역 글로불린, 항혈우병 인자, 항트롬빈 알파, 인간 항트롬빈 III, 항흉선 세포 글로불린, 항흉선 세포 글로불린(말), 항흉선 세포 글로불린(토끼), 아프로티닌, 아르시투모맙, 아스포타제 알파, 아스파라기나제, 아스파라기나제 에르위니아 크리산테미, 베카플러민, 벨라타셉트, 베락탄트, 비발리루딘, 보툴리눔 독소 A형, 보툴리눔 독소 B형, 부세렐린, C1 에스테라제 억제제(인간), C1 에스테라제 억제제, 융모성 생식선 자극 호르몬 알파, 융모성 생식선 자극 호르몬(인간), 융모성 생식선 자극 호르몬, 응고 인자 IX, 응고 인자 VIIa, 인간 응고 인자 X, 응고 인자 XIII A-서브유닛, 콜라게나제, 코네스타트 알파, 코르티코트로핀, 코신트로핀, 답토마이신, 다베포에틴 알파, 데피브로타이드, 데닐류킨 디프티톡스, 데시루딘, 도나제 알파, 드로트레코긴 알파, 둘라글루타이드, 에팔리주맙, 에프모록토코그 알파, 엘로설파제 알파, 엔푸버타이드, 에포에틴 알파, 에포에틴 제타, 엡티피바타이드, 에타너셉트, 엑세나타이드, 인자 IX 복합체(인간), 피브리노겐 농축물(인간), 피브린분해효소 일명 플라스민, 필그라스팀, 필그라스팀-sndz, 폴리트로핀 알파, 폴리트로핀 베타, 갈설파제, 위장 내인자, 글라티라머 아세테이트, 글루카곤 재조합체, 글루카르피다제, 그라미시딘 D, A형 간염 백신, B형 간염 면역 글로불린, 인간 칼시토닌, 인간 클로스트리듐 테타니 톡소이드 면역 글로불린, 인간 광견병 바이러스 면역 글로불린, 인간 Rho(D) 면역 글로불린, 인간 혈청 알부민, 인간 수두-대상포진 면역 글로불린, 히알루로니다제, 히알루로니다제, 이브리투모맙, 이두설파제, 이미글루세라제, 인간 면역 글로불린, 인플릭시맙, 인슐린 아스파르트, 인슐린 비프, 인슐린 데글루덱, 인슐린 디터머, 인슐린 글라진, 인슐린 글루리신, 인슐린 리스프로, 인슐린 포크, 인슐린 레귤러, 인슐린 레귤러, 인슐린, 돼지, 인슐린, 이소판, 인터페론 알파-2a, 재조합형, 인터페론 알파-2b, 인터페론 알파콘-1, 인터페론 알파-n1, 인터페론 알파-n9, 인터페론 베타-1a, 인터페론 베타-1b, 인터페론 감마-1b, 정맥 면역글로불린, 이필리무맙, 익세키주맙, 라로니다제, 레노그라스팀, 레피루딘, 류프롤라이드, 리라글루타이드, 루시낙탄트, 루트로핀 알파, 루트로핀 알파, 메카세르민, 메노트로핀, 에포에틴 베타, 메트레렙틴, 무로모납, 알파 인터페론, 네시리타이드, 오크리플라스민, 오말리주맙, 오프레베킨, OspA 지질단백질, 옥시토신, 팔리퍼민, 췌장리파제, 포락탄트 알파, 프람린타이드, 프레오탁트, 인간 단백질 S, 라스부리카제, 레테플라제, 릴로나셉트, 리툭시맙, 로미플로스팀, 사크로시다제, 연어 칼시토닌, 사르그라모스팀, 사투모맙 펜데타이드, 세벨리파제 알파, 세크레틴, 세쿠키누맙, 세르모렐린, 혈청 알부민, 요오드처리된 혈청 알부민, 시목토코그 알파, 시플루셀-T, 소마트로핀 재조합형, 소마트로핀 재조합형, 스트렙토키나제, 설로덱사이드, 서스옥토코그 알파, 탈리글루세라제 알파, 테두글루타이드, 테이코플라닌, 테넥테플라제, 테리파라타이드, 테사모렐린, 트롬보모둘린 알파, 티말파신, 갑상선글로불린, 갑상선 자극 호르몬 알파, 갑상선 자극 호르몬 알파, 토실리주맙, 토시투모맙, 투베르쿨린 정제 단백질 유도체, 투록토코그 알파, 요난포자극호르몬, 유로키나제, 바소프레신 및 벨라글루세라제 알파로 이루어진 군으로부터 선택된다.

일부 실시형태에서, 표적 단백질은 바이오시밀러(biosimilar)이다. 일부 실시형태에서, 표적 단백질은 생물학적 제제로도 알려진 생물약제; 진단, 예후 또는 예측 바이오마커와 같은 바이오마커 활성화 폴리펩타이드; 보조제, 가용성 항원, 하위 바이러스 입자, 바이러스 유사 입자와 같은 예방적 폴리펩타이드; 다른 분자의 활성 또는 결합을 지원하거나 다른 단백질-단백질 상호작용을 억제하는 폴리펩타이드와 같은 보조 폴리펩타이드; 동물에서 새로운 단일클론 및 다중클론 항체를 생성하기 위한 항원, 리포터 단백질 또는 생리학적 또는 병리학적 과정과 동물 모델에서 이러한 과정에 대한 약물의 효과를 연구하기 위한 도구 폴리펩타이드와 같은 연구에 사용되는 폴리펩타이드와 같은 치료용 폴리펩타이드이다. 일부 실시형태에서, 표적 단백질은 형광 단백질과 같이 현미경 및 영상화에 적용되는 단백질이다. 일부 실시형태에서, 표적 단백질은 예를 들어 루시퍼라제와 같은 리포터 단백질이 아니다. 일부 실시형태에서, 표적 단백질은 인간 단백질이다.

일부 실시형태에서, 표적 단백질은 면역조절제이다. 면역조절제의 비제한적인 예는 사이토카인, 케모카인, 인터류킨, 인터페론을 포함한다. 일부 실시형태에서, 표적 단백질은 백신으로 사용하거나 연구를 위한 항원이다. 일부 실시형태에서, 표적 단백질은 단백질 복합 조립체에서 기능하는 구조 단백질과 같은 구조 단백질이다. 일부 실시형태에서, 표적 단백질은 항미생물 폴리펩타이드; 또는 항바이러스 폴리펩타이드이다. 일부 실시형태에서, 표적 단백질은 종양 억제인자이다. 일부 실시형태에서, 표적 단백질은 전사 인자 또는 번역 인자이다. 일부 실시형태에서, 표적 단백질은 약동학 조절 단백질, 소분자 결합 단백질, RNA 결합 단백질, 또는 단백질 결합 단백질이다.

일부 실시형태에서, 표적 단백질은 도파민 수용체 1(DRD1: dopamine receptor 1), 낭포성 섬유증 막횡단 전도 조절자(CFTR: cystic fibrosis transmembrane conductance regulator), C1 에스테라제 억제제(C1-Inh: C1 esterase inhibitor), IL2 유도성 T 세포 키나제(ITK: inducible T cell kinase) 또는 NADase이다. 일부 실시형태에서, 표적 단백질은 반딧불이 루시퍼라제이다.

인핸서 단백질

본 개시내용은 표적 단백질 및 인핸서 단백질의 동시 발현에 관한 것이다. 일부 실시형태에서, 인핸서 단백질은 수율, 품질, 접힘, 번역 후 수정, 활성, 국소화 및 하류 활성을 포함하지만 이에 제한되지 않는 표적 단백질 발현의 하나 이상의 양태를 개선할 수 있거나, 접힘 오류, 변경된 활성, 부정확한 번역 후 수정 및/또는 독성 중 하나 이상을 감소시킬 수 있다.

일부 실시형태에서, 인핸서 단백질은 핵공 차단 바이러스 단백질이다. 일부 실시형태에서, 인핸서 단백질은 핵공을 차단하여 핵세포질 수송("NCT")을 억제할 수 있는 천연 또는 합성 펩타이드이다. 일부 실시형태에서, 인핸서 단백질은 바이러스 벡터이다. 일부 양태에서, 바이러스 단백질은 NCT 억제제이다.

일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다.

인핸서 단백질은 본원에 개시된 임의의 단백질의 기능적 변이체이다. 본원에 사용되는 용어 "기능적 변이체"는 원래의 단백질과 상동성이고/이거나 원래의 단백질과 실질적인 서열 유사성(예를 들어, 30% 초과, 40% 초과, 50% 초과, 60% 초과, 70% 초과, 80% 초과, 85% 초과, 90% 초과, 95% 초과 또는 99% 초과의 서열 동일성)을 공유하며 원래의 단백질의 하나 이상의 기능적 특성을 공유하는 단백질을 지칭한다. 예를 들어, NCT 억제제인 인핸서 단백질의 기능적 변이체는 NCT를 억제하는 능력을 유지한다.

일부 실시형태에서, 인핸서 단백질은 피코르나바이러스로부터의 리더(L) 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 카디오바이러스(cardiovirus), 헤파토바이러스(hepatovirus), 또는 아프토바이러스(aphthovirus) 속으로부터의 리더 단백질이다. 예를 들어, 인핸서 단백질은 소 비염 A 바이러스, 소 비염 B 바이러스, 말 비염 A 바이러스, 구제역 바이러스, 헤파토바이러스 A, 헤파토바이러스 B, 마르모타 히말라야나 헤파토바이러스, 포피바이러스, 카디오바이러스 A, 카디오바이러스 B, 타일러 쥐 뇌척수염 바이러스(TMEV: Theiler's Murine encephalomyelitis virus), 빌류스크 인간 뇌척수염 바이러스(VHEV: vilyuisk human encephalomyelitis virus), 타일러 유사 쥐 바이러스(TRV: Theiler-like rat virus) 또는 사폴드 바이러스(SAF-V: Saffold virus)로부터 유래할 수 있다.

일부 실시형태에서, 인핸서 단백질은 타일러 바이러스의 L 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, L 단백질은 서열번호 1과 적어도 90% 동일성을 공유한다. 일부 실시형태에서, 인핸서 단백질은 서열번호 1을 포함하거나, 서열번호 1로 구성되거나, 필수적으로 구성될 수 있다. 인핸서 단백질은 서열번호 1과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일성을 공유할 수 있다.

일부 실시형태에서, L 단백질은 뇌심근염 바이러스(EMCV: encephalomyocarditis virus)의 L 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, L 단백질은 서열번호 2와 적어도 90% 동일성을 공유할 수 있다. 일부 실시형태에서, 인핸서 단백질은 서열번호 2를 포함하거나, 서열번호 2로 구성되거나, 필수적으로 구성될 수 있다. 인핸서 단백질은 서열번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일성을 공유할 수 있다.

일부 실시형태에서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 이의 기능적 변이체로 이루어진 군으로부터 선택된다.

일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 2A 프로테아제 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 엔테로바이러스(enterovirus), 라이노바이러스, 아프토바이러스, 또는 카디오바이러스로부터의 2A 프로테아제이다.

일부 실시형태에서, 인핸서 단백질은 라이노바이러스 3C 프로테아제 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 피코르나인 3C 프로테아제이다. 일부 실시형태에서, 인핸서 단백질은 엔테로바이러스, 라이노바이러스, 아프토바이러스 또는 카디오바이러스로부터의 3C 프로테아제이다. 예를 들어, 일부 비제한적 실시형태에서, 인핸서 단백질은 폴리오바이러스, 콕사키바이러스(coxsackievirus), 라이노바이러스, 구제역 바이러스 또는 헤파토바이러스 A로부터의 3C 프로테아제이다.

일부 실시형태에서, 인핸서 단백질은 코로나바이러스 ORF6 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 핵 내수송(import) 복합체 형성을 방해하고/하거나 핵으로의 STAT1 수송을 방해하는 바이러스 단백질이다.

일부 실시형태에서, 인핸서 단백질은 에볼라바이러스 VP24 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 에볼라바이러스 VP40 단백질 또는 VP35 단백질이다. 일부 실시형태에서, 인핸서 단백질은 내수송 단백질 카리오페린-α(KPNA: karyopherin-α)에 결합하는 바이러스 단백질이다. 일부 실시형태에서, 인핸서 단백질은 STAT1과 KPNA의 결합을 억제하는 바이러스 단백질이다.

일부 실시형태에서, 인핸서 단백질은 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 핵공 복합체와 상호작용하는 바이러스 캡시드 단백질이다.

일부 실시형태에서, 인핸서 단백질은 헤르페스 바이러스(HSV) ICP27 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 HSV ORF57 단백질이다.

일부 실시형태에서, 인핸서 단백질은 랍도바이러스 매트릭스(M) 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, 인핸서 단백질은 사이토랍도바이러스(cytorhabdovirus), 디코르하바이러스(dichorhavirus), 에페머로바이러스(ephemerovirus), 리사바이러스(lyssavirus), 노비랍도바이러스(novirhabdovirus), 뉴클레오랍도바이러스(nucleorhabdovirus), 퍼랍도바이러스(perhabdovirus), 시그마바이러스(sigmavirus), 스프리비바이러스(sprivivirus), 티브로바이러스(tibrovirus), 투파바이러스(tupavirus), 바리코사바이러스(varicosavirus), 또는 베시쿨로바이러스(vesiculovirus)로부터의 M 단백질이다.

일부 실시형태에서, 인핸서 단백질은 표 1에 나열된 단백질 또는 이의 기능적 변이체로부터 선택된다. 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드는 표 1에 나열된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일한 아미노산 서열을 인코딩할 수 있다. 인핸서 단백질의 아미노산 서열은 표 1에 나열된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일할 수 있다. 인핸서 단백질의 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일할 수 있다. 일부 실시형태에서, 인핸서 단백질은 표 1에 나열된 아미노산 서열 중 하나를 포함하거나, 이로 구성되거나, 필수적으로 구성된 아미노산 서열을 가질 수 있다. 일부 실시형태에서, 인핸서 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 11의 아미노산 서열을 포함하거나, 이로 구성되거나, 필수적으로 구성된 아미노산 서열을 가질 수 있다.

[표 1]

융합 단백질

일부 실시형태에서, 표적 단백질 및 인핸서 단백질은 단일 융합 단백질에 포함된다. 일부 실시형태에서, 융합 단백질은 연결 요소를 포함할 수 있다. 일부 실시형태에서, 연결 요소는 효소적 절단을 위한 절단 부위를 포함할 수 있다. 다른 실시형태에서, 융합 단백질 또는 연결 요소는 절단 부위를 포함하지 않으며 발현된 융합 단백질은 표적 단백질과 인핸서 단백질 둘 다를 포함한다.

단백질 수정

표적 단백질, 인핸서 단백질 및/또는 융합 단백질, 또는 이를 인코딩하는 폴리뉴클레오타이드는 하나 이상의 마커, 표지 또는 태그를 포함하도록 수정될 수 있다. 예를 들어, 일부 실시형태에서, 본 개시내용의 단백질은 이의 검출을 허용하는 임의의 표지, 예를 들어 방사성 표지, 형광제, 비오틴, 펩타이드 태그, 효소 단편 등으로 표지될 수 있다. 단백질은 친화성 태그, 예를 들어, His-태그, GST-태그, Strep-태그, 비오틴-태그, 면역글로불린 결합 도메인, 예를 들어, IgG 결합 도메인, 칼모듈린 결합 펩타이드 등을 포함할 수 있다. 일부 실시형태에서, 본 개시내용의 폴리뉴클레오타이드는 선택성 마커, 예를 들어, 항생제 내성 마커를 포함한다.

일부 실시형태에서, 표적 단백질은 하나 이상의 번역 후 수정을 갖는다. 번역 후 수정의 유형은 제한되지 않으며, 당업계에 알려진 임의의 번역 후 수정일 수 있다. 번역 후 수정의 비제한적인 예는 글리코실화, 아세틸화, 알킬화, 메틸화, 비오티닐화, 글루타밀화, 글리실화, 이소프레닐화, 리포일화, 포스포판테테이닐화, 인산화, 황산화, 셀렌화, C-말단 아미드화, 수모화 및 이들의 임의의 조합을 포함한다.

중합효소

표적 단백질(들) 및 인핸서 단백질(들)을 인코딩하는 폴리뉴클레오타이드의 전사를 위해, 내인성 또는 외인성 중합효소가 사용될 수 있다. 일부 실시형태에서, 폴리뉴클레오타이드(들)의 전사는 세포(예를 들어, 진핵 세포)에 포함된 천연 중합효소에 의해 수행된다. 바이러스 중합효소가 대안적으로 또는 추가적으로 사용될 수 있다. 일부 실시형태에서, 바이러스 프로모터는 하나 이상의 바이러스 중합효소와 조합하여 사용된다. 일부 실시형태에서, 진핵생물 프로모터는 하나 이상의 진핵생물 중합효소와 조합하여 사용된다. 예시적인 바이러스 중합효소는 T7, T5, EMCV, HIV, 인플루엔자, SP6, CMV, T3, T1, SP01, SP2, Phi15 등을 포함하지만, 이에 제한되지 않는다. 바이러스 중합효소는 RNA 프라이밍 또는 캡핑 중합효소이다. 일부 실시형태에서, IRES 요소는 바이러스 중합효소와 연계하여 사용된다.

본 개시내용에 따른 벡터 또는 벡터들은 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 일부 실시형태에서, 중합효소는 바이러스 중합효소이다. 중합효소를 인코딩하는 폴리뉴클레오타이드 서열은 표적 단백질 인코딩 폴리뉴클레오타이드 및/또는 인핸서 단백질 인코딩 폴리뉴클레오타이드를 포함하는 벡터에 포함될 수 있다. 일부 실시형태에서, 중합효소는 표적 단백질 또는 인핸서 단백질 인코딩 폴리뉴클레오타이드를 포함하지 않는 벡터에 포함될 수 있다.

일부 실시형태에서, 본원에 개시된 시스템, 방법 또는 세포에 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다.

벡터

일부 양태에서, 본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 핵산 서열을 포함하는 벡터에 관한 것이다. 일부 실시형태에서, 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 갖는다.

본 개시내용에 따라 사용하기 위한 벡터는 당업계에 알려진 임의의 벡터를 포함할 수 있다. 특정 실시형태에서, 벡터는 관심 대상의 단백질 또는 폴리펩타이드 또는 이의 단편을 발현할 수 있는 임의의 재조합 벡터, 예를 들어, 아데노-관련 바이러스(AAV: adeno-associated virus) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 능력이 있는 아데노바이러스, 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬병 바이러스, 폭스바이러스, 피코르나바이러스, 헤르페스 바이러스 벡터, 바큘로바이러스 벡터, 아데노바이러스(Ad) 벡터 또는 비바이러스 플라스미드이다. 일부 실시형태에서, 벡터는 아데노-관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 능력이 있는 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬병 바이러스, 폭스바이러스, 피코르나바이러스, 헤르페스 바이러스 벡터, 바큘로바이러스 벡터, 아데노바이러스(Ad) 벡터이다.

일부 실시형태에서, 벡터는 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체이다. 일부 실시형태에서, 벡터는 박테리아 인공 염색체(BAC: bacterial artificial chromosome), 플라스미드, 박테리오파지 P1 유래 벡터(PAC: P1-derived vector), 효모 인공 염색체(YAC: yeast artificial chromosome), 또는 포유동물 인공 염색체(MAC: mammalian artificial chromosome)이다. 일부 실시형태에서, 벡터는 노출(naked) 또는 제형화된 플라스미드 DNA 또는 미니서클(minicircle)이다. 제형화는 제한되지 않으며, 예를 들어 펩타이드, 지질, 중합체 또는 양이온과 같은 비(non)-바이러스성 DNA 담체를 기반으로 할 수 있다.

일부 실시형태에서, 벡터는 구성적으로, 일시적으로 또는 조절된 방식으로 발현되는 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 조절에는 안전 스위치가 포함된다. 벡터로부터의 폴리뉴클레오타이드의 조절된 발현은 유도성 유전자 스위치(예를 들어, 합성 수용체, 단백질 기반 스위치, 유전자 회로, 게놈 편집 도구, 리보자임 또는 앱타자임)와 같은 당업계에 알려진 임의의 기술의 사용; 또는 세포사멸 자살 유전자 및 전구 약물의 사용을 포함할 수 있다. 단백질 기반 스위치는 당업계에 알려져 있으며, 단량체성 카스파제 9의 리미두시드 유도 이량체화와 같은 이량체화 단백질 또는 항체의 사용을 포함할 수 있다.

본원에 개시된 세포, 시스템 및 방법은 하나의 벡터를 포함할 수 있다. 일부 실시형태에서, 세포, 시스템 및 방법은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하는 단일 벡터를 포함할 수 있다.

본원에 개시된 세포, 시스템 및 방법은 2개의 벡터를 포함할 수 있다. 일부 실시형태에서, 세포, 시스템 및 방법은 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함할 수 있다.

본원에 개시된 세포, 시스템 및 방법은 2개 초과의 벡터를 포함할 수 있으며, 여기서 벡터는 다양한 조합 또는 구성으로 표적 단백질(들) 및 인핸서 단백질(들)을 인코딩할 수 있다.

일부 실시형태에서, 본 개시내용의 벡터 또는 벡터들을 포함하는 세포가 제공된다. 일부 실시형태에서, 본 개시내용의 폴리뉴클레오타이드를 포함하는 세포가 제공된다. 일부 실시형태에서, 본 개시내용의 표적 단백질(들) 및 인핸서 단백질(들)을 발현하는 세포가 제공된다.

프로모터

본 개시내용에 따른 벡터는 하나 이상의 프로모터를 포함할 수 있다. 용어 "프로모터"는 전사를 개시하기 위한 RNA 중합효소 및 다른 단백질의 인식 및 결합에 관여하는 전사 시작으로부터 상류 또는 하류에 위치한 영역 또는 서열을 지칭한다. 본 개시내용에 따른 폴리뉴클레오타이드(들) 또는 벡터(들)는 하나 이상의 프로모터를 포함할 수 있다. 프로모터는 당업계에 알려진 임의의 프로모터일 수 있다. 프로모터는 정방향 프로모터 또는 역방향 프로모터일 수 있다. 일부 실시형태에서, 프로모터는 포유동물 프로모터이다. 일부 실시형태에서, 하나 이상의 프로모터는 천연 프로모터이다. 일부 실시형태에서, 하나 이상의 프로모터는 비(non)-천연 프로모터이다. 일부 실시형태에서, 하나 이상의 프로모터는 비(non)-포유동물 프로모터이다. 개시된 조성물 및 방법에 사용하기 위한 RNA 프로모터의 비제한적인 예는 U1, 인간 신장 인자-1 알파(EF-1 알파), 거대세포바이러스(CMV), 인간 유비퀴틴, 비장 병소 형성 바이러스(SFFV: spleen focus-forming virus), U6, H1, tRNA^Lys, tRNA^Ser 및 tRNA^Arg, CAG, PGK, TRE, UAS, UbC, SV40, T7, Sp6, lac, araBad, trp 및 Ptac 프로모터를 포함한다.

본원에 사용되는 용어 "작동가능하게 연결된"은 물리적 위치가 아닌 작동 능력에 의해 연결된 핵산 서열의 요소 또는 구조를 지칭한다. 요소 또는 구조는 원하는 작동을 수행할 수 있거나 이를 특징으로 한다. 핵산 서열에서 요소 또는 구조가 작동 가능하게 연결되기 위해 직렬 또는 인접 순서로 있을 필요는 없다는 것이 당업자에 의해 인식된다.

일부 실시형태에서, 본 개시내용에 따른 벡터에 포함된 프로모터는 유도성 프로모터이다.

본 개시내용에 따른 벡터는 하나 이상의 바이러스 중합효소에 의해 하나 이상의 폴리뉴클레오타이드의 전사를 가능하게 하는 하나 이상의 바이러스 프로모터를 포함할 수 있다. 일부 실시형태에서, 예를 들어, 벡터는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드(즉, 표적 단백질 인코딩 폴리뉴클레오타이드) 또는 제2 폴리뉴클레오타이드(즉, 인핸서 단백질 인코딩 폴리뉴클레오타이드) 중 하나 또는 둘 다의 전사를 위해 구성된 T7 프로모터를 포함할 수 있다.

발현 카세트

본 개시내용에 따른 벡터 또는 벡터들은 하나 이상의 발현 카세트를 포함할 수 있다. 본원에 사용되는 어구 "발현 카세트"는 다른 핵산 또는 해당 핵산 분자에 의해 인코딩된 단백질의 생성에 필요한 최소 요소를 포함하는 핵산 분자의 정의된 세그먼트를 지칭한다. 일부 실시형태에서, 벡터는 발현 카세트를 포함할 수 있고, 발현 카세트는 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함한다. 일부 실시형태에서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함한다.

일부 실시형태에서, 발현 카세트는 분리 요소(예를 들어, 리보솜 스키핑 부위 또는 2A 요소)를 인코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 분리 요소(예를 들어, 리보솜 스키핑 부위 또는 2A 요소)에 의해 연결된 인핸서 단백질 및 표적 단백질을 인코딩하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 발현 카세트는 분리 요소(예를 들어, 리보솜 스키핑 부위 또는 2A 요소)에 의해 연결된, 표적 단백질과 인핸서 단백질 둘 다를 인코딩하는 단일 전령 RNA의 전사를 위해 구성되고; 여기서, 전령 RNA의 번역은 표적 단백질 및 인핸서 단백질(예를 들어, L 단백질)을 별개의 폴리펩타이드로서 발현시키는 결과를 가져온다.

일부 실시형태에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하며, 코딩 폴리뉴클레오타이드는 폴리펩타이드 링커가 있거나 없는 융합 단백질로서 인핸서 단백질과 표적 단백질을 인코딩하며, 선택적으로 폴리펩타이드 링커는 절단 가능한 링커 또는 인테인 기반 절단 시스템이다.

분리 요소

일부 실시형태에서, 본 개시내용에 따른 표적 단백질(들) 및 인핸서 단백질(들)은 동일한 벡터 상에 인코딩되거나 별도의 벡터 상에 인코딩된다. 일부 실시형태에서, 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질에 대한 핵산 서열이 동일한 벡터에 포함되는 경우, 벡터는 단백질의 별도 발현을 위한 분리 요소를 포함할 수 있다. 다양한 실시형태에서, 벡터는 바이시스트로닉 벡터 또는 폴리시스트로닉 벡터이다. 분리 요소는 내부 리보솜 진입 부위(IRES) 또는 2A 요소일 수 있다. 일부 실시형태에서, 벡터는 2A 자가 절단 펩타이드를 인코딩하는 핵산을 포함할 수 있다. 예시적인 2A 자가 절단 펩타이드는 P2A, E2A, F2A 및 T2A를 포함한다.

일부 실시형태에서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 다는 내부 리보솜 진입 부위(IRES: internal ribosome entry site)에 작동가능하게 연결된다.

일부 실시형태에서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 다는 2A 요소에 작동가능하게 연결된다.

일부 실시형태에서, 벡터는 도 13a 또는 도 13b에 도시된 바와 같다. 일부 실시형태에서, 벡터는 서열번호 132를 인코딩하는 폴리뉴클레오타이드 및/또는 서열번호 133을 인코딩하는 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 벡터는 서열번호 134의 핵산 서열을 포함하는 폴리뉴클레오타이드 및/또는 서열번호 135를 인코딩하는 폴리뉴클레오타이드를 포함한다.

일부 실시형태에서, 벡터는 서열번호 100의 핵산 서열, 또는 서열번호 100과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 핵산 서열을 포함한다.

서열번호 100:

CGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGCGCTACCGGACTCAGATCTCGAGCTCAAGCTTCGAATTCTGCAGTCGACGGTACCGCGGGCCCGGGATCCACCGGTCGCCACGATGAAGTGGGTGACCTTCATCAGCCTGCTGTTCCTGTTTTCTTCCGCCTACAGCGAAGTGCAGCTGGTTGAAAGCGGAGGCGGACTGGTCCAGCCAGGCAGAAGCCTGAGACTGTCTTGTGCCGCCTCTGGCTTCACCTTTGACGACTACGCCATGCACTGGGTGCGGCAGGCCCCTGGCAAGGGACTCGAGTGGGTCAGCGCCATCACCTGGAATAGCGGCCACATCGACTACGCAGATAGCGTTGAAGGCAGATTCACCATCTCCAGGGACAACGCCAAGAATTCTCTGTACCTGCAGATGAACAGCCTGCGGGCCGAGGATACCGCTGTGTACTACTGCGCCAAAGTGTCCTACCTGAGCACCGCCAGCTCCCTGGACTACTGGGGCCAGGGCACCCTGGTGACAGTGAGCTCTGCTAGCACAAAAGGACCTAGCGTGTTTCCCCTGGCCCCTAGCAGCAAAAGCACCAGCGGCGGAACCGCCGCTCTGGGTTGTCTGGTGAAGGACTATTTCCCTGAACCTGTGACCGTGTCCTGGAACTCTGGCGCCCTGACTAGCGGCGTGCATACCTTCCCTGCCGTGCTGCAAAGCTCTGGCCTGTATAGCCTTTCTTCTGTGGTGACCGTGCCTAGCAGCTCTCTGGGCACACAGACATACATCTGCAATGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAAAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCGTGCCCCGCTCCTGAGCTGCTGGGCGGCCCTTCTGTGTTCCTGTTCCCCCCCAAACCTAAAGACACACTGATGATCAGCCGGACCCCTGAGGTGACCTGCGTGGTGGTGGACGTGAGCCACGAGGACCCCGAGGTGAAGTTCAACTGGTACGTGGACGGCGTGGAGGTCCACAACGCCAAGACCAAACCTAGAGAGGAACAATACAACAGCACATATAGAGTGGTGTCTGTGCTGACAGTGCTCCACCAGGACTGGCTGAACGGAAAGGAATACAAGTGCAAGGTGTCCAACAAGGCCCTCCCTGCTCCAATCGAGAAGACCATTAGCAAGGCCAAGGGCCAACCTAGAGAGCCCCAGGTCTACACCCTGCCACCAAGTAGAGATGAGCTGACCAAGAACCAGGTGAGCCTAACATGCCTGGTGAAGGGCTTTTACCCCAGCGACATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACACCTCCTGTTCTGGATTCTGATGGCAGCTTCTTCCTGTACAGCAAGCTGACAGTGGATAAGAGCCGGTGGCAGCAGGGCAACGTGTTCAGCTGCTCCGTTATGCACGAGGCCCTGCATAATCACTACACCCAGAAGAGCCTGTCTCTGAGCCCTGGCAAGGAAGTGCAGCTGGTTGAAAGCGGAGGCGGACTGGTCCAGCCAGGCAGAAGCCTGAGACTGTCTTGTGCCGCCTCTGGCTTCACCTTTGACGACTACGCCATGCACTGGGTGCGGCAGGCCCCTGGCAAGGGACTCGAGTGGGTCAGCGCCATCACCTGGAATAGCGGCCACATCGACTACGCAGATAGCGTTGAAGGCAGATTCACCATCTCCAGGGACAACGCCAAGAATTCTCTGTACCTGCAGATGAACAGCCTGCGGGCCGAGGATACCGCTGTGTACTACTGCGCCAAAGTGTCCTACCTGAGCACCGCCAGCTCCCTGGACTACTGGGGCCAGGGCACCCTGGTGACAGTGAGCTCTGCTAGCACAAAAGGACCTAGCGTGTTTCCCCTGGCCCCTAGCAGCAAAAGCACCAGCGGCGGAACCGCCGCTCTGGGTTGTCTGGTGAAGGACTATTTCCCTGAACCTGTGACCGTGTCCTGGAACTCTGGCGCCCTGACTAGCGGCGTGCATACCTTCCCTGCCGTGCTGCAAAGCTCTGGCCTGTATAGCCTTTCTTCTGTGGTGACCGTGCCTAGCAGCTCTCTGGGCACACAGACATACATCTGCAATGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAAAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCGTGCCCCGCTCCTGAGCTGCTGGGCGGCCCTTCTGTGTTCCTGTTCCCCCCCAAACCTAAAGACACACTGATGATCAGCCGGACCCCTGAGGTGACCTGCGTGGTGGTGGACGTGAGCCACGAGGACCCCGAGGTGAAGTTCAACTGGTACGTGGACGGCGTGGAGGTCCACAACGCCAAGACCAAACCTAGAGAGGAACAATACAACAGCACATATAGAGTGGTGTCTGTGCTGACAGTGCTCCACCAGGACTGGCTGAACGGAAAGGAATACAAGTGCAAGGTGTCCAACAAGGCCCTCCCTGCTCCAATCGAGAAGACCATTAGCAAGGCCAAGGGCCAACCTAGAGAGCCCCAGGTCTACACCCTGCCACCAAGTAGAGATGAGCTGACCAAGAACCAGGTGAGCCTAACATGCCTGGTGAAGGGCTTTTACCCCAGCGACATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACACCTCCTGTTCTGGATTCTGATGGCAGCTTCTTCCTGTACAGCAAGCTGACAGTGGATAAGAGCCGGTGGCAGCAGGGCAACGTGTTCAGCTGCTCCGTTATGCACGAGGCCCTGCATAATCACTACACCCAGAAGAGCCTGTCTCTGAGCCCTGGCAAGCAAGCGAAAACGGCGCGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGATGTGGAGGAGAACCCTGGACCTGATATCCAGATGACCCAGTCTCCATCTAGCCTGAGCGCCAGCGTGGGAGATAGAGTGACCATCACCTGTAGAGCCTCTCAAGGCATCCGGAACTACCTGGCCTGGTATCAGCAGAAACCTGGCAAGGCTCCTAAGCTGCTGATCTACGCCGCTTCCACCCTGCAGAGCGGCGTTCCTTCTAGATTCAGCGGCAGCGGCTCCGGAACAGACTTCACCCTGACAATTAGCTCCCTGCAACCTGAAGATGTGGCTACATACTACTGCCAGAGATACAATCGGGCCCCTTACACCTTTGGACAGGGCACCAAGGTGGAAATCAAGCGGACCGTGGCCGCCCCATCTGTGTTCATCTTCCCCCCCAGCGACGAGCAGCTGAAAAGCGGCACAGCCAGCGTGGTGTGCCTGCTGAACAACTTCTACCCCAGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGAGCGGCAACAGCCAGGAGAGCGTGACCGAGCAGGACAGCAAGGACAGCACCTACAGCCTGAGCAGCACCCTCACACTGTCTAAAGCCGACTACGAGAAGCACAAGGTCTACGCCTGCGAGGTGACCCACCAGGGCCTGTCCTCCCCTGTGACAAAGAGCTTTAACAGAGGCGAGTGCTAAGATATCCAGATGACCCAGTCTCCATCTAGCCTGAGCGCCAGCGTGGGAGATAGAGTGACCATCACCTGTAGAGCCTCTCAAGGCATCCGGAACTACCTGGCCTGGTATCAGCAGAAACCTGGCAAGGCTCCTAAGCTGCTGATCTACGCCGCTTCCACCCTGCAGAGCGGCGTTCCTTCTAGATTCAGCGGCAGCGGCTCCGGAACAGACTTCACCCTGACAATTAGCTCCCTGCAACCTGAAGATGTGGCTACATACTACTGCCAGAGATACAATCGGGCCCCTTACACCTTTGGACAGGGCACCAAGGTGGAAATCAAGCGGACCGTGGCCGCCCCATCTGTGTTCATCTTCCCCCCCAGCGACGAGCAGCTGAAAAGCGGCACAGCCAGCGTGGTGTGCCTGCTGAACAACTTCTACCCCAGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGAGCGGCAACAGCCAGGAGAGCGTGACCGAGCAGGACAGCAAGGACAGCACCTACAGCCTGAGCAGCACCCTCACACTGTCTAAAGCCGACTACGAGAAGCACAAGGTCTACGCCTGCGAGGTGACCCACCAGGGCCTGTCCTCCCCTGTGACAAAGAGCTTTAACAGAGGCGAGTGCTAACCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAATATGGCCACAACCATGGAACAAGAGACTTGCGCGCACTCTCTCACTTTTGAGGAATGCCCAAAATGCTCTGCTCTACAATACCGTAATGGATTTTACCTGCTAAAGTATGATGAAGAATGGTACCCAGAGGAGTTATTGACTGATGGAGAGGATGATGTCTTTGATCCCGAATTAGACATGGAAGTCGTTTTCGAGTTACAGTAAATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTAAGGCGTCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTTGACTCTT

일부 실시형태에서, 벡터는 하기의 유전적 요소를 하나 이상 포함한다.

도 13b에 도시된 벡터의 유전적 요소

기타사항: 서열번호 101

CGCGATGTACGGGCCAGATATACGCGTT

CMV 인핸서: 서열번호 102

GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATG

CMV 프로모터: 서열번호 103

GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCT

기타사항: 서열번호 104

GGTTTAGTGAACCGTCAGATCCGCTAGCGCTACCGGACTCAGATCTCGAGCTCAAGCTTCGAATTCTGCAGTCGACGGTACCGCGGGCCCGGGATCCACCGGTCGCCACG

알부민 신호 펩타이드(코돈 최적화): 서열번호 105

ATGAAGTGGGTGACCTTCATCAGCCTGCTGTTCCTGTTTTCTTCCGCCTACAGC

아달리무맙 중쇄(가변 영역): 서열번호 106

GAAGTGCAGCTGGTTGAAAGCGGAGGCGGACTGGTCCAGCCAGGCAGAAGCCTGAGACTGTCTTGTGCCGCCTCTGGCTTCACCTTTGACGACTACGCCATGCACTGGGTGCGGCAGGCCCCTGGCAAGGGACTCGAGTGGGTCAGCGCCATCACCTGGAATAGCGGCCACATCGACTACGCAGATAGCGTTGAAGGCAGATTCACCATCTCCAGGGACAACGCCAAGAATTCTCTGTACCTGCAGATGAACAGCCTGCGGGCCGAGGATACCGCTGTGTACTACTGCGCCAAAGTGTCCTACCTGAGCACCGCCAGCTCCCTGGACTACTGGGGCCAGGGCACCCTGGTGACAGTGAGCTCT

인간 IgG1 중쇄(불변 영역): 서열번호 107

GCTAGCACAAAAGGACCTAGCGTGTTTCCCCTGGCCCCTAGCAGCAAAAGCACCAGCGGCGGAACCGCCGCTCTGGGTTGTCTGGTGAAGGACTATTTCCCTGAACCTGTGACCGTGTCCTGGAACTCTGGCGCCCTGACTAGCGGCGTGCATACCTTCCCTGCCGTGCTGCAAAGCTCTGGCCTGTATAGCCTTTCTTCTGTGGTGACCGTGCCTAGCAGCTCTCTGGGCACACAGACATACATCTGCAATGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAAAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCGTGCCCCGCTCCTGAGCTGCTGGGCGGCCCTTCTGTGTTCCTGTTCCCCCCCAAACCTAAAGACACACTGATGATCAGCCGGACCCCTGAGGTGACCTGCGTGGTGGTGGACGTGAGCCACGAGGACCCCGAGGTGAAGTTCAACTGGTACGTGGACGGCGTGGAGGTCCACAACGCCAAGACCAAACCTAGAGAGGAACAATACAACAGCACATATAGAGTGGTGTCTGTGCTGACAGTGCTCCACCAGGACTGGCTGAACGGAAAGGAATACAAGTGCAAGGTGTCCAACAAGGCCCTCCCTGCTCCAATCGAGAAGACCATTAGCAAGGCCAAGGGCCAACCTAGAGAGCCCCAGGTCTACACCCTGCCACCAAGTAGAGATGAGCTGACCAAGAACCAGGTGAGCCTAACATGCCTGGTGAAGGGCTTTTACCCCAGCGACATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACACCTCCTGTTCTGGATTCTGATGGCAGCTTCTTCCTGTACAGCAAGCTGACAGTGGATAAGAGCCGGTGGCAGCAGGGCAACGTGTTCAGCTGCTCCGTTATGCACGAGGCCCTGCATAATCACTACACCCAGAAGAGCCTGTCTCTGAGCCCTGGCAAG

아달리무맙 중쇄 완전함: 서열번호 134

GAAGTGCAGCTGGTTGAAAGCGGAGGCGGACTGGTCCAGCCAGGCAGAAGCCTGAGACTGTCTTGTGCCGCCTCTGGCTTCACCTTTGACGACTACGCCATGCACTGGGTGCGGCAGGCCCCTGGCAAGGGACTCGAGTGGGTCAGCGCCATCACCTGGAATAGCGGCCACATCGACTACGCAGATAGCGTTGAAGGCAGATTCACCATCTCCAGGGACAACGCCAAGAATTCTCTGTACCTGCAGATGAACAGCCTGCGGGCCGAGGATACCGCTGTGTACTACTGCGCCAAAGTGTCCTACCTGAGCACCGCCAGCTCCCTGGACTACTGGGGCCAGGGCACCCTGGTGACAGTGAGCTCTGCTAGCACAAAAGGACCTAGCGTGTTTCCCCTGGCCCCTAGCAGCAAAAGCACCAGCGGCGGAACCGCCGCTCTGGGTTGTCTGGTGAAGGACTATTTCCCTGAACCTGTGACCGTGTCCTGGAACTCTGGCGCCCTGACTAGCGGCGTGCATACCTTCCCTGCCGTGCTGCAAAGCTCTGGCCTGTATAGCCTTTCTTCTGTGGTGACCGTGCCTAGCAGCTCTCTGGGCACACAGACATACATCTGCAATGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAAAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCGTGCCCCGCTCCTGAGCTGCTGGGCGGCCCTTCTGTGTTCCTGTTCCCCCCCAAACCTAAAGACACACTGATGATCAGCCGGACCCCTGAGGTGACCTGCGTGGTGGTGGACGTGAGCCACGAGGACCCCGAGGTGAAGTTCAACTGGTACGTGGACGGCGTGGAGGTCCACAACGCCAAGACCAAACCTAGAGAGGAACAATACAACAGCACATATAGAGTGGTGTCTGTGCTGACAGTGCTCCACCAGGACTGGCTGAACGGAAAGGAATACAAGTGCAAGGTGTCCAACAAGGCCCTCCCTGCTCCAATCGAGAAGACCATTAGCAAGGCCAAGGGCCAACCTAGAGAGCCCCAGGTCTACACCCTGCCACCAAGTAGAGATGAGCTGACCAAGAACCAGGTGAGCCTAACATGCCTGGTGAAGGGCTTTTACCCCAGCGACATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACACCTCCTGTTCTGGATTCTGATGGCAGCTTCTTCCTGTACAGCAAGCTGACAGTGGATAAGAGCCGGTGGCAGCAGGGCAACGTGTTCAGCTGCTCCGTTATGCACGAGGCCCTGCATAATCACTACACCCAGAAGAGCCTGTCTCTGAGCCCTGGCAAG

푸린 절단 부위: 서열번호 108

CAAGCGAAAACGGCGC

GSG 링커: 서열번호 109

GGAAGCGGA

P2A 자가 절단 펩타이드: 서열번호 110

GCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGATGTGGAGGAGAACCCTGGACCT

아달리무맙 경쇄(가변 영역): 서열번호 111

GATATCCAGATGACCCAGTCTCCATCTAGCCTGAGCGCCAGCGTGGGAGATAGAGTGACCATCACCTGTAGAGCCTCTCAAGGCATCCGGAACTACCTGGCCTGGTATCAGCAGAAACCTGGCAAGGCTCCTAAGCTGCTGATCTACGCCGCTTCCACCCTGCAGAGCGGCGTTCCTTCTAGATTCAGCGGCAGCGGCTCCGGAACAGACTTCACCCTGACAATTAGCTCCCTGCAACCTGAAGATGTGGCTACATACTACTGCCAGAGATACAATCGGGCCCCTTACACCTTTGGACAGGGCACCAAGGTGGAAATCAAG

인간 Ig 카파 불변(경쇄의 불변 영역): 서열번호 112

CGGACCGTGGCCGCCCCATCTGTGTTCATCTTCCCCCCCAGCGACGAGCAGCTGAAAAGCGGCACAGCCAGCGTGGTGTGCCTGCTGAACAACTTCTACCCCAGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGAGCGGCAACAGCCAGGAGAGCGTGACCGAGCAGGACAGCAAGGACAGCACCTACAGCCTGAGCAGCACCCTCACACTGTCTAAAGCCGACTACGAGAAGCACAAGGTCTACGCCTGCGAGGTGACCCACCAGGGCCTGTCCTCCCCTGTGACAAAGAGCTTTAACAGAGGCGAGTGCTAA

아달리무맙 경쇄 완전함: 서열번호 135

GATATCCAGATGACCCAGTCTCCATCTAGCCTGAGCGCCAGCGTGGGAGATAGAGTGACCATCACCTGTAGAGCCTCTCAAGGCATCCGGAACTACCTGGCCTGGTATCAGCAGAAACCTGGCAAGGCTCCTAAGCTGCTGATCTACGCCGCTTCCACCCTGCAGAGCGGCGTTCCTTCTAGATTCAGCGGCAGCGGCTCCGGAACAGACTTCACCCTGACAATTAGCTCCCTGCAACCTGAAGATGTGGCTACATACTACTGCCAGAGATACAATCGGGCCCCTTACACCTTTGGACAGGGCACCAAGGTGGAAATCAAGCGGACCGTGGCCGCCCCATCTGTGTTCATCTTCCCCCCCAGCGACGAGCAGCTGAAAAGCGGCACAGCCAGCGTGGTGTGCCTGCTGAACAACTTCTACCCCAGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGAGCGGCAACAGCCAGGAGAGCGTGACCGAGCAGGACAGCAAGGACAGCACCTACAGCCTGAGCAGCACCCTCACACTGTCTAAAGCCGACTACGAGAAGCACAAGGTCTACGCCTGCGAGGTGACCCACCAGGGCCTGTCCTCCCCTGTGACAAAGAGCTTTAACAGAGGCGAGTGCTAA

기타사항: 서열번호 113

CCCCCCCCCCTA

IRES: 서열번호 114

ACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAT

인핸서 펩타이드: 서열번호 115

ATGGCCACAACCATGGAACAAGAGACTTGCGCGCACTCTCTCACTTTTGAGGAATGCCCAAAATGCTCTGCTCTACAATACCGTAATGGATTTTACCTGCTAAAGTATGATGAAGAATGGTACCCAGAGGAGTTATTGACTGATGGAGAGGATGATGTCTTTGATCCCGAATTAGACATGGAAGTCGTTTTCGAGTTACAGTAA

기타사항: 서열번호 116

ATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTT

SV40 폴리(A) 신호: 서열번호 117

AACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTA

링커: 서열번호 118

AGGCGTCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGC

네오마이신/카나마이신 내성 유전자: 서열번호 119

ATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGA

기타사항: 서열번호 120

ATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTC

복제 원점: 서열번호 121

TTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAA

기타사항: 서열번호 122

AACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTTGACTCTT

도 13b에 도시된 벡터로부터 발현된 단백질의 아미노산 서열

일부 실시형태에서, 아달리무맙은 단일 전구체 폴리펩타이드(즉, 단일 오픈 리딩 프레임)로서 발현되며, 이는 번역과 동시에 성숙 항체 중쇄 및 경쇄로 처리된다. 단백질의 성분은 하기와 같다:

알부민 신호 펩타이드: 서열번호 123

MKWVTFISLLFLFSSAYS

아달리무맙 중쇄(가변 영역): 서열번호 124

EVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSS

인간 IgG1 중쇄(불변): 서열번호 125

ASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK

푸린 절단 부위(^는 절단 부위를 나타냄): 서열번호 126

RKRR^

링커: 서열번호 127

GSG

P2A 자가 절단 펩타이드(^는 절단 부위를 나타냄): 서열번호 128

ATNFSLLKQAGDVEENPG^P

아달리무맙 경쇄(가변 영역): 서열번호 129

DIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIK

인간 Ig 카파 불변(*는 전구체 폴리펩티이드의 정지 코돈을 나타냄): 서열번호 130

RTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*

인핸서 펩타이드는 하기와 같이 내부 리보솜 진입 부위로부터 발현된다.

인핸서 펩타이드(*는 정지 코돈을 나타냄) 서열번호 131

MATTMEQETCAHSLTFEECPKCSALQYRNGFYLLKYDEEWYPEELLTDGEDDVFDPELDMEVVFELQ

아달리무맙 완전 중쇄: 서열번호 132

EVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK

아달리무맙 완전 경쇄: 서열번호 133

DIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*

일부 실시형태에서, 벡터는 아달리무맙의 상보성 결정 영역(CDR: complementary determining region) 중 임의의 것, 예를 들어, 경쇄 CDR의 서열번호 137, 139, 141을 포함한다:

서열번호 137

QRYNRAPYX

서열번호 139

AASTLQS

서열번호 141

RASQGIRNYLA

일부 실시형태에서, 벡터는 아달리무맙의 상보성 결정 영역(CDR) 중 임의의 것, 예를 들어, 중쇄 CDR의 서열번호 138, 140, 142를 포함한다:

서열번호 138

VSYLSTASSLD

서열번호 140

AITWNSGHIDYADSVEG

서열번호 142

DYAMH

일부 실시형태에서, 벡터는 서열번호 136과 적어도 약 70%(예를 들어, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 약 98%, 약 99%, 또는 약 100%) 동일성을 갖는 핵산 서열을 포함한다.

도 13a에 도시된 벡터의 핵산 서열

서열번호 136

CGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGCGCTACCGGACTCAGATCTCGAGCTCAAGCTTCGAATTCTGCAGTCGACGGTACCGCGGGCCCGGGATCCACCGGTCGCCACGATGAAGTGGGTGACCTTCATCAGCCTGCTGTTCCTGTTTTCTTCCGCCTACAGCGAAGTGCAGCTGGTTGAAAGCGGAGGCGGACTGGTCCAGCCAGGCAGAAGCCTGAGACTGTCTTGTGCCGCCTCTGGCTTCACCTTTGACGACTACGCCATGCACTGGGTGCGGCAGGCCCCTGGCAAGGGACTCGAGTGGGTCAGCGCCATCACCTGGAATAGCGGCCACATCGACTACGCAGATAGCGTTGAAGGCAGATTCACCATCTCCAGGGACAACGCCAAGAATTCTCTGTACCTGCAGATGAACAGCCTGCGGGCCGAGGATACCGCTGTGTACTACTGCGCCAAAGTGTCCTACCTGAGCACCGCCAGCTCCCTGGACTACTGGGGCCAGGGCACCCTGGTGACAGTGAGCTCTGCTAGCACAAAAGGACCTAGCGTGTTTCCCCTGGCCCCTAGCAGCAAAAGCACCAGCGGCGGAACCGCCGCTCTGGGTTGTCTGGTGAAGGACTATTTCCCTGAACCTGTGACCGTGTCCTGGAACTCTGGCGCCCTGACTAGCGGCGTGCATACCTTCCCTGCCGTGCTGCAAAGCTCTGGCCTGTATAGCCTTTCTTCTGTGGTGACCGTGCCTAGCAGCTCTCTGGGCACACAGACATACATCTGCAATGTGAACCACAAGCCCTCCAACACCAAGGTGGACAAAAAGGTGGAACCCAAGAGCTGCGACAAGACCCACACCTGTCCTCCGTGCCCCGCTCCTGAGCTGCTGGGCGGCCCTTCTGTGTTCCTGTTCCCCCCCAAACCTAAAGACACACTGATGATCAGCCGGACCCCTGAGGTGACCTGCGTGGTGGTGGACGTGAGCCACGAGGACCCCGAGGTGAAGTTCAACTGGTACGTGGACGGCGTGGAGGTCCACAACGCCAAGACCAAACCTAGAGAGGAACAATACAACAGCACATATAGAGTGGTGTCTGTGCTGACAGTGCTCCACCAGGACTGGCTGAACGGAAAGGAATACAAGTGCAAGGTGTCCAACAAGGCCCTCCCTGCTCCAATCGAGAAGACCATTAGCAAGGCCAAGGGCCAACCTAGAGAGCCCCAGGTCTACACCCTGCCACCAAGTAGAGATGAGCTGACCAAGAACCAGGTGAGCCTAACATGCCTGGTGAAGGGCTTTTACCCCAGCGACATCGCCGTGGAATGGGAGAGCAACGGCCAGCCTGAGAACAACTACAAGACAACACCTCCTGTTCTGGATTCTGATGGCAGCTTCTTCCTGTACAGCAAGCTGACAGTGGATAAGAGCCGGTGGCAGCAGGGCAACGTGTTCAGCTGCTCCGTTATGCACGAGGCCCTGCATAATCACTACACCCAGAAGAGCCTGTCTCTGAGCCCTGGCAAGCAAGCGAAAACGGCGCGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGATGTGGAGGAGAACCCTGGACCTATGAAGTGGGTGACCTTCATCAGCCTGCTGTTCCTGTTTTCTTCCGCCTACAGCGATATCCAGATGACCCAGTCTCCATCTAGCCTGAGCGCCAGCGTGGGAGATAGAGTGACCATCACCTGTAGAGCCTCTCAAGGCATCCGGAACTACCTGGCCTGGTATCAGCAGAAACCTGGCAAGGCTCCTAAGCTGCTGATCTACGCCGCTTCCACCCTGCAGAGCGGCGTTCCTTCTAGATTCAGCGGCAGCGGCTCCGGAACAGACTTCACCCTGACAATTAGCTCCCTGCAACCTGAAGATGTGGCTACATACTACTGCCAGAGATACAATCGGGCCCCTTACACCTTTGGACAGGGCACCAAGGTGGAAATCAAGCGGACCGTGGCCGCCCCATCTGTGTTCATCTTCCCCCCCAGCGACGAGCAGCTGAAAAGCGGCACAGCCAGCGTGGTGTGCCTGCTGAACAACTTCTACCCCAGGGAAGCCAAGGTGCAGTGGAAGGTGGACAATGCCCTGCAGAGCGGCAACAGCCAGGAGAGCGTGACCGAGCAGGACAGCAAGGACAGCACCTACAGCCTGAGCAGCACCCTCACACTGTCTAAAGCCGACTACGAGAAGCACAAGGTCTACGCCTGCGAGGTGACCCACCAGGGCCTGTCCTCCCCTGTGACAAAGAGCTTTAACAGAGGCGAGTGCTAAATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTAAGGCGTCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTTGACTCTT

형질감염, 형질도입, 형질전환

용어 "형질감염", "형질도입" 및 "형질전환"은 핵산을 세포(예를 들어, 진핵 세포) 내로 도입하는 과정을 지칭한다. 일부 실시형태에서, 본원에 기재된 폴리뉴클레오타이드 또는 벡터는 당업계에 알려진 임의의 방법을 사용하여 세포(예를 들어, 진핵 세포) 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터는 당업계에 잘 알려져 있고 부분적으로 특정 숙주 세포에 기초하여 선택되는 다양한 방법에 의해 세포 내로 도입될 수 있다. 예를 들어, 폴리뉴클레오타이드는 화학적, 물리적, 생물학적 또는 바이러스 수단을 사용하여 세포 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터를 세포 내로 도입하는 방법은 인산칼슘, 덴드리머, 양이온성 중합체, 리포펙션, 퓨진(fugene), 세포 침투 펩타이드, 펩타이드 덴드리머, 전기천공, 세포 압착, 초음파천공법, 광학적 형질감염, 원형질체 융합, 임페일펙션, 유체역학적 전달, 유전자 총, 자기감염, 입자 충격, 핵감염 및 바이러스 형질도입의 사용을 포함하지만, 이에 제한되지 않는다.

표적 단백질을 인코딩하는 표적화 DNA 및/또는 핵산 및 인핸서 단백질을 포함하는 벡터는 다양한 방법(예를 들어, 주입, 형질전환, 형질감염, 직접 흡수, 발사체 충격(projectile bombardment), 리포솜)에 의해 세포 내로 도입될 수 있다. 표적 단백질 및 인핸서 단백질은 발현 벡터를 사용하여 세포에서 안정적으로 또는 일시적으로 발현될 수 있다. 진핵 세포에서의 발현의 기법은 당업자에게 잘 알려져 있다. (문헌[Current Protocols in Human Genetics: Chapter 12 "Vector Therapy" & Chapter 13 "Delivery Systems for Gene Therapy"] 참조).

일부 실시형태에서, 폴리뉴클레오타이드 또는 벡터는 선택적으로 렌티바이러스 형질감염, 포유류 세포로의 바큘로바이러스 유전자 전달(BacMam), 레트로바이러스 형질감염, CRISPR/Cas9 및/또는 트랜스포존의 사용을 통해 안정한 세포주를 생성하기 위한 표준 방법을 사용하여 게놈에 삽입함으로써 숙주 세포 내로 도입될 수 있다. 일부 실시형태에서, 폴리뉴클레오타이드 또는 벡터는 일시적 형질감염을 위해 숙주 세포 내로 도입될 수 있다. 일부 실시형태에서, 일시적 형질감염은 바이러스 벡터, 헬퍼 지질, 예를 들어, PEI, 리포펙타민 및/또는 펙타민 293의 사용을 통해 수행될 수 있다. 유전적 요소는 예를 들어, 벡터 상에 DNA로서 또는 예를 들어, PCR로부터 RNA로서 인코딩될 수 있다. 유전적 요소는 서로 다르게 분리되거나 동일한 벡터 상에 조합될 수 있다.

폴리뉴클레오타이드 또는 벡터는 당업계에 잘 알려져 있는 다양한 방법에 의해 세포 내로 도입될 수 있다. 예를 들어, 폴리뉴클레오타이드는 화학적, 물리적, 생물학적 또는 바이러스 수단을 사용하여 세포 내로 도입될 수 있다.

표적 단백질의 생체 내 전달

일부 실시형태에서, 본원에 기재된 폴리뉴클레오타이드 또는 벡터는 당업계에 알려진 임의의 방법을 사용하여 대상체 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터는 당업계에 잘 알려져 있는 다양한 방법에 의해 대상체 내로 도입될 수 있다. 표적 단백질을 인코딩하는 표적화 DNA 및/또는 핵산 및 인핸서 단백질을 포함하는 벡터는 다양한 방법(예를 들어, 주입, 바이러스 형질감염, 직접 흡수, 발사체 충격)에 의해 대상체에게 투여될 수 있다.

주사에 의한 투여는 예를 들어, 근육내, 정맥내, 심장내, 복강내, 정맥내, 동맥내, 피내, 피하, 두개내, 요추, 유리체내, 비강내 또는 다른 주사를 포함할 수 있다. 벡터 또는 폴리뉴클레오타이드는 화학적, 물리적, 생물학적 또는 바이러스 수단을 사용하여 대상체의 세포 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터를 대상체에게 투여하고/하거나 폴리뉴클레오타이드 또는 벡터를 대상체의 세포 내로 도입하는 방법은 양이온성 또는 다른 중합체, 지질, 지질 제형, 세포 투과성 펩타이드, 나노입자 기반 전달 운반체, 나노젤, 유전자 총, 제트 유전자 장치, 입자 충격 및 바이러스 형질도입을 사용하거나 사용하지 않는 동안 전기천공법/초음파천공법을 사용하거나 사용하지 않고 직접 주사하는 방법을 포함하지만, 이에 제한되지 않는다. 일부 실시형태에서, 투여는 피하 주사에 의한다. 본 출원의 다른 곳에서도 기재된 바와 같이, 일부 실시형태에서, 본원에 개시된 벡터 또는 폴리뉴클레오티이드는 임의의 바이러스 유전자 전달 벡터, 예를 들어, 아데노바이러스, 아데노-관련 바이러스, 헤르페스 바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬병 바이러스, 폭스바이러스, 피코르나바이러스 또는 임의의 다른 바이러스 전달 시스템을 사용하여 대상체의 세포 내로 도입될 수 있다.

일부 실시형태에서, 본원에 기재된 표적 단백질 및 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드 또는 벡터는 질병의 적어도 하나의 증상을 치료, 예방 또는 관리하기 위해 대상체에게 투여될 수 있다. 일부 실시형태에서, 표적 단백질은 단일클론 항체(예를 들어, 아달리무맙)와 같은 항체이다. 일부 실시형태에서, 대상체는 표적 단백질(예를 들어 아달리무맙)의 발현에 의해 치료, 예방 또는 관리되는 것으로 알려졌거나 향후에 발견될 임의의 상태를 갖는 대상체이다. 예를 들어, 아달리무맙을 인코딩하는 폴리뉴클레오타이드 또는 벡터의 투여에 의해 치료될 수 있는 상태의 비제한적인 예는 류마티스 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 건선, 화농성 한선염, 포도막염 및 청소년 특발성 관절염을 포함한다.

따라서, 본 개시내용은 대상체에게 본원에 개시된 표적 단백질 및 인핸서 단백질을 인코딩하는 벡터 또는 폴리뉴클레오타이드 중 임의의 하나의 치료적 유효량을 투여하는 단계를 포함하는, 대상체에서 질병을 치료 또는 예방하는 방법을 제공한다. 용어 "유효량" 또는 "치료적 유효량"은 결과를 달성하는 데, 예를 들어 유익하거나 원하는 결과를 달성하기에 충분한 제제의 양을 지칭한다. 치료적 유효량은 당업자에 의해 용이하게 결정될 수 있는 치료할 대상체 및 질병 상태, 대상체의 체중 및 연령, 질병 상태의 중증도, 투여 방식 등 중 하나 이상에 따라 달라질 수 있다. 특이적인 용량은 선택된 특정 제제, 따라야 할 투여 요법, 다른 화합물과의 병용 투여 여부, 투여 시기, 영상화할 조직 및 제제가 운반되는 물리적 전달 시스템 중 하나 이상에 따라 달라질 수 있다.

인핸서의 존재 하에 표적 단백질을 발현시키는 개시된 방법은 하기에 기재된 바와 같이 몇몇 장점을 갖는다. 일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현된 표적 단백질은 인핸서 단백질의 부재 하에 발현되는 표적 단백질보다 기능적으로 더 활성이다. 일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현되는 표적 단백질은 인핸서 단백질의 부재 하에 발현되는 표적 단백질보다 적어도 약 1.2배(예를 들어, 그 사이에 있는 모든 값과 하위 범위를 포함하여, 약 1.5배, 약 1.7배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 5.5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 20배, 또는 약 50배) 더 활성이다.

일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현된 표적 단백질은 인핸서 단백질의 부재 하에 발현된 표적 단백질과 비교하여 더 긴 지속 기간 동안 발현된다. 일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현되는 표적 단백질은 인핸서 단백질의 부재 하에 발현되는 표적 단백질과 비교하여 적어도 약 1시간(예를 들어, 약 12시간, 약 1일, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 1주, 약 2주, 약 3주, 약 1개월, 약 2개월, 약 6개월, 또는 약 1년) 더 오랫동안 발현된다.

일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현된 표적 단백질의 더 적은 비율은 인핸서 단백질의 부재 하에 발현되는 표적 단백질과 비교하여 바람직하지 않은 특성(예를 들어, 접힘 오류, 변경된 활성, 부정확한 번역 후 변형 및/또는 독성)을 나타낸다. 예를 들어, 일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현된 약 30% 미만(예를 들어, 그 사이에 있는 모든 값과 하위 범위를 포함하여, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 2% 미만, 또는 약 1% 미만)의 표적 단백질은 바람직하지 않은 특성을 나타낸다. 일부 실시형태에서, 본원에 개시된 조성물 또는 방법을 사용하여 인핸서 단백질의 존재 하에 발현된 표적 단백질의 더 높은 비율은 인핸서 단백질의 부재 하에 발현된 표적 단백질과 비교하여 정확한 접힘을 나타낸다.

일부 실시형태에서, 대상체에게 투여된 벡터 또는 표적 단백질을 인코딩하는 폴리뉴클레오타이드 및 인핸서 단백질의 치료적 유효량은 단지 표적 단백질을 인코딩하는 대조군 벡터 또는 대조군 폴리뉴클레오타이드의 치료적 유효량보다 적다. 이론에 구애됨이 없이, 인핸서 단백질의 존재 하에 발현될 시 표적 단백질의 향상된 발현 품질 및/또는 양 및/또는 더 긴 발현 기간으로 인해 벡터 또는 표적 단백질을 인코딩하는 폴리뉴클레오타이드 및 인핸서 단백질(대조군 벡터 또는 표적 단백질만을 인코딩하는 대조군 폴리뉴클레오타이드과 비교하여)의 더 적은 용량은 유사한 생물학적 효과를 이끌어내기에 충분하다고 여겨진다.

일부 실시형태에서, 벡터 또는 표적 단백질을 인코딩하는 폴리뉴클레오타이드 및 인핸서 단백질이 투여된 대상체는 벡터 또는 단지 표적 단백질을 인코딩하는 폴리뉴클레오타이드가 투여된 대조군 대상체와 비교하여 항-표적 단백질 항체의 생성이 감소된 것으로 나타난다. 이론에 구애됨이 없이, 또한 인핸서의 부재 하에 발현되는, 접힘이 잘 안되거나 접혀지지 않은 표적 단백질의 형성은 항-표적 단백질 항체의 생성을 촉진시키는 것으로 여겨진다. 반면에, 인핸서 단백질의 존재 하에 발현될 시 표적 단백질의 개선된 발현 품질 및/또는 양은 항표적 단백질 항체의 생성을 감소시킨다.

세포, 세포주, 숙주 세포

본 개시내용의 다른 양태는 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드 및/또는 벡터를 포함하는 세포에 관한 것이다. 폴리뉴클레오타이드, 벡터, 표적 단백질 및 인핸서 단백질은 본원에 기재된 것들 중 임의의 것일 수 있다.

일부 실시형태에서, 세포는 임의의 진핵 세포 또는 세포주이다. 개시된 폴리뉴클레오타이드, 벡터, 시스템 및 방법은 임의의 진핵 1차 세포 및 세포주에서 사용될 수 있다. 진핵 세포주는 인간 및 동물 세포주와 같은 포유동물 세포주를 포함할 수 있다. 진핵 세포주는 또한 곤충, 식물 또는 진균 세포주를 포함할 수 있다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비제한적 예는 Bc HROC277, COS, CHO(예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, 5P2/0-Ag14, HeLa, HEK293(예를 들어, HEK293-F, HEK293-H, HEK293-T) 및 perC6 세포뿐만 아니라 열대거세미나방(Spodoptera frugiperda)(Sf, 예를 들어 Sf9)와 같은 곤충 세포 또는 사카로미세스(Saccharomyces), 피키아(Pichia) 및 분열효모균(Schizosaccharomyces)과 같은 진균 세포를 포함한다.

일부 실시형태에서, 표적 단백질(들) 및 인핸서 단백질(들)을 발현하기 위한 세포 또는 세포주는 인간 세포 또는 세포주이다. 특정 양태에서, 인간 세포주의 선택은 예를 들어 표적 단백질에서 글리코실화, 인산화, 이황화 결합과 같은 번역 후 수정("PTM: post-translational modification")에 유익하다. 일부 실시형태에서, 인간 세포 또는 세포주는 인간 표적 단백질의 발현을 위해 사용된다.

일부 실시형태에서, 본 개시내용은 표적 단백질의 발현을 위한 진핵 세포로서, 세포는 인핸서 단백질을 인코딩하는 외인성 폴리뉴클레오타이드를 포함하는, 진핵 세포를 제공한다. 일부 실시형태에서, 인핸서 단백질을 인코딩하는 외인성 폴리뉴클레오타이드는 일시적으로 형질도입되고/되거나 세포의 게놈 내로 혼입되지 않는다. 일부 실시형태에서, 인핸서 단백질을 인코딩하는 외인성 폴리뉴클레오타이드는 안정적으로 혼입된다. 일부 실시형태에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다. 외인성 폴리뉴클레오타이드는 프로모터(선택적으로 천연 프로모터 또는 외인성 프로모터)에 작동가능하게 연결된다. 일부 실시형태에서, 폴리뉴클레오타이드는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된다. 일부 실시형태에서, 프로모터는 유도성 프로모터이다.

시험관 내 및 생체 외 방법

본 개시내용은 진핵 세포에서 목적 단백질을 발현시키는 방법을 제공한다. 방법은 표적 단백질을 인코딩하는 폴리뉴클레오타이드(프로모터에 작동가능하게 연결된 폴리뉴클레오타이드)를 진핵 세포 내로 도입하는 단계를 포함할 수 있다. 이 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 활용한다. 또한, 방법은 인핸서 단백질의 동시 발현을 활용하여 장기간에 걸쳐 표적 단백질의 발현을 연장한다. 일부 실시형태에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다.

일부 양태에서, 본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 세포의 사용을 통해 표적 단백질을 생성하는 방법에 관한 것이다. 일부 실시형태에서, 방법은 하나 이상의 벡터를 포함하는 진핵 세포에서 수행된다. 일부 실시형태에서, 방법은 전술한 섹션에 기재된 폴리뉴클레오타이드, 벡터 및 세포를 사용하여 수행된다. 일부 실시형태에서, 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 가질 수 있다. 일부 실시형태에서, 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 방법은 프로모터에 작동가능하게 연결된 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함할 수 있다. 일부 실시형태에서, 방법은 하나 이상의 DNA 분자를 사용한 진핵 세포의 형질감염, 단일 바이러스 벡터를 사용한 진핵 세포의 형질도입, 및/또는 2개 이상의 바이러스 벡터를 사용한 진핵 세포의 형질도입을 포함할 수 있다.

또한, 프로모터에 작동가능하게 연결된 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법이 제공된다. 일부 실시형태에서, 표적 단백질 발현의 방법은 본 개시내용의 벡터 시스템을 진핵 세포 내로 도입하는 단계를 포함한다. 일부 실시형태에서, 표적 단백질은 막 단백질이다. 일부 실시형태에서, 세포막에 대한 막 단백질의 국소화는 인핸서 단백질 없이 막 단백질이 발현될 때 관찰되는 국소화와 비교하여 증가된다.

생체 내 방법

본 개시내용은 생체 내에서 표적 단백질을 발현시키는 방법을 제공한다. 일부 실시형태에서, 방법은 표적 단백질을 인코딩하는 폴리뉴클레오타이드(프로모터에 작동가능하게 연결된 폴리뉴클레오타이드)를 대상체의 세포 내로 도입하는 단계를 포함한다. 이 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 활용한다. 일부 실시형태에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다.

일부 실시형태에서, 방법은 대상체에서 면역 반응을 이끌어낸다. 면역 반응은 본질적으로 면역원성일 뿐만 아니라 면역억제성 또는 면역조절성일 수 있다. 일부 실시형태에서, 방법은 대상체의 질병을 치료하며, 질병은 표적 단백질에 의해 유발되거나, 관련되거나, 연관된다. 일부 실시형태에서, 방법은 대상체의 질병을 치료하며, 대상체에서의 표적 단백질의 발현 수준은 대조군 대상체에서의 표적 단백질의 발현 수준보다 낮고, 대조군 대상체는 질병을 갖지 않는다.

일부 실시형태에서, 본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드의 사용을 통해 표적 단백질을 생성하는 방법에 관한 것이다. 일부 실시형태에서, 방법은 하나 이상의 벡터를 포함하는 생체 내에서 수행된다. 일부 실시형태에서, 방법은 전술한 섹션에 기재된 폴리뉴클레오타이드, 벡터 및 세포를 사용하여 수행된다. 일부 실시형태에서, 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 가질 수 있다. 일부 실시형태에서, 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 방법은 프로모터에 작동가능하게 연결된 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드를 대상체 내로 도입하는 단계를 포함할 수 있다. 일부 실시형태에서, 방법은 하나 이상의 DNA 분자, 단일 바이러스 벡터 및/또는 2개 이상의 바이러스 벡터를 주사하는 단계를 포함할 수 있다.

또한, 프로모터에 작동가능하게 연결된 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 생체 내 발현 방법이 제공된다. 일부 실시형태에서, 표적 단백질 발현의 방법은 본 개시내용의 벡터 시스템을 대상체 내로 도입하는 단계를 포함한다.

일부 실시형태에서, 표적 단백질 및 인핸서 단백질 DNA 작제물은 지질 나노입자(LNP: lipid nanoparticle)를 통해 전달된다. 일부 실시형태에서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함한다. 일부 실시형태에서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함한다. 일부 실시형태에서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함한다.

하류 적용

일부 실시형태에서, 본 조성물, 시스템 및 방법의 사용을 통해 생성된 표적 단백질은 치료제, 진단제 또는 연구 개발을 위해 사용된다. 예시적 적용은 백신, 효소 대체 요법, 호르몬 대체 요법, 항체 요법, 항바이러스 치료, 항미생물 치료, 면역조절제, 치료용 암 백신, 면역종양학 적용, 이중특이적 T 세포 관여제, 스크리닝 검정, 진단 검정, 임상 테스트 키트, 약물 발견, 항체 발견 등을 포함하지만, 이에 제한되지 않는다.

일부 실시형태에서, 본 조성물, 시스템 및 방법의 사용을 통해 생성된 표적 단백질 및 이러한 단백질을 발현하는 세포는 단리, 정제 및/또는 하류 적용을 위해 사용된다. 예시적인 적용은 소분자 스크리닝, 구조 결정(예를 들어, X선 결정학, 저온 전자 현미경 등), 활성 검정, 치료제, 효소 대체 요법, 스크리닝 분석, 진단 검정, 임상 테스트 키트, 약물 발견, 항체 발견 등을 포함되지만 이에 국한되지는 않는다. 일부 실시형태에서, 본 조성물 및 방법은 항체를 생성하거나 항체 스크리닝 검정을 위한 항원을 생성하는 데 사용된다. 일부 실시형태에서, 표적 단백질을 발현하는 세포는 예를 들어 전체 세포 시스템에서 세포 상호작용, 항체 결합 또는 소분자 영향을 스크리닝하기 위한 검정 시스템으로 사용될 수 있다.

일부 실시형태에서, 본 개시내용은 항체 발견을 위한 시스템 및 방법을 제공한다. 일부 실시형태에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질로 대상체를 면역화시키는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법을 제공한다. 다양한 실시형태에서, 면역화된 대상체는 마우스, 래트, 토끼, 인간이 아닌 영장류, 라마, 낙타, 또는 인간이다. 대상체로부터 단리된 세포는 단리된 세포로서 추가 라운드의 선택을 거치거나, 선택적으로 단리된 세포로부터 하이브리도마를 생성한 후에 추가 라운드의 선택을 거칠 수 있다. 유전자 클로닝 및/또는 서열분석을 사용하여 단리된 세포 또는 하이브리도마로부터 중쇄 및 경쇄를 인코딩하는 폴리뉴클레오타이드 서열(들)을 단리할 수 있다. 유전자 클로닝 및/또는 서열분석은 단일 세포 또는 세포 집단에 적용될 수 있다. 일부 실시형태에서, 본 개시내용의 조성물 및 방법은 대상체의 면역화에 이어 대상체로부터 혈청을 수확하여 다중클론 항체를 생성하는 데 사용된다.

본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 표지된 세포 또는 표적 단백질, 및 재조합 세포의 집단을 포함하는 용액으로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는, 용액을 제공하는 단계; 및 표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 검출함으로써 용액으로부터 하나 이상의 재조합 세포를 분류하는 단계를 포함하는, 세포 분류에 의한 항체 발견 방법을 추가로 제공한다. 다른 변형에서, 세포 분류는 면역화된 대상체로부터 유래된 세포에 대해 수행된다. 대상체는 본 개시내용의 방법에 따라 생산된 세포 또는 표적 단백질로, 또는 다른 적합한 면역원을 사용하여 면역화될 수 있다. 일부 실시형태에서, 재조합 세포는 나이브() 항체 라이브러리, 선택적으로 인간 나이브 항체 라이브러리를 포함한다. 다양한 항체 라이브러리 생성 방법이 당업계에 알려져 있으며 본 개시내용의 방법과 조합될 수 있다. 본원에 사용되는, 용어 "분류" 또는 "세포 분류"는 형광 활성화된 세포 분류, 자기 보조 세포 분류, 및 표지된 세포 집단과 표지되지 않은 세포 집단에서 표지된 세포를 선택하는 다른 수단을 지칭한다.

본 개시내용은 파지-디스플레이 라이브러리를 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질과 혼합하는 단계; 및 세포 또는 표적 단백질에 결합하는 파지-디스플레이 라이브러리의 구성원을 정제 및/또는 농축시키는 단계를 포함하는, 파지-디스플레이 라이브러리를 패닝하는 방법을 추가로 제공한다. 일부 실시형태에서, 파지-디스플레이 라이브러리는 단일쇄 가변 단편(scFv: single-chain variable fragment) 또는 다른 유형의 항체/항체 단편(Fab 등)의 집단을 발현한다.

추가 실시형태에서, 본 개시내용은 임의의 유형의 단백질 결합제를 스크리닝하는 방법을 제공한다. 본 개시내용의 세포 및 표적 단백질은 표적 단백질에 대한 결합 파트너를 확인하기 위해 약물 및 거대분자(단백질, 핵산 및 단백질:핵산 복합체)를 포함하는 다양한 유형의 분자 라이브러리를 스크리닝하는 데 사용될 수 있다. 다른 실시형태에서, 본 개시내용의 시스템 및 방법은 단일 웰, 여러 서열의 풀, 또는 유전자 서열의 라이브러리에서 표적 단백질의 라이브러리를 발현하는 데 사용된다.

높은 수율로 및/또는 세포 표면에 존재하는 천연 또는 질병 관련 형태의 항원을 발현하는 능력은 종래 기술 방법보다 항체, 항체 단편 및 다른 분자의 더 확실한 발견 및/또는 생성을 가능하게 한다. 이러한 항체, 항체 단편 및 다른 분자는 치료제 및/또는 연구 도구로서 또는 기타 응용 분야에 유용할 수 있다.

일부 실시형태에서, 본 개시내용의 시스템 및 방법은 표적 분자(예를 들어, 당단백질) 상의 특정 글리코실화 패턴에 결합하고/거나 이에 특이적인 항체의 발견에 사용하기에 적합하다. 일부 실시형태에서, 항체 라이브러리는 본래 글리코실화된 단백질에 대해 분류되고, 부적절하게 글리코실화된 또는 탈글리코실화된 동족 단백질에 대해 역분류(counter-sorted)된다. 유사하게 말하면, 탈글리코실화 효소를 사용함으로써 항체는 글리코실화화 패턴에 대해 특이적으로 분류될 수 있다. 추가 실시형태에서, 본 개시내용의 세포 및/또는 표적 단백질은 신규 항체 또는 다른 거대분자의 결합 및/또는 기능적 활성을 확인하는 데 사용된다.

일부 실시형태에서, 본 조성물, 시스템 및 방법의 사용을 통해 생성된 표적 단백질은 치료제, 진단제 또는 연구 개발을 위해 사용된다. 예시적 적용은 백신, 효소 대체 요법, 호르몬 대체 요법, 항체 요법, 항바이러스 치료, 항미생물 치료, 면역조절제, 치료용 암 백신, 이중특이적 T 세포 관여제, 스크리닝 검정, 진단 검정, 임상 테스트 키트, 약물 발견, 항체 발견 등을 포함하지만 이에 제한되지 않는다.

예시적인 장점

본 조성물, 시스템 및 방법은 수많은 장점을 가질 수 있다. 예를 들어, 실시예 11에서 나타낸 바와 같이, 일반적으로 세포사멸을 일으켜서 인간 세포주에서 과발현될 때 검출할 수 없는 수율을 생성하는 인간 NADase는 인핸서 단백질이 이 표적 단백질과 함께 발현 동시 발현되는 경우 20 mg/L 초과의 수율을 생성하도록 안정적으로 발현될 수 있다. 또한, 이 예시적인 방법을 통해 발현된 NADase는 기능적이며(인산염 방출 검증에 의해 나타낸 바와 같이) 낮은 배치 대 배치(batch to batch) 변화를 보여준다.

유사하게는, 일부 실시형태에서, 본 방법, 시스템 및 세포는 발현이 어려운 단백질의 확실한 발현을 위해 사용된다. 일부 실시형태에서, 본 개시내용은 낮은 배치 대 배치 변화를 갖는 단백질의 생성에 관한 것이다. 본 개시내용에 따라 생성된 단백질은 하기 개선 사항 중 하나 이상을 나타낼 수 있다: 정제 태그 융합 없는 정제; 개선된 기능적 활성; 확실한 생성; 일관된 활성; 및 치료 적용에 대한 적합성.

본 개시내용의 세포는 표적 단백질 발현의 측면에서 하기 장점 중 하나 이상을 가질 수 있다: 막 내 표적 막 단백질의 더 높은 농도; 더 느리거나 감소된 표적 단백질 분해; 전체 세포 검정에서 개선된 신호 대 잡음비; 하류 세포 대사에 영향을 주지 않고 표적 단백질 및/또는 인핸서 단백질 발현; 막 결합 막 단백질의 탈감작화에 대한 증가된 안정성; 및 더 높은 표적 단백질 수율. 실시예 1은 세포의 하류 대사에 영향을 주지 않고 인핸서 단백질 발현의 예시적인 예를 제공한다. 실시예 1에 예시된 GPCR은 천연 기질과 상호작용할 수 있었고 시험관 내에서 측정할 수 있는 활성화를 생성할 수 있었다.

본 시스템 및 방법은 일부 실시형태에서 하기 장점 중 하나 이상을 가질 수 있다: 임의의 진핵 세포 유형에 대한 적합성; 표적 단백질 발현 최적화에 대한 감소된 필요성; 및 발현이 어려운 단백질의 확실한 발현.

본원에 개시된 생체 내에서 표적 단백질을 발현시키는 방법은 당업계에서 이러한 목적을 위해 사용되는 표준 방법과 비교하여 우수한 특성을 갖는다. 예를 들어, 실시예에서 나타낸 바와 같이, 본원에 개시된 방법은 장기간에 걸쳐 표적 단백질의 안정적인 발현을 확보하고 동물 간의 발현 수준의 가변성을 감소시킨다. 이들 특성은 질병의 예방 및 치료에 본원에 개시된 방법의 적용을 가능하게 한다.

시스템

본 개시내용은 하나 이상의 벡터를 포함하는 진핵 세포에서 표적 단백질의 재조합 발현을 위한 시스템을 제공한다. 본 개시내용은 하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법을 추가로 제공하며, 하나 이상의 벡터는 a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및 b) 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며, 여기서: i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 ii) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되며, 여기서 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다. 벡터들(또는 벡터)은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 가질 수 있다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제일 수 있다. 일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV) ICP27 단백질 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택될 수 있다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결될 수 있다.

일부 실시형태에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 실시형태에서, NCT 억제제는 바이러스 단백질이다.

일부 실시형태에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된 NCT 억제제이다.

NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 이의 기능적 변이체일 수 있다. 일부 실시형태에서, NCT 억제제는 헤르페스 바이러스(HSV) ICP27 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, NCT 억제제는 랍도바이러스 매트릭스(M) 단백질 또는 이의 기능적 변이체이다.

일부 실시형태에서, 인핸서 단백질은 타일러 바이러스의 L 단백질 또는 이의 기능적 변이체인 L 단백질이다. 일부 실시형태에서, L 단백질은 서열번호 1과 적어도 90% 동일성을 공유할 수 있다.

일부 실시형태에서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 이의 기능적 변이체이다. 일부 실시형태에서, L 단백질은 서열번호 2와 적어도 90% 동일성을 공유할 수 있다.

시스템은 발현 카세트를 포함하는 단일 벡터를 포함할 수 있으며, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함한다. 일부 실시형태에서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함한다.

일부 실시형태에서, 발현 카세트는 리보솜 스키핑 부위를 인코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 인핸서 단백질을 인코딩하는 코딩 폴리뉴클레오타이드 및 표적 단백질은 리보솜 스키핑 부위에 의해 연결되고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 실시형태에서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 둘 다를 인코딩하는 단일 전령 RNA의 전사를 위해 구성되고; 여기서, 전령 RNA의 번역은 표적 단백질 및 인핸서 단백질(예를 들어, L 단백질)을 별개의 폴리펩타이드로서 발현시키는 결과를 가져온다.

시스템은 하나의 벡터를 포함할 수 있다. 일부 실시형태에서, 시스템은 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하는 단일 벡터를 포함할 수 있다.

시스템은 2개의 벡터를 포함할 수 있다. 일부 실시형태에서, 시스템은 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함할 수 있다.

일부 실시형태에서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 다는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된다.

일부 실시형태에서, 시스템에 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드 중 하나 또는 둘 다의 전사를 위해 구성된 T7 프로모터를 포함할 수 있다.

일부 실시형태에서, 시스템에 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다.

본 개시내용의 조성물 및 방법은 인핸서 단백질, 예를 들어, L 단백질과 동시 발현될 때 표적 단백질의 개선된 발현을 제공한다. 본원에 사용되는, "표적 단백질의 개선된 발현"은 표적 단백질에 비해 하기 중 하나 이상을 포함하지만 이에 제한되지는 않는다: 증가된 활성, 더 낮은 발현 수준, 증가된 발현 기간, 증가된 안정성, 세포 또는 대상체에서 증가된 검출 기간, 전달의 증가된 균일성, 감소된 분해, 및 감소된 EC₅₀.

일부 실시형태에서, 인핸서 단백질의 동시 발현은 세포 또는 대상체에서 표적 단백질의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시킨다.

일부 실시형태에서, 인핸서 단백질의 동시 발현은 표적 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 낮춘다.

일부 실시형태에서, 인핸서 단백질의 동시 발현은 활성 표적 단백질이 세포 또는 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시킨다.

변동 계수(CV%)는 표적 단백질 발현의 균일성의 척도로 제공되며, 진단 모이어티(예를 들어, 형광단 또는 방사성 표지) 신호의 표준 편차를 신호 평균으로 나눈 값으로 정의된다. 일부 실시형태에서, 인핸서 단백질의 동시 발현은 조직 또는 대상체에서 표적 단백질의 발현의 균일성을 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시킨다.

일부 실시형태에서, 인핸서 단백질의 동시 발현은 표적 단백질의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시킨다.

일부 실시형태에서, 인핸서 단백질의 동시 발현은 최대 반응의 50%(EC50)를 생성하는 데 효과적인 표적 단백질의 농도를 감소시킨다. 일부 실시형태에서, 표적 단백질은 아달리무맙이고 반응은 세포 또는 대상체에서 종양 괴사 인자-알파(TNF-알파)의 중화이다. 일부 실시형태에서, 아달리무맙의 EC50은 세포 또는 대상체에서 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소된다.

일부 실시형태에서, 인핸서 단백질 예를 들어, L 단백질의 아달리무맙 단백질과의 동시 발현은 하기로부터 선택된 질병의 치료를 개선시킨다: 류마티스 관절염, 청소년 특발성 관절염(JIA: Juvenile Idiopathic Arthritis), 건선성 관절염(PsA: Psoriatic Arthritis), 강직성 척추염(AS: Ankylosing Spondylitis), 크론병(CD: Crohn's Disease), 궤양성 대장염(CD: Ulcerative Colitis), 판상 건선(Ps: Plaque Psoriasis), 화농성 한선염(HS: Hidradenitis Suppurativa) 및 포도막염(UV: Uveitis). 일부 실시형태에서, 본원에 제공된 바와 같은 아달리무맙과 인핸서 단백질의 동시 발현은 앞서 언급된 질환의 치료를 인핸서 단백질의 동시 발현이 없는 아달리무맙 치료에 비해 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 개선시킨다.

일부 실시형태에서, 인핸서 단백질, 예를 들어 L 단백질의 동시 발현은 표적 단백질의 발현을 개선시키며, 여기서 표적 단백질은 아달리무맙, 펨브롤리주맙, 니볼루맙, 트라스투주맙, 베바시주맙, 우스테키누맙, 오크렐리주맙, 세쿠키누맙, 베돌리주맙, 이발리주맙, 니르세비맙, 아톨티비맙, 마프티비맙, 오데시비맙, 카시리비맙, 임데비맙, 및 브롤루시주맙을 포함하는(또한 표 8 참조) 군으로부터 선택되는 항체이다.

[표 8]

일부 실시형태에서, 인핸서 단백질, 예를 들어 L 단백질의 동시 발현은 표적 단백질의 발현을 개선시키며, 여기서 표적 단백질은 rFIX-Fc 응고 인자 IX, 탈리글루세라제, 아갈시다제 베타, 알글루코시다제 알파, 라로니다제, 이두설파제, HLA 클래스 I 알파 사슬(마우스 K2-D1) & B2m(마우스), Nlrc5(마우스), NLRC5(인간), scIL-12 (마우스), scIL-12(인간), 및 HLA 클래스 I 알파 사슬(인간) 및 B2M(인간)을 포함하는(또한 표 9 참조) 군으로부터 선택되는 혈액 단백질 또는 면역 종양학 단백질이다.

[표 9]

일부 실시형태에서, 인핸서 단백질, 예를 들어, L 단백질과 서열번호 191 내지 216의 폴리뉴클레오타이드의 세트와의 동시 발현은 표 8 또는 9로부터의 항체 또는 표적 단백질의 발현을 개선하는 데 사용될 수 있으며, 여기서 표적 단백질은 아달리무맙 대신에 발현된다.

일부 실시형태에서, 인핸서 단백질, 예를 들어, L 단백질과 서열번호 243 내지 272(AAV 벡터)의 폴리뉴클레오타이드의 세트와의 동시 발현은 표 8 또는 9로부터의 항체 또는 표적 단백질의 발현을 개선하는 데 사용될 수 있으며, 여기서 표적 단백질은 아달리무맙 대신에 발현된다.

예시적인 실시형태

실시형태 I

실시형태 I-1. 하나 이상의 벡터를 포함하는 진핵 세포에서 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는:

a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

b) 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며,

i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

ii) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV) ICP27 단백질 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되며,

제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

실시형태 I-2. 실시형태 I-1에 있어서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제인, 시스템.

실시형태 I-3. 실시형태 I-2에 있어서, NCT 억제제는 바이러스 단백질인, 시스템.

실시형태 I-4. 실시형태 1-1 내지 실시형태 1-3 중 어느 하나에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되는, 시스템.

실시형태 I-5. 실시형태 I-4에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-6. 실시형태 I-4에 있어서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 이의 기능적 변이체인, 시스템.

실시형태 I-7. 실시형태 I-4에 있어서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 이의 기능적 변이체인, 시스템.

실시형태 I-8. 실시형태 I-4에 있어서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-9. 실시형태 I-4에 있어서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-10. 실시형태 I-4에 있어서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-11. 실시형태 I-4에 있어서, NCT 억제제는 헤르페스 바이러스(HSV) ICP27 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-12. 실시형태 I-4에 있어서, NCT 억제제는 랍도바이러스 매트릭스(M) 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-13. 실시형태 I-5에 있어서, L 단백질은 타일러 바이러스의 L 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-14. 실시형태 I-5에 있어서, L 단백질은 서열번호 1과 적어도 90% 동일성을 공유하는, 시스템.

실시형태 I-15. 실시형태 I-5에 있어서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 이의 기능적 변이체인, 시스템.

실시형태 I-16. 실시형태 I-5에 있어서, L 단백질은 서열번호 2와 적어도 90% 동일성을 공유하는, 시스템.

실시형태 I-17. 실시형태 I-5에 있어서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 이의 기능적 변이체로 이루어진 군으로부터 선택되는, 시스템.

실시형태 I-18. 실시형태 I-1 내지 실시형태 I-17 중 어느 하나에 있어서, 시스템은 발현 카세트를 포함하는 단일 벡터를 포함하며, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는, 시스템.

실시형태 I-19. 실시형태 I-18에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 시스템.

실시형태 I-20. 실시형태 I-18에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 시스템.

실시형태 I-21. 실시형태 I-20에 있어서, 발현 카세트는 리보솜 스키핑 부위를 인코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결되는, 시스템.

실시형태 I-22. 실시형태 I-20에 있어서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 인핸서 단백질을 인코딩하는 코딩 폴리뉴클레오타이드 및 표적 단백질은 리보솜 스키핑 부위에 의해 연결되고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결되는, 시스템.

실시형태 I-23. 실시형태 I-18 내지 실시형태 I-22 중 어느 하나에 있어서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 둘 다를 인코딩하는 단일 전령 RNA의 전사를 위해 구성되고; 여기서, 전령 RNA의 번역은 표적 단백질 및 L 단백질을 별개의 폴리펩타이드로서 발현시키는 결과를 가져오는, 시스템.

실시형태 I-24. 실시형태 I-1 내지 실시형태 I-23 중 어느 하나에 있어서, 하나의 벡터를 포함하는 시스템.

실시형태 I-25. 실시형태 I-1 내지 I-17 중 어느 하나에 있어서,

a) 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및

b) 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함하는 시스템.

실시형태 I-26. 실시형태 I-1 내지 실시형태 I-17, 또는 실시형태 I-25 중 어느 하나에 있어서, 2개의 벡터를 포함하는 시스템.

실시형태 I-27. 실시형태 I-1 내지 실시형태 I-26 중 어느 하나에 있어서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 다는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결되는, 시스템.

실시형태 I-28. 실시형태 I-1 내지 실시형태 I-27 중 어느 하나에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드 중 하나 또는 둘 다의 전사를 위해 구성된 T7 프로모터를 포함하는, 시스템.

실시형태 I-29. 실시형태 I-1 내지 실시형태 I-28 중 어느 하나에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함하는, 시스템.

실시형태 I-30. 진핵 세포에서 목적 단백질의 재조합 발현을 위한 벡터로서:

a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

ii) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되고,

제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 적어도 하나의 프로모터에 작동가능하게 연결된다.

실시형태 I-31. 실시형태 I-30에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 벡터.

실시형태 I-32. 실시형태 I-30에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 벡터.

실시형태 I-32.1 실시형태 I-30에 있어서, 서열번호 100과 적어도 80% 동일성을 갖는 핵산 서열을 포함하는 벡터.

실시형태 I-32.2 실시형태 I-30에 있어서, 서열번호 132를 인코딩하는 폴리뉴클레오타이드 및/또는 서열번호 133을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터.

실시형태 I-32.3 실시형태 I-30에 있어서, 서열번호 134의 핵산 서열을 포함하는 폴리뉴클레오타이드 및/또는 서열번호 135를 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터.

실시형태 I-33. 인핸서 단백질을 인코딩하는 외인성 폴리뉴클레오타이드를 포함하는, 표적 단백질의 발현을 위한 진핵 세포로서:

a) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

b) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되고,

외인성 폴리뉴클레오타이드는 프로모터에 작동가능하게 연결되어 있는, 세포.

실시형태 I-34. 실시형태 I-33에 있어서, 폴리뉴클레오타이드는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결되는, 세포.

실시형태 I-35. 실시형태 I-33 또는 실시형태 I-34에 있어서, 프로모터는 유도성 프로모터인, 세포.

실시형태 I-36. 프로모터에 작동가능하게 연결된 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.

실시형태 I-37. 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 시스템 또는 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터를 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.

실시형태 I-38. 실시형태 I-36 또는 실시형태 I-37에 있어서, 표적 단백질은 막 단백질인, 방법.

실시형태 I-39. 실시형태 I-38에 있어서, 세포막에 대한 막 단백질의 국소화는 인핸서 단백질 없이 막 단백질이 발현될 때 관찰되는 국소화와 비교하여 증가되는, 방법.

실시형태 I-40. 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 시스템 또는 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터를 진핵 세포 내로 도입하여 생성된 세포.

실시형태 I-41. 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 시스템 또는 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터를 진핵 세포 내로 도입하여 발현된 표적 단백질.

실시형태 I-42. 프로모터에 작동가능하게 연결된, 표적 단백질을 인코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는, 진핵 세포에서 표적 단백질을 발현시키는 방법으로서,

방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 활용하며,

여기서,

a) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

b) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택된다.

실시형태 I-43. 실시형태 I-42에 있어서, 인핸서 단백질의 동시 발현은 프로모터에 작동가능하게 연결된 인핸서 단백질을 인코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는. 방법.

실시형태 I-44. 실시형태 I-42 또는 실시형태 I-43에 있어서, 도입하는 단계 또는 단계들은 하나 이상의 DNA 분자를 사용한 진핵 세포의 형질감염, 단일 바이러스 벡터를 사용한 진핵 세포의 형질도입, 및/또는 2개 이상의 바이러스 벡터를 사용한 진핵 세포의 형질도입을 포함하는, 방법.

실시형태 I-45. 표적 단백질은 가용성 단백질인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-46. 표적 단백질은 분비 단백질인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-47. 표적 단백질은 막 단백질인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-48. 표적 단백질은 도파민 수용체 1(DRD1)인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-49. 표적 단백질은 낭포성 섬유증 막횡단 전도 조절자(CFTR)인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-50. 표적 단백질은 C1 에스테라제 억제제(C1-Inh)인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-51. 표적 단백질은 IL2 유도성 T 세포 키나제(ITK)인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-52. 표적 단백질은 NADase인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 벡터 시스템, 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 또는 실시형태 I-36 내지 실시형태 I-44 중 어느 하나의 방법.

실시형태 I-53. 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 실시형태 I-40의 세포, 또는 실시형태 I-41의 표적 단백질로 대상체를 면역화시키는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법.

실시형태 I-54. 실시형태 I-53에 있어서, 표적 단백질에 특이적인 면역글로불린 단백질을 발현하는 하나 이상의 면역 세포를 단리하는 단계를 더 포함하는 방법.

실시형태 I-55. 실시형태 I-53 또는 실시형태 I-54에 있어서, 하나 이상의 면역 세포로부터 하나 이상의 하이브리도마를 생성하는 단계를 포함하는, 방법.

실시형태 I-56. 실시형태 I-53 내지 실시형태 I-55 중 어느 하나에 있어서, 하나 이상의 면역 세포로부터 하나 이상의 면역글로불린 유전자를 클로닝하는 단계를 포함하는, 방법.

실시형태 I-57. 세포 분류에 의한 항체 발견 방법으로서,

a) 세포 또는 표적 단백질은 표지되는, 실시형태 I-33 내지 실시형태 I-35 중 어느 하나의 세포, 실시형태 I-40의 세포, 또는 실시형태 I-41의 표적 단백질, 및

b) 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는 재조합 세포의 집단을 포함하는 단계; 및

표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 분류하여 용액으로부터 하나 이상의 재조합 세포를 분리하는 단계를 포함하는, 방법.

실시형태 I-58. 파지 디스플레이 라이브러리를 패닝하는 방법으로서,

a) 파지-디스플레이 라이브러리를 실시형태 I-33 내지 I-35 중 어느 하나의 세포, 실시 형태 I-40의 세포, 또는 실시 형태 I-41의 표적 단백질과 혼합하는 단계; 및

b) 세포 또는 표적 단백질에 결합하는 파지-디스플레이 라이브러리의 구성원을 정제 및/또는 농축하는 단계를 포함하는, 방법.

실시형태 I-59. 하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 하나 이상의 벡터는:

a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

실시형태 I-60. 실시형태 I-59에 있어서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제인, 방법.

실시형태 I-61. 실시형태 I-60에 있어서, NCT 억제제는 바이러스 단백질인, 방법.

실시형태 I-62. 실시형태 1-59 내지 실시형태 1-61 중 어느 하나에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되는, 방법.

실시형태 I-63. 실시형태 I-62에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-64. 실시형태 I-62에 있어서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 이의 기능적 변이체인, 방법.

실시형태 I-65. 실시형태 I-62에 있어서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 이의 기능적 변이체인, 방법.

실시형태 I-66. 실시형태 I-62에 있어서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-67. 실시형태 I-62에 있어서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-68. 실시형태 I-62에 있어서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-69. 실시형태 I-62에 있어서, NCT 억제제는 헤르페스 바이러스(HSV) ICP27 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-70. 실시형태 I-62에 있어서, NCT 억제제는 랍도바이러스 매트릭스(M) 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-71. 실시형태 I-63에 있어서, L 단백질은 타일러 바이러스의 L 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-72. 실시형태 I-63에 있어서, L 단백질은 서열번호 1과 적어도 90% 동일성을 공유하는, 방법.

실시형태 I-73. 실시형태 I-63에 있어서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 이의 기능적 변이체인, 방법.

실시형태 I-74. 실시형태 I-63에 있어서, L 단백질은 서열번호 2와 적어도 90% 동일성을 공유하는, 방법.

실시형태 I-75. 실시형태 I-63에 있어서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 이의 기능적 변이체로 이루어진 군으로부터 선택되는, 방법.

실시형태 I-76. 실시형태 I-59 내지 실시형태 I-75 중 어느 하나에 있어서, 시스템은 발현 카세트를 포함하는 단일 벡터를 포함하며, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는, 방법.

실시형태 I-77. 실시형태 I-76에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 방법.

실시형태 I-78. 실시형태 I-76에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 방법.

실시형태 I-79. 실시형태 I-78에 있어서, 발현 카세트는 리보솜 스키핑 부위를 인코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결되는, 방법.

실시형태 I-80. 실시형태 I-78에 있어서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 인핸서 단백질을 인코딩하는 코딩 폴리뉴클레오타이드 및 표적 단백질은 리보솜 스키핑 부위에 의해 연결되고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결되는, 방법.

실시형태 I-81. 실시형태 I-76 내지 실시형태 I-80 중 어느 하나에 있어서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 둘 다를 인코딩하는 단일 전령 RNA의 전사를 위해 구성되고; 여기서, 전령 RNA의 번역은 표적 단백질 및 L 단백질을 별개의 폴리펩타이드로서 발현시키는 결과를 가져오는, 방법.

실시형태 I-82. 실시형태 I-59 내지 실시형태 I-75 중 어느 하나에 있어서, 시스템은 하나의 벡터를 포함하는, 방법.

실시형태 I-83. 실시형태 I-59 내지 실시형태 I-75 중 어느 하나에 있어서, 시스템은

b) 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함하는, 방법.

실시형태 I-84. 실시형태 I-59 내지 실시형태 I-75 중 어느 하나에 있어서, 시스템은 2개의 벡터를 포함하는, 방법.

실시형태 I-85. 실시형태 I-59 내지 실시형태 I-84 중 어느 하나에 있어서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 다는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결되는, 방법.

실시형태 I-86. 실시형태 I-59 내지 실시형태 I-85 중 어느 하나에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드 중 하나 또는 둘 다의 전사를 위해 구성된 T7 프로모터를 포함하는, 방법.

실시형태 I-87. 실시형태 I-59 내지 실시형태 I-86 중 어느 하나에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함하는, 방법.

실시형태 I-88. 벡터를 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 벡터는:

a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

실시형태 I-89. 실시형태 I-88에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 방법.

실시형태 I-90. 실시형태 I-88에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 방법.

실시형태 I-91. 실시형태 I-59 내지 실시형태 I-90 중 어느 하나에 있어서, 표적 단백질은 치료 단백질인, 방법.

실시형태 I-92. 실시형태 I-59 내지 실시형태 I-91 중 어느 하나에 있어서, 표적 단백질은 면역원성 단백질인, 방법.

실시형태 I-93. 실시형태 I-59 내지 실시형태 I-92 중 어느 하나에 있어서, 표적 단백질은 항체, 나노바디, 수용체, 이중특이적 T 세포 관여제(BiTE), 성장 인자, 호르몬, 효소, 면역조절 단백질, 항원, 구조 단백질, 혈액 단백질, 항미생물 폴리펩타이드, 항바이러스 폴리펩타이드, 종양 억제인자, 전사 인자, 또는 번역 인자인, 방법.

실시형태 I-94. 실시형태 I-93에 있어서, 표적 단백질은 항체인, 방법.

실시형태 I-95. 실시형태 I-93에 있어서, 표적 단백질은 혈액 단백질인, 방법.

실시형태 I-96. 실시형태 I-59 내지 실시형태 I-95 중 어느 하나에 있어서, 방법은 대상체에서 면역 반응을 이끌어내는, 방법.

실시형태 I-97. 실시형태 I-59 내지 실시형태 I-96 중 어느 하나에 있어서, 방법은 대상체의 질병을 치료하며, 질병은 표적 단백질에 의해 유발되거나, 관련되거나, 연관되는, 방법.

실시형태 I-98. 실시형태 I-97에 있어서, 방법은 대상체의 질병을 치료하며, 대상체에서의 표적 단백질의 발현 수준은 대조군 대상체에서의 표적 단백질의 발현 수준보다 낮고, 대조군 대상체는 질병을 갖지 않는, 방법.

실시형태 I-99. 실시형태 I-59 내지 실시형태 I-98 중 어느 하나에 있어서, 표적 단백질은 압식시맙, 알렘투주맙, 알리로쿠맙, 아미반타맙, 아테졸리주맙, 아벨루맙, 바실릭시맙, 벨리무맙, 벤랄리주맙, 베바시주맙, 베즐로톡수맙, 블리나투모맙, 브렌툭시맙 베도틴, 브로달루맙, 브롤루시주맙, 부로수맙, 카나키누맙, 카플라시주맙, 카프로맙, 카투막소맙, 세미플리맙, 세르톨리주맙 페골, 세툭시맙, 크리잔리주맙, 다클리주맙, 다라투무맙, 데노수맙, 디누툭시맙, 두필루맙, 더발루맙, 에쿨리주맙, 엘로투주맙, 에마팔루맙, 에미시주맙, 엔포르투맙 베도틴, 엡티네주맙, 에레누맙, 에르투막소맙, 에타라시주맙, 에볼로쿠맙, 프레마네주맙, 갈카네주맙, 젬투주맙 오조가미신, 골리무맙, 구셀쿠맙, 이발리주맙, 이브리투모맙 티욱세탄, 이다루시주맙, 임시로맙, 인플릭시맙, 이노투주맙 오조가미신, 이필리무맙, 이사툭시맙, 이톨리주맙, 익세키주맙, 라나델루맙, 로키베트맙, 메폴리주맙, 모가물리주맙, 목세투모맙 파수도톡스, 나탈리주맙, 네시투무맙, 니모투주맙, 니볼루맙, 오빌톡사시맙, 오비누투주맙, 오크렐리주맙, 오파투무맙, 올라라투맙, 오말리주맙, 팔리비주맙, 파니투무맙, 펨브롤리주맙, 페르투주맙, 폴라투주맙 베도틴, 라코투모맙, 라무시루맙, 라니비주맙, 락시바쿠맙, 라불리주맙, 레슬리주맙, 리산키주맙, 리툭시맙, Rmab, 로모소주맙, 로벨리주맙, 루플리주맙, 사시투주맙 고비테칸, 사릴루맙, 세쿠키누맙, 실툭시맙, 탈케타맙, 테클리스타맙, 테프로투무맙, 틸드라키주맙, 토실리주맙, 토시투모맙, 트라스투주맙, 트라스투주맙 듀오카마진, 트라스투주맙 엠탄신, 우스테키누맙 및 베돌리주맙, 블리나투모맙, 에미시주맙, 솔리토맙, 애드넥틴, 안티칼린, 아비머, 피노머, 쿠니츠 도메인, 노틴, 아피바디, DARPin, 혈전용해제, 트랜스페린, t-PA, 히루딘, C1 에스테라제 억제제, 항트롬빈, 혈장 칼리크레인 억제제, 플라스민, 프로트롬빈 복합체, 보체 성분, 프리알부민(트랜스티레틴), 알파 1 항트립신, 알파-1-산 당단백질, 알파-1-태아단백질, 알파2-마크로글로불린, 감마 글로불린, 베타-2 마이크로글로불린, 합토글로빈, 세룰로플라스민, 보체 성분 3, 보체 성분 4, C 반응성 단백질(CRP), 지질단백질(킬로미크론, VLDL, LDL, HDL), 트랜스페린, 프로트롬빈, 만노스 결합 렉틴(MBL), 알부민, 글로불린, 피브리노겐, 조절 인자 및 응고 인자, 예를 들어, 인자 I, 인자 II, 인자 III, 인자 IV, 인자 V, 인자 VI, 인자 VII, 인자 IX, 인자 X, 인자 XI, 인자 XII, 인자 XIII, 폰 빌레브란트 인자, 프리칼리크레인, 피츠제럴드 인자, 피브로넥틴, 항트롬빈 III, 헤파린 보조 인자 II, 단백질 C, 단백질 S, 단백질 Z, 단백질 Z-관련 프로테아제 억제제, 플라스미노겐, 알파 2-항플라스민, 조직 플라스미노겐 활성화제, 유로키나제, 플라스미노겐 활성화제 억제제-1, 플라스미노겐 활성화제 억제제-2, 암 응혈원, EPO, IGF-1, G-CSF, GM-GCF, BMP-2, BMP-7, KGF, PDGF-BB, TMP, 아드레노메둘린(AM), 안지오포이에틴(Ang), 자가분비 운동성 인자, 골 형태형성 단백질(BMPs), 섬모 신경영양 인자 패밀리, 섬모 신경 영양 인자(CNTF), 백혈병 억제 인자(LIF), 인터류킨-6(IL-6), 집락 자극 인자, 대식세포 집락 자극 인자(M-CSF), 과립구 집락 자극 인자(G-CSF), 과립구 대식세포 집락 자극 인자(GM-CSF), 표피 성장 인자(EGF), 에프린스 - 에프린 A1, 에프린 A2, 에프린 A3, 에프린 A4, 에프린 A5, 에프린 B1, 에프린 B2, 에프린 B3, 에리스로포이에틴(EPO), 섬유아세포 성장인자(FGF) 1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23의 각각, 소 태아 성장 호르몬(FBS), 리간드의 GDNF 패밀리, 신경교세포주 유래 신경영양인자(GDNF), 뉴투린, 페르세핀, 아르테민, 성장 분화 인자-9(GDF9), 간세포 성장 인자(HGF), 간암 유래 성장 인자(HDGF), 인슐린, 인슐린 유사 성장 인자, 인슐린 유사 성장 인자-1(IGF-1), 인슐린 유사 성장 인자-2(IGF-2), 인터류킨-1(IL-1), IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, 각질세포 성장 인자(KGF), 이동 자극 인자(MSF), 간세포 성장 인자 유사 단백질(HGFLP)로도 알려진 대식세포 자극 단백질(MSP), 미오스타틴(GDF-8), 뉴레귤린 1(NRG1) 뉴레귤린 2(NRG2), 뉴레귤린 3(NRG3), 뉴레귤린 4(NRG4), 뉴로트로핀, 뇌유래 신경영양 인자(BDNF), 신경 성장 인자(NGF), 뉴로트로핀-3(NT-3), 뉴로트로핀-4(NT-4), 태반성장인자(PGF), 혈소판유래 성장 인자(PDGF), 레날라제(RNLS), T-세포 성장 인자(TCGF), 트롬보포이에틴(TPO), 형질전환 성장 인자 알파(TGF-α), 형질전환 성장 인자 베타(TGF-β), 혈관 내피 성장 인자(VEGF), Wnt 신호전달 경로, 글루카곤 유사 펩타이드-1, 인슐린, 인간 성장 호르몬, 난포 자극 호르몬, 칼시토닌, 루트로핀, 글루카곤 유사 펩타이드-2, 렙틴, 부갑상선 호르몬, 융모성 생식선 자극 호르몬, 갑상선 자극 호르몬 및 글루카곤, 알파-글리코시다제, 글루코세레브로시다제, 이두로네이트-2-황산염, 알파-갈락토시다제, 요산염 산화효소, N-아세틸-갈락토시다제, 카르복시펩티다제, 히알루로니다제, DNA 분해효소, 아스파라기나제, 요산분해효소, 아데노신 데아미나제 및 다른 엔테로키나제, 사이클라제, 카스파제, 카텝신, 산화환원효소, 전이효소, 가수분해효소, 분해효소, 이성질화효소 및 연결효소, 아갈시다제 베타, 아갈시다제 알파, 이미글루세라제, 탈리굴세라제 알파, 벨라글루세라제 알파, 알글루세라제, 세벨리파제 알파, 라로니다제, 이두설파제, 엘로설파제 알파, 갈설파제, 알글루코시다제 알파, C3 억제제, 헐러 및 헌터 교정 인자, 이온 채널, 간극 연접, 이온성 수용체, 수송체, 세포 표면 수용체, 도파민 수용체 1(DRD1), 낭포성 섬유증 막횡단 전도 조절자(CFTR), C1 에스테라제 억제제(C1-Inh), IL2 유도성 T 세포 키나제(ITK), 및 NADase로 이루어진 군으로부터 선택되는, 방법.

실시형태 I-100. 표적 단백질은 항체인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 시스템, 실시형태 I-30 내지 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 I-35 중 어느 하나의 진핵 세포, 실시형태 I-36 내지 I-39 중 어느 하나의 방법, 실시형태 I-40의 세포, 실시형태 I-41의 표적 단백질, 실시형태 I-42 내지 실시형태 I-44 중 어느 하나의 방법, 실시형태 I-45 내지 I-52 중 어느 하나의 벡터 시스템, 실시형태 I-53 내지 실시형태 I-93 및 실시형태 I-96 내지 실시형태 I-98 중 어느 하나의 방법.

실시형태 I-101. 표적 단백질은 아달리무맙인, 실시형태 I-1 내지 실시형태 I-29 중 어느 하나의 시스템, 실시형태 I-30 내지 I-32 중 어느 하나의 벡터, 실시형태 I-33 내지 I-35 중 어느 하나의 진핵 세포, 실시형태 I-36 내지 I-39 중 어느 하나의 방법, 실시형태 I-40의 세포, 실시형태 I-41의 표적 단백질, 실시형태 I-42 내지 실시형태 I-44 중 어느 하나의 방법, 실시형태 I-45 내지 I-52 중 어느 하나의 벡터 시스템, 실시형태 I-53 내지 실시형태 I-93 및 실시형태 I-96 내지 실시형태 I-98 중 어느 하나의 방법.

실시형태 I-102. 실시형태 I-101에 있어서, 아달리무맙의 중쇄는 서열번호 132의 아미노산 서열을 갖는, 시스템, 벡터, 벡터 시스템, 진핵 세포, 방법, 세포, 또는 표적 단백질.

실시형태 I-103. 실시형태 I-101 또는 실시형태 I-102에 있어서, 아달리무맙의 경쇄는 서열번호 133의 아미노산 서열을 갖는, 시스템, 벡터, 벡터 시스템, 진핵 세포, 방법, 세포, 또는 표적 단백질.

실시형태 I-104. 실시형태 I-101 내지 실시형태 I-103 중 어느 하나에 있어서, 아달리무맙의 중쇄는 서열번호 134의 핵산 서열에 의해 인코딩되는, 시스템, 벡터, 벡터 시스템, 진핵 세포, 방법, 세포, 또는 표적 단백질.

실시형태 I-105. 실시형태 I-101 내지 실시형태 I-104 중 어느 하나에 있어서, 아달리무맙의 경쇄는 서열번호 135의 핵산 서열에 의해 인코딩되는, 시스템, 벡터, 벡터 시스템, 진핵 세포, 방법, 세포, 또는 표적 단백질.

실시형태 I-106. 실시형태 I-88 내지 실시형태 I-99 중 어느 하나에 있어서, 인핸서 단백질은 표적 단백질의 활성을 증가시키는, 방법.

실시형태 I-107. 실시형태 I-88 내지 실시형태 I-99 및 실시형태 I-106 중 어느 하나에 있어서, 인핸서 단백질은 표적 단백질의 발현 수준을 낮추는, 방법.

실시형태 I-108. 실시형태 I-88 내지 실시형태 I-99 및 실시형태 I-106 및 실시형태 I-107 중 어느 하나에 있어서, 인핸서 단백질은 생체 내에서 표적 단백질의 발현의 균일성을 증가시키는, 방법.

실시형태 I-109. 실시형태 I-88 내지 실시형태 I-99 및 실시형태 I-106 및 실시형태 I-107 중 어느 하나에 있어서, 인핸서 단백질은 세포 또는 유기체에서 활성 표적 단백질의 지속 기간을 증가시키는, 방법.

실시형태 I-110. 실시형태 I-30 내지 실시형태 I-32 중 어느 하나의 벡터 및 하나 이상의 지질을 포함하는 지질 나노입자(LNP).

실시형태 I-111. 리더 단백질 및 아달리무맙 단백질을 인코딩하는 폴리뉴클레오타이드.

실시형태 I-112. 실시형태 I-111에 있어서, 폴리뉴클레오타이드는 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 리더 단백질을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-113. 실시형태 I-111 또는 실시형태 I-112에 있어서, 폴리뉴클레오타이드는 서열번호 124의 아달리무맙 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및 서열번호 129의 아달리무맙 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-114. 실시형태 I-111 내지 실시형태 I-113 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 세포 또는 대상체에서 아달리무맙 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 폴리뉴클레오타이드.

실시형태 I-120. 실시형태 I-111에 있어서, 폴리뉴클레오타이드는 서열번호 191 내지 216의 세트의 서열 또는 서열번호 217 내지 242의 세트의 서열을 포함하는, 폴리뉴클레오타이드.

실시형태 I-121. 실시형태 I-111의 폴리뉴클레오타이드를 포함하는 벡터.

실시형태 I-122. 실시형태 I-121에 있어서, 벡터는 아데노-관련 바이러스(AAV: Adeno-Associated Viral) 벡터인, 벡터.

실시형태 I-123. 실시형태 I-121의 전달 플라스미드 및 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는 시스템.

실시형태 I-124. 실시형태 I-120의 벡터를 포함하는 지질 나노입자(LNP).

실시형태 I-125. 실시형태 I-123에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-126. 실시형태 I-123에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-127. 실시형태 I-123에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, LNP.

실시형태 I-128. 실시형태 I-122의 시스템 및/또는 실시형태 I-123 내지 실시형태 I-126 중 어느 하나의 LNP를 전달하는 단계를 포함하는, 치료가 필요한 대상체를 치료하는 방법.

실시형태 I-129. 실시형태 I-127에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 I-130. 리더 단백질 및 글루코실세라미다제(GBA) 단백질을 인코딩하는 폴리뉴클레오타이드.

실시형태 I-131. 실시형태 I-130에 있어서, 폴리뉴클레오타이드는 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 리더 단백질을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-132. 실시형태 I-130 또는 실시형태 I-131에 있어서, 폴리뉴클레오타이드는 서열번호 406의 GBA 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-139. 실시형태 I-130의 폴리뉴클레오타이드를 포함하는 벡터.

실시형태 I-140. 실시형태 I-139에 있어서, 벡터는 아데노-관련 바이러스(AAV) 벡터인 벡터.

실시형태 I-141. 실시형태 I-140의 전달 플라스미드 및 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는 시스템.

실시형태 I-142. 실시형태 I-139의 벡터를 포함하는 지질 나노입자(LNP).

실시형태 I-143. 실시형태 I-142에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-144. 실시형태 I-142에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-145. 실시형태 I-142에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, LNP.

실시형태 I-146. 실시형태 I-141의 시스템 및/또는 실시형태 I-142 내지 실시형태 I-145 중 어느 하나의 LNP를 전달하는 단계를 포함하는, 치료가 필요한 대상체를 치료하는 방법.

실시형태 I-147. 실시형태 I-146에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 I-148. 리더 단백질 및 표적 단백질을 인코딩하는 폴리뉴클레오타이드.

실시형태 I-149. 실시형태 I-130에 있어서, 폴리뉴클레오타이드는 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 리더 단백질을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-150. 실시형태 I-130 또는 실시형태 I-131에 있어서, 폴리뉴클레오타이드는 서열번호 124, 129, 374 내지 405 및/또는 서열번호 406 내지 422 중 어느 하나의 표적 단백질 아미노산 서열, 및/또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 폴리뉴클레오타이드.

실시형태 I-157. 실시형태 I-130의 폴리뉴클레오타이드를 포함하는 벡터.

실시형태 I-158. 실시형태 I-139에 있어서, 벡터는 아데노-관련 바이러스(AAV) 벡터인 벡터.

실시형태 I-159. 실시형태 I-140의 전달 플라스미드 및 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는 시스템.

실시형태 I-160. 실시형태 I-139의 벡터를 포함하는 지질 나노입자(LNP).

실시형태 I-161. 실시형태 I-142에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-162. 실시형태 I-142에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, LNP.

실시형태 I-163. 실시형태 I-142에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, LNP.

실시형태 I-164. 실시형태 I-141의 시스템 및/또는 실시형태 I-142 내지 실시형태 I-145 중 어느 하나의 LNP를 전달하는 단계를 포함하는, 치료가 필요한 대상체를 치료하는 방법.

실시형태 I-165. 실시형태 I-146에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 II

실시형태 II-52. 하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 아달리무맙 단백질을 발현시키는 방법으로서, 하나 이상의 벡터는:

a) 아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;

아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 L 단백질을 인코딩하는 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 아달리무맙 단백질과 L 단백질은 동시 발현된다.

실시형태 II-53. 실시형태 I-52에 있어서, 제1 폴리뉴클레오타이드는 서열번호 124의 아달리무맙 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및 서열번호 129의 아달리무맙 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.

실시형태 II-54. 실시형태 II-52 및 실시형태 II-53 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 세포 또는 대상체에서 아달리무맙 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.

실시형태 II-55. 실시형태 II-52 내지 실시형태 II-54 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 대상체의 세포 또는 대상체에서 아달리무맙 단백질의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.

실시형태 II-56. 실시형태 II-52 내지 실시형태 II-55 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 아달리무맙 단백질이 대상체의 세포 또는 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.

실시형태 II-57. 실시형태 II-52 내지 실시형태 II-56 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 대상체의 조직 또는 대상체에서 표적 단백질의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.

실시형태 II-58. 실시형태 II-52 내지 실시형태 II-57 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 표적 단백질의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.

실시형태 II-59. 실시형태 II-52 내지 실시형태 II-58 중 어느 하나에 있어서, 리더 단백질과 아달리무맙 단백질의 동시 발현은 아달리무맙의 EC₅₀을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.

실시형태 II-60. 실시형태 II-52 내지 실시형태 II-59 중 어느 하나에 있어서, 벡터 시스템은 서열번호 191 내지 216의 세트의 폴리뉴클레오타이드 서열 또는 서열번호 217 내지 242의 세트의 서열을 포함하는, 방법.

실시형태 II-61. 실시형태 II-52 내지 실시형태 II-60 중 어느 하나에 있어서, 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.

실시형태 II-62. 실시형태 II-52 내지 실시형태 II-61 중 어느 하나에 있어서, 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.

실시형태 II-63. 실시형태 II-62에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-64. 실시형태 II-62에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-65. 실시형태 II-62에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.

실시형태 II-66. 실시형태 II-52 내지 실시형태 II-65 중 어느 하나에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 II-67. 하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 글루코실세라미다제(GBA) 단백질을 발현시키는 방법으로서, 하나 이상의 벡터는:

a) 글루코실세라미다제(GBA) 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

글루코실세라미다제(GBA) 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 L 단백질을 인코딩하는 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; GBA 단백질과 L 단백질은 동시 발현된다.

실시형태 II-68. 실시형태 II-67에 있어서, 제1 폴리뉴클레오타이드는 서열번호 406의 GBA 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.

실시형태 II-69. 실시형태 II-67 및 실시형태 II-68 중 어느 하나에 있어서, 리더 단백질과 GBA 단백질의 동시 발현은 대상체의 세포 또는 대상체에서 GBA 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.

실시형태 II-70. 실시형태 II-67 내지 실시형태 II-69 중 어느 하나에 있어서, 리더 단백질과 GBA 단백질의 동시 발현은 대상체의 세포 또는 대상체에서 GBA의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.

실시형태 II-71. 실시형태 II-67 내지 실시형태 II-70 중 어느 하나에 있어서, 리더 단백질과 GBA 단백질의 동시 발현은 GBA가 대상체의 세포 또는 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.

실시형태 II-72. 실시형태 II-67 내지 실시형태 II-71 중 어느 하나에 있어서, 인핸서 단백질의 동시 발현은 대상체의 조직 또는 대상체에서 GBA의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.

실시형태 II-73. 실시형태 II-67 내지 실시형태 II-72 중 어느 하나에 있어서, 리더 단백질과 GBA 단백질의 동시 발현은 GBA의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.

실시형태 II-74. 실시형태 II-67 내지 실시형태 II-73 중 어느 하나에 있어서, 리더 단백질과 GBA 단백질의 동시 발현은 최대 반응의 50%(EC₅₀)를 생성하는 데 효과적인 GBA의 농도를 감소시키는, 방법.

실시형태 II-75. 실시형태 II-67 내지 실시형태 II-74 중 어느 하나에 있어서, 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.

실시형태 II-76. 실시형태 II-67 내지 실시형태 II-75 중 어느 하나에 있어서, 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.

실시형태 II-77. 실시형태 II-76에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-78. 실시형태 II-76에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-79. 실시형태 II-76에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.

실시형태 II-80. 실시형태 II-67 내지 실시형태 II-79 중 어느 하나에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 II-81. 하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 하나 이상의 벡터는:

a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및

표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 L 단백질을 인코딩하는 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 표적 단백질과 L 단백질은 동시 발현된다.

실시형태 II-82. 실시형태 II-81에 있어서, 제1 폴리뉴클레오타이드는 표 8의 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및/또는 표 8의 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.

실시형태 II-83. 실시형태 II-81에 있어서, 제1 폴리뉴클레오타이드는 표 9의 단백질 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.

실시형태 II-84. 실시형태 II-81 내지 실시형태 II-83 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 세포 또는 대상체에서 표적 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.

실시형태 II-85. 실시형태 II-81 내지 실시형태 II-84 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 대상체의 세포 또는 대상체에서 표적 단백질의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.

실시형태 II-86. 실시형태 II-81 내지 실시형태 II-85 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 표적 단백질이 대상체의 세포 또는 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.

실시형태 II-87. 실시형태 II-81 내지 실시형태 II-85 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 대상체의 조직 또는 대상체에서 표적 단백질의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.

실시형태 II-88. 실시형태 II-81 내지 실시형태 II-87 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 표적 단백질의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.

실시형태 II-89. 실시형태 II-81 내지 실시형태 II-88 중 어느 하나에 있어서, 리더 단백질과 표적 단백질의 동시 발현은 표적의 EC₅₀을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.

실시형태 II-90. 실시형태 II-81 내지 실시형태 II-89 중 어느 하나에 있어서, 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.

실시형태 II-91. 실시형태 II-81 내지 실시형태 II-90 중 어느 하나에 있어서, 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.

실시형태 II-92. 실시형태 II-81 내지 실시형태 II-91 중 어느 하나에 있어서, LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-93. 실시형태 II-92에 있어서, LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.

실시형태 II-94. 실시형태 II-92에 있어서, LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.

실시형태 II-95. 실시형태 II-81 내지 실시형태 II-94 중 어느 하나에 있어서, 시스템은 근육내 또는 피하로 전달되는, 방법.

실시형태 II-96. 임의의 선행하는 실시형태에 따른 방법에 사용하기 위한 벡터 시스템.

실시예

시험관 내 연구를 위한 재료 및 방법

DNA 분자의 구성

모든 어셈블리는 높은 카피수 복제 원점(ColE1)을 제어하는 프로모터에 이어 터미네이터(rrnB T1 및 T2 터미네이터)를 포함하는 E. 콜라이(E. coli)에서 증식할 수 있는 플라스미드 백본으로 만들어졌다. 그 다음에는 제2 터미네이터(파지 람다로부터의 전사 터미네이터)에 의해 벡터의 나머지 부분으로부터 단리되는 항생제 내성 유전자를 제어하는 프로모터가 이어진다. 백본의 요소를 포함하는 유전자는 포스포라미다이트 화학으로 합성되었다.

플라스미드의 구성에 사용된 구조 유전자는 포스포라미다이트 화학, 화학에 의해 합성되고, 증폭 및 표 2에 나열된 프라이머를 사용하여 NEB HI-FI 또는 깁슨 어셈블리(Gibson Assembly)와 같은 등온 조립 반응을 사용하여 상기 기재된 벡터로 클로닝되었다. 이들 실시예에 사용된 예시적인 작제물에 포함된 선택된 아미노산 서열이 표 3에 제공되어 있다.

[표 2]

[표 3]

세포주 - 배양 및 형질감염

HEK293 세포는 인간 진핵 세포에서 본 시스템, 방법 및 조성물의 적용을 설명하기 위해 사용되었다. HEK293 부착 세포(CLS)를 10% 소 태아 혈청(Gibco) 및 50,000 U Pen 연쇄상 구균(Gibco)이 보충된 Dulbecco's Modified Eagle 배지 고포도당(Gibco)에서 배양하였다. HEK293 세포를 제조업체의 지침에 따라 293 펙틴(ThermoFisher)을 사용하여 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 80% 컨플루언시까지 성장시켰다. 0.5% 트립신 용액을 사용하여 37℃에서 5분 동안 세포를 탈착하고 긁어내어 48시간 후에 단백질 발현 세포를 수확하였다. 세포를 펠릿화하고(5,000 × g, 15분, 4℃) 상청액을 폐기하였다. 세포 펠릿은 추가 사용 시까지 -80℃에서 저장하였다.

CHO-K1 세포는 진핵 동물 세포에서 본 시스템, 방법 및 조성물의 적용을 설명하기 위해 사용된다. CHO-K1 부착 세포(CLS)를 10% 소 태아 혈청(Gibco)이 보충된 F-12K 배지(ATCC)에서 배양한다. CHO-K1 세포를 제조업체의 지침에 따라 리포펙타민 LTX(ThermoFisher)를 사용하여 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 80% 컨플루언시까지 성장시킨다. 0.5% 트립신 용액을 사용하여 37℃에서 5분 동안 세포를 탈착하고 긁어내어 48시간 후에 단백질 발현 세포를 수확한다. 세포를 펠릿화하고(5,000 × g, 15분, 4℃) 상청액을 폐기한다. 세포 펠릿은 추가 사용 시까지 -80℃에서 저장한다.

SF9 세포는 진핵 곤충 세포에서 본 시스템, 방법 및 조성물의 적용을 설명하기 위해 사용된다. SF9 현탁 세포(CLS)를 10% 소 태아 혈청(Gibco)이 보충된 Grace's 곤충 배지(ThermoFisher)에서 배양한다. SF9 세포를 제조업체의 지침에 따라 Cellfectin II(ThermoFisher)를 사용하여 일시적으로 형질감염시키기 전에 26℃ 및 130 rpm에서 성장시킨다. 단백질 발현 세포를 48시간(5,000 × g, 15분, 4℃) 후에 수확하고 상청액을 폐기한다. 세포 펠릿은 추가 사용 시까지 -80℃에서 저장한다.

실시예 1: GFP를 이용한 L 인핸서 단백질의 발현은 GFP 단백질의 과발현을 감소시켰다.

CMV 프로모터 시스템

발현 동안 바이러스 핵 기공 차단 단백질의 도입의 영향을 입증하기 위해, HEK293 세포를 EG1, EG2로 형질감염시키거나 EG3 및 EG4 작제물로 공동 형질감염시켰다(작제물 세부사항에 대해서는 표 2 및 도 2 참조). 바이러스 기공 차단 단백질의 발현은 단백질 발현의 제어된 조절을 가져오게 되었다. 결과적으로, 수득된 GFP 신호는 감소되었다. 기공 차단 단백질과 함께 관심 대상 유전자의 제어된 조절에 대한 이유는 바이러스 단백질의 작용 방식 때문이다. 이론에 구애됨이 없이, 단백질 조절에 대한 가능한 메커니즘은 기공 차단 단백질을 발현함으로써 mRNA의 핵 외 수송이 억제될 수 있고 결과적으로 표적 단백질의 번역이 하향조절된다는 것이다. 안정화된 후에는 기공 차단 단백질이 분해되고 mRNA 수송이 재개될 것이다. 이는 다시 표적 단백질과 인핸서 단백질, 예를 들어, 기공 차단 단백질 둘 다의 발현으로 이어진다. 이런 엄격하게 제어되는 피드백은 표적 단백질의 안정화 및 영구적인 발현을 확보하고 단백질 발현을 중단시키는 진핵 세포의 일반적인 조절을 방지한다.

도 3a 내지 도 3d는 본 개시내용에 따른 예시적인 인핸서 단백질로서 ECMV로부터의 L-단백질의 부재 및 존재 하에 GFP 발현에 대한 효과를 보여준다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG1 또는 EG2로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션하였다. GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 이 실시예는 본 개시내용에 따른 표적 단백질 폴리뉴클레오타이드 및 인핸서 단백질 폴리뉴클레오타이드를 포함하는 예시적인 시스템에서 표적 단백질 발현의 개선된 조절을 나타낸다.

T7 중합효소 시스템

EG2는 진핵 숙주의 천연 중합효소를 사용하는 반면, T7과 같은 다른 바이러스 중합효소는 핵 외부에서 전사를 개시하는 데 사용될 수 있다. 바이러스 중합효소는 표준 진핵 프로모터의 제어를 받으며 대응 mRNA는 핵 외 수송에 따라 달라질 것이다. 세포질에서 바이러스 중합효소는 번역된 다음 표적 단백질 폴리뉴클레오타이드와 인핸서 단백질 폴리뉴클레오타이드의 전사를 개시한다. 일부 실시형태에서, 인핸서 단백질의 발현의 결과로, 바이러스 중합효소의 핵 수송이 감소할 것이다. 시스템이 안정화되면 인핸서 단백질의 분해로 이어지고 바이러스 중합효소의 mRNA 수송이 재개될 것이다. 이론에 구애됨이 없이, 이러한 피드백은 재조합 단백질을 과발현하는 동안 세포의 일반적인 조절을 방지할 수 있다. 일부 상황에서, 바이러스 중합효소를 사용하면 진핵 중합효소를 사용하는 시스템과 비교하여 세포 대 세포 기준으로 더 높은 발현 수준을 얻을 수 있다는 장점이 있다.

도 4a 내지 도 4d는 T7 보유 벡터로 공동 형질감염될 때 T7 프로모터로부터의 ECMV로부터의 L 단백질과 함께 GFP의 성공적인 발현을 보여준다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG1 또는 EG3 및 EG4로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션하였다. GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 이 실시예는 표적 단백질로서 GFP 및 인핸서 단백질로서 ECMV의 L-단백질과 함께 예시적인 바이러스 중합효소로 T7을 성공적으로 사용했음을 나타낸다. 상기 실시예와 유사하게, L-단백질의 도입으로 인해 발현이 더욱 엄격하게 조절되어 과발현이 전반적으로 감소했다.

실시예 2: L 인핸서 단백질과 DRD1-GFP의 동시 발현은 DRD1 막 단백질의 발현 및 국소화를 개선시켰다.

DRD1은 고밀도의 활성 막 수용체를 생성하기 위해 인핸서 단백질로서 기공 차단 단백질과 조합하여 표적 단백질로서 막 단백질의 동시 발현에 개시된 시스템 및 방법의 적용을 설명하기 위해 사용되었다. DRD1은 G-단백질 결합 수용체이며 학술 표준(academic standards)으로는 표현하기 어려운 것으로 알려져 있다. 세포의 외막으로의 정확한 전위를 시각화하기 위해 DRD1-GFP 융합체(EG8)가 본 시스템에서 사용되었다. 학술 및 산업 환경에서 GPCR의 문제를 설명하기 위해 학술 표준(EG10)을 대조군으로 사용하였다.

개선된 막 단백질 발현 및 막 국소화

DRD1-GFP 융합체는 HEK293 세포에서 발현되었다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG10 또는 EG8로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션하였다. DRD1-GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다.

도 5a 내지 도 5d는 EG10이 발현된 수용체를 정확하게 전위시키지 못함을 나타낸다. 이론에 구애됨이 없이, EG10 작제물을 사용하여 인간 세포에서 인간 DRD1 수용체를 과발현한 결과, 세포는 발현된 표적 단백질을 분해하거나 제어하기 시작하는 것으로 여겨진다. 이러한 형태의 조절은 봉입체로서 변성된 단백질을 형성하게 된다(도 5b, 적색 화살표). 이러한 방식으로 세포에 의한 막 단백질의 발현을 제어하면 단백질이 비활성화되고 접힘 오류가 생겨서 결과적으로 사용할 수 없게 되고 품질이 떨어지는 단백질이 발현될 수 있다. 대조적으로, 예시적인 인핸서 단백질과 표적 막 단백질의 동시 발현은 정확하게 전위된 DRD1-GFP를 가져왔으며, 이는 막으로의 정확한 삽입 및 봉입체의 부재로 볼 수 있는 바와 같다(도 5c 및 도 5d). 이 실시예는 예시적인 표적 막 단백질(DRD1)과 연계하여 예시적인 인핸서 단백질(ECMV의 L-단백질)의 동시 발현이 막 단백질의 발현 및 국소화를 개선시켰다는 것을 나타낸다. 이론에 구애됨이 없이, 본 시스템은 표적 단백질 발현의 엄격한 조절을 생성함으로써 발현된 막 단백질을 분해하게 하는 세포의 정상적인 조절을 우회하는 것으로 여겨진다. 따라서, 본 시스템은 GPCR의 고수율 발현 및 정제에 적합하다.

목적 단백질과 인핸서 단백질의 분리된 발현

또한, 인핸서 단백질이 별도의 DNA 분자에 위치할 수 있음을 설명하기 위해 DRD1-GFP(EG10) 작제물을 별도의 벡터에서 별도의 프로모터의 제어 하에 ECMV(EG11)의 L 단백질과 함께 공동 발현된다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG10 및 EG11로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션한다. DRD1-GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링한다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석한다.

막 단백질의 기능적 활성

정확하게 전위된 GPCR의 예시 외에도 DRD1-Strep 융합체를 사용하여 활성 테스트를 수행하였다. 연쇄상 구균-태그가 작을수록 세포질에 위치한 G-단백질과의 정확한 상호작용이 손상되지 않고 기능적 분석이 수행될 수 있음을 보장한다. 도파민의 결합 시, DRD1은 이종삼량체 G-단백질을 이의 Gα 서브유닛과 이의 Gβγ 복합체로 방출한다. 휴면 상태에서, Gα는 GDP를 결합하지만 활성화 시 GTP를 GDP로 교환한다. Gα-GTP 복합체는 아데닐산 사이클라제(AC: adenylase cyclase)와 상호작용하여 AC 활성을 활성화하고 결과적으로 cAMP 수준을 증가시키게 된다. 세포내 cAMP의 변화는 표준 cAMP 검정으로 측정할 수 있다. 다시, 학계 및 산업 표준(EG5)을 ECMV의 L-단백질과 동시 발현하는 동일한 표적 단백질과 비교하였다.

DRD1-연쇄상 구균 융합체는 HEK293 세포에서 발현된다. HEK293 세포를 96 웰 백색 투명 바닥 플레이트에 5,000 세포/웰로 시딩하고 상기 기재된 바와 같이 EG5 또는 EG6으로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션한다. 단백질은 48시간 동안 발현되고 DRD1 활성은 제조업체의 지침에 따라 cAMP(glo) 검정(Promega)을 사용하여 분석된다. 상세하게는, 48시간 후 세포를 pH 7.2의 멸균 PBS 로 세척하고 세포를 37℃에서 1 mM 내지 1 μM 범위의 20 μl 도파민 기질 농도로 2시간 동안 인큐베이션한다. 유도되지 않은 대조군으로서 세포를 pH 7.2의 20 μl PBS 와 함께 인큐베이션한다. 인큐베이션 후, 세포를 pH 7.2의 PBS로 세척하고 20 μl 용해 완충액을 첨가한다. 진탕하면서 실온(RT)에서 15분 동안 용해를 수행한다. 이어서, 40 μl 검출 용액을 첨가하고 세포를 진탕시키면서 RT에서 20분 동안 인큐베이션한다. 분석 전 RT에서 15분 동안 인큐베이션된 80 μl 키나제-Glo 시약을 사용하여 반응을 중지한다. 플레이트 판독기(Synergy LX(BioTek))를 사용하여 발광을 측정하고 표준 분석 프로그램을 사용하여 데이터를 분석한다.

실시예 3: 핵 외부에서 DRD1-GFP 및 L 인핸서 단백질 작제물의 전사를 개시하는 데 성공적으로 사용되는 T7 바이러스 프로모터.

이 실시예를 위해, DRD1-GFP는 T7 프로모터와 조합하여 표적 막 단백질을 발현하기 어려운 예시로 선택되어 T7과 같은 바이러스 중합효소가 핵 외부에서 전사를 시작하는 데 사용될 수 있음을 보여준다. 실시예 1에서와 같이, 바이러스 중합효소는 표준 진핵 프로모터의 제어를 받았으며 대응 mRNA는 핵 외 수송에 의존하였다.

도 6a 및 도 6b는 T7 보유 벡터로 공동 형질감염될 때 T7 프로모터로부터의 ECMV로부터의 L 단백질과 함께 DRD1-GFP의 성공적인 발현을 보여준다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG10 또는 EG12 및 EG4로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션하였다. DRD1-GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 이 실시예는 표적 단백질로서 DRD1-GFP 및 인핸서 단백질로서 ECMV의 L-단백질과 함께 바이러스 중합효소로 T7을 성공적으로 사용했음을 나타낸다.

실시예 4: DRD1-GFP 및 L 인핸서 단백질의 발현은 상이한 포유동물 프로모터와 상용성이다.

본 개시내용에 따른 시스템, 방법 및 조성물은 매우 다양한 포유동물 프로모터와 상용성이다. 표적 단백질과 상이한 프로모터로부터의 인핸서 단백질의 동시 발현의 상용성을 보여주기 위해, DRD1-GFP가 예시적인 표적 단백질로 사용되었다. 실시예 2에 기재된 바와 같이, DRD1-GFP의 정확한 발현 및 전위를 형광 현미경을 통해 용이하게 검출할 수 있다. CMV 프로모터(EG10) 외에 EF1-α(EG22) 및 SV40(EG23)이 사용된 다음 동일한 DRD1-GFP IRES L 어셈블리가 사용된다.

상이한 포유동물 프로모터의 제어 하에 있는 DRD1-GFP 융합체는 HEK293 세포에서 발현된다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG8, EG22 또는 EG23으로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션한다. DRD1-GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링한다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석한다.

실시예 5: 테스트된 임의의 L 인핸서 단백질을 사용하여 DRD1-GFP 발현 및 국소화를 성공적으로 향상시킬 수 있다.

이론에 구애됨이 없이, 재조합적으로 삽입된 표적 단백질 폴리뉴클레오타이의 발현을 조절하는 데 사용될 수 있는 한 가지 메커니즘은 기공 차단 단백질의 도입이다. 천연 또는 합성 기공 차단 단백질이 본 시스템의 한 실시형태에서 세포 조절 제어의 이점을 유지하면서 서로 교환될 수 있음을 보여주기 위해, ECMV(EG10)의 리더 단백질, 타일러 바이러스(EG19)의 리더 단백질, 폴리오바이러스(EG21)의 2A 프로테아제 및 수포성 구내염 바이러스(EG20)의 M 단백질을 예시적인 표적 단백질로 DRD1-GFP와 함께 클로닝하였다. 실시예 2에 기재된 바와 같이, DRD1-GFP의 정확한 발현 및 전위를 형광 현미경을 통해 용이하게 검출할 수 있다.

상이한 인핸서 단백질과 함께 DRD1-GFP 융합체가 HEK293 세포에서 발현된다. HEK293 세포를 24웰 플레이트에 0.05 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG8, EG19, EG20 또는 EG21로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션한다. DRD1-GFP 발현을 형광 현미경을 사용하여 24시간 및 48시간 후에 모니터링한다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석한다.

실시예 6: L 인핸서 단백질의 발현은 낭포성 섬유증 막횡단 전도 조절인자(CFTR)의 발현을 개선시킨다.

CFTR은 인핸서 단백질로서 기공 차단 단백질과 조합하여 표적 단백질로서 막 단백질의 동시 발현이 고밀도 활성 이온 채널을 생성한다는 것을 보여주기 위한 추가적인 실시예로 사용되었다. CFTR은 상피 세포막을 가로질러 염화물 이온을 전도하는 ABC-수송체 클래스의 막횡단 수송체이다. CFTR은 학술 표준을 사용할 때 이질적으로 표현되는 것으로 알려져 있다. 이질성은 ABC 수송체를 정제하거나 분석하는 데 어려움을 증가시킨다. 균질성의 개선을 보여주기 위해, CFTR을 예시적인 시스템(EG25)의 백본에 클로닝하거나 PCR 생성물로 사용하였다. 비교로서, 학술 표준(EG24)을 대조군으로 함께 사용하였다.

CFTR 작제물은 HEK293 세포에서 발현되었다. HEK293 세포를 6웰 플레이트에 0.3 × 10⁶ 세포/웰로 시딩하고 상기 기재된 바와 같이 EG25, EG25의 PCR 생성물, 또는 EG24로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션하였다. GFTR 발현을 현미경을 사용하여 24시간 및 48시간 후에 모니터링하였다. 세포를 수확하고 RIPA 완충액(CellGene)을 사용하여 48시간 후에 용해시켰다. 용해물을 제거하고 SDS-PAGE(6-12% BOLT, ThermoFisher)에 이어 항-CFTR(Abcam, 2^nd 항-마우스-hrp)을 사용하여 웨스턴 블롯(NC 멤브레인, ThermoFisher)으로 분석하였다.

도 6은 L-단백질과 CFTR의 동시 발현의 영향을 보여준다. 학술 표준은 웨스턴 블롯에서 넓은 밴드를 생성한 반면, EG25 작제물을 기반으로 한 전사 및 번역은 ABC-수송체의 매우 동질적인 발현을 보여주는 정의된 밴드를 생성하게 되었다. 또한, 이 실시예는 발현 시스템이 벡터로서 또는 PCR 생성물로서 세포 내로 전달될 수 있음을 보여준다.

실시예 7: 번역 후 수정이 필요한 예시적인 단백질로서 사용되는 C1 에스테라제 억제제(C1-Inh) 단백질의 생성.

C1-Inh는 발현이 어려운 분비 단백질에 대한 개시된 시스템의 적용을 예시하기 위한 예시적인 표적 단백질로서 사용되어 정확한 번역 후 수정을 생성한다. C1-Inh는 세르핀 수퍼패밀리(serpin superfamily)에 속하는 프로테아제 억제제이다. 분비된 단백질로서 C1-Inh는 고도로 글리코실화되어 있으므로 재조합 발현을 위한 어려운 표적이라는 증거가 된다. 시스템이 정확하게 글리코실화된 C1-Inh를 높은 수율로 생산할 수 있음을 보여주기 위해, C1-Inh-his 융합체가 제시된 시스템(EG16)을 사용하여 발현된다. 비교로서, 학술 및 산업 표준(EG15)이 함께 사용된다.

C1-Inh-his 융합체는 HEK293 세포에서 발현된다. HEK293 세포를 T175 플라스크에 4.9 × 10⁶ 세포로 시딩하고 상기 기재된 바와 같이 EG15 또는 EG16으로 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 밤새 인큐베이션한다. C1-Inh-his 발현을 현미경을 사용하여 24시간 및 48시간 후에 모니터링한다. 상청액 함유 단백질은 48시간 후에 수집되고 상청액은 여과(22 um, 니트로셀룰로오스)에 의해 제거된다. C1-Inh를 정제하기 위해, His-수지(GE Healthcare HisTrap)를 상층액에 첨가하기 전에 pH 7.5의 20 mM Tris, 50 mM NaCl로 평형화한다. 상등액을 진탕시키면서 4℃에서 2시간 동안 수지와 함께 인큐베이션한다. 수지를 침전시키고 pH 7.5의 5 CV 20 mM Tris, 50 mM NaCl로 세척하고 단백질을 pH 7.5의 3 CV 20 mM, 50 mM NaCl, 500 mM 이미다졸로 용출하였다. 정제는 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석하고 단백질 함유 분획을 모으고 농축한다. 단백질은 크기 배제 크로마토그래피(SEC: size-exclusion chromatography)(Superdex 200, ThermoFisher)로 추가로 연마되고 분획은 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석된다. 단백질 함유 분획을 모아 글리코실화 패턴 및 서열 분석에 관한 분석을 위해 보낸다.

실시예 8: 용해되기 어려운 예시적인 단백질로 사용되는 IL2 유도성 T 세포 키나제(ITK)의 생성.

ITK는 발현이 어려운 가용성 단백질에 대한 개시된 시스템의 적용을 예시하기 위한 예시적인 표적 단백질로서 사용되었다. ITK는 키나제의 TEC 패밀리의 구성원이며 T 세포에서 T 세포 증식 및 분화에 역할을 하는 것으로 여겨진다. 또한, ITK는 배치(batch) 간 효소 활성의 일관성과 본원에 개시된 방법의 확장성을 보여주는 데 사용되었다. ITK는 3 × 10 ml, 100 ml 및 1000 ml 성장 배지에서 발현되었다. 또한, ITK-L-his 단백질 융합 작제물(EG9)을 사용하여 조절을 제어하는 능력을 잃지 않으면서 인핸서 단백질이 재조합적으로 발현된 표적 단백질에 융합될 수 있음을 보여준다. ITK-his 융합체는 제시된 시스템(EG17)과 학술 및 산업 표준(EG18)에서 비교로 표현되었다.

ITK-his 및 ITK-L-his 융합체는 HEK293 세포에서 발현되었다. HEK293 세포를 10 ml, 100 ml 또는 1000 ml Expi293 배지에 2 × 10⁶ 세포/ml로 시딩하고 상기 기재된 바와 같이 EG9, EG17 또는 EG18로 일시적으로 형질감염시키기 전에 37℃, 120 rpm 및 5% CO₂에서 밤새 인큐베이션하였다. 세포를 48시간(5,000 × g, 15분, 4℃) 후에 수확하였으며, 세포 펠릿을 추가 사용 시까지 -80℃에서 저장하였다. ITK를 정제하기 위해, 세포를 용해 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂, 프로테아제 억제제, DNAse)에 재현탁하고 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭) 및 조세포 추출물을 제거하였다(100,000 × g, 45분, 4℃). His-수지(GE Healthcare HisTrap)를 제거된 용해물에 첨가하기 전에 세척 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂)으로 평형화하였다. 용해물을 진탕하면서 4℃에서 2시간 동안 수지와 함께 인큐베이션하였다. 수지를 침전시키고 5 CV 세척 완충액으로 세척하고 단백질을 3 CV 용출 완충액(세척 완충액 + 300 mM 이미다졸)으로 용출시켰다.

정제는 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석되었다. 도 9a는 ITK의 His-tag 정제의 SDS-PAGE 결과를 보여준다. 왼쪽에서 오른쪽으로, 레인은 단백질 사다리(Seeblue2 + 사전염색), 500 ng GFP, 2 μg ITK, 5 μg ITK 및 10 μg ITK를 보여준다. 그런 다음 SDS-PAGE 겔을 비(non)-환원 웨스턴 블롯으로 분석하였다. 단백질을 니트로셀룰로오스 막으로 옮기고 1차 마우스-항-His 항체 및 2차 항-마우스-HRP 항체와 결합한 후 NBT/BCIP 용액을 사용하여 시각화하였다. 도 9b는 화살표로 표시된 ITK 단백질 단량체 및 이량체를 사용한, 웨스턴 블롯 분석의 결과를 보여준다.

SDS-PAGE 분석 후, 단백질 함유 분획을 모아서 농축한다. 단백질은 크기 배제 크로마토그래피(SEC)(Superdex 200, ThermoFisher)로 추가로 정제되고 분획은 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석된다. 단백질 함유 분획을 모아 인산화 패턴 및 서열 분석에 관한 분석을 위해 보낸다.

ITK 활성은 제조업체의 지침에 따라 ADP-Glo 키나제 분석(Promega)을 사용하여 분석한다. E4Y1을 ITK 기질로 사용한다. ITK 농도는 0.1 내지 500 ng 범위에서 다양하다. 재조합적으로 발현된 ITK의 품질을 표준 이용 가능한 ITK와 비교하기 위해, ITK 키나제 효소 시스템(Promega)을 사용한다. ITK, 기질 및 ATP는 세척 완충액에서 작업 농도로 희석된다. ITK를 기질 및 ATP와 혼합하고 실온(RT)에서 60분 동안 인큐베이션한다. ADP-Glo 시약을 첨가하고 반응을 RT에서 40분 동안 인큐베이션한다. 키나제 검출 시약을 첨가하여 반응을 중단하고 RT에서 30분 동안 인큐베이션한다. 플레이트 판독기(Synergy LX(BioTek))를 사용하여 발광을 측정하고 표준 분석 프로그램을 사용하여 데이터를 분석한다.

실시예 9: IL2 유도성 T 세포 키나제(ITK)의 생성은 CHO-K1 세포와 상용성이었다.

다른 진핵 세포주와 본 시스템의 실시형태의 상용성을 보여주기 위해, HEK293 대신 CHO 세포를 사용하여 실시예 7의 실험을 반복한다. ITK-his는 제시된 시스템(EG17) 또는 산업 및 학술 표준(EG18)에서 발현된다.

ITK-his 융합체는 CHO-K1 세포에서 발현된다. CHO-K1 세포를 2 × 10⁶ 세포/ml 100 ml로 시딩하고 상기 기재된 바와 같이 EG17 또는 EG18로 일시적으로 형질감염시키기 전에 37℃, 120 rpm 및 5% CO₂에서 밤새 인큐베이션하였다. 세포를 48시간(5,000 × g, 15분, 4℃) 후에 수확하였으며, 세포 펠릿을 추가 사용 시까지 -80℃에서 저장한다. ITK를 정제하기 위해, 세포를 용해 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂, 프로테아제 억제제, DNAse)에 재현탁하고 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭) 및 조세포 추출물을 제거한다(100,000 × g, 45분, 4℃). His-수지(GE Healthcare HisTrap)를 제거된 용해물에 첨가하기 전에 세척 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂)으로 평형화한다. 용해물을 진탕하면서 4℃에서 2시간 동안 수지와 함께 인큐베이션한다. 수지를 침전시키고 5 CV 세척 완충액으로 세척하고 단백질을 3 CV 용출 완충액(세척 완충액 + 300 mM 이미다졸)으로 용출시켰다. 정제는 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석하고 단백질 함유 분획을 모으고 농축한다. 단백질은 크기 배제 크로마토그래피(SEC)(Superdex 200, ThermoFisher)로 추가로 연마되고 분획은 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석되었다. 단백질 함유 분획을 모아 인산화 패턴 및 서열 분석에 관한 분석을 위해 보낸다.

실시예 10: IL2 유도성 T 세포 키나제(ITK)의 생성은 Sf9 세포와 상용성이었다.

다른 진핵 세포주와 본 시스템의 상용성을 보여주기 위해, HEK293 대신 Sf9 세포를 사용하여 실시예 7의 실험을 반복한다. ITK-his는 제시된 시스템(EG17) 또는 산업 및 학술 표준(EG18)에서 발현된다.

ITK-his 융합체는 CHO-K1 세포에서 발현된다. CHO-K1 세포를 2 × 10⁶ 세포/ml 100 ml로 시딩하고 상기 기재된 바와 같이 EG17 또는 EG18로 일시적으로 형질감염시키기 전에 26℃ 및 130 rpm에서 밤새 인큐베이션한다. 세포를 48시간(5,000 × g, 15분, 4℃) 후에 수확하였으며, 세포 펠릿을 추가 사용 시까지 -80℃에서 저장한다. ITK를 정제하기 위해, 세포를 용해 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂, 프로테아제 억제제, DNAse)에 재현탁하고 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭) 및 조세포 추출물을 제거한다(100,000 × g, 45분, 4℃). His-수지(GE Healthcare HisTrap)를 제거된 용해물에 첨가하기 전에 세척 완충액(40 mM Tris,7.5; 20 mM MgCl₂; 0.1 mg/ml BSA; 50 μM DTT; 및 2 mM MnCl₂)으로 평형화한다. 용해물을 진탕하면서 4℃에서 2시간 동안 수지와 함께 인큐베이션한다. 수지를 침전시키고 5 CV 세척 완충액으로 세척하고 단백질을 3 CV 용출 완충액(세척 완충액 + 300 mM 이미다졸)으로 용출시켰다. 정제는 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석하고 단백질 함유 분획을 모으고 농축한다. 단백질은 크기 배제 크로마토그래피(SEC: size-exclusion chromatography)(Superdex 200, ThermoFisher)로 추가로 연마되고 분획은 SDS-PAGE(6-12% BOLT, ThermoFisher)로 분석된다. 단백질 함유 분획을 모아 인산화 패턴 및 서열 분석의 분석을 위해 보낸다.

실시예 11: 생체 내 연구의 재료 및 방법

DNA 분자의 구성

모든 어셈블리는 높은 카피수 복제 원점(ColE1)을 제어하는 프로모터에 이어 터미네이터(rrnB T1 및 T2 터미네이터)를 포함하는 E. 콜라이에서 증식할 수 있는 플라스미드 백본으로 만들어졌다. 그 다음에는 제2 터미네이터(파지 람다로부터의 전사 터미네이터)에 의해 벡터의 나머지 부분으로부터 단리되는 항생제 내성 유전자를 제어하는 프로모터가 이어진다. 백본의 요소를 포함하는 유전자는 포스포라미다이트 화학으로 합성되었다.

플라스미드의 구성에 사용된 구조 유전자는 포스포라미다이트 화학에 의해 합성되었고, 3' 영역에 대해서는 GATG, 5' 영역에 대해서는 TAAG에 대한 어셈블리 부위를 갖는 Esp3I 제한을 통해 제한 분해 및 골든 게이트 어셈블리를 사용하여 상기 기재된 벡터에 클로닝되었다. 도 10 참조.

도 10a에 도시된 작제물을 3'에 대한 어셈블리 부위 GATG 및 5'에 대한 어셈블리 부위 TAAG를 갖는 ESP3I를 사용하여 합성되고 pVax1의 적응된 버전으로 클로닝되어 도 10b에 도시된 플라스미드를 수득하였다.

도 10c에 도시된 작제물을 3'에 대한 어셈블리 부위 GATG 및 5'에 대한 어셈블리 부위 TAAG를 갖는 ESP3I를 사용하여 합성되고 pVax1의 적응된 버전으로 클로닝되어 도 13d에 도시된 플라스미드를 수득하였다.

[표 7]

세포주 - 배양 및 형질감염

HEK293 세포는 동물에 주사하기 전에 시험관 내에서 작제물을 검증하는 데 사용되었다. HEK293 부착 세포(CLS)를 10% 소 태아 혈청(Gibco) 및 50,000 U Pen 연쇄상 구균(Gibco)이 보충된 Dulbecco's Modified Eagle 배지 고포도당(Gibco)에서 배양하였다. HEK293 세포를 제조업체의 지침에 따라 293 펙틴(ThermoFisher)을 사용하여 일시적으로 형질감염시키기 전에 37℃ 및 5% CO₂에서 80% 컨플루언시까지 성장시켰다. 0.5% 트립신 용액을 사용하여 37℃에서 5분 동안 세포를 탈착하고 긁어내어 48시간 후에 단백질 발현 세포를 수확하였다. 세포를 펠릿화하고(5,000 × g, 15분, 4℃) 상청액을 폐기하였다. 세포 펠릿은 추가 사용 시까지 -80℃에서 저장하였다.

HEK293 현탁액 적응된 세포를 Expi293 무혈청 배지(Gibco)에서 배양하였다. HEK293 세포를 제조업체의 지침에 따라 ExpiFectamin 293(Gibco)을 사용하여 일시적으로 형질감염시키기 전에 37℃, 5% CO₂ 및 120 rpm에서 3.0 × 10^6 세포/ml로 시딩하였다. 실시예에 따라, 단백질 발현을 위해 세포를 펠렛화(5,000 × g, 15분, 4℃)하여 48시간 내지 72시간 후에 세포를 수확하고 상청액을 폐기하였다. 세포 펠릿은 추가 사용 시까지 -80℃에서 저장하였다. 분비된 단백질의 경우, 96시간 후에 상청액을 수집하고 원심분리(5,000 × g, 15분, 4℃)를 통해 제거하였다. 상청액을 추가 분석 또는 정제를 위해 즉시 사용하였다.

동물

동물 연구를 위해, BALB/c 마우스(Charles River Laboratories)와 야생형 마우스를 사용하였다. 대응하는 질병 모델을 또한 사용할 수 있었다. 나이는 실시예에 표시되어 있다. 동일한 성별의 동물을 적절한 침구가 들어 있는 폴리카보네이트 우리에 그룹으로 수용하였다. 꼬리에 눈에 띄는 문신을 하거나 전자 식별 칩을 이식하여 마우스를 식별하였다. 마우스를 실험실 환경에 적응시키기 위해 처리 전 적어도 5일 동안 적응시켰다. 실험 동물의 관리 및 사용에 관한 지침에 기재된 바와 같이 사회적 하우징(housing)과 동물 환경 강화를 위한 씹는 물체를 갖춘 하우징을 설치하였다.목표 환경 조건은 19 내지 25℃의 온도, 30% 내지 70%의 습도, 및 12시간 밝음과 12시간 어두움의 빛 주기였다. 식품(Lab Diet Certified CR Rodent Diet 5CR4)을 펠릿 형태로 자유롭게 제공하였다. 물을 역삼투압 및 자외선 조사로 처리된 도시 수돗물 형태로 자유롭게 제공하였다.

실시예 12: 루시퍼라제를 이용한 L 인핸서 단백질의 생체 내 발현은 루시퍼라제 발현의 안정성 및 지속 기간을 증가시킨다.

생체 내에서 반딧불이 루시퍼라제의 발현을 평가하기 위해, 각각 6 내지 8주령의 암컷 BALB/c 마우스 4마리로 구성된 그룹을 사용하였다. 그룹에는 (a) 도 9b에 도시된 루시퍼라제를 인코딩하는 플라스미드 또는 (b) 도 9d에 도시된 인핸서 단백질을 갖는 루시퍼라제 서열을 인코딩하는 플라스미드의 25 μg의 PBS(137 mM NaCl, 2.7 mM KCl, 10 mM Na₂HPO₄, 1.8 mM KH₂PO₄ pH 7.4) 중 50 μl가 피내 주사되었다. 기본 측정을 위해, 4마리의 마우스에게 50 μl PBS만을 피내 주사하였다. 복용량의 부피를 등쪽의 요추 또는 천골 영역의 구분된 면적 내에서 주사기/바늘을 사용하여 투여하였다.

동물을 그룹별로 무작위화하고 체중을 1일에 기록한 다음 연구가 끝날 때까지 격주로 기록하였다. 이상반응(RM, SD, RD)을 적정 실험실 표준(good laboratory standards)에 따라 기록하였다. 1회에 >30% 체중 감소가 관찰되거나 3회 연속 측정에서 >25% 체중 감소가 관찰된 임의의 개별 동물을 안락사시켰다.

루시퍼라제의 발현을 2일(주사 후 24시간), 3일(주사 후 48시간), 4일(주사 후 72시간), 11일, 18일, 25일, 32일, 38일, 53일, 67일에 전체 동물의 생물발광 영상화로 측정하였다. 모든 동물이 안락사되는 연구의 종료점은 67일이었다. 생물발광 이미징을 마취 하에 수행하였다. 루시페린의 기질 주입 후 10분 후에 등쪽 이미지를 촬영하였다. 기질을 최근 체중을 기준으로 10 ml/kg에서 150 mg/kg 복강 내로 투여하였다. 도 11 및 도 12 참조.

이러한 결과는 루시퍼라제가 EMCV의 L1 단백질과 같은 인핸서 단백질과 함께 발현될 때 루시퍼라제의 생체 내 발현이 더 오랫동안 유지된다는 것을 보여준다. 도 10에 도시된 바와 같이, 대조군 동물에서 루시퍼라제의 발현 수준은 처음에는 높았다가 치료 후 30일까지 감소하였다. 대조적으로, L1 단백질과 조합하여 발현될 시 루시퍼라제의 발현 수준은 치료 후 110일까지 더 오랜 기간 동안 일정한 수준으로 유지된다. 즉, L1 단백질과 함께 루시퍼라제가 발현되는 경우 시간에 따른 루시퍼라제 발현 수준의 변화가 적다.

또한, 루시퍼라제 및 L1 단백질을 발현하는 동물 간의 루시퍼라제 발현 수준의 변화는 루시퍼라제만을 발현하는 동물 간에 비해 적다. 이 효과는 특히 53일 시점과 같이 시간이 지남에 따라 뚜렷이 나타난다. FIG. 11 참조. 도 9b의 플라스미드를 주사한 동물 중 25%(4마리 중 1마리)만이 주사 후 53일에 검출 가능한 루시퍼라제 발현을 나타내는 반면에, 도 9d의 플라스미드를 주사한 동물의 100%(3마리 중 3마리)는 53일 시점에서 루시퍼라제 발현을 나타내었다. 따라서, 개시된 방법은 동물 간에 표적 단백질의 발현 수준의 가변성을 감소시켜, 치료제에서 중요한 적용을 갖는 표적 단백질의 발현에 더 많은 재현성을 제공한다.

최종적으로, 도 12는 인핸서 단백질의 존재 하에 루시퍼라제의 발현이 장기간에 걸쳐 보다 더 안정적인 발현을 가져온다는 것을 추가로 보여준다. 루시퍼라제만을 발현하는 대조군 마우스는 며칠 동안 높은 수준의 루시퍼라제를 나타낸 후 발현이 최소한으로 까지 서서히 감소하는 반면, L1 단백질의 존재 하에 루시퍼라제를 발현하는 마우스는 123일 동안 검출 가능하고 안정적인 루시퍼라제 발현을 보여준다. 이 결과는 표적 단백질의 생체 내 발현을 위해 개시된 조성물 및 방법의 우수한 장점을 보여준다.

리포터 유전자 발현의 시간 경과에 따른 유익한 효과가 투여 경로 또는 주사 부위에 특이적이지 않음을 보여주기 위해, 피하 투여를 사용하여 실험을 반복하였다. 즉, 6 내지 8주령의 암컷 BALB/c 마우스 4마리로 구성된 그룹을 사용하였다. 그룹에는 도 9a 및 도 9b에 도시된 루시퍼라제를 인코딩하는 플라스미드 또는 도 9c 및 도 9d에 도시된 인핸서 단백질을 갖는 루시퍼라제 서열을 인코딩하는 플라스미드를 사용하여, PBS(137 mM NaCl, 2.7 mM KCl, 10 mM Na₂HPO₄, 1.8 mM KH₂PO₄ pH 7.4) 중 30 μg 노출 플라스미드의 200 μl가 피하로 1회 주사되었다. 기본 측정을 위해 4마리의 대조군 마우스에 PBS만을 처리하였다. 용량을 견갑골 사이의 피하 주사로 주사기 바늘을 사용하여 투여하였다.

마우스에게 0일에 투여하였고, 루시퍼라제의 발현을 1일, 2일, 3일, 7일, 15일, 21일, 28일, 35일 및 42일에 동물 몸 전체의 생물발광 영상화로 측정하였다(영상 데이터는 도 19에서 정량화됨). 영상화를 위해, 루시페린(즉, 반딧불이 루시퍼라제의 기질)을 10 ml/kg 부피에서 150 mg/kg의 용량으로 마우스의 복강내(i.p.)에 주사하였다. 마취 하에 기질 투여 후 10분 후에 이미지를 획득하였다. 주사 부위에 초점을 맞추기 위해 마우스를 복위 자세로 이미지화하였다.

도 19는 인핸서 단백질과 조합된 반딧불이 루시퍼라제를 발현하는 플라스미드(Fluc EG) 또는 인핸서 단백질이 없는 동일한 플라스미드(Fluc Std)로 Balb/c 마우스를 피하 처리한 후 반딧불이 루시퍼라제(Fluc)의 생물발광 영상화 결과를 보여준다. 전술한 바와 같이, 인핸서 단백질의 첨가는 리포터 유전자가 기능적으로 발현되는 시간을 증가시킨다. 인핸서 단백질은 실험 기간 전체에 걸쳐 안정적인 발현으로 이어지는 반면, 인핸서 단백질이 없으면, 활성 루시퍼라제 발현의 손실을 며칠 내에 검출할 수 있다. 놀랍게도, 인핸서 단백질의 안정화 효과는 주사 부위와 무관하다. 이 결과는 표적 단백질의 생체 내 발현을 위해 본원에 개시된 조성물 및 방법의 일반적인 적용 가능성을 보여준다.

실시예 13: 아달리무맙을 이용한 L 인핸서 단백질의 발현은 아달리무맙 단백질 품질 및 발현 수준을 개선시킨다

아달리무맙을 인코딩하는 핵산 서열(EG140, 도 13a)을 포함하는 대조군 플라스미드 및 아달리무맙을 인코딩하는 핵산 서열(EG141, 도 13b)과 조합된 인핸서 유전자를 포함하는 플라스미드로부터 아달리무맙이 HEK293T 세포에서 발현되었는지 여부를 테스트하기 위해, 하기 실험을 수행하였다.

0일에, HEK293T 세포를 24-웰 플레이트에 20,000 세포/웰로 시딩하였다. 1일에 성장 배지를 Opti-MEM(웰당 450 ul)으로 변경하였다. 그런 다음 표준 형질감염 절차에 따라 웰당 0.5 ug 플라스미드와 1 ug PEI를 1:2 비율로 사용하여 세포를 형질감염시켰다. 총 6개의 복제물을 사용하였다. 3일에, 면역형광 현미경을 위한 ELISA 및 세포 고정을 위해 세포 배양 상청액의 상청액을 수집하였다. 500X g에서 5분 동안 수행된 원심분리를 사용하여 남은 세포 잔해를 제거하였다. 그런 다음 투명한 상청액을 새로운 1.5 ml 에펜도르프(Eppendorf) 튜브에 피펫팅하고 ELISA로 분석할 때까지 -20℃에서 저장하였다.

세포를 실온(RT)에서 10분 동안 10% 중성 완충 포르말린을 사용하여 고정시키고, 실온에서 10분 동안 0.2% Triton X-100을 사용하여 투과시켰다. 세포를 DyLight488-표지된 항-인간 항체(IgG Fc Cross-Adsorbed Goat anti-Human, DyLight® 488, Invitrogen - PISA510134 ANTI-HUMAN IGG-FC XMIN D488)를 사용하여 1:500 희석으로 RT에서 1시간 동안 염색하고, 세척하였다. FLoid 형광 현미경을 사용하여 세포를 영상화하였다.

면역형광 결과를 도 14에 제시한다. 결과는 아달리무맙이 HEK293T 세포에서 EG140 및 EG141 플라스미드 둘 다로부터 발현되었음을 보여준다. 두 플라스미드 모두에서 아달리무맙의 발현이 용이하게 검출된 반면, EMCV L1 단백질(EG141로부터)과 조합된 아달리무맙의 발현은 아달리무맙이 단독으로 발현되었을 때(EG140로부터)보다 약간 더 낮았다. 놀랍게도, 아달리무맙이 L1 인핸서 단백질과 조합하여 발현되는 경우, 인핸서 단백질의 부재(도 14a)와 비교하여 항체의 세포 내 분포가 더 균일하다(도 14b). 더욱이, 아달리무맙 단독 발현 시 나타나는 잘못 접히거나 접히지 않은 단백질의 존재를 나타내는 세포 내 병소는 아달리무맙이 L1 인핸서와 조합하여 발현되는 경우에는 존재하지 않는다. 이러한 결과는 L1 인핸서 단백질의 존재가 세포에서 발현되는 재조합 아달리무맙 항체의 발현 품질 및/또는 양을 개선시킨다는 것을 추가로 뒷받침한다.

또한, 직접 효소 결합 면역흡착 검정(ELISA) 방법을 이용하여 세포 배양 상청액에서 아달리무맙이 검출될 수 있는지 여부를 테스트하였다. ELISA 실험을 위해, 동결된 세포 배양 상층액을 해동하고 ELISA 고결합 플레이트 코팅에 사용하였다. 코팅을 2X 희석 계열의 세포 배양 상청액(웰당 75 ul)을 사용하여 수행하였다. 양성 대조군의 경우, 일련의 재조합 인간 항-TNFa 항체(NBP2-62567, Novus Biologicals)의 희석 시리즈를 대신 사용하였다. 코팅을 4℃에서 밤새 수행하였다.

다음날, ELISA 플레이트를 PBS-T를 사용하여 1회 세척하고 EZ Block을 사용하여 37℃에서 2시간 동안 웰당 150 ul씩 차단하였다. 플레이트를 세척하고 2차 항체(항-인간 HRP 표지 항체, IgG (H+L) 염소 항-인간, HRP, Invitrogen - A18805 GTXHU IGG HRP AFFINITY)와 1:2000의 희석률로 1시간 동안 인큐베이션하였다. 플레이트를 PBS-T를 사용하여 5회 세척하였다. TMB 기질을 첨가하고(웰당 75 ul) 20분 동안 인큐베이션한 후 정지 용액(웰당 75 ul)을 첨가하였다. 450 nm에서의 흡광도를 Biotek 플레이트 판독기를 사용하여 측정하였다.

결과를 도 15에 제시한다. ELISA 플레이트가 아달리무맙 발현 HEK293T 세포로부터 유래된 세포 배양 상청액으로 코팅되었기 때문에, 결과는 아달리무맙이 EG140 및 EG141 둘 다에 형질감염된 세포의 상청액에서 용이하게 검출될 수 있음을 시사한다. EG140(대조군) 발현 시 아달리무맙 수준은 EG141(아달리무맙 및 L1 인핸서를 인코딩하는 플라스미드) 발현 시보다 3배 초과하여 더 높다.

실시예 14: L 인핸서 단백질의 발현은 아달리무맙 단백질 품질 및 발현 수준을 유의미하게 개선시킨다.

EG140- 또는 EG141-형질감염된 세포로부터 발현되고 분비된 항체가 재조합 인간 TNF-알파에 특이적으로 결합할 수 있는지 여부를 검출하기 위해, 하기 실험을 수행하였다.

플라스미드 EG140 및 EG141 외에도, 동일한 발현 카세트를 상이한 폴리아데닐화 신호 및 동물에서 AAV의 하류 생체내 사용을 위한 재조합 AAV 벡터를 생성하기 위해 역전된 말단 반복부(ITR: inverted terminal repeat)가 측면에 있는 발현 카세트에 의해 EG140 및 EG141 백본과는 상이한 AAV 전달 플라스미드 백본에 클로닝하였다(도 20). HEK293T 세포에서 발현된 인핸서 단백질이 없는(도 21) 및 인핸서 단백질이 있는(도 22) AAV 전달 플라스미드로부터의 아달리무맙이 재조합 인간 TNF-알파에 특이적으로 결합할 수 있는지 여부를 테스트하기 위해, 하기 실험을 수행하였다.

실시예 13에 기재된 바와 같이 세포를 성장시키고 형질감염시켰다. 그러나, 실험 13과 대조적으로, 고결합 ELISA 플레이트는 먼저 재조합 TNF-알파(1 ug/ml, 웰당 75 μl)로 4℃에서 밤새 코팅하였다. 2일에 ELISA 플레이트를 PBST로 세척하고 EZ Block 시약으로 차단하였다. 세포 배양 상청액 샘플을 Opti-MEM(1:256)에서 희석하고 차단된 웰에 첨가하였다(웰당 75 μl, 37℃에서 1시간). 웰을 PBST를 사용하여 3회 세척하고 2차 항체(항-인간 IgG HRP)를 1:2000 희석으로 첨가하였다(웰당 75 μl, 37℃에서 1시간). 그런 다음 웰을 PBST를 사용하여 5회 세척하였다. 75 ul의 3,3',5,5'-테트라메틸벤지딘(TMB) 기질을 첨가하여 결합된 항체를 검출하였다. 75 μl의 TMB 중지 용액을 사용하여 반응을 정지시켰고, Biotek 마이크로플레이트 판독기를 이용하여 450 nm에서 흡광도를 측정하여 신호를 판독하였다.

일부 실험에서, 분비된 아달리무맙의 총 농도를 정량적 ELISA를 사용하여 측정하였다. 해당 실험에서, ELISA를 하기와 같이 수정하여 상기에 기재된 바와 같이, 수행하였다. 세포 배양 상층액을 EZ Block 시약에 사전 희석하였고 사전 코팅되고 차단된 웰에 샘플로서 첨가하였다. 양성 대조군 항체인 재조합 단일클론 아달리무맙(Novus Biologicals NB001486)을 EZ Block 시약에 0, 0.1, 1, 10 및 100 ng/ml의 농도로 희석하고 사전 코팅 및 차단된 웰에 표준 커브로서 추가하였다. 다른 모든 측면에서, ELISA를 상기 기재된 바와 같이 수행하였다. 450 nm에서의 흡광도를 판독한 후, 표준곡선의 흡광도 값을 이용하여 샘플의 흡광도 값을 ng/ml 단위의 총 분비된 아달리무맙 농도로 환산하였다.

결과는 EG140-형질감염된 세포로부터의 세포 배양 상층액이 EG141-형질감염된 세포와 비교하여 대략 3배 더 많은 TNF-알파 결합 인간 항체를 함유함을 보여주었다(도 16).

인핸서 L 단백질이 있거나(서열번호 243 내지 272) 없는(서열번호 217 내지 242) 아달리무맙을 인코딩하는 AAV 전달 플라스미드에 대한 결과를 인핸서 단백질(STD)이 없고 인핸서 단백질(EG)이 있는 아달리무맙을 인코딩하는 형질감염된 플라스미드의 반복 실험과 함께 도 23에 도시하였다. 분비된 아달리무맙 농도를 정량적 ELISA에 의해 ng/ml 단위로 정량화하였다. 두 경우 모두에서, 인핸서 단백질의 존재로 인해 세포 상청액 중 아달리무맙의 총량이 감소했다. 특히, 인핸서 단백질을 갖는 표준 플라스미드에 아달리무맙이 존재하면 상청액에서 아달리무맙 단백질의 존재를 39배 만큼 감소시킨 반면, AAV 전달 플라스미드에 있는 인핸서 단백질은 상청액에서 아달리무맙 단백질의 존재를 77배 만큼 감소시켰다.

아달리무맙 품질의 분석을 세포 배양 상청액에서 TNF-알파 활성화의 수준으로 테스트하였다. 활성 아달리무맙은 TNF-알파를 차단할 것이다. 이 실험을 루시퍼라제 TNF-알파 리포터 세포를 사용하여 수행하였다.

NF-kappaB의 활성화를 평가함으로써 샘플 내 생리활성 TNF-알파의 수준을 모니터링하도록 설계된 리포터 세포를 사용하여 단리된 세포 배양 상청액을 분석하였다. 리포터 HEK-Dual TNF-a 세포주(Invivogen)를 HEK293 세포를 NF-kappaB 유도성 분비 반딧불 루시퍼라제로 형질감염시켜 생성하였다. TNF-알파 처리 시, NF-kappaB 경로가 활성화되어 분비된 루시퍼라제의 발현으로 이어지며, 이는 루시퍼라제 기질을 사용하여 검출할 수 있다. EG140- 및 EG141-형질감염된 세포의 세포 배양 상청액 또는 AAV 전달 플라스미드 백본에 클로닝된 동일한 발현 카세트에서 TNF-알파 중화 항체가 존재 시, NF-kappaB 활성화가 억제되고 루시퍼라제 신호가 감소할 것으로 예측되었다.

실험을 하기와 같이 수행하였다. 리포터 세포를 DMEM + 10% FBS 중 96웰 플레이트(웰당 5000개 세포)에 시딩하였다. 다음날, EG140- 및 EG141-형질감염된 세포로부터의 세포 배양 상청액을 세포 배양 배지에서 지시된 비율로 희석하고 실온에서 30분 동안 1 ng/ml 인간 재조합 TNF-알파와 혼합하였다. 그런 다음 96웰 플레이트에 사전 시딩된 TNF-알파 리포터 세포의 세포 배지를 웰당 100 μl의 혼합물을 사용하여 사전 인큐베이션된 세포 배양 상청액/TNF-알파 샘플로 교체하였다. 그런 다음 리포터 세포를 37℃에서 5시간 동안 인큐베이션하였다. 그런 다음 분비된 루시퍼라제 신호를 TNF-알파 활성화를 검출하기 위한 제조업체의 지침에 따라 Quanti-Luc Gold 검정(Invivogen)을 사용하여 검출하였고, 마이크로플레이트 판독기를 사용하여 루시퍼라제 활성을 측정하였다.

결과는 도 17, 도 24 및 표 4 및 표 5에 제시되어 있다. EG140- 및 EG141-형질감염된 세포 둘 다로부터 단리된 세포 배양 상층액은 NF-kappaB 구동 루시퍼라제 발현의 TNF-알파 매개 활성화를 억제할 수 있었던 반면, EG140-형질감염된 세포의 상층액은 EG141-형질감염된 세포의 상청액과 비교하여 TNF-알파 억제에서 약 3배 더 활성이었다.

[표 4]

[표 5]

또한, 분비된 아달리무맙의 상대적 품질을 추정하기 위해, 상청액 중 분비된 아달리무맙의 총량(정량적 ELISA로 측정한 ng/ml의 단위)을 TNF-알파 신호전달(HEK 이중 TNF-알파 리포터 세포를 사용하여 측정한 EC₅₀ 단위)을 억제하기 위해 동일한 상청액의 효능과 비교하였다.

흥미롭게도, 표준 시스템에 대해 생성되고 분비된 아달리무맙의 양이 더 높았음에도 불구하고(도 24 및 표 4 및 5), 생물학적 활성에 의해 정의된 바와 같이 생성된 아달리무맙의 상대적 품질은 인핸서 L을 갖는 작제물에서 더 높았다. 즉, 인핸서 단백질의 활성은 표준 작제물 형질감염된 세포에서 22.2배 더 높았고 AAV 작제물 형질감염된 세포에서 65.3배 더 높았다.

특히, 생물학적으로 활성인 아달리무맙의 상대적 백분율을 추가로 분석하였다. 도 25는 인핸서 단백질 동시 발현을 갖는 활성 아달리무맙의 상대적인 양이 인핸서 단백질 동시 발현이 없는 것보다 더 높았음을 보여준다. 중요한 것은 활성 발현된 아달리무맙의 백분율이 인핸서 단백질 동시 발현을 통해 최대 60% 더 높았다는 것이었다.

실시예 15: L 인핸서의 발현은 비활성 아달리무맙 발현 생성물의 수를 감소시키는 것으로 나타났다.

EG140 및 EG141 플라스미드로 일시적으로 형질감염된 HEK293T 세포의 세포 배양 상층액에서 분비된 항체의 총량을 시각화하기 위해 하기 실험을 수행하였다. 세포를 15 cm 세포 배양 접시에 접시당 4E6개 세포씩 시딩하고 40 ug 플라스미드와 80 ug PEI를 사용하여 형질감염시켰다. 제조업체의 지침에 따라 단백질 A/G 아가로스 수지(MPbio)를 사용하여 세포 배양 상청액으로부터 항체를 정제하였다. 제조업체의 지침에 따라 SDS-Page와 웨스턴 블롯팅(GenScript)을 통해 동일한 부피의 정제된 항체를 분석하였다.

SDS PAGE(도 18a) 및 웨스턴 블롯(도 18b) 결과는 정제된 아달리무맙 경쇄 및 중쇄가 EG140- 및 EG141-형질감염된 HEK293T 세포 둘 다의 세포 배양 상청액에서 검출되었음을 나타낸다. 결과는 대조군 EG140-형질감염된 세포에서 발현된 정제된 아달리무맙의 양이 EG141-형질감염된 세포에서 L1 인핸서의 존재 하에 발현된 정제된 아달리무맙의 양보다 유의미하게 더 크다는 것을 보여준다. 이론에 구애됨이 없이, EG140-형질감염된 세포에 의해 발현되는 분비된 아달리무맙의 상당 부분은 EG141-형질감염된 세포에 의해 발현되는 분비된 아달리무맙과 비교하여, 접힘 오류 및/또는 세포내 병소에 대한 부적절한 국소화로 인해 잠재적으로 기능하지 않는 것으로 생각된다.

실시예 16: 생체 내에서 L 인핸서 단백질의 발현은 주사 부위 의존성 효과를 감소시킨다.

생체 내에서 아달리무맙의 발현을 평가하기 위해, 각각 6 내지 8주령의 6마리 암컷 BALB/c 마우스의 그룹을 사용하였다. 그룹에는 PBS(137 mM NaCl, 2.7 mM KCl, 10 mM Na₂HPO₄, 1.8 mM KH₂PO₄ pH 7.4) 중 재조합 AAV의 50 μl의 2x10¹¹ 게놈 복사본을 근육내(i.m.) 또는 피하(s.c.) 경로를 통해 1회 주사하였다. 사용된 재조합 AAV 벡터를 (a) 도 21에 도시된 아달리무맙을 인코딩하는 플라스미드 또는 (b) 도 22에 도시된 인핸서 단백질을 갖는 아달리무맙을 인코딩하는 플라스미드를 사용하여 생성하였다. 재조합 AAV 벡터를 AAV 전달 플라스미드를 헬퍼 플라스미드(아데노바이러스 유전자 E4, E2A 및 VA를 인코딩) 및 Rep-Cap 플라스미드(AAV 혈청형 8, AAV8의 Cap 단백질을 인코딩)와 함께 HEK293T 패키징 세포로 삼중 형질감염하여 VectorBuilder Inc.에서 생성하였다. 유사하게는, 바이러스 게놈 복제 및 패키징에 충분한 임의의 복제 유전자 및 바이러스 캡시드 형성에 충분한 임의의 바이러스 캡시드 유전자를 Rep-Cap 대신 사용할 수 있다. 형질감염 후 2일에, 세포를 수확하고, PEG로 농축하고, CsCl 구배 정제로 정제하였다.

AAV8 처리된 마우스에서 아달리무맙의 약동학을 대조군으로서 재조합적으로 생성된 아달리무맙 단백질로 처리된 마우스의 약동학과 비교하였는데, 이는 항-TNFa 요법의 현재 표준 치료를 모방한다. 대조군에는 PBS에 용해된 재조합적으로 생성된 아달리무맙 100 μg의 50 μl를 3마리의 마우스에 피하 주사하였다.

동물을 그룹별로 무작위화하고 체중을 1일에 기록한 다음 연구가 끝날 때까지 격주로 기록하였다. 이상반응(RM, SD, RD)을 적정 실험실 표준에 따라 기록하였다. 20% 초과의 체중 감소, 식사, 음주 및 이동성과 같은 정상적인 생리적 기능을 억제하는 상처, 또는 허탈, 발작 및 출혈의 임상적 관찰이 한 번이라도 관찰된 임의의 개별 동물은 모두 안락사시켰다.

전혈을 턱밑 정맥으로 수집하고 처리하여 분석용 혈청을 수집하였다. 혈액을 0일(투약 전), 3일, 7일, 14일, 21일, 28일 및 42일에 수집하였다. 정량적 ELISA를 통해 혈청의 아달리무맙 농도를 분석하였다.

정량적 ELISA를 마우스 혈청 샘플(EZ Block 시약에서 사전 희석된)을 샘플로 사용하여 상기 실시예 14에 기재된 바와 같이 수행하였다. 양성 대조군 항체인 재조합 단일클론 아달리무맙(Novus Biologicals NB001486)을 EZ Block 시약에 0, 0.1, 1, 10 및 100 ng/ml의 농도로 희석하고 표준 커브로서 사용하였다. 450 nm에서의 흡광도를 판독한 후, 표준곡선의 흡광도 값을 이용하여 샘플의 흡광도 값을 ng/ml 단위의 혈청에서 총 분비된 아달리무맙 농도로 환산하였다.

ELISA 실험의 결과를 도 26a 및 도 26b에 도시한다. 직선 점선 역치는 아달리무맙 농도가 5 μg/ml임을 나타내며, 이를 초과하면 류마티스 관절염 모델에서 아달리무맙의 치료 효과가 관찰된다. 도 26a는 인핸서 단백질이 있는(EG) 및 없는(STD) AAV의 근육내 주사의 결과를 도시한다. 도 26b는 동일한 물질의 피하 주사를 도시한다. 본원에 제시된 다른 실험과 관련하여 상기 기재된 바와 같이, 인핸서 단백질이 없는(STD) 시스템은 인핸서 단백질(EG)이 있는 시스템과 비교하여 혈청 내 아달리무맙의 농도가 더 높은 것을 보였다.

특히, 인핸서 단백질 동시 발현이 없는 아달리무맙의 농도는 주사 부위에 따라 크게 달라졌다. 전체적으로 주사 부위 사이에 10배의 차이가 관찰될 수 있었다. 이는 치료 투여에서 상대적으로 작은 편차가 치료용 이식유전자의 정상 상태 혈청 수준에 큰 변화를 가져올 수 있기 때문에 주사 부위를 다양화할 수 없는 특이적인 유전자 요법의 경우 매우 어려울 수 있다.

대조적으로, 인핸서 단백질이 있는(EG) 시스템은 주사 부위와 상관없이 혈류 투여량을 보여주었다. 이러한 데이터는 인핸서 단백질이 치료 중 세포 유형에 상관없이 유사한 단백질 발현 수준을 확보하며, 이는 강력하고 재현 가능한 치료 효과를 달성하는 데 중요한 결과라는 것을 보여준다. 중요한 것은 근육내 투여와 피하 투여 둘 다에서 치료된 마우스의 혈청에서 필요한 치료 농도를 초과하여 동일한 수준의 아달리무맙이 발견되었다. 놀랍게도, 인핸서 단백질의 첨가로 아달리무맙이 주사 부위와 상관없이 안정적이고 일정한 수준으로 발현되는 것을 확보하였다.

실시예 17: L 인핸서 단백질의 발현은 시험관 내에서 분비된 글루코실세라미다제(GBA)의 활성에 비해 증가한다

HEK293T 세포에서 인핸서 L 단백질이 있거나 없는 글루코실세라미다제(GBA) 발현을 테스트하기 위해 하기 실험을 수행하였다.

HEK293T 세포를 GBA-NanoLuc 융합 단백질을 발현하는 대조군 플라스미드(도 28a) 및 GBA-NanoLuc 키메라와 함께 인핸서 단백질 L을 동시 발현하는 플라스미드(도 28b)로 형질감염시켰다. 0일에 HEK 293T 세포를 10% FBS를 함유하는 500 μl DMEM에서 24웰 세포 배양 마이크로플레이트에 시딩하였다. 1일에, 제조업체의 지침에 따라 Mirus TransIT-Lenti 형질감염 시약을 사용하여 세포를 각각의 pGBA-NanoLuc_STD(서열번호 273 내지 296) 및 pGBA-NanoLuc_EG(서열번호 297 내지 324) 플라스미드로 형질감염시켰다. 각 웰을 0.2 μg 플라스미드, 0.6 μl Mirus TransIT-Lenti 시약 및 50 μl의 Opti-MEM 배지를 사용하여 만든 복합체로 처리하였다. 3일에, 형질감염된 세포 및 세포 배양 상층액을 NanoLuc 루시퍼라제 및 GBA의 활성에 대해 검정하고 웨스턴 블롯팅을 위해 처리하였다.

NanoLuc 검정을 위해 세포 배양 상층액을 미세원심분리 튜브에 수집하고 원심분리에 의해 세포 잔해를 제거하였다. 24웰 플레이트에 부착된 세포를 실온에서 PBS 중 0.2% Triton X-100의 250 ul를 사용하여 용해시켰다. 50 μl의 제거된 세포 배양 상층액 또는 50 μl의 세포 용해물을 불투명한 흑색 96웰 마이크로플레이트에 로딩하였다. 각각의 검정 완충액(Promega)에 들어 있는 새로운 1X Nano-Glo 검정 시약 50 μl를 각 웰에 첨가하고 2 내지 5분 동안 인큐베이션한 후 Biotex Synergy LX 플레이트 판독기를 사용하여 발광성을 측정하였다. 제조업체의 지침에 따라 A660 시약(Thermo Scientific)을 사용하여 세포 용해물을 단백질 농도에 대해 추가로 분석하였다. 간단히 말하면, 40 μl의 샘플 또는 표준을 150 μl의 A660 검정 시약과 혼합하고 Biotek Synergy LX 플레이트 판독기를 사용하여 660 nm에서의 흡광도를 측정하였으며, 표준 곡선을 기반으로 단백질 농도를 정량화했다. 세포 용해물의 발광을 세포 용해물 단백질 μg 당 정규화하였고(즉, 상대적인 광 단위(RLU)/μg 단백질 단위로 발광 값을 산출), 반면에 세포 배양 상청액의 발광을 검정에 사용된 상청액의 부피를 사용하여 표준화하였다(즉, RLU/ml 상청액 단위로 발광 값을 산출).

GBA 활성을 결정하기 위해, 세포를 상기의 NanoLuc 검정에서와 같이 각각의 플라스미드로 시딩하고 형질감염시켰다. 3일에, 세포 배양 상청액을 수집하고, 원심분리에 의해 세포 잔해물로부터 제거하고, 분비된 GBA 활성을 검정하기 위해 저장하였다. 부착 세포를 500 μl PBS를 사용하여 플레이트로부터 탈리하고 원심분리에 의해 펠렛화하였다. 세포 펠릿을 1X GBA 검정 완충액(0.1 M 구연산나트륨, 0.2 M 인산나트륨, 0.25% Triton X-100, 0.25% 타우로콜산나트륨, 1.25 mM EDTA, 5 mM DTT)을 사용하여 용해하고, 용해하기 전에 37℃로 평형화했다. 제조업체의 지침에 따라 Pierce A660 단백질 검정을 사용하여 세포 용해물의 단백질 농도를 측정한 후, 1X GBA 검정 완충액을 사용하여 세포 용해물을 125 μg/ml의 최종 단백질 농도로 희석하였다. 40 μl의 사전 희석된 세포 용해물을 투명한 96웰 플레이트의 개별 웰에 2벌씩 피펫팅했다. 이전에 수집된 바와 같이, 20 μl의 세포 배양 상청액을 투명한 96웰 플레이트의 개별 웰에 2벌씩 첨가하고, 세포 배양 상청액을 함유하는 각 웰에 20 μl의 2X GBA 검정 완충액을 첨가하였다. 그 후, 20 μl의 검정 기질(1X GBA 분석 완충액에서 제조된 6 mM 4-MU-베타-D-글루코푸라노사이드)을 세포 용해물 또는 세포 배양 상청액을 함유하는 각 웰에 첨가하였다. 인접한 웰에서는 1X GBA 검정 완충액에서 4-메틸-움벨리페론을 사용한 교정 곡선을 작성하였다. 샘플을 검정 기질의 존재 하에 37℃에서 30분 내지 4시간 동안 인큐베이션한 후 100 μl의 정지 용액(0.5 M 글리신, pH10의 0.3 M NaOH)을 첨가하였다. 그 후, Biotek Synergy LX 플레이트 판독기를 사용하여 360/445 nm의 여기/방출 파장에서 각 샘플 및 표준의 형광을 측정하였다. 세포 용해물 샘플에서 GBA 활성은 하기 방정식을 사용하여 계산되었다: 활성 = [B / (T × V × P)] × D = pmol/분/mg = μU/mg, 상기 식에서 B는 표준 곡선을 사용하여 계산한 바와 같이 변환된 4-MU 양(pmol)이고, T는 반응 시간(분)이고, V는 샘플 부피(ml)이고, P는 초기 단백질 샘플 농도이며, D는 샘플 희석 인자(해당되는 경우)이다. 세포 배양 상청액에서 GBA 활성은 하기 방정식을 사용하여 계산되었다: 활성 = [B / (T × V × P)] × D = pmol/분/mg = μU/mg, 상기 식에서 B는 표준 곡선을 사용하여 계산한 바와 같이 변환된 4-MU 양(pmol)이고, T는 반응 시간(분)이고, V는 샘플 부피(ml)이며, D는 샘플 희석 인자(해당되는 경우)이다.

웨스턴 블롯팅을 위해, 형질감염된 세포를 긁어 모아 수확하고 원심분리에 의해 펠렛화하였다. 1X 프로테아제 억제제 칵테일과 10U의 범용 뉴클레아제가 보충된 100 μl RIPA 완충액(Cell Signaling technologies)을 사용하여 세포 펠렛을 용해시키고 얼음 위에서 10분 동안 인큐베이션한 후 10초 동안 초음파 처리했다. 용해된 샘플을 14,000 g에서 10분간 원심분리하고, 분석을 위해 80 μl의 상층액을 수집하였다. 각 샘플의 단백질 농도를 제조업체의 지침에 따라 Pierce A660 검정을 사용하여 결정하였다. 40 μg의 세포 용해물을 4 내지 12% Bis-Tris MES 겔의 각 웰에 로딩하고 앞서 실시예 15에서 개시된 바와 같이 웨스턴 블롯팅을 계속한다. GBA를 검출하기 위해, 토끼 항-GBA 항체(Abcam ab128879)를 밤새 1:500 희석하여 사용하였다.

웨스턴 블롯팅을 통해 설계된 pGBA-NanoLuc_STD 및 pGBA-NanoLuc_EG 작제물은 HEK 293T 세포에서 발현될 시 대략 75 kDa의 pGBA-NanoLuc 단백질 키메라에 대한 정확한 예측 크기의 단일 밴드로 검출된다는 것을 밝혀내었다. pGBA-NanoLuc_STD 작제물의 밴드는 pGBA-NanoLuc_EG 작제물의 밴드보다 다소 강했고(도 29), 이는 실시예 15에 제시된 바와 같이 발현된 분비된 단백질에 대한 초기 관찰에 해당한다.

분석 중에 NanoLuc 태그된 GBA 단백질을 사용함으로써 관심 대상의 단백질의 전체 발현(NanoLuc 리포터 판독)과 관심 대상의 기능적으로 활성인 단백질의 발현(GBA 효소 활성)을 구별하는 것이 가능했다. 리포터 단백질(NanoLuc)과 효소 활성(GBA) 둘 다의 총량은 pGBA-NanoLuc_STD 작제물의 경우에 더 높았으며(도 30a 내지 도 30d), 이는 위의 웨스턴 블롯 결과와 일치한다. 그러나, pGBA-NanoLuc_EG 작제물의 경우 인핸서 단백질을 동시 발현시켰을 때 생성된 단백질의 상대적 품질이 훨씬 높았다(도 31). 발현된 GBA 단백질의 상대적 품질은 먼저 NanoLuc 리포터 신호를 사용하여 GBA 효소 활성을 정규화한 다음(즉, 특이적인 GBA 활성 GBA_S = GBA_활성/NanoLuc_신호를 산출함) 2개의 상이한 작제물의 GBA_S를 비교하여 추정하였다. 이 분석은 세포 용해물에서 특이적인 GBA 활성이 pGBA-NanoLuc_STD와 pGBA-NanoLuc_EG 작제물 간에 유사하다는 것을 밝혀 주었다.

그러나, 주목할 만한 점은 세포 상층액에서 인핸서 단백질(즉, pGBA-NanoLuc_EG 작제물)의 존재 하에 특이적인 GBA 활성은 인핸서 L 단백질(즉, pGBA-NanoLuc_STD 작제물)의 부재 하에서의 것보다 대략 300% 더 높았다(도 31). 내인성 GBA가 상청액에서 완전히 활성인 분비된 단백질이라는 점을 고려하면, 이들 데이터는 본원에 제시된 바와 같이 인핸서 단백질 L과 동시 발현될 때 단백질의 품질이 증가되었음을 뒷받침한다.

실시예 18: L 인핸서 단백질의 발현은 생체 내 글루코실세라미다제(GBA) 발현의 균일성을 개선시킨다

생체 내에서 GBA의 발현을 평가하기 위해, 하기 실험을 수행하였다. pGBA-NanoLuc_STD(인핸서 단백질 L 없음, 서열번호 273 내지 296) 및 pGBA-NanoLuc_EG(인핸서 단백질 L 있음, 서열번호 297 내지 324) 플라스미드 둘 다를 하기와 같이 생체 내 전달을 위해 지질 나노입자(LNP)로 제형화하였다. 300 μg 플라스미드를 2.6 ml의 캡슐화 완충액(EB, pH4에서 25 mM 아세트산나트륨)에 용해시켰다. LNP 지질 혼합물을 1% DMG-PEG(2000), 39% 콜레스테롤, 10% DOPC 및 50% DLin-KC2-DMA 이온화 가능한 지질을 함유하고 최종 총 지질 농도가 4 mM인, 2.6 ml의 100% EtOH에서 제조하였다. EB의 플라스미드와 EtOH의 지질을 동일한 부피(각각 2.6 ml)로 빠르게 혼합하여 조합하였다. 혼합 직후, 5.2 ml의 뉴트리바이오시밀러퍼(neutrbiosimilarffer)(NB, pH6에서 300 mM NaCl + 20 mM 구연산나트륨)를 지질/플라스미드 혼합물에 첨가하고 빠르게 혼합하며 37℃에서 30분간 인큐베이션하였다. Amicon Ultra 15-ml 100 kDa MWCO 스핀 필터를 사용하여 혼합물을 PBS에 대해 정용여과하였다. 캡슐화 효율과 로딩된 플라스미드의 총 농도를 하기와 같이 SYBRSafe 캡슐화 효율 분석을 사용하여 결정하였다. 5 μl의 플라스미드/LNP를 TE 완충액(LNP에 로딩되지 않은 플라스미드의 양을 검출하기 위해)에서 또는 1% Triton X-100을 함유하는 TE 완충액(플라스미드의 총량을 검출하기 위해, 즉, LNP에 로딩된 플라스미드와 로딩되지 않은 플라스미드 둘 다)에서 1X SYBRSafe DNA 결합 염료와 혼합하였다. 플라스미드 DNA 절대량 계산을 위해 표준 곡선을 TE 완충액에서 또는 1% Triton X-100을 함유한 TE 완충액에서 각각 1X SYBRSafe DNA 결합 염료에 혼합된 알려진 양의 기준 노출 플라스미드 DNA를 사용하여 작성하였다. 샘플 또는 표준을 5분 동안 인큐베이션하고 FITC용 필터 세트를 사용하는 Biotek Synergy LX 형광 마이크로플레이트 판독기를 사용하여 형광을 판독하였다. 캡슐화 효율을 하기 방정식을 사용하여 계산하였다: 로딩_효율 = (플라스미드_전체 - 플라스미드_비로딩) / 플라스미드_전체 × 100%.

로딩 효율은 >90%였다. PBS를 사용하여 플라스미드/LNP를 200 μl PBS당 플라스미드 30 μg의 등가 플라스미드 농도로 희석하였다. 암컷 Balb/c 마우스를 마취시키고 견갑골 사이의 피하 주사를 위해 200 μl의 고정 용량을 개별적으로 투여했다, 그룹당 N=3. 표시된 시점에서, Nano-Glo® In Vivo Substrate, FFz를 마우스에 복강내(i.p.) 주사하여 전신 생물발광 이미징(BLI)을 수행하고 복위 자세와 앙와위 자세에서 이미지를 촬영했다. 복위 자세는 주사 부위에 초점을 맞추고 앙와위 자세는 간 부위에 초점을 맞췄다. 발광 값을 정량화하고, 표로 작성하고, 플롯팅했다.

생물발광 영상화(BLI) 결과는 검출된 발광 신호가 LNP-pGBA-NanoLuc_EG 그룹과 비교하여 LNP-pGBA-NanoLuc_STD 그룹에서 약간 더 높지는 않더라도 상대적으로 동일하였는데(도 32a 내지 도 32c 및 표 6), 이는 시험관 내 실험과 일치하였음을 나타내었다. 강한 신호는 복위 자세 BLI(즉, 주사의 부위에서)와 앙와위 자세(즉, 간일 가능성이 높은, 발현된 GBA-NanoLuc 축적의 부위에서, 이는 생체 내에서 생성된 단백질은 분비되고 표적 조직에서 축적됨을 나타냄) 둘 다에서 검출되었다.

[표 6]

LNP-pGBA-NanoLuc_STD 그룹에서 BLI 신호는 LNP-pGBA-NanoLuc_EG 그룹과 비교할 경우 동일한 시점에서 측정된 바와 같이 시간에 따라 뿐만 아니라 개별 동물 간에 더 가변적이었다. 이를 각 측정 시점에서 신호의 변동 계수(CV%)를 정량화한 후, 각 처리군에 대한 평균 CV%를 계산하여 추가로 조사하였다. CV%는 신호의 표준 편차를 신호 평균으로 나눈 값으로 정의되었다. 이 분석은 평균 CV%가 인핸서 단백질의 부재 시 더 높았다는 것을 밝혀 주었다(도 32c 및 표 6). 복위 자세(즉, LNP 투여의 부위)에서는 CV%의 차이가 상대적으로 작은 반면, 복위 자세(즉, 분비된 GBA-NanoLuc 단백질 축적의 부위)에서는 차이가 대략 2배였다. 이는 인핸서 단백질 L의 존재 하에 생체 내에서 벡터화된 분비 단백질을 사용하는 것이 인핸서 단백질 L의 부재 하의 경우에 비해 더 균일하고 견고할 것임을 시사한다.

SEQUENCE LISTING <110> EXCEPGEN INC. <120> SYSTEMS AND METHODS FOR PROTEIN EXPRESSION <130> EXCI-002/02WO 336721-2011 <150> US 63/160,672 <151> 2021-03-12 <160> 422 <170> PatentIn version 3.5 <210> 1 <211> 71 <212> PRT <213> Cardiovirus Theiler's-like cardiovirus <400> 1 Met Ala Cys Lys His Gly Tyr Pro Leu Met Cys Pro Leu Cys Thr Ala 1 5 10 15 Leu Asp Lys Thr Ser Asp Gly Leu Phe Thr Leu Leu Phe Asp Asn Glu 20 25 30 Trp Tyr Pro Thr Asp Leu Leu Thr Val Asp Leu Glu Asp Glu Val Phe 35 40 45 Tyr Pro Asp Asp Pro His Met Glu Trp Thr Asp Leu Pro Leu Ile Gln 50 55 60 Asp Ile Glu Met Glu Pro Gln 65 70 <210> 2 <211> 67 <212> PRT <213> Cardiovirus Encephalomyocarditis virus <400> 2 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 3 <211> 127 <212> PRT <213> Enterovirus Enterovirus C <400> 3 Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn Val 1 5 10 15 Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly Thr 20 25 30 Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys Glu 35 40 45 Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe Gln 50 55 60 Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His Met 65 70 75 80 Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile Leu 85 90 95 Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu Gly 100 105 110 Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu 115 120 125 <210> 4 <211> 219 <212> PRT <213> Erbovirus Equine rhinitis B virus 1 <400> 4 Met Val Thr Met Ala Gly Asn Met Ile Cys Asn Val Phe Ala Gly Leu 1 5 10 15 Ala Thr Glu Ile Cys Ser Pro Lys Gln Gly Pro Leu Leu Asp Asn Glu 20 25 30 Leu Pro Leu Pro Leu Glu Leu Ala Glu Phe Pro Asn Lys Asp Asn Asn 35 40 45 Cys Trp Val Ala Ala Leu Ser His Tyr Tyr Thr Leu Cys Asp Val Thr 50 55 60 Asn His Val Thr Lys Val Thr Pro Thr Thr Ser Gly Ile Arg Tyr Tyr 65 70 75 80 Leu Thr Ala Trp Gln Ser Ile Leu Gln Thr Asp Leu Phe Asn Gly Tyr 85 90 95 Tyr Pro Ala Ala Phe Ala Val Glu Thr Gly Leu Cys His Gly Pro Phe 100 105 110 Pro Met Gln Gln His Gly Tyr Val Arg Asn Ala Thr Ser His Pro Tyr 115 120 125 Asn Phe Cys Leu Cys Ser Glu Pro Val Pro Gly Glu Asp Tyr Trp His 130 135 140 Ala Val Val Lys Val Asp Leu Ser Arg Thr Glu Ala Arg Val Asp Lys 145 150 155 160 Trp Leu Cys Ile Asp Asp Asp Arg Met Tyr Leu Ser Gly Pro Pro Thr 165 170 175 Arg Val Lys Leu Ala Ser Ser Tyr Lys Ile Pro Thr Trp Ile Glu Ser 180 185 190 Leu Ala Gln Phe Cys Leu Gln Leu His Pro Val Gln His Arg Arg Thr 195 200 205 Leu Ala Asn Ser Leu Arg Asn Glu Gln Cys Arg 210 215 <210> 5 <211> 67 <212> PRT <213> Cardiovirus Encephalomyocarditis virus <400> 5 Met Ala Thr Thr Met Glu Gln Glu Ile Cys Ala His Ser Met Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Ser Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Asp Leu Asp Met Glu Val Val Phe 50 55 60 Glu Thr Gln 65 <210> 6 <211> 71 <212> PRT <213> Cardiovirus Cardiovirus B <400> 6 Met Ala Cys Lys His Gly Tyr Pro Phe Leu Cys Pro Leu Cys Thr Ala 1 5 10 15 Ile Asp Thr Thr His Asp Gly Ser Phe Thr Leu Leu Ile Asp Asn Glu 20 25 30 Trp Tyr Pro Thr Asp Leu Leu Thr Val Asp Leu Asp Asp Asp Val Phe 35 40 45 His Pro Asp Asp Ser Val Met Glu Trp Thr Asp Leu Pro Leu Ile Gln 50 55 60 Asp Val Val Met Glu Pro Gln 65 70 <210> 7 <211> 149 <212> PRT <213> Enterovirus Enterovirus C <400> 7 Gly Phe Gly His Gln Asn Lys Ala Val Tyr Thr Ala Gly Tyr Lys Ile 1 5 10 15 Cys Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn 20 25 30 Val Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly 35 40 45 Thr Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys 50 55 60 Glu Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe 65 70 75 80 Gln Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His 85 90 95 Met Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile 100 105 110 Leu Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu 115 120 125 Gly Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu 130 135 140 Glu Ala Met Glu Gln 145 <210> 8 <211> 182 <212> PRT <213> Enterovirus Human rhinovirus 16 <400> 8 Gly Pro Glu Glu Glu Phe Gly Met Ser Ile Ile Lys Asn Asn Thr Cys 1 5 10 15 Val Val Thr Thr Thr Asn Gly Lys Phe Thr Gly Leu Gly Ile Tyr Asp 20 25 30 Arg Ile Leu Ile Leu Pro Thr His Ala Asp Pro Gly Ser Glu Ile Gln 35 40 45 Val Asn Gly Ile His Thr Lys Val Leu Asp Ser Tyr Asp Leu Phe Asn 50 55 60 Lys Glu Gly Val Lys Leu Glu Ile Thr Val Leu Lys Leu Asp Arg Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Arg Lys Tyr Ile Pro Glu Ser Glu Asp Asp 85 90 95 Tyr Pro Glu Cys Asn Leu Ala Leu Val Ala Asn Gln Thr Glu Pro Thr 100 105 110 Ile Ile Lys Val Gly Asp Val Val Ser Tyr Gly Asn Ile Leu Leu Ser 115 120 125 Gly Thr Gln Thr Ala Arg Met Leu Lys Tyr Asn Tyr Pro Thr Lys Ser 130 135 140 Gly Tyr Cys Gly Gly Val Leu Tyr Lys Ile Gly Gln Ile Leu Gly Ile 145 150 155 160 His Val Gly Gly Asn Gly Arg Asp Gly Phe Ser Ser Met Leu Leu Arg 165 170 175 Ser Tyr Phe Thr Glu Gln 180 <210> 9 <211> 229 <212> PRT <213> Vesiculovirus Indiana vesiculovirus <400> 9 Met Ser Ser Leu Lys Lys Ile Leu Gly Leu Lys Gly Lys Gly Lys Lys 1 5 10 15 Ser Lys Lys Leu Gly Ile Ala Pro Pro Pro Tyr Glu Glu Asp Thr Ser 20 25 30 Met Glu Tyr Ala Pro Ser Ala Pro Ile Asp Lys Ser Tyr Phe Gly Val 35 40 45 Asp Glu Met Asp Thr Tyr Asp Pro Asn Gln Leu Arg Tyr Glu Lys Phe 50 55 60 Phe Phe Thr Val Lys Met Thr Val Arg Ser Asn Arg Pro Phe Arg Thr 65 70 75 80 Tyr Ser Asp Val Ala Ala Ala Val Ser His Trp Asp His Met Tyr Ile 85 90 95 Gly Met Ala Gly Lys Arg Pro Phe Tyr Lys Ile Leu Ala Phe Leu Gly 100 105 110 Ser Ser Asn Leu Lys Ala Thr Pro Ala Val Leu Ala Asp Gln Gly Gln 115 120 125 Pro Glu Tyr His Thr His Cys Glu Gly Arg Ala Tyr Leu Pro His Arg 130 135 140 Met Gly Lys Thr Pro Pro Met Leu Asn Val Pro Glu His Phe Arg Arg 145 150 155 160 Pro Phe Asn Ile Gly Leu Tyr Lys Gly Thr Ile Glu Leu Thr Met Thr 165 170 175 Ile Tyr Asp Asp Glu Ser Leu Glu Ala Ala Pro Met Ile Trp Asp His 180 185 190 Phe Asn Ser Ser Lys Phe Ser Asp Phe Arg Glu Lys Ala Leu Met Phe 195 200 205 Gly Leu Ile Val Glu Lys Lys Ala Ser Gly Ala Trp Val Leu Asp Ser 210 215 220 Ile Ser His Phe Lys 225 <210> 10 <211> 230 <212> PRT <213> Alphainfluenzavirus Influenza A virus <400> 10 Met Asp Pro Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp 1 5 10 15 His Val Arg Lys Arg Val Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe 20 25 30 Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser 35 40 45 Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr Arg Ala Gly Lys Gln Ile 50 55 60 Val Glu Arg Ile Leu Lys Glu Glu Ser Asp Glu Ala Leu Lys Met Thr 65 70 75 80 Met Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Glu 85 90 95 Glu Met Ser Arg Asp Trp Ser Met Leu Ile Pro Lys Gln Lys Val Ala 100 105 110 Gly Pro Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile 115 120 125 Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Asp Arg Leu Glu Thr Leu 130 135 140 Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Ile Val Gly Glu Ile 145 150 155 160 Ser Pro Leu Pro Ser Leu Pro Gly His Thr Ala Glu Asp Val Lys Asn 165 170 175 Ala Val Gly Val Leu Ile Gly Gly Leu Glu Trp Asn Asp Asn Thr Val 180 185 190 Arg Val Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser Asn Glu 195 200 205 Asn Gly Arg Pro Pro Leu Thr Pro Lys Gln Lys Arg Glu Met Ala Gly 210 215 220 Thr Ile Arg Ser Glu Val 225 230 <210> 11 <211> 512 <212> PRT <213> Unknown <220> <223> Simplexvirus sp. <400> 11 Met Ala Thr Asp Ile Asp Met Leu Ile Asp Leu Gly Leu Asp Leu Ser 1 5 10 15 Asp Ser Asp Leu Asp Glu Asp Pro Pro Glu Pro Ala Glu Ser Arg Arg 20 25 30 Asp Asp Leu Glu Ser Asp Ser Ser Gly Glu Cys Ser Ser Ser Asp Glu 35 40 45 Asp Met Glu Asp Pro His Gly Glu Asp Gly Pro Glu Pro Ile Leu Asp 50 55 60 Ala Ala Arg Pro Ala Val Arg Pro Ser Arg Pro Glu Asp Pro Gly Val 65 70 75 80 Pro Ser Thr Gln Thr Pro Arg Pro Thr Glu Arg Gln Gly Pro Asn Asp 85 90 95 Pro Gln Pro Ala Pro His Ser Val Trp Ser Arg Leu Gly Ala Arg Arg 100 105 110 Pro Ser Cys Ser Pro Glu Gln His Gly Gly Lys Val Ala Arg Leu Gln 115 120 125 Pro Pro Pro Thr Lys Ala Gln Pro Ala Arg Gly Gly Arg Arg Gly Arg 130 135 140 Arg Arg Gly Arg Gly Arg Gly Gly Pro Gly Ala Ala Asp Gly Leu Ser 145 150 155 160 Asp Pro Arg Arg Arg Ala Pro Arg Thr Asn Arg Asn Pro Gly Gly Pro 165 170 175 Arg Pro Gly Ala Gly Trp Thr Asp Gly Pro Gly Ala Pro His Gly Glu 180 185 190 Ala Trp Arg Gly Ser Glu Gln Pro Asp Pro Pro Gly Gly Gln Arg Thr 195 200 205 Arg Gly Val Arg Gln Ala Pro Pro Pro Leu Met Thr Leu Ala Ile Ala 210 215 220 Pro Pro Pro Ala Asp Pro Arg Ala Pro Ala Pro Glu Arg Lys Ala Pro 225 230 235 240 Ala Ala Asp Thr Ile Asp Ala Thr Thr Arg Leu Val Leu Arg Ser Ile 245 250 255 Ser Glu Arg Ala Ala Val Asp Arg Ile Ser Glu Ser Phe Gly Arg Ser 260 265 270 Ala Gln Val Met His Asp Pro Phe Gly Gly Gln Pro Phe Pro Ala Ala 275 280 285 Asn Ser Pro Trp Ala Pro Val Leu Ala Gly Gln Gly Gly Pro Phe Asp 290 295 300 Ala Glu Thr Arg Arg Val Ser Trp Glu Thr Leu Val Ala His Gly Pro 305 310 315 320 Ser Leu Tyr Arg Thr Phe Ala Gly Asn Pro Arg Ala Ala Ser Thr Ala 325 330 335 Lys Ala Met Arg Asp Cys Val Leu Arg Gln Glu Asn Phe Ile Glu Ala 340 345 350 Leu Ala Ser Ala Asp Glu Thr Leu Ala Trp Cys Lys Met Cys Ile His 355 360 365 His Asn Leu Pro Leu Arg Pro Gln Asp Pro Ile Ile Gly Thr Thr Ala 370 375 380 Ala Val Leu Asp Asn Leu Ala Thr Arg Leu Arg Pro Phe Leu Gln Cys 385 390 395 400 Tyr Leu Lys Ala Arg Gly Leu Cys Gly Leu Asp Glu Leu Cys Ser Arg 405 410 415 Arg Arg Leu Ala Asp Ile Lys Asp Ile Ala Ser Phe Val Phe Val Ile 420 425 430 Leu Ala Arg Leu Ala Asn Arg Val Glu Arg Gly Val Ala Glu Ile Asp 435 440 445 Tyr Ala Thr Leu Gly Val Gly Val Gly Glu Lys Met His Phe Tyr Leu 450 455 460 Pro Gly Ala Cys Met Ala Gly Leu Ile Glu Ile Leu Asp Thr His Arg 465 470 475 480 Gln Glu Cys Ser Ser Arg Val Cys Glu Leu Thr Ala Ser His Ile Val 485 490 495 Ala Pro Pro Tyr Val His Gly Lys Tyr Phe Tyr Cys Asn Ser Leu Phe 500 505 510 <210> 12 <211> 700 <212> PRT <213> Artificial Sequence <220> <223> DRD1-GFP <400> 12 Met Arg Thr Leu Asn Thr Ser Ala Met Asp Gly Thr Gly Leu Val Val 1 5 10 15 Glu Arg Asp Phe Ser Val Arg Ile Leu Thr Ala Cys Phe Leu Ser Leu 20 25 30 Leu Ile Leu Ser Thr Leu Leu Gly Asn Thr Leu Val Cys Ala Ala Val 35 40 45 Ile Arg Phe Arg His Leu Arg Ser Lys Val Thr Asn Phe Phe Val Ile 50 55 60 Ser Leu Ala Val Ser Asp Leu Leu Val Ala Val Leu Val Met Pro Trp 65 70 75 80 Lys Ala Val Ala Glu Ile Ala Gly Phe Trp Pro Phe Gly Ser Phe Cys 85 90 95 Asn Ile Trp Val Ala Phe Asp Ile Met Cys Ser Thr Ala Ser Ile Leu 100 105 110 Asn Leu Cys Val Ile Ser Val Asp Arg Tyr Trp Ala Ile Ser Ser Pro 115 120 125 Phe Arg Tyr Glu Arg Lys Met Thr Pro Lys Ala Ala Phe Ile Leu Ile 130 135 140 Ser Val Ala Trp Thr Leu Ser Val Leu Ile Ser Phe Ile Pro Val Gln 145 150 155 160 Leu Ser Trp His Lys Ala Lys Pro Thr Ser Pro Ser Asp Gly Asn Ala 165 170 175 Thr Ser Leu Ala Glu Thr Ile Asp Asn Cys Asp Ser Ser Leu Ser Arg 180 185 190 Thr Tyr Ala Ile Ser Ser Ser Val Ile Ser Phe Tyr Ile Pro Val Ala 195 200 205 Ile Met Ile Val Thr Tyr Thr Arg Ile Tyr Arg Ile Ala Gln Lys Gln 210 215 220 Ile Arg Arg Ile Ala Ala Leu Glu Arg Ala Ala Val His Ala Lys Asn 225 230 235 240 Cys Gln Thr Thr Thr Gly Asn Gly Lys Pro Val Glu Cys Ser Gln Pro 245 250 255 Glu Ser Ser Phe Lys Met Ser Phe Lys Arg Glu Thr Lys Val Leu Lys 260 265 270 Thr Leu Ser Val Ile Met Gly Val Phe Val Cys Cys Trp Leu Pro Phe 275 280 285 Phe Ile Leu Asn Cys Ile Leu Pro Phe Cys Gly Ser Gly Glu Thr Gln 290 295 300 Pro Phe Cys Ile Asp Ser Asn Thr Phe Asp Val Phe Val Trp Phe Gly 305 310 315 320 Trp Ala Asn Ser Ser Leu Asn Pro Ile Ile Tyr Ala Phe Asn Ala Asp 325 330 335 Phe Arg Lys Ala Phe Ser Thr Leu Leu Gly Cys Tyr Arg Leu Cys Pro 340 345 350 Ala Thr Asn Asn Ala Ile Glu Thr Val Ser Ile Asn Asn Asn Gly Ala 355 360 365 Ala Met Phe Ser Ser His His Glu Pro Arg Gly Ser Ile Ser Lys Glu 370 375 380 Cys Asn Leu Val Tyr Leu Ile Pro His Ala Val Gly Ser Ser Glu Asp 385 390 395 400 Leu Lys Lys Glu Glu Ala Ala Gly Ile Ala Arg Pro Leu Glu Lys Leu 405 410 415 Ser Pro Ala Leu Ser Val Ile Leu Asp Tyr Asp Thr Asp Val Ser Leu 420 425 430 Glu Lys Ile Gln Pro Ile Thr Gln Asn Gly Gln His Pro Thr Gly Gly 435 440 445 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Ser 450 455 460 Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu 465 470 475 480 Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu 485 490 495 Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr 500 505 510 Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr 515 520 525 Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp 530 535 540 Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile 545 550 555 560 Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe 565 570 575 Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe 580 585 590 Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn 595 600 605 Ser His Lys Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys 610 615 620 Val Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu 625 630 635 640 Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu 645 650 655 Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp 660 665 670 Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala 675 680 685 Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 690 695 700 <210> 13 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> GFP <400> 13 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Lys Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 14 <211> 460 <212> PRT <213> Artificial Sequence <220> <223> DRD1-Strep <400> 14 Met Arg Thr Leu Asn Thr Ser Ala Met Asp Gly Thr Gly Leu Val Val 1 5 10 15 Glu Arg Asp Phe Ser Val Arg Ile Leu Thr Ala Cys Phe Leu Ser Leu 20 25 30 Leu Ile Leu Ser Thr Leu Leu Gly Asn Thr Leu Val Cys Ala Ala Val 35 40 45 Ile Arg Phe Arg His Leu Arg Ser Lys Val Thr Asn Phe Phe Val Ile 50 55 60 Ser Leu Ala Val Ser Asp Leu Leu Val Ala Val Leu Val Met Pro Trp 65 70 75 80 Lys Ala Val Ala Glu Ile Ala Gly Phe Trp Pro Phe Gly Ser Phe Cys 85 90 95 Asn Ile Trp Val Ala Phe Asp Ile Met Cys Ser Thr Ala Ser Ile Leu 100 105 110 Asn Leu Cys Val Ile Ser Val Asp Arg Tyr Trp Ala Ile Ser Ser Pro 115 120 125 Phe Arg Tyr Glu Arg Lys Met Thr Pro Lys Ala Ala Phe Ile Leu Ile 130 135 140 Ser Val Ala Trp Thr Leu Ser Val Leu Ile Ser Phe Ile Pro Val Gln 145 150 155 160 Leu Ser Trp His Lys Ala Lys Pro Thr Ser Pro Ser Asp Gly Asn Ala 165 170 175 Thr Ser Leu Ala Glu Thr Ile Asp Asn Cys Asp Ser Ser Leu Ser Arg 180 185 190 Thr Tyr Ala Ile Ser Ser Ser Val Ile Ser Phe Tyr Ile Pro Val Ala 195 200 205 Ile Met Ile Val Thr Tyr Thr Arg Ile Tyr Arg Ile Ala Gln Lys Gln 210 215 220 Ile Arg Arg Ile Ala Ala Leu Glu Arg Ala Ala Val His Ala Lys Asn 225 230 235 240 Cys Gln Thr Thr Thr Gly Asn Gly Lys Pro Val Glu Cys Ser Gln Pro 245 250 255 Glu Ser Ser Phe Lys Met Ser Phe Lys Arg Glu Thr Lys Val Leu Lys 260 265 270 Thr Leu Ser Val Ile Met Gly Val Phe Val Cys Cys Trp Leu Pro Phe 275 280 285 Phe Ile Leu Asn Cys Ile Leu Pro Phe Cys Gly Ser Gly Glu Thr Gln 290 295 300 Pro Phe Cys Ile Asp Ser Asn Thr Phe Asp Val Phe Val Trp Phe Gly 305 310 315 320 Trp Ala Asn Ser Ser Leu Asn Pro Ile Ile Tyr Ala Phe Asn Ala Asp 325 330 335 Phe Arg Lys Ala Phe Ser Thr Leu Leu Gly Cys Tyr Arg Leu Cys Pro 340 345 350 Ala Thr Asn Asn Ala Ile Glu Thr Val Ser Ile Asn Asn Asn Gly Ala 355 360 365 Ala Met Phe Ser Ser His His Glu Pro Arg Gly Ser Ile Ser Lys Glu 370 375 380 Cys Asn Leu Val Tyr Leu Ile Pro His Ala Val Gly Ser Ser Glu Asp 385 390 395 400 Leu Lys Lys Glu Glu Ala Ala Gly Ile Ala Arg Pro Leu Glu Lys Leu 405 410 415 Ser Pro Ala Leu Ser Val Ile Leu Asp Tyr Asp Thr Asp Val Ser Leu 420 425 430 Glu Lys Ile Gln Pro Ile Thr Gln Asn Gly Gln His Pro Thr Thr Gly 435 440 445 Thr Arg Pro Leu Trp Ser His Pro Gln Phe Glu Lys 450 455 460 <210> 15 <211> 635 <212> PRT <213> Artificial Sequence <220> <223> ITK <400> 15 Met Asn Asn Phe Ile Leu Leu Glu Glu Gln Leu Ile Lys Lys Ser Gln 1 5 10 15 Gln Lys Arg Arg Thr Ser Pro Ser Asn Phe Lys Val Arg Phe Phe Val 20 25 30 Leu Thr Lys Ala Ser Leu Ala Tyr Phe Glu Asp Arg His Gly Lys Lys 35 40 45 Arg Thr Leu Lys Gly Ser Ile Glu Leu Ser Arg Ile Lys Cys Val Glu 50 55 60 Ile Val Lys Ser Asp Ile Ser Ile Pro Cys His Tyr Lys Tyr Pro Phe 65 70 75 80 Gln Val Val His Asp Asn Tyr Leu Leu Tyr Val Phe Ala Pro Asp Arg 85 90 95 Glu Ser Arg Gln Arg Trp Val Leu Ala Leu Lys Glu Glu Thr Arg Asn 100 105 110 Asn Asn Ser Leu Val Pro Lys Tyr His Pro Asn Phe Trp Met Asp Gly 115 120 125 Lys Trp Arg Cys Cys Ser Gln Leu Glu Lys Leu Ala Thr Gly Cys Ala 130 135 140 Gln Tyr Asp Pro Thr Lys Asn Ala Ser Lys Lys Pro Leu Pro Pro Thr 145 150 155 160 Pro Glu Asp Asn Arg Arg Pro Leu Trp Glu Pro Glu Glu Thr Val Val 165 170 175 Ile Ala Leu Tyr Asp Tyr Gln Thr Asn Asp Pro Gln Glu Leu Ala Leu 180 185 190 Arg Arg Asn Glu Glu Tyr Cys Leu Leu Asp Ser Ser Glu Ile His Trp 195 200 205 Trp Arg Val Gln Asp Arg Asn Gly His Glu Gly Tyr Val Pro Ser Ser 210 215 220 Tyr Leu Val Glu Lys Ser Pro Asn Asn Leu Glu Thr Tyr Glu Trp Tyr 225 230 235 240 Asn Lys Ser Ile Ser Arg Asp Lys Ala Glu Lys Leu Leu Leu Asp Thr 245 250 255 Gly Lys Glu Gly Ala Phe Met Val Arg Asp Ser Arg Thr Ala Gly Thr 260 265 270 Tyr Thr Val Ser Val Phe Thr Lys Ala Val Val Ser Glu Asn Asn Pro 275 280 285 Cys Ile Lys His Tyr His Ile Lys Glu Thr Asn Asp Asn Pro Lys Arg 290 295 300 Tyr Tyr Val Ala Glu Lys Tyr Val Phe Asp Ser Ile Pro Leu Leu Ile 305 310 315 320 Asn Tyr His Gln His Asn Gly Gly Gly Leu Val Thr Arg Leu Arg Tyr 325 330 335 Pro Val Cys Phe Gly Arg Gln Lys Ala Pro Val Thr Ala Gly Leu Arg 340 345 350 Tyr Gly Lys Trp Val Ile Asp Pro Ser Glu Leu Thr Phe Val Gln Glu 355 360 365 Ile Gly Ser Gly Gln Phe Gly Leu Val His Leu Gly Tyr Trp Leu Asn 370 375 380 Lys Asp Lys Val Ala Ile Lys Thr Ile Arg Glu Gly Ala Met Ser Glu 385 390 395 400 Glu Asp Phe Ile Glu Glu Ala Glu Val Met Met Lys Leu Ser His Pro 405 410 415 Lys Leu Val Gln Leu Tyr Gly Val Cys Leu Glu Gln Ala Pro Ile Cys 420 425 430 Leu Val Phe Glu Phe Met Glu His Gly Cys Leu Ser Asp Tyr Leu Arg 435 440 445 Thr Gln Arg Gly Leu Phe Ala Ala Glu Thr Leu Leu Gly Met Cys Leu 450 455 460 Asp Val Cys Glu Gly Met Ala Tyr Leu Glu Glu Ala Cys Val Ile His 465 470 475 480 Arg Asp Leu Ala Ala Arg Asn Cys Leu Val Gly Glu Asn Gln Val Ile 485 490 495 Lys Val Ser Asp Phe Gly Met Thr Arg Phe Val Leu Asp Asp Gln Tyr 500 505 510 Thr Ser Ser Thr Gly Thr Lys Phe Pro Val Lys Trp Ala Ser Pro Glu 515 520 525 Val Phe Ser Phe Ser Arg Tyr Ser Ser Lys Ser Asp Val Trp Ser Phe 530 535 540 Gly Val Leu Met Trp Glu Val Phe Ser Glu Gly Lys Ile Pro Tyr Glu 545 550 555 560 Asn Arg Ser Asn Ser Glu Val Val Glu Asp Ile Ser Thr Gly Phe Arg 565 570 575 Leu Tyr Lys Pro Arg Leu Ala Ser Thr His Val Tyr Gln Ile Met Asn 580 585 590 His Cys Trp Lys Glu Arg Pro Glu Asp Arg Pro Ala Phe Ser Arg Leu 595 600 605 Leu Arg Gln Leu Ala Glu Ile Ala Glu Ser Gly Leu Gly Gly Gly Gly 610 615 620 Gly Gly Gly Gly His His His His His His Val 625 630 635 <210> 16 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> C1 Inhibitor <400> 16 Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala 1 5 10 15 Gly Asp Arg Ala Ser Ser Asn Pro Asn Ala Thr Ser Ser Ser Ser Gln 20 25 30 Asp Pro Glu Ser Leu Gln Asp Arg Gly Glu Gly Lys Val Ala Thr Thr 35 40 45 Val Ile Ser Lys Met Leu Phe Val Glu Pro Ile Leu Glu Val Ser Ser 50 55 60 Leu Pro Thr Thr Asn Ser Thr Thr Asn Ser Ala Thr Lys Ile Thr Ala 65 70 75 80 Asn Thr Thr Asp Glu Pro Thr Thr Gln Pro Thr Thr Glu Pro Thr Thr 85 90 95 Gln Pro Thr Ile Gln Pro Thr Gln Pro Thr Thr Gln Leu Pro Thr Asp 100 105 110 Ser Pro Thr Gln Pro Thr Thr Gly Ser Phe Cys Pro Gly Pro Val Thr 115 120 125 Leu Cys Ser Asp Leu Glu Ser His Ser Thr Glu Ala Val Leu Gly Asp 130 135 140 Ala Leu Val Asp Phe Ser Leu Lys Leu Tyr His Ala Phe Ser Ala Met 145 150 155 160 Lys Lys Val Glu Thr Asn Met Ala Phe Ser Pro Phe Ser Ile Ala Ser 165 170 175 Leu Leu Thr Gln Val Leu Leu Gly Ala Gly Glu Asn Thr Lys Thr Asn 180 185 190 Leu Glu Ser Ile Leu Ser Tyr Pro Lys Asp Phe Thr Cys Val His Gln 195 200 205 Ala Leu Lys Gly Phe Thr Thr Lys Gly Val Thr Ser Val Ser Gln Ile 210 215 220 Phe His Ser Pro Asp Leu Ala Ile Arg Asp Thr Phe Val Asn Ala Ser 225 230 235 240 Arg Thr Leu Tyr Ser Ser Ser Pro Arg Val Leu Ser Asn Asn Ser Asp 245 250 255 Ala Asn Leu Glu Leu Ile Asn Thr Trp Val Ala Lys Asn Thr Asn Asn 260 265 270 Lys Ile Ser Arg Leu Leu Asp Ser Leu Pro Ser Asp Thr Arg Leu Val 275 280 285 Leu Leu Asn Ala Ile Tyr Leu Ser Ala Lys Trp Lys Thr Thr Phe Asp 290 295 300 Pro Lys Lys Thr Arg Met Glu Pro Phe His Phe Lys Asn Ser Val Ile 305 310 315 320 Lys Val Pro Met Met Asn Ser Lys Lys Tyr Pro Val Ala His Phe Ile 325 330 335 Asp Gln Thr Leu Lys Ala Lys Val Gly Gln Leu Gln Leu Ser His Asn 340 345 350 Leu Ser Leu Val Ile Leu Val Pro Gln Asn Leu Lys His Arg Leu Glu 355 360 365 Asp Met Glu Gln Ala Leu Ser Pro Ser Val Phe Lys Ala Ile Met Glu 370 375 380 Lys Leu Glu Met Ser Lys Phe Gln Pro Thr Leu Leu Thr Leu Pro Arg 385 390 395 400 Ile Lys Val Thr Thr Ser Gln Asp Met Leu Ser Ile Met Glu Lys Leu 405 410 415 Glu Phe Phe Asp Phe Ser Tyr Asp Leu Asn Leu Cys Gly Leu Thr Glu 420 425 430 Asp Pro Asp Leu Gln Val Ser Ala Met Gln His Gln Thr Val Leu Glu 435 440 445 Leu Thr Glu Thr Gly Val Glu Ala Ala Ala Ala Ser Ala Ile Ser Val 450 455 460 Ala Arg Thr Leu Leu Val Phe Glu Val Gln Gln Pro Phe Leu Phe Val 465 470 475 480 Leu Trp Asp Gln Gln His Lys Phe Pro Val Phe Met Gly Arg Val Tyr 485 490 495 Asp Pro Arg Ala 500 <210> 17 <211> 883 <212> PRT <213> Artificial Sequence <220> <223> T7 RNA polymerase <400> 17 Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu 1 5 10 15 Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu 20 25 30 Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu 35 40 45 Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val 50 55 60 Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys 65 70 75 80 Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg 85 90 95 Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu 100 105 110 Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser 115 120 125 Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala 130 135 140 Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys 145 150 155 160 His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His 165 170 175 Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser 180 185 190 Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp 195 200 205 Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr 210 215 220 Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp 225 230 235 240 Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr 245 250 255 Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val 260 265 270 Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala 275 280 285 Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala 290 295 300 Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile 305 310 315 320 Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala 325 330 335 Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile 340 345 350 Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp 355 360 365 Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val 370 375 380 Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe 385 390 395 400 Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe 405 410 415 Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe 420 425 430 Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys 435 440 445 Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly 450 455 460 Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys 465 470 475 480 Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro 485 490 495 Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu 500 505 510 Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr 515 520 525 Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln 530 535 540 His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn 545 550 555 560 Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys 565 570 575 Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn 580 585 590 Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys 595 600 605 Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly 610 615 620 Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly 625 630 635 640 Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln 645 650 655 Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln 660 665 670 Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr 675 680 685 Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys 690 695 700 Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg 705 710 715 720 Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp 725 730 735 Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu 740 745 750 Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu 755 760 765 Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His 770 775 780 Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu 785 790 795 800 Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr 805 810 815 Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met 820 825 830 Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln 835 840 845 Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu 850 855 860 Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe 865 870 875 880 Ala Phe Ala <210> 18 <211> 1480 <212> PRT <213> Artificial Sequence <220> <223> CFTR <400> 18 Met Gln Arg Ser Pro Leu Glu Lys Ala Ser Val Val Ser Lys Leu Phe 1 5 10 15 Phe Ser Trp Thr Arg Pro Ile Leu Arg Lys Gly Tyr Arg Gln Arg Leu 20 25 30 Glu Leu Ser Asp Ile Tyr Gln Ile Pro Ser Val Asp Ser Ala Asp Asn 35 40 45 Leu Ser Glu Lys Leu Glu Arg Glu Trp Asp Arg Glu Leu Ala Ser Lys 50 55 60 Lys Asn Pro Lys Leu Ile Asn Ala Leu Arg Arg Cys Phe Phe Trp Arg 65 70 75 80 Phe Met Phe Tyr Gly Ile Phe Leu Tyr Leu Gly Glu Val Thr Lys Ala 85 90 95 Val Gln Pro Leu Leu Leu Gly Arg Ile Ile Ala Ser Tyr Asp Pro Asp 100 105 110 Asn Lys Glu Glu Arg Ser Ile Ala Ile Tyr Leu Gly Ile Gly Leu Cys 115 120 125 Leu Leu Phe Ile Val Arg Thr Leu Leu Leu His Pro Ala Ile Phe Gly 130 135 140 Leu His His Ile Gly Met Gln Met Arg Ile Ala Met Phe Ser Leu Ile 145 150 155 160 Tyr Lys Lys Thr Leu Lys Leu Ser Ser Arg Val Leu Asp Lys Ile Ser 165 170 175 Ile Gly Gln Leu Val Ser Leu Leu Ser Asn Asn Leu Asn Lys Phe Asp 180 185 190 Glu Gly Leu Ala Leu Ala His Phe Val Trp Ile Ala Pro Leu Gln Val 195 200 205 Ala Leu Leu Met Gly Leu Ile Trp Glu Leu Leu Gln Ala Ser Ala Phe 210 215 220 Cys Gly Leu Gly Phe Leu Ile Val Leu Ala Leu Phe Gln Ala Gly Leu 225 230 235 240 Gly Arg Met Met Met Lys Tyr Arg Asp Gln Arg Ala Gly Lys Ile Ser 245 250 255 Glu Arg Leu Val Ile Thr Ser Glu Met Ile Glu Asn Ile Gln Ser Val 260 265 270 Lys Ala Tyr Cys Trp Glu Glu Ala Met Glu Lys Met Ile Glu Asn Leu 275 280 285 Arg Gln Thr Glu Leu Lys Leu Thr Arg Lys Ala Ala Tyr Val Arg Tyr 290 295 300 Phe Asn Ser Ser Ala Phe Phe Phe Ser Gly Phe Phe Val Val Phe Leu 305 310 315 320 Ser Val Leu Pro Tyr Ala Leu Ile Lys Gly Ile Ile Leu Arg Lys Ile 325 330 335 Phe Thr Thr Ile Ser Phe Cys Ile Val Leu Arg Met Ala Val Thr Arg 340 345 350 Gln Phe Pro Trp Ala Val Gln Thr Trp Tyr Asp Ser Leu Gly Ala Ile 355 360 365 Asn Lys Ile Gln Asp Phe Leu Gln Lys Gln Glu Tyr Lys Thr Leu Glu 370 375 380 Tyr Asn Leu Thr Thr Thr Glu Val Val Met Glu Asn Val Thr Ala Phe 385 390 395 400 Trp Glu Glu Gly Phe Gly Glu Leu Phe Glu Lys Ala Lys Gln Asn Asn 405 410 415 Asn Asn Arg Lys Thr Ser Asn Gly Asp Asp Ser Leu Phe Phe Ser Asn 420 425 430 Phe Ser Leu Leu Gly Thr Pro Val Leu Lys Asp Ile Asn Phe Lys Ile 435 440 445 Glu Arg Gly Gln Leu Leu Ala Val Ala Gly Ser Thr Gly Ala Gly Lys 450 455 460 Thr Ser Leu Leu Met Met Ile Met Gly Glu Leu Glu Pro Ser Glu Gly 465 470 475 480 Lys Ile Lys His Ser Gly Arg Ile Ser Phe Cys Ser Gln Phe Ser Trp 485 490 495 Ile Met Pro Gly Thr Ile Lys Glu Asn Ile Ile Phe Gly Val Ser Tyr 500 505 510 Asp Glu Tyr Arg Tyr Arg Ser Val Ile Lys Ala Cys Gln Leu Glu Glu 515 520 525 Asp Ile Ser Lys Phe Ala Glu Lys Asp Asn Ile Val Leu Gly Glu Gly 530 535 540 Gly Ile Thr Leu Ser Gly Gly Gln Arg Ala Arg Ile Ser Leu Ala Arg 545 550 555 560 Ala Val Tyr Lys Asp Ala Asp Leu Tyr Leu Leu Asp Ser Pro Phe Gly 565 570 575 Tyr Leu Asp Val Leu Thr Glu Lys Glu Ile Phe Glu Ser Cys Val Cys 580 585 590 Lys Leu Met Ala Asn Lys Thr Arg Ile Leu Val Thr Ser Lys Met Glu 595 600 605 His Leu Lys Lys Ala Asp Lys Ile Leu Ile Leu His Glu Gly Ser Ser 610 615 620 Tyr Phe Tyr Gly Thr Phe Ser Glu Leu Gln Asn Leu Gln Pro Asp Phe 625 630 635 640 Ser Ser Lys Leu Met Gly Cys Asp Ser Phe Asp Gln Phe Ser Ala Glu 645 650 655 Arg Arg Asn Ser Ile Leu Thr Glu Thr Leu His Arg Phe Ser Leu Glu 660 665 670 Gly Asp Ala Pro Val Ser Trp Thr Glu Thr Lys Lys Gln Ser Phe Lys 675 680 685 Gln Thr Gly Glu Phe Gly Glu Lys Arg Lys Asn Ser Ile Leu Asn Pro 690 695 700 Ile Asn Ser Ile Arg Lys Phe Ser Ile Val Gln Lys Thr Pro Leu Gln 705 710 715 720 Met Asn Gly Ile Glu Glu Asp Ser Asp Glu Pro Leu Glu Arg Arg Leu 725 730 735 Ser Leu Val Pro Asp Ser Glu Gln Gly Glu Ala Ile Leu Pro Arg Ile 740 745 750 Ser Val Ile Ser Thr Gly Pro Thr Leu Gln Ala Arg Arg Arg Gln Ser 755 760 765 Val Leu Asn Leu Met Thr His Ser Val Asn Gln Gly Gln Asn Ile His 770 775 780 Arg Lys Thr Thr Ala Ser Thr Arg Lys Val Ser Leu Ala Pro Gln Ala 785 790 795 800 Asn Leu Thr Glu Leu Asp Ile Tyr Ser Arg Arg Leu Ser Gln Glu Thr 805 810 815 Gly Leu Glu Ile Ser Glu Glu Ile Asn Glu Glu Asp Leu Lys Glu Cys 820 825 830 Leu Phe Asp Asp Met Glu Ser Ile Pro Ala Val Thr Thr Trp Asn Thr 835 840 845 Tyr Leu Arg Tyr Ile Thr Val His Lys Ser Leu Ile Phe Val Leu Ile 850 855 860 Trp Cys Leu Val Ile Phe Leu Ala Glu Val Ala Ala Ser Leu Val Val 865 870 875 880 Leu Trp Leu Leu Gly Asn Thr Pro Leu Gln Asp Lys Gly Asn Ser Thr 885 890 895 His Ser Arg Asn Asn Ser Tyr Ala Val Ile Ile Thr Ser Thr Ser Ser 900 905 910 Tyr Tyr Val Phe Tyr Ile Tyr Val Gly Val Ala Asp Thr Leu Leu Ala 915 920 925 Met Gly Phe Phe Arg Gly Leu Pro Leu Val His Thr Leu Ile Thr Val 930 935 940 Ser Lys Ile Leu His His Lys Met Leu His Ser Val Leu Gln Ala Pro 945 950 955 960 Met Ser Thr Leu Asn Thr Leu Lys Ala Gly Gly Ile Leu Asn Arg Phe 965 970 975 Ser Lys Asp Ile Ala Ile Leu Asp Asp Leu Leu Pro Leu Thr Ile Phe 980 985 990 Asp Phe Ile Gln Leu Leu Leu Ile Val Ile Gly Ala Ile Ala Val Val 995 1000 1005 Ala Val Leu Gln Pro Tyr Ile Phe Val Ala Thr Val Pro Val Ile 1010 1015 1020 Val Ala Phe Ile Met Leu Arg Ala Tyr Phe Leu Gln Thr Ser Gln 1025 1030 1035 Gln Leu Lys Gln Leu Glu Ser Glu Gly Arg Ser Pro Ile Phe Thr 1040 1045 1050 His Leu Val Thr Ser Leu Lys Gly Leu Trp Thr Leu Arg Ala Phe 1055 1060 1065 Gly Arg Gln Pro Tyr Phe Glu Thr Leu Phe His Lys Ala Leu Asn 1070 1075 1080 Leu His Thr Ala Asn Trp Phe Leu Tyr Leu Ser Thr Leu Arg Trp 1085 1090 1095 Phe Gln Met Arg Ile Glu Met Ile Phe Val Ile Phe Phe Ile Ala 1100 1105 1110 Val Thr Phe Ile Ser Ile Leu Thr Thr Gly Glu Gly Glu Gly Arg 1115 1120 1125 Val Gly Ile Ile Leu Thr Leu Ala Met Asn Ile Met Ser Thr Leu 1130 1135 1140 Gln Trp Ala Val Asn Ser Ser Ile Asp Val Asp Ser Leu Met Arg 1145 1150 1155 Ser Val Ser Arg Val Phe Lys Phe Ile Asp Met Pro Thr Glu Gly 1160 1165 1170 Lys Pro Thr Lys Ser Thr Lys Pro Tyr Lys Asn Gly Gln Leu Ser 1175 1180 1185 Lys Val Met Ile Ile Glu Asn Ser His Val Lys Lys Asp Asp Ile 1190 1195 1200 Trp Pro Ser Gly Gly Gln Met Thr Val Lys Asp Leu Thr Ala Lys 1205 1210 1215 Tyr Thr Glu Gly Gly Asn Ala Ile Leu Glu Asn Ile Ser Phe Ser 1220 1225 1230 Ile Ser Pro Gly Gln Arg Val Gly Leu Leu Gly Arg Thr Gly Ser 1235 1240 1245 Gly Lys Ser Thr Leu Leu Ser Ala Phe Leu Arg Leu Leu Asn Thr 1250 1255 1260 Glu Gly Glu Ile Gln Ile Asp Gly Val Ser Trp Asp Ser Ile Thr 1265 1270 1275 Leu Gln Gln Trp Arg Lys Ala Phe Gly Val Ile Pro Gln Lys Val 1280 1285 1290 Phe Ile Phe Ser Gly Thr Phe Arg Lys Asn Leu Asp Pro Tyr Glu 1295 1300 1305 Gln Trp Ser Asp Gln Glu Ile Trp Lys Val Ala Asp Glu Val Gly 1310 1315 1320 Leu Arg Ser Val Ile Glu Gln Phe Pro Gly Lys Leu Asp Phe Val 1325 1330 1335 Leu Val Asp Gly Gly Cys Val Leu Ser His Gly His Lys Gln Leu 1340 1345 1350 Met Cys Leu Ala Arg Ser Val Leu Ser Lys Ala Lys Ile Leu Leu 1355 1360 1365 Leu Asp Glu Pro Ser Ala His Leu Asp Pro Val Thr Tyr Gln Ile 1370 1375 1380 Ile Arg Arg Thr Leu Lys Gln Ala Phe Ala Asp Cys Thr Val Ile 1385 1390 1395 Leu Cys Glu His Arg Ile Glu Ala Met Leu Glu Cys Gln Gln Phe 1400 1405 1410 Leu Val Ile Glu Glu Asn Lys Val Arg Gln Tyr Asp Ser Ile Gln 1415 1420 1425 Lys Leu Leu Asn Glu Arg Ser Leu Phe Arg Gln Ala Ile Ser Pro 1430 1435 1440 Ser Asp Arg Val Lys Leu Phe Pro His Arg Asn Ser Ser Lys Cys 1445 1450 1455 Lys Ser Lys Pro Gln Ile Ala Ala Leu Lys Glu Glu Thr Glu Glu 1460 1465 1470 Glu Val Gln Asp Thr Arg Leu 1475 1480 <210> 19 <211> 550 <212> PRT <213> Artificial Sequence <220> <223> Luciferase insert sequence <400> 19 Met Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe Tyr Pro 1 5 10 15 Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met Lys Arg 20 25 30 Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His Ile Glu 35 40 45 Val Asp Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg Leu Ala 50 55 60 Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile Val Val 65 70 75 80 Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly Ala Leu 85 90 95 Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn Glu Arg 100 105 110 Glu Leu Leu Asn Ser Met Gly Ile Ser Gln Pro Thr Val Val Phe Val 115 120 125 Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys Leu Pro 130 135 140 Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr Gln Gly 145 150 155 160 Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro Gly Phe 165 170 175 Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys Thr Ile 180 185 190 Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys Gly Val 195 200 205 Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala Arg Asp 210 215 220 Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu Ser Val 225 230 235 240 Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly Tyr Leu 245 250 255 Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu Glu Leu 260 265 270 Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu Leu Val 275 280 285 Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp Lys Tyr 290 295 300 Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser 305 310 315 320 Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile 325 330 335 Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr 340 345 350 Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe 355 360 365 Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val 370 375 380 Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly 385 390 395 400 Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp Gly 405 410 415 Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp Glu His Phe 420 425 430 Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys Gly Tyr Gln 435 440 445 Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn Ile 450 455 460 Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu Leu 465 470 475 480 Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu Lys 485 490 495 Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys Leu 500 505 510 Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr Gly 515 520 525 Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys Lys 530 535 540 Gly Gly Lys Ile Ala Val 545 550 <210> 20 <211> 2237 <212> DNA <213> Artificial Sequence <220> <223> Luciferase insert sequence <400> 20 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctatggaa gatgccaaaa 600 acattaagaa gggcccagcg ccattctacc cactcgaaga cgggaccgcc ggcgagcagc 660 tgcacaaagc catgaagcgc tacgccctgg tgcccggcac catcgccttt accgacgcac 720 atatcgaggt ggacattacc tacgccgagt acttcgagat gagcgttcgg ctggcagaag 780 ctatgaagcg ctatgggctg aatacaaacc atcggatcgt ggtgtgcagc gagaatagct 840 tgcagttctt catgcccgtg ttgggtgccc tgttcatcgg tgtggctgtg gccccagcta 900 acgacatcta caacgagcgc gagctgctga acagcatggg catcagccag cccaccgtcg 960 tattcgtgag caagaaaggg ctgcaaaaga tcctcaacgt gcaaaagaag ctaccgatca 1020 tacaaaagat catcatcatg gatagcaaga ccgactacca gggcttccaa agcatgtaca 1080 ccttcgtgac ttcccatttg ccacccggct tcaacgagta cgacttcgtg cccgagagct 1140 tcgaccggga caaaaccatc gccctgatca tgaacagtag tggcagtacc ggattgccca 1200 agggcgtagc cctaccgcac cgcaccgctt gtgtccgatt cagtcatgcc cgcgacccca 1260 tcttcggcaa ccagatcatc cccgacaccg ctatcctcag cgtggtgcca tttcaccacg 1320 gcttcggcat gttcaccacg ctgggctact tgatctgcgg ctttcgggtc gtgctcatgt 1380 accgcttcga ggaggagcta ttcttgcgca gcttgcaaga ctataagatt caatctgccc 1440 tgctggtgcc cacactattt agcttcttcg ctaagagcac tctcatcgac aagtacgacc 1500 taagcaactt gcacgagatc gccagcggcg gggcgccgct cagcaaggag gtaggtgagg 1560 ccgtggccaa acgcttccac ctaccaggca tccgccaggg ctacggcctg acagaaacaa 1620 ccagcgccat tctgatcacc cccgaagggg acgacaagcc tggcgcagta ggcaaggtgg 1680 tgcccttctt cgaggctaag gtggtggact tggacaccgg taagacactg ggtgtgaacc 1740 agcgcggcga gctgtgcgtc cgtggcccca tgatcatgag cggctacgtt aacaaccccg 1800 aggctacaaa cgctctcatc gacaaggacg gctggctgca cagcggcgac atcgcctact 1860 gggacgagga cgagcacttc ttcatcgtgg accggctgaa gagcctgatc aaatacaagg 1920 gctaccaggt agccccagcc gaactggaga gcatcctgct gcaacacccc aacatcttcg 1980 acgccggggt cgccggcctg cccgacgacg atgccggcga gctgcccgcc gcagtcgtcg 2040 tgctggaaca cggtaaaacc atgaccgaga aggagatcgt ggactatgtg gccagccagg 2100 ttacaaccgc caagaagctg cgcggtggtg ttgtgttcgt ggacgaggtg cctaaaggac 2160 tgaccggcaa gttggacgcc cgcaagatcc gcgagattct cattaaggcc aagaagggcg 2220 gcaagatcgc cgtgtaa 2237 <210> 21 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> L1 insert sequence <400> 21 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 22 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> L1 insert sequence <400> 22 atggccacaa ccatggaaca agagacttgc gcgcactctc tcacttttga ggaatgccca 60 aaatgctctg ctctacaata ccgtaatgga ttttacctgc taaagtatga tgaagaatgg 120 tacccagagg agttattgac tgatggagag gatgatgtct ttgatcccga attagacatg 180 gaagtcgttt tcgagttaca gtaa 204 <210> 23 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> IRES insert sequence <400> 23 cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 60 atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 120 ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 180 tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 240 tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 300 agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 360 ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 420 atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 480 catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg gacgtggttt 540 tcctttgaaa aacacgatga taat 564 <210> 24 <211> 76 <212> PRT <213> Cardiovirus Cardiovirus B <400> 24 Met Ala Cys Lys His Gly Tyr Pro Asp Val Cys Pro Ile Cys Thr Ala 1 5 10 15 Val Asp Ala Thr Pro Gly Phe Glu Tyr Leu Leu Met Ala Asp Gly Glu 20 25 30 Trp Tyr Pro Thr Asp Leu Leu Cys Val Asp Leu Asp Asp Asp Val Phe 35 40 45 Trp Pro Ser Asp Thr Ser Asn Gln Ser Gln Thr Met Asp Trp Thr Asp 50 55 60 Val Pro Leu Ile Arg Asp Ile Val Met Glu Pro Gln 65 70 75 <210> 25 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 gcccgggatc caccggtcgc caccatggtg agcaagggcg aggagc 46 <210> 26 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 26 agatggctgg caactagaag gcacagttac ttgtacagct cgtccatgcc gag 53 <210> 27 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 cactctcggc atggacgagc tgtacaagta actgtgcctt ctagttgcca gccatctgt 59 <210> 28 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 cagctcctcg cccttgctca ccatggtggc gaccggtgga tccc 44 <210> 29 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 cggccagtaa cgttaggggg gggggattac ttgtacagct cgtccatgcc gag 53 <210> 30 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 30 cggtaccgcg ggcccgggat ccaccggtcg ccaccatggt gagcaagggc gaggagc 57 <210> 31 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 ctcggcatgg acgagctgta caagtaatcc ccccccccta acgttactgg 50 <210> 32 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 32 acgggggagg ggcaaacaac agatggctgg caactagaag gcacagctgt aactcgaaaa 60 cgacttccat gtctaattcg g 81 <210> 33 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 33 cgcgggcccg ggatccaccg gtcgccacca tgaacaccat caatattgcc aagaacgact 60 tttctgacat cg 72 <210> 34 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 34 agatggctgg caactagaag gcacagttag ggtcaggcaa atgcgaaatc ggactccag 59 <210> 35 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 35 cctggagtcc gatttcgcat ttgcctgacc ctaactgtgc cttctagttg ccagccatct 60 gt 62 <210> 36 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 36 cgttcttggc aatattgatg gtgttcatgg tggcgaccgg tggatcccgg gcc 53 <210> 37 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 37 accttggccg actctggtaa tggtaatacg actcactata ggaaaaa 47 <210> 38 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 38 agtcagtgag cgaggaagcc caaaaaaccc ctcaagaccc gttta 45 <210> 39 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 39 aaacgggtct tgaggggttt tttgggcttc ctcgctcact gac 43 <210> 40 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 40 tagtgagtcg tattaccatt accagagtcg gccaaggt 38 <210> 41 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 41 gcccgggatc caccggtcgc cacctcgcca ccatgaggac tctgaacacc tctgccatgg 60 <210> 42 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 42 cttttcgaac tgcgggtggc tccagagcgg ccgcgttccc gtggttgggt gctgaccgtt 60 ttgtgtg 67 <210> 43 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 43 acgcggccgc tctggagcca cccgcagttc gaaaagtaaa gcggccgcga ctctagatca 60 <210> 44 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 gtgttcagag tcctcatggt ggcgaggtgg cgacc 35 <210> 45 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 45 atccaccggt cgccaccatg aggactctga acacctctgc catgg 45 <210> 46 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 46 tgtggtatgg ctgattatga tttactgtaa ctcgaaaacg acttccatgt ctaattcggg 60 <210> 47 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 47 gttttcgagt tacagtaaat cataatcagc cataccacat ttgtagaggt tttacttgct 60 <210> 48 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 48 tggcagaggt gttcagagtc ctcatggtgg cgaccggtgg 40 <210> 49 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 caccatcacc atcaccatgt tatggccaca accatggaac aagagactt 49 <210> 50 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 tcttgatgag ctgttcttcc aggaggataa agttgttcat ggtggcgacc ggtggatccc 60 <210> 51 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 cgggcccggg atccaccggt cgccaccatg aacaacttta tcctcctgga agaacagctc 60 <210> 52 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 aagtctcttg ttccatggtt gtggccataa catggtgatg gtgatggtg 49 <210> 53 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 ctctcggcat ggacgagctg tacaag 26 <210> 54 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 54 ttacttgtac agctcgtcca tgccgagag 29 <210> 55 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 tgcgcgcaag tctcttgttc catggttgtg gccatggtgg cgaccggtgg atccc 55 <210> 56 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 cccgaattag acatggaagt cgttttcgag ttacag 36 <210> 57 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 gggatccacc ggtcgccacc atggccacaa ccatggaaca agagacttg 49 <210> 58 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 ctgtaactcg aaaacgactt ccatgtctaa ttcggg 36 <210> 59 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 59 tctcttgttc catggttgtg gccatggtgg cgaccggtgg 40 <210> 60 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 60 acgtggtttt cctttgaaaa acacgatgat aaatgaggac tctgaacacc tctgccatgg 60 <210> 61 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 61 gcagaggtgt tcagagtcct catttatcat cgtgtttttc aaaggaaaac cacg 54 <210> 62 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 62 agtcgttttc gagttacagt aatccccccc ccctaacgtt actgg 45 <210> 63 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 63 ccagtaacgt tagggggggg ggattactgt aactcgaaaa cgacttccat gt 52 <210> 64 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 64 ccaccggtcg ccaccatggc cacaaccatg gaacaagag 39 <210> 65 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 65 gatggtgtcc cccgccacct ccgccacctc caagtcctga ttctgcaatt tcagccagtt 60 <210> 66 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 66 aattgcagaa tcaggacttg gaggtggcgg aggtggcggg ggacaccatc accatcacca 60 tgtttaatcc ccccccccta acgttactgg 90 <210> 67 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 67 ttataggcgg acagcagcag ggtcagcacc atggtggcga ggtggcgacc 50 <210> 68 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 68 cggccgctcg attacaagga tgacgacgat aaggtttaaa gcggccgcga ctctagatca 60 <210> 69 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 69 taaaccttat cgtcgtcatc cttgtaatcg agcggccgcg ttgtagggcc catgggggcg 60 <210> 70 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 70 gcgggcccgg gatccaccgg tcgccacctc gccaccatgg tgctgaccct gctgctgtcc 60 <210> 71 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 71 ccctgtcttc atggggcgag tatatgaccc cagggccgga ggtggcggag gtggc 55 <210> 72 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 ggagggtcag cagggtcagc ctggaggcca tggtggcgac cggtggatcc 50 <210> 73 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 73 cggtaccgcg ggcccgggat ccaccggtcg ccaccatggc ctccaggctg accctg 56 <210> 74 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 tggtgtcccc cgccacctcc gccacctccg gccctggggt catatactcg cc 52 <210> 75 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 aattgcagaa tcaggacttg gaggtggcgg aggtggcggg ggacacc 47 <210> 76 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 76 cataatcagc cataccacat ttgtagaggt tttacttgc 39 <210> 77 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 tacttgtaca gctcgtccat gccgagag 28 <210> 78 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 ctctcggcat ggacgagctg tacaagta 28 <210> 79 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 gcaagtaaaa cctctacaaa tgtggtatgg ctgattatg 39 <210> 80 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 tcctctctgc ttctagaata aatcataatc agccatacca catttgtaga ggttttactt 60 gct 63 <210> 81 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 81 tgtcatgaat cagtaggtcc gcaaagtaac cagcgtagtg cttgtacagc tcgtccatgc 60 cgagag 66 <210> 82 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 82 actttgcgga cctactgatt catgacattg agacaaatcc agggatgaac tttctacgta 60 agatagtgaa aaatt 75 <210> 83 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 83 acctctacaa atgtggtatg gctgattatg atttattcta gaagcagaga ggaatctttg 60 <210> 84 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 84 gctggttact ttgcggacct actgattcat gacattgaga caaatccagg gggattcgga 60 caccaaaaca aagcggtgta cactg 85 <210> 85 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 85 aaacctctac aaatgtggta tggctgatta tgatttgttc catggcttct tcttcgtagg 60 catacaagtc 70 <210> 86 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 86 tgtctcaatg tcatgaatca gtaggtccgc aaagtaacca gcgtagtgct tgtacagctc 60 gtccatgccg agagtgatcc c 81 <210> 87 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 87 gagacttgta tgcctacgaa gaagaagcca tggaacaaat cataatcagc cataccacat 60 ttgtagaggt tttacttgct 80 <210> 88 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 88 catggcagag gtgttcagag tcctcatggt ggcgaccggt ggattcacga cacctgaaat 60 ggaagaaaaa aac 73 <210> 89 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 89 attaccgcca tgcattagtt attaggctcc ggtgcccgtc agtgggcaga gcg 53 <210> 90 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 90 agtttttttc ttccatttca ggtgtcgtga atccaccggt cgccaccatg aggactctga 60 acacctc 67 <210> 91 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 91 gtgcgctctg cccactgacg ggcaccggag cctaataact aatgcatggc ggtaat 56 <210> 92 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 92 gaggccgagg ccgcctcggc ctctgagcta atccaccggt cgccaccatg aggactctga 60 acacctc 67 <210> 93 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 93 ataaccgtat taccgccatg cattagttat taggtgtgga aagtccccag gctccccagc 60 aggcaga 67 <210> 94 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 94 ttcagagtcc tcatggtggc gaccggtgga ttagctcaga ggccgaggcg gcctcggcct 60 ct 62 <210> 95 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 95 tctgcctgct ggggagcctg gggactttcc acacctaata actaatgcat ggcggtaata 60 cggtta 66 <210> 96 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 96 ggaggtggcg gaggtggcgg gggacaccat caccatca 38 <210> 97 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 97 agacaacgct ggccttttcc agaggcgacc tctgcatggt ggcgaccggt ggatcccggg 60 cccg 64 <210> 98 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 98 cgggcccggg atccaccggt cgccaccatg cagaggtcgc ctctggaaaa ggccagcgtt 60 gtctc 65 <210> 99 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 99 ccccgccacc tccgccacct ccaagccttg tatcttgcac ctcttcttct gtctcc 56 <210> 100 <211> 7808 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 100 cgcgatgtac gggccagata tacgcgttga cattgattat tgactagtta ttaatagtaa 60 tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 120 gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 180 tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggactattta 240 cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 300 gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 360 tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt 420 tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac 480 cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt 540 cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat 600 ataagcagag ctggtttagt gaaccgtcag atccgctagc gctaccggac tcagatctcg 660 agctcaagct tcgaattctg cagtcgacgg taccgcgggc ccgggatcca ccggtcgcca 720 cgatgaagtg ggtgaccttc atcagcctgc tgttcctgtt ttcttccgcc tacagcgaag 780 tgcagctggt tgaaagcgga ggcggactgg tccagccagg cagaagcctg agactgtctt 840 gtgccgcctc tggcttcacc tttgacgact acgccatgca ctgggtgcgg caggcccctg 900 gcaagggact cgagtgggtc agcgccatca cctggaatag cggccacatc gactacgcag 960 atagcgttga aggcagattc accatctcca gggacaacgc caagaattct ctgtacctgc 1020 agatgaacag cctgcgggcc gaggataccg ctgtgtacta ctgcgccaaa gtgtcctacc 1080 tgagcaccgc cagctccctg gactactggg gccagggcac cctggtgaca gtgagctctg 1140 ctagcacaaa aggacctagc gtgtttcccc tggcccctag cagcaaaagc accagcggcg 1200 gaaccgccgc tctgggttgt ctggtgaagg actatttccc tgaacctgtg accgtgtcct 1260 ggaactctgg cgccctgact agcggcgtgc ataccttccc tgccgtgctg caaagctctg 1320 gcctgtatag cctttcttct gtggtgaccg tgcctagcag ctctctgggc acacagacat 1380 acatctgcaa tgtgaaccac aagccctcca acaccaaggt ggacaaaaag gtggaaccca 1440 agagctgcga caagacccac acctgtcctc cgtgccccgc tcctgagctg ctgggcggcc 1500 cttctgtgtt cctgttcccc cccaaaccta aagacacact gatgatcagc cggacccctg 1560 aggtgacctg cgtggtggtg gacgtgagcc acgaggaccc cgaggtgaag ttcaactggt 1620 acgtggacgg cgtggaggtc cacaacgcca agaccaaacc tagagaggaa caatacaaca 1680 gcacatatag agtggtgtct gtgctgacag tgctccacca ggactggctg aacggaaagg 1740 aatacaagtg caaggtgtcc aacaaggccc tccctgctcc aatcgagaag accattagca 1800 aggccaaggg ccaacctaga gagccccagg tctacaccct gccaccaagt agagatgagc 1860 tgaccaagaa ccaggtgagc ctaacatgcc tggtgaaggg cttttacccc agcgacatcg 1920 ccgtggaatg ggagagcaac ggccagcctg agaacaacta caagacaaca cctcctgttc 1980 tggattctga tggcagcttc ttcctgtaca gcaagctgac agtggataag agccggtggc 2040 agcagggcaa cgtgttcagc tgctccgtta tgcacgaggc cctgcataat cactacaccc 2100 agaagagcct gtctctgagc cctggcaagg aagtgcagct ggttgaaagc ggaggcggac 2160 tggtccagcc aggcagaagc ctgagactgt cttgtgccgc ctctggcttc acctttgacg 2220 actacgccat gcactgggtg cggcaggccc ctggcaaggg actcgagtgg gtcagcgcca 2280 tcacctggaa tagcggccac atcgactacg cagatagcgt tgaaggcaga ttcaccatct 2340 ccagggacaa cgccaagaat tctctgtacc tgcagatgaa cagcctgcgg gccgaggata 2400 ccgctgtgta ctactgcgcc aaagtgtcct acctgagcac cgccagctcc ctggactact 2460 ggggccaggg caccctggtg acagtgagct ctgctagcac aaaaggacct agcgtgtttc 2520 ccctggcccc tagcagcaaa agcaccagcg gcggaaccgc cgctctgggt tgtctggtga 2580 aggactattt ccctgaacct gtgaccgtgt cctggaactc tggcgccctg actagcggcg 2640 tgcatacctt ccctgccgtg ctgcaaagct ctggcctgta tagcctttct tctgtggtga 2700 ccgtgcctag cagctctctg ggcacacaga catacatctg caatgtgaac cacaagccct 2760 ccaacaccaa ggtggacaaa aaggtggaac ccaagagctg cgacaagacc cacacctgtc 2820 ctccgtgccc cgctcctgag ctgctgggcg gcccttctgt gttcctgttc ccccccaaac 2880 ctaaagacac actgatgatc agccggaccc ctgaggtgac ctgcgtggtg gtggacgtga 2940 gccacgagga ccccgaggtg aagttcaact ggtacgtgga cggcgtggag gtccacaacg 3000 ccaagaccaa acctagagag gaacaataca acagcacata tagagtggtg tctgtgctga 3060 cagtgctcca ccaggactgg ctgaacggaa aggaatacaa gtgcaaggtg tccaacaagg 3120 ccctccctgc tccaatcgag aagaccatta gcaaggccaa gggccaacct agagagcccc 3180 aggtctacac cctgccacca agtagagatg agctgaccaa gaaccaggtg agcctaacat 3240 gcctggtgaa gggcttttac cccagcgaca tcgccgtgga atgggagagc aacggccagc 3300 ctgagaacaa ctacaagaca acacctcctg ttctggattc tgatggcagc ttcttcctgt 3360 acagcaagct gacagtggat aagagccggt ggcagcaggg caacgtgttc agctgctccg 3420 ttatgcacga ggccctgcat aatcactaca cccagaagag cctgtctctg agccctggca 3480 agcaagcgaa aacggcgcgg aagcggagct actaacttca gcctgctgaa gcaggctgga 3540 gatgtggagg agaaccctgg acctgatatc cagatgaccc agtctccatc tagcctgagc 3600 gccagcgtgg gagatagagt gaccatcacc tgtagagcct ctcaaggcat ccggaactac 3660 ctggcctggt atcagcagaa acctggcaag gctcctaagc tgctgatcta cgccgcttcc 3720 accctgcaga gcggcgttcc ttctagattc agcggcagcg gctccggaac agacttcacc 3780 ctgacaatta gctccctgca acctgaagat gtggctacat actactgcca gagatacaat 3840 cgggcccctt acacctttgg acagggcacc aaggtggaaa tcaagcggac cgtggccgcc 3900 ccatctgtgt tcatcttccc ccccagcgac gagcagctga aaagcggcac agccagcgtg 3960 gtgtgcctgc tgaacaactt ctaccccagg gaagccaagg tgcagtggaa ggtggacaat 4020 gccctgcaga gcggcaacag ccaggagagc gtgaccgagc aggacagcaa ggacagcacc 4080 tacagcctga gcagcaccct cacactgtct aaagccgact acgagaagca caaggtctac 4140 gcctgcgagg tgacccacca gggcctgtcc tcccctgtga caaagagctt taacagaggc 4200 gagtgctaag atatccagat gacccagtct ccatctagcc tgagcgccag cgtgggagat 4260 agagtgacca tcacctgtag agcctctcaa ggcatccgga actacctggc ctggtatcag 4320 cagaaacctg gcaaggctcc taagctgctg atctacgccg cttccaccct gcagagcggc 4380 gttccttcta gattcagcgg cagcggctcc ggaacagact tcaccctgac aattagctcc 4440 ctgcaacctg aagatgtggc tacatactac tgccagagat acaatcgggc cccttacacc 4500 tttggacagg gcaccaaggt ggaaatcaag cggaccgtgg ccgccccatc tgtgttcatc 4560 ttccccccca gcgacgagca gctgaaaagc ggcacagcca gcgtggtgtg cctgctgaac 4620 aacttctacc ccagggaagc caaggtgcag tggaaggtgg acaatgccct gcagagcggc 4680 aacagccagg agagcgtgac cgagcaggac agcaaggaca gcacctacag cctgagcagc 4740 accctcacac tgtctaaagc cgactacgag aagcacaagg tctacgcctg cgaggtgacc 4800 caccagggcc tgtcctcccc tgtgacaaag agctttaaca gaggcgagtg ctaacccccc 4860 cccctaacgt tactggccga agccgcttgg aataaggccg gtgtgcgttt gtctatatgt 4920 tattttccac catattgccg tcttttggca atgtgagggc ccggaaacct ggccctgtct 4980 tcttgacgag cattcctagg ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga 5040 atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag acaaacaacg tctgtagcga 5100 ccctttgcag gcagcggaac cccccacctg gcgacaggtg cctctgcggc caaaagccac 5160 gtgtataaga tacacctgca aaggcggcac aaccccagtg ccacgttgtg agttggatag 5220 ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg aaggatgccc 5280 agaaggtacc ccattgtatg ggatctgatc tggggcctcg gtgcacatgc tttacatgtg 5340 tttagtcgag gttaaaaaaa cgtctaggcc ccccgaacca cggggacgtg gttttccttt 5400 gaaaaacacg atgataatat ggccacaacc atggaacaag agacttgcgc gcactctctc 5460 acttttgagg aatgcccaaa atgctctgct ctacaatacc gtaatggatt ttacctgcta 5520 aagtatgatg aagaatggta cccagaggag ttattgactg atggagagga tgatgtcttt 5580 gatcccgaat tagacatgga agtcgttttc gagttacagt aaatcataat cagccatacc 5640 acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct gaacctgaaa 5700 cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 5760 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 5820 ggtttgtcca aactcatcaa tgtatcttaa ggcgtcttct actgggcggt tttatggaca 5880 gcaagcgaac cggaattgcc agctggggcg ccctctggta aggttgggaa gccctgcaaa 5940 gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc aagctctgat 6000 caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct 6060 ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc 6120 tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc 6180 gacctgtccg gtgccctgaa tgaactgcaa gacgaggcag cgcggctatc gtggctggcc 6240 acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 6300 ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 6360 aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 6420 ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 6480 cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc 6540 gccaggctca aggcgagcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc 6600 tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 6660 ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag 6720 cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg 6780 cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaattattaa cgcttacaat 6840 ttcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacaggtg 6900 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 6960 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatag cacgtgctaa 7020 aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 7080 aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 7140 gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 7200 cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 7260 ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 7320 accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 7380 tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 7440 cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 7500 gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7560 ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7620 cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7680 tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7740 ccagcaacgc ggccttttta cggttcctgg gcttttgctg gccttttgct cacatgttct 7800 tgactctt 7808 <210> 101 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 101 cgcgatgtac gggccagata tacgcgtt 28 <210> 102 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer <400> 102 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 103 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> CMV promoter <400> 103 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180 tgggaggtct atataagcag agct 204 <210> 104 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 104 ggtttagtga accgtcagat ccgctagcgc taccggactc agatctcgag ctcaagcttc 60 gaattctgca gtcgacggta ccgcgggccc gggatccacc ggtcgccacg 110 <210> 105 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide (codon optimized) <400> 105 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 106 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab Heavy Chain (variable region) <400> 106 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tct 363 <210> 107 <211> 990 <212> DNA <213> Homo sapiens <400> 107 gctagcacaa aaggacctag cgtgtttccc ctggccccta gcagcaaaag caccagcggc 60 ggaaccgccg ctctgggttg tctggtgaag gactatttcc ctgaacctgt gaccgtgtcc 120 tggaactctg gcgccctgac tagcggcgtg cataccttcc ctgccgtgct gcaaagctct 180 ggcctgtata gcctttcttc tgtggtgacc gtgcctagca gctctctggg cacacagaca 240 tacatctgca atgtgaacca caagccctcc aacaccaagg tggacaaaaa ggtggaaccc 300 aagagctgcg acaagaccca cacctgtcct ccgtgccccg ctcctgagct gctgggcggc 360 ccttctgtgt tcctgttccc ccccaaacct aaagacacac tgatgatcag ccggacccct 420 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc ccgaggtgaa gttcaactgg 480 tacgtggacg gcgtggaggt ccacaacgcc aagaccaaac ctagagagga acaatacaac 540 agcacatata gagtggtgtc tgtgctgaca gtgctccacc aggactggct gaacggaaag 600 gaatacaagt gcaaggtgtc caacaaggcc ctccctgctc caatcgagaa gaccattagc 660 aaggccaagg gccaacctag agagccccag gtctacaccc tgccaccaag tagagatgag 720 ctgaccaaga accaggtgag cctaacatgc ctggtgaagg gcttttaccc cagcgacatc 780 gccgtggaat gggagagcaa cggccagcct gagaacaact acaagacaac acctcctgtt 840 ctggattctg atggcagctt cttcctgtac agcaagctga cagtggataa gagccggtgg 900 cagcagggca acgtgttcag ctgctccgtt atgcacgagg ccctgcataa tcactacacc 960 cagaagagcc tgtctctgag ccctggcaag 990 <210> 108 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Furin cleavage site <400> 108 caagcgaaaa cggcgc 16 <210> 109 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> GSG linker <400> 109 ggaagcgga 9 <210> 110 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A self-cleaving peptide <400> 110 gctactaact tcagcctgct gaagcaggct ggagatgtgg aggagaaccc tggacct 57 <210> 111 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab Light Chain (variable region) <400> 111 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa g 321 <210> 112 <211> 324 <212> DNA <213> Homo sapiens <400> 112 cggaccgtgg ccgccccatc tgtgttcatc ttccccccca gcgacgagca gctgaaaagc 60 ggcacagcca gcgtggtgtg cctgctgaac aacttctacc ccagggaagc caaggtgcag 120 tggaaggtgg acaatgccct gcagagcggc aacagccagg agagcgtgac cgagcaggac 180 agcaaggaca gcacctacag cctgagcagc accctcacac tgtctaaagc cgactacgag 240 aagcacaagg tctacgcctg cgaggtgacc caccagggcc tgtcctcccc tgtgacaaag 300 agctttaaca gaggcgagtg ctaa 324 <210> 113 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 113 cccccccccc ta 12 <210> 114 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> IRES <400> 114 acgttactgg ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt 60 ccaccatatt gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga 120 cgagcattcc taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg 180 tgaaggaagc agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt 240 gcaggcagcg gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat 300 aagatacacc tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg 360 aaagagtcaa atggctctcc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg 420 taccccattg tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt 480 cgaggttaaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 540 cacgatgata at 552 <210> 115 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> Enhancer peptide <400> 115 atggccacaa ccatggaaca agagacttgc gcgcactctc tcacttttga ggaatgccca 60 aaatgctctg ctctacaata ccgtaatgga ttttacctgc taaagtatga tgaagaatgg 120 tacccagagg agttattgac tgatggagag gatgatgtct ttgatcccga attagacatg 180 gaagtcgttt tcgagttaca gtaa 204 <210> 116 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 116 atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 60 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgtt 105 <210> 117 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> SV40 poly(A) signal <400> 117 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 118 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Linker <400> 118 aggcgtcttc tactgggcgg ttttatggac agcaagcgaa ccggaattgc cagctggggc 60 gccctctggt aaggttggga agccctgcaa agtaaactgg atggctttct tgccgccaag 120 gatctgatgg cgcaggggat caagctctga tcaagagaca ggatgaggat cgtttcgc 178 <210> 119 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Neomycin/Kanamycin resistance gene <400> 119 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 120 <211> 325 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 120 attattaacg cttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt 60 tcacaccgca tacaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 120 ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 180 aataatagca cgtgctaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt 240 ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 300 ccgtagaaaa gatcaaagga tcttc 325 <210> 121 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Origin of replication <400> 121 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 122 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 122 aacgccagca acgcggcctt tttacggttc ctgggctttt gctggccttt tgctcacatg 60 ttcttgactc tt 72 <210> 123 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 123 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 124 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab heavy chain (variable region) <400> 124 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 125 <211> 330 <212> PRT <213> Homo sapiens <400> 125 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 126 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <400> 126 Arg Lys Arg Arg 1 <210> 127 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 127 Gly Ser Gly 1 <210> 128 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A self-cleaving peptide <400> 128 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 129 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab Light Chain (variable region) <400> 129 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 130 <211> 107 <212> PRT <213> Homo sapiens <400> 130 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 1 5 10 15 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 20 25 30 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 35 40 45 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 50 55 60 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 65 70 75 80 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 85 90 95 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 100 105 <210> 131 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Enhancer peptide <400> 131 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 132 <211> 451 <212> PRT <213> Artificial Sequence <220> <223> Albumin complete heavy chain <400> 132 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser 115 120 125 Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala 130 135 140 Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val 145 150 155 160 Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala 165 170 175 Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val 180 185 190 Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His 195 200 205 Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys 210 215 220 Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly 225 230 235 240 Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met 245 250 255 Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His 260 265 270 Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val 275 280 285 His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr 290 295 300 Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly 305 310 315 320 Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile 325 330 335 Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val 340 345 350 Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser 355 360 365 Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu 370 375 380 Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro 385 390 395 400 Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val 405 410 415 Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met 420 425 430 His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser 435 440 445 Pro Gly Lys 450 <210> 133 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> Albumin complete light chain <400> 133 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210 <210> 134 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> Albumin Heavy Chain complete <400> 134 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tctgctagca caaaaggacc tagcgtgttt cccctggccc ctagcagcaa aagcaccagc 420 ggcggaaccg ccgctctggg ttgtctggtg aaggactatt tccctgaacc tgtgaccgtg 480 tcctggaact ctggcgccct gactagcggc gtgcatacct tccctgccgt gctgcaaagc 540 tctggcctgt atagcctttc ttctgtggtg accgtgccta gcagctctct gggcacacag 600 acatacatct gcaatgtgaa ccacaagccc tccaacacca aggtggacaa aaaggtggaa 660 cccaagagct gcgacaagac ccacacctgt cctccgtgcc ccgctcctga gctgctgggc 720 ggcccttctg tgttcctgtt cccccccaaa cctaaagaca cactgatgat cagccggacc 780 cctgaggtga cctgcgtggt ggtggacgtg agccacgagg accccgaggt gaagttcaac 840 tggtacgtgg acggcgtgga ggtccacaac gccaagacca aacctagaga ggaacaatac 900 aacagcacat atagagtggt gtctgtgctg acagtgctcc accaggactg gctgaacgga 960 aaggaataca agtgcaaggt gtccaacaag gccctccctg ctccaatcga gaagaccatt 1020 agcaaggcca agggccaacc tagagagccc caggtctaca ccctgccacc aagtagagat 1080 gagctgacca agaaccaggt gagcctaaca tgcctggtga agggctttta ccccagcgac 1140 atcgccgtgg aatgggagag caacggccag cctgagaaca actacaagac aacacctcct 1200 gttctggatt ctgatggcag cttcttcctg tacagcaagc tgacagtgga taagagccgg 1260 tggcagcagg gcaacgtgtt cagctgctcc gttatgcacg aggccctgca taatcactac 1320 acccagaaga gcctgtctct gagccctggc aag 1353 <210> 135 <211> 645 <212> DNA <213> Artificial Sequence <220> <223> Albumin Light Chain complete <400> 135 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa gcggaccgtg gccgccccat ctgtgttcat cttccccccc 360 agcgacgagc agctgaaaag cggcacagcc agcgtggtgt gcctgctgaa caacttctac 420 cccagggaag ccaaggtgca gtggaaggtg gacaatgccc tgcagagcgg caacagccag 480 gagagcgtga ccgagcagga cagcaaggac agcacctaca gcctgagcag caccctcaca 540 ctgtctaaag ccgactacga gaagcacaag gtctacgcct gcgaggtgac ccaccagggc 600 ctgtcctccc ctgtgacaaa gagctttaac agaggcgagt gctaa 645 <210> 136 <211> 5096 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 136 cgcgatgtac gggccagata tacgcgttga cattgattat tgactagtta ttaatagtaa 60 tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 120 gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 180 tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggactattta 240 cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 300 gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 360 tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt 420 tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac 480 cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt 540 cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat 600 ataagcagag ctggtttagt gaaccgtcag atccgctagc gctaccggac tcagatctcg 660 agctcaagct tcgaattctg cagtcgacgg taccgcgggc ccgggatcca ccggtcgcca 720 cgatgaagtg ggtgaccttc atcagcctgc tgttcctgtt ttcttccgcc tacagcgaag 780 tgcagctggt tgaaagcgga ggcggactgg tccagccagg cagaagcctg agactgtctt 840 gtgccgcctc tggcttcacc tttgacgact acgccatgca ctgggtgcgg caggcccctg 900 gcaagggact cgagtgggtc agcgccatca cctggaatag cggccacatc gactacgcag 960 atagcgttga aggcagattc accatctcca gggacaacgc caagaattct ctgtacctgc 1020 agatgaacag cctgcgggcc gaggataccg ctgtgtacta ctgcgccaaa gtgtcctacc 1080 tgagcaccgc cagctccctg gactactggg gccagggcac cctggtgaca gtgagctctg 1140 ctagcacaaa aggacctagc gtgtttcccc tggcccctag cagcaaaagc accagcggcg 1200 gaaccgccgc tctgggttgt ctggtgaagg actatttccc tgaacctgtg accgtgtcct 1260 ggaactctgg cgccctgact agcggcgtgc ataccttccc tgccgtgctg caaagctctg 1320 gcctgtatag cctttcttct gtggtgaccg tgcctagcag ctctctgggc acacagacat 1380 acatctgcaa tgtgaaccac aagccctcca acaccaaggt ggacaaaaag gtggaaccca 1440 agagctgcga caagacccac acctgtcctc cgtgccccgc tcctgagctg ctgggcggcc 1500 cttctgtgtt cctgttcccc cccaaaccta aagacacact gatgatcagc cggacccctg 1560 aggtgacctg cgtggtggtg gacgtgagcc acgaggaccc cgaggtgaag ttcaactggt 1620 acgtggacgg cgtggaggtc cacaacgcca agaccaaacc tagagaggaa caatacaaca 1680 gcacatatag agtggtgtct gtgctgacag tgctccacca ggactggctg aacggaaagg 1740 aatacaagtg caaggtgtcc aacaaggccc tccctgctcc aatcgagaag accattagca 1800 aggccaaggg ccaacctaga gagccccagg tctacaccct gccaccaagt agagatgagc 1860 tgaccaagaa ccaggtgagc ctaacatgcc tggtgaaggg cttttacccc agcgacatcg 1920 ccgtggaatg ggagagcaac ggccagcctg agaacaacta caagacaaca cctcctgttc 1980 tggattctga tggcagcttc ttcctgtaca gcaagctgac agtggataag agccggtggc 2040 agcagggcaa cgtgttcagc tgctccgtta tgcacgaggc cctgcataat cactacaccc 2100 agaagagcct gtctctgagc cctggcaagc aagcgaaaac ggcgcggaag cggagctact 2160 aacttcagcc tgctgaagca ggctggagat gtggaggaga accctggacc tatgaagtgg 2220 gtgaccttca tcagcctgct gttcctgttt tcttccgcct acagcgatat ccagatgacc 2280 cagtctccat ctagcctgag cgccagcgtg ggagatagag tgaccatcac ctgtagagcc 2340 tctcaaggca tccggaacta cctggcctgg tatcagcaga aacctggcaa ggctcctaag 2400 ctgctgatct acgccgcttc caccctgcag agcggcgttc cttctagatt cagcggcagc 2460 ggctccggaa cagacttcac cctgacaatt agctccctgc aacctgaaga tgtggctaca 2520 tactactgcc agagatacaa tcgggcccct tacacctttg gacagggcac caaggtggaa 2580 atcaagcgga ccgtggccgc cccatctgtg ttcatcttcc cccccagcga cgagcagctg 2640 aaaagcggca cagccagcgt ggtgtgcctg ctgaacaact tctaccccag ggaagccaag 2700 gtgcagtgga aggtggacaa tgccctgcag agcggcaaca gccaggagag cgtgaccgag 2760 caggacagca aggacagcac ctacagcctg agcagcaccc tcacactgtc taaagccgac 2820 tacgagaagc acaaggtcta cgcctgcgag gtgacccacc agggcctgtc ctcccctgtg 2880 acaaagagct ttaacagagg cgagtgctaa atcataatca gccataccac atttgtagag 2940 gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3000 gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3060 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3120 ctcatcaatg tatcttaagg cgtcttctac tgggcggttt tatggacagc aagcgaaccg 3180 gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg 3240 gctttcttgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca agagacagga 3300 tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg 3360 gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc 3420 gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt 3480 gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt 3540 ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc 3600 gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc 3660 atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac 3720 caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag 3780 gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag 3840 gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat 3900 atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg 3960 gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa 4020 tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc 4080 ttctatcgcc ttcttgacga gttcttctga attattaacg cttacaattt cctgatgcgg 4140 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tacaggtggc acttttcggg 4200 gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 4260 tcatgagaca ataaccctga taaatgcttc aataatagca cgtgctaaaa cttcattttt 4320 aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 4380 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 4440 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 4500 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 4560 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 4620 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 4680 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 4740 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 4800 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 4860 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 4920 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 4980 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 5040 cctttttacg gttcctgggc ttttgctggc cttttgctca catgttcttg actctt 5096 <210> 137 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <220> <221> SITE <222> (9)..(9) <223> Xaa is Thr or Ala <400> 137 Gln Arg Tyr Asn Arg Ala Pro Tyr Xaa 1 5 <210> 138 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <220> <221> SITE <222> (12)..(12) <223> Xaa is Tyr or Asn <400> 138 Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Xaa 1 5 10 <210> 139 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 139 Ala Ala Ser Thr Leu Gln Ser 1 5 <210> 140 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 140 Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu 1 5 10 15 Gly <210> 141 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 141 Arg Ala Ser Gln Gly Ile Arg Asn Tyr Leu Ala 1 5 10 <210> 142 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 142 Asp Tyr Ala Met His 1 5 <210> 143 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 143 Gln Lys Tyr Asn Ser Ala Pro Tyr Ala 1 5 <210> 144 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 144 Gln Lys Tyr Asn Arg Ala Pro Tyr Ala 1 5 <210> 145 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 145 Gln Lys Tyr Gln Arg Ala Pro Tyr Thr 1 5 <210> 146 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 146 Gln Lys Tyr Ser Ser Ala Pro Tyr Thr 1 5 <210> 147 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 147 Gln Lys Tyr Asn Ser Ala Pro Tyr Thr 1 5 <210> 148 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 148 Gln Lys Tyr Asn Arg Ala Pro Tyr Thr 1 5 <210> 149 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 149 Gln Lys Tyr Asn Ser Ala Pro Tyr Tyr 1 5 <210> 150 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 150 Gln Lys Tyr Asn Ser Ala Pro Tyr Asn 1 5 <210> 151 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 151 Gln Lys Tyr Thr Ser Ala Pro Tyr Thr 1 5 <210> 152 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 152 Gln Lys Tyr Asn Arg Ala Pro Tyr Asn 1 5 <210> 153 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 153 Gln Lys Tyr Asn Ser Ala Ala Tyr Ser 1 5 <210> 154 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 154 Gln Gln Tyr Asn Ser Ala Pro Asp Thr 1 5 <210> 155 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 155 Gln Lys Tyr Asn Ser Asp Pro Tyr Thr 1 5 <210> 156 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 156 Gln Lys Tyr Ile Ser Ala Pro Tyr Thr 1 5 <210> 157 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 157 Gln Lys Tyr Asn Arg Pro Pro Tyr Thr 1 5 <210> 158 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 158 Gln Arg Tyr Asn Arg Ala Pro Tyr Ala 1 5 <210> 159 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 159 Ala Ser Tyr Leu Ser Thr Ser Ser Ser Leu Asp Asn 1 5 10 <210> 160 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 160 Ala Ser Tyr Leu Ser Thr Ser Ser Ser Leu Asp Lys 1 5 10 <210> 161 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 161 Ala Ser Tyr Leu Ser Thr Ser Ser Ser Leu Asp Tyr 1 5 10 <210> 162 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 162 Ala Ser Tyr Leu Ser Thr Ser Ser Ser Leu Asp Asp 1 5 10 <210> 163 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 163 Ala Ser Tyr Leu Ser Thr Ser Phe Ser Leu Asp Tyr 1 5 10 <210> 164 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 164 Ala Ser Tyr Leu Ser Thr Ser Ser Ser Leu His Tyr 1 5 10 <210> 165 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 165 Ala Ser Phe Leu Ser Thr Ser Ser Ser Leu Glu Tyr 1 5 10 <210> 166 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 166 Ala Ser Tyr Leu Ser Thr Ala Ser Ser Leu Glu Tyr 1 5 10 <210> 167 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CDR <400> 167 Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Asn 1 5 10 <210> 168 <211> 536 <212> PRT <213> Homo sapiens <400> 168 Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser 1 5 10 15 Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln 20 25 30 Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe 35 40 45 Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser 50 55 60 Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu 65 70 75 80 Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln 85 90 95 Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln 100 105 110 Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala 115 120 125 Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu 130 135 140 Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val 145 150 155 160 Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp 165 170 175 Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp 180 185 190 Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln 195 200 205 Arg Pro Val Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu 210 215 220 Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro 225 230 235 240 Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu 245 250 255 Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu 260 265 270 Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu 275 280 285 Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly 290 295 300 Pro Thr Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu 305 310 315 320 Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr 325 330 335 Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr 340 345 350 Leu Asp Phe Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg 355 360 365 Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser 370 375 380 Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met 385 390 395 400 Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly 405 410 415 Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp 420 425 430 Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp 435 440 445 Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys 450 455 460 Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys 465 470 475 480 Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val 485 490 495 Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys 500 505 510 Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile 515 520 525 His Thr Tyr Leu Trp Arg Arg Gln 530 535 <210> 169 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> CMV Enhancer <400> 169 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 170 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> CMV promoter <400> 170 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180 tgggaggtct atataagcag agct 204 <210> 171 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 171 ggtttagtga accgtcagat cc 22 <210> 172 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Multiple cloning site (MSC) <400> 172 gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 60 gcgggcccgg gatccaccgg t 81 <210> 173 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 173 cgccacg 7 <210> 174 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 174 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 175 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 175 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tct 363 <210> 176 <211> 990 <212> DNA <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 176 gctagcacaa aaggacctag cgtgtttccc ctggccccta gcagcaaaag caccagcggc 60 ggaaccgccg ctctgggttg tctggtgaag gactatttcc ctgaacctgt gaccgtgtcc 120 tggaactctg gcgccctgac tagcggcgtg cataccttcc ctgccgtgct gcaaagctct 180 ggcctgtata gcctttcttc tgtggtgacc gtgcctagca gctctctggg cacacagaca 240 tacatctgca atgtgaacca caagccctcc aacaccaagg tggacaaaaa ggtggaaccc 300 aagagctgcg acaagaccca cacctgtcct ccgtgccccg ctcctgagct gctgggcggc 360 ccttctgtgt tcctgttccc ccccaaacct aaagacacac tgatgatcag ccggacccct 420 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc ccgaggtgaa gttcaactgg 480 tacgtggacg gcgtggaggt ccacaacgcc aagaccaaac ctagagagga acaatacaac 540 agcacatata gagtggtgtc tgtgctgaca gtgctccacc aggactggct gaacggaaag 600 gaatacaagt gcaaggtgtc caacaaggcc ctccctgctc caatcgagaa gaccattagc 660 aaggccaagg gccaacctag agagccccag gtctacaccc tgccaccaag tagagatgag 720 ctgaccaaga accaggtgag cctaacatgc ctggtgaagg gcttttaccc cagcgacatc 780 gccgtggaat gggagagcaa cggccagcct gagaacaact acaagacaac acctcctgtt 840 ctggattctg atggcagctt cttcctgtac agcaagctga cagtggataa gagccggtgg 900 cagcagggca acgtgttcag ctgctccgtt atgcacgagg ccctgcataa tcactacacc 960 cagaagagcc tgtctctgag ccctggcaag 990 <210> 177 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Furin cleavage site <400> 177 cgaaaacggc gc 12 <210> 178 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> GSG linker <400> 178 ggaagcgga 9 <210> 179 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A cleavage site <400> 179 gctactaact tcagcctgct gaagcaggct ggagatgtgg aggagaaccc tggacct 57 <210> 180 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 180 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 181 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 181 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa g 321 <210> 182 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 182 cggaccgtgg ccgccccatc tgtgttcatc ttccccccca gcgacgagca gctgaaaagc 60 ggcacagcca gcgtggtgtg cctgctgaac aacttctacc ccagggaagc caaggtgcag 120 tggaaggtgg acaatgccct gcagagcggc aacagccagg agagcgtgac cgagcaggac 180 agcaaggaca gcacctacag cctgagcagc accctcacac tgtctaaagc cgactacgag 240 aagcacaagg tctacgcctg cgaggtgacc caccagggcc tgtcctcccc tgtgacaaag 300 agctttaaca gaggcgagtg c 321 <210> 183 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 183 taa 3 <210> 184 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 184 atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 60 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgtt 105 <210> 185 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> SV40 polyadenylation signal <400> 185 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 186 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 186 aggcgtcttc tactgggcgg ttttatggac agcaagcgaa ccggaattgc cagctggggc 60 gccctctggt aaggttggga agccctgcaa agtaaactgg atggctttct tgccgccaag 120 gatctgatgg cgcaggggat caagctctga tcaagagaca ggatgaggat cgtttcgc 178 <210> 187 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Neomycin/Kanamycin resistance gene <400> 187 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 188 <211> 325 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 188 attattaacg cttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt 60 tcacaccgca tacaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 120 ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 180 aataatagca cgtgctaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt 240 ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 300 ccgtagaaaa gatcaaagga tcttc 325 <210> 189 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Ori <400> 189 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 190 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 190 aacgccagca acgcggcctt tttacggttc ctgggctttt gctggccttt tgctcacatg 60 ttcttgactc ttcgcgatgt acgggccaga tatacgcgtt 100 <210> 191 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> CMV Enhancer <400> 191 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 192 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> CMV promoter <400> 192 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180 tgggaggtct atataagcag agct 204 <210> 193 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 193 ggtttagtga accgtcagat cc 22 <210> 194 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Multiple cloning site (MSC) <400> 194 gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 60 gcgggcccgg gatccaccgg t 81 <210> 195 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 195 cgccacg 7 <210> 196 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 196 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 197 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 197 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tct 363 <210> 198 <211> 990 <212> DNA <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 198 gctagcacaa aaggacctag cgtgtttccc ctggccccta gcagcaaaag caccagcggc 60 ggaaccgccg ctctgggttg tctggtgaag gactatttcc ctgaacctgt gaccgtgtcc 120 tggaactctg gcgccctgac tagcggcgtg cataccttcc ctgccgtgct gcaaagctct 180 ggcctgtata gcctttcttc tgtggtgacc gtgcctagca gctctctggg cacacagaca 240 tacatctgca atgtgaacca caagccctcc aacaccaagg tggacaaaaa ggtggaaccc 300 aagagctgcg acaagaccca cacctgtcct ccgtgccccg ctcctgagct gctgggcggc 360 ccttctgtgt tcctgttccc ccccaaacct aaagacacac tgatgatcag ccggacccct 420 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc ccgaggtgaa gttcaactgg 480 tacgtggacg gcgtggaggt ccacaacgcc aagaccaaac ctagagagga acaatacaac 540 agcacatata gagtggtgtc tgtgctgaca gtgctccacc aggactggct gaacggaaag 600 gaatacaagt gcaaggtgtc caacaaggcc ctccctgctc caatcgagaa gaccattagc 660 aaggccaagg gccaacctag agagccccag gtctacaccc tgccaccaag tagagatgag 720 ctgaccaaga accaggtgag cctaacatgc ctggtgaagg gcttttaccc cagcgacatc 780 gccgtggaat gggagagcaa cggccagcct gagaacaact acaagacaac acctcctgtt 840 ctggattctg atggcagctt cttcctgtac agcaagctga cagtggataa gagccggtgg 900 cagcagggca acgtgttcag ctgctccgtt atgcacgagg ccctgcataa tcactacacc 960 cagaagagcc tgtctctgag ccctggcaag 990 <210> 199 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Furin cleavage site <400> 199 cgaaaacggc gc 12 <210> 200 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> GSG linker <400> 200 ggaagcgga 9 <210> 201 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A cleavage site <400> 201 gctactaact tcagcctgct gaagcaggct ggagatgtgg aggagaaccc tggacct 57 <210> 202 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 202 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 203 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 203 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa g 321 <210> 204 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 204 cggaccgtgg ccgccccatc tgtgttcatc ttccccccca gcgacgagca gctgaaaagc 60 ggcacagcca gcgtggtgtg cctgctgaac aacttctacc ccagggaagc caaggtgcag 120 tggaaggtgg acaatgccct gcagagcggc aacagccagg agagcgtgac cgagcaggac 180 agcaaggaca gcacctacag cctgagcagc accctcacac tgtctaaagc cgactacgag 240 aagcacaagg tctacgcctg cgaggtgacc caccagggcc tgtcctcccc tgtgacaaag 300 agctttaaca gaggcgagtg c 321 <210> 205 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 205 taa 3 <210> 206 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 206 cccccccccc ta 12 <210> 207 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> Internal ribosome entry site (IRES) (non-coding) <400> 207 acgttactgg ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt 60 ccaccatatt gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga 120 cgagcattcc taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg 180 tgaaggaagc agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt 240 gcaggcagcg gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat 300 aagatacacc tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg 360 aaagagtcaa atggctctcc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg 420 taccccattg tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt 480 cgaggttaaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 540 cacgatgata at 552 <210> 208 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Enhancer protein L <400> 208 atggccacaa ccatggaaca agagacttgc gcgcactctc tcacttttga ggaatgccca 60 aaatgctctg ctctacaata ccgtaatgga ttttacctgc taaagtatga tgaagaatgg 120 tacccagagg agttattgac tgatggagag gatgatgtct ttgatcccga attagacatg 180 gaagtcgttt tcgagttaca g 201 <210> 209 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 209 taa 3 <210> 210 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 210 atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 60 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgtt 105 <210> 211 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> SV40 polyadenylation signal <400> 211 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 212 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 212 aggcgtcttc tactgggcgg ttttatggac agcaagcgaa ccggaattgc cagctggggc 60 gccctctggt aaggttggga agccctgcaa agtaaactgg atggctttct tgccgccaag 120 gatctgatgg cgcaggggat caagctctga tcaagagaca ggatgaggat cgtttcgc 178 <210> 213 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Neomycin/Kanamycin resistance gene <400> 213 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 214 <211> 325 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 214 attattaacg cttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt 60 tcacaccgca tacaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 120 ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 180 aataatagca cgtgctaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt 240 ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 300 ccgtagaaaa gatcaaagga tcttc 325 <210> 215 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Ori <400> 215 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 216 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 216 aacgccagca acgcggcctt tttacggttc ctgggctttt gctggccttt tgctcacatg 60 ttcttgactc ttcgcgatgt acgggccaga tatacgcgtt 100 <210> 217 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> 5' inverted terminal repeat (ITR) <400> 217 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 218 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 218 tctagacaac tttgtataga aaagttg 27 <210> 219 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer and promoter <400> 219 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatc 589 <210> 220 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 220 caagtttgta caaaaaagca ggctgccacc 30 <210> 221 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 221 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 222 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 222 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tct 363 <210> 223 <211> 990 <212> DNA <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 223 gctagcacaa aaggacctag cgtgtttccc ctggccccta gcagcaaaag caccagcggc 60 ggaaccgccg ctctgggttg tctggtgaag gactatttcc ctgaacctgt gaccgtgtcc 120 tggaactctg gcgccctgac tagcggcgtg cataccttcc ctgccgtgct gcaaagctct 180 ggcctgtata gcctttcttc tgtggtgacc gtgcctagca gctctctggg cacacagaca 240 tacatctgca atgtgaacca caagccctcc aacaccaagg tggacaaaaa ggtggaaccc 300 aagagctgcg acaagaccca cacctgtcct ccgtgccccg ctcctgagct gctgggcggc 360 ccttctgtgt tcctgttccc ccccaaacct aaagacacac tgatgatcag ccggacccct 420 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc ccgaggtgaa gttcaactgg 480 tacgtggacg gcgtggaggt ccacaacgcc aagaccaaac ctagagagga acaatacaac 540 agcacatata gagtggtgtc tgtgctgaca gtgctccacc aggactggct gaacggaaag 600 gaatacaagt gcaaggtgtc caacaaggcc ctccctgctc caatcgagaa gaccattagc 660 aaggccaagg gccaacctag agagccccag gtctacaccc tgccaccaag tagagatgag 720 ctgaccaaga accaggtgag cctaacatgc ctggtgaagg gcttttaccc cagcgacatc 780 gccgtggaat gggagagcaa cggccagcct gagaacaact acaagacaac acctcctgtt 840 ctggattctg atggcagctt cttcctgtac agcaagctga cagtggataa gagccggtgg 900 cagcagggca acgtgttcag ctgctccgtt atgcacgagg ccctgcataa tcactacacc 960 cagaagagcc tgtctctgag ccctggcaag 990 <210> 224 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Furin cleavage site <400> 224 cgaaaacggc gc 12 <210> 225 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> GSG linker <400> 225 ggaagcgga 9 <210> 226 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A cleavage site <400> 226 gctactaact tcagcctgct gaagcaggct ggagatgtgg aggagaaccc tggacct 57 <210> 227 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 227 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 228 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 228 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa g 321 <210> 229 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 229 cggaccgtgg ccgccccatc tgtgttcatc ttccccccca gcgacgagca gctgaaaagc 60 ggcacagcca gcgtggtgtg cctgctgaac aacttctacc ccagggaagc caaggtgcag 120 tggaaggtgg acaatgccct gcagagcggc aacagccagg agagcgtgac cgagcaggac 180 agcaaggaca gcacctacag cctgagcagc accctcacac tgtctaaagc cgactacgag 240 aagcacaagg tctacgcctg cgaggtgacc caccagggcc tgtcctcccc tgtgacaaag 300 agctttaaca gaggcgagtg c 321 <210> 230 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 230 taa 3 <210> 231 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 231 acccagcttt cttgtacaaa gtgggaattc ctagagctcg ctgatcagcc tcga 54 <210> 232 <211> 208 <212> DNA <213> Artificial Sequence <220> <223> BGH polyadenylation signal <400> 232 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180 gggaagagaa tagcaggcat gctgggga 208 <210> 233 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 233 gggccgc 7 <210> 234 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> 3' inverted terminal repeat (ITR) <400> 234 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 235 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 235 ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 60 aaagcaacca tagt 74 <210> 236 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> F1 ori <400> 236 acgcgccctg tagcggcgca ttaagcgcgg cgggggtggt ggttacgcgc agcgtgaccg 60 ctacacttgc cagcgcctta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 120 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 180 gtgctttacg gcacctcgac cccaaaaaac ttgatttggg tgatggttca cgtagtgggc 240 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 300 gactcttgtt ccaaactgga acaacactca actctatctc gggctattct tttgatttat 360 aagggatttt gccgatttcg gtctattggt taaaaaatga gctgatttaa caaaaattta 420 acgcgaattt taacaaaata ttaacgttta caattt 456 <210> 237 <211> 281 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 237 tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 60 cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 120 aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 180 gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa 240 tggtttctta gacgtcaggt ggcacttttc ggggaaatgt g 281 <210> 238 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> AmpR promoter <400> 238 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 60 caataaccct gataaatgct tcaataatat tgaaaaagga agagt 105 <210> 239 <211> 861 <212> DNA <213> Artificial Sequence <220> <223> AmpR gene <400> 239 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 60 gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 120 cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 180 gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 240 cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 300 gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 360 tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 420 ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 480 gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 540 cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 600 tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 660 tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtggaagc 720 cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 780 acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 840 tcactgatta agcattggta a 861 <210> 240 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 240 ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 60 aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 120 ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 170 <210> 241 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> pUC ori <400> 241 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 242 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 242 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60 t 61 <210> 243 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> 5' inverted terminal repeat (ITR) <400> 243 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 244 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 244 tctagacaac tttgtataga aaagttg 27 <210> 245 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer and promoter <400> 245 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatc 589 <210> 246 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 246 caagtttgta caaaaaagca ggctgccacc 30 <210> 247 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 247 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 248 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 248 gaagtgcagc tggttgaaag cggaggcgga ctggtccagc caggcagaag cctgagactg 60 tcttgtgccg cctctggctt cacctttgac gactacgcca tgcactgggt gcggcaggcc 120 cctggcaagg gactcgagtg ggtcagcgcc atcacctgga atagcggcca catcgactac 180 gcagatagcg ttgaaggcag attcaccatc tccagggaca acgccaagaa ttctctgtac 240 ctgcagatga acagcctgcg ggccgaggat accgctgtgt actactgcgc caaagtgtcc 300 tacctgagca ccgccagctc cctggactac tggggccagg gcaccctggt gacagtgagc 360 tct 363 <210> 249 <211> 990 <212> DNA <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 249 gctagcacaa aaggacctag cgtgtttccc ctggccccta gcagcaaaag caccagcggc 60 ggaaccgccg ctctgggttg tctggtgaag gactatttcc ctgaacctgt gaccgtgtcc 120 tggaactctg gcgccctgac tagcggcgtg cataccttcc ctgccgtgct gcaaagctct 180 ggcctgtata gcctttcttc tgtggtgacc gtgcctagca gctctctggg cacacagaca 240 tacatctgca atgtgaacca caagccctcc aacaccaagg tggacaaaaa ggtggaaccc 300 aagagctgcg acaagaccca cacctgtcct ccgtgccccg ctcctgagct gctgggcggc 360 ccttctgtgt tcctgttccc ccccaaacct aaagacacac tgatgatcag ccggacccct 420 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc ccgaggtgaa gttcaactgg 480 tacgtggacg gcgtggaggt ccacaacgcc aagaccaaac ctagagagga acaatacaac 540 agcacatata gagtggtgtc tgtgctgaca gtgctccacc aggactggct gaacggaaag 600 gaatacaagt gcaaggtgtc caacaaggcc ctccctgctc caatcgagaa gaccattagc 660 aaggccaagg gccaacctag agagccccag gtctacaccc tgccaccaag tagagatgag 720 ctgaccaaga accaggtgag cctaacatgc ctggtgaagg gcttttaccc cagcgacatc 780 gccgtggaat gggagagcaa cggccagcct gagaacaact acaagacaac acctcctgtt 840 ctggattctg atggcagctt cttcctgtac agcaagctga cagtggataa gagccggtgg 900 cagcagggca acgtgttcag ctgctccgtt atgcacgagg ccctgcataa tcactacacc 960 cagaagagcc tgtctctgag ccctggcaag 990 <210> 250 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Furin cleavage site <400> 250 cgaaaacggc gc 12 <210> 251 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> GSG linker <400> 251 ggaagcgga 9 <210> 252 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A cleavage site <400> 252 gctactaact tcagcctgct gaagcaggct ggagatgtgg aggagaaccc tggacct 57 <210> 253 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 253 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 254 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 254 gatatccaga tgacccagtc tccatctagc ctgagcgcca gcgtgggaga tagagtgacc 60 atcacctgta gagcctctca aggcatccgg aactacctgg cctggtatca gcagaaacct 120 ggcaaggctc ctaagctgct gatctacgcc gcttccaccc tgcagagcgg cgttccttct 180 agattcagcg gcagcggctc cggaacagac ttcaccctga caattagctc cctgcaacct 240 gaagatgtgg ctacatacta ctgccagaga tacaatcggg ccccttacac ctttggacag 300 ggcaccaagg tggaaatcaa g 321 <210> 255 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 255 cggaccgtgg ccgccccatc tgtgttcatc ttccccccca gcgacgagca gctgaaaagc 60 ggcacagcca gcgtggtgtg cctgctgaac aacttctacc ccagggaagc caaggtgcag 120 tggaaggtgg acaatgccct gcagagcggc aacagccagg agagcgtgac cgagcaggac 180 agcaaggaca gcacctacag cctgagcagc accctcacac tgtctaaagc cgactacgag 240 aagcacaagg tctacgcctg cgaggtgacc caccagggcc tgtcctcccc tgtgacaaag 300 agctttaaca gaggcgagtg c 321 <210> 256 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 256 taa 3 <210> 257 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 257 cccccccccc ta 12 <210> 258 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> Internal ribosome entry site (IRES) (non-coding) <400> 258 acgttactgg ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt 60 ccaccatatt gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga 120 cgagcattcc taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg 180 tgaaggaagc agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt 240 gcaggcagcg gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat 300 aagatacacc tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg 360 aaagagtcaa atggctctcc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg 420 taccccattg tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt 480 cgaggttaaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 540 cacgatgata at 552 <210> 259 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Enhancer protein L <400> 259 atggccacaa ccatggaaca agagacttgc gcgcactctc tcacttttga ggaatgccca 60 aaatgctctg ctctacaata ccgtaatgga ttttacctgc taaagtatga tgaagaatgg 120 tacccagagg agttattgac tgatggagag gatgatgtct ttgatcccga attagacatg 180 gaagtcgttt tcgagttaca g 201 <210> 260 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 260 taa 3 <210> 261 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 261 acccagcttt cttgtacaaa gtgggaattc ctagagctcg ctgatcagcc tcga 54 <210> 262 <211> 208 <212> DNA <213> Artificial Sequence <220> <223> BGH polyadenylation signal <400> 262 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180 gggaagagaa tagcaggcat gctgggga 208 <210> 263 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 263 gggccgc 7 <210> 264 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> 3' inverted terminal repeat (ITR) <400> 264 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 265 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 265 ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 60 aaagcaacca tagt 74 <210> 266 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> F1 ori <400> 266 acgcgccctg tagcggcgca ttaagcgcgg cgggggtggt ggttacgcgc agcgtgaccg 60 ctacacttgc cagcgcctta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 120 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 180 gtgctttacg gcacctcgac cccaaaaaac ttgatttggg tgatggttca cgtagtgggc 240 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 300 gactcttgtt ccaaactgga acaacactca actctatctc gggctattct tttgatttat 360 aagggatttt gccgatttcg gtctattggt taaaaaatga gctgatttaa caaaaattta 420 acgcgaattt taacaaaata ttaacgttta caattt 456 <210> 267 <211> 281 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 267 tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 60 cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 120 aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 180 gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa 240 tggtttctta gacgtcaggt ggcacttttc ggggaaatgt g 281 <210> 268 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> AmpR promoter <400> 268 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 60 caataaccct gataaatgct tcaataatat tgaaaaagga agagt 105 <210> 269 <211> 861 <212> DNA <213> Artificial Sequence <220> <223> AmpR gene <400> 269 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 60 gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 120 cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 180 gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 240 cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 300 gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 360 tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 420 ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 480 gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 540 cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 600 tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 660 tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtggaagc 720 cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 780 acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 840 tcactgatta agcattggta a 861 <210> 270 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 270 ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 60 aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 120 ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 170 <210> 271 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> pUC ori <400> 271 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 272 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 272 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60 t 61 <210> 273 <211> 304 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer <400> 273 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300 catg 304 <210> 274 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> CMV promoter <400> 274 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180 tgggaggtct atataagcag agct 204 <210> 275 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 275 ggtttagtga accgtcagat cc 22 <210> 276 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Multiple cloning site (MSC) <400> 276 gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 60 gcgggcccgg gatccaccgg t 81 <210> 277 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 277 cgccacc 7 <210> 278 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> GBA signal peptide <400> 278 atggagtttt caagtccttc cagagaggaa tgtcccaagc ctttgagtag ggtaagcatc 60 atggctggca gcctcacagg attgcttcta cttcaggcag tgtcgtgggc atcaggt 117 <210> 279 <211> 1491 <212> DNA <213> Artificial Sequence <220> <223> GBA mature protein <400> 279 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ttggtacctt cagccgctat 120 gagagtacac gcagtgggcg acggatggag ctgagtatgg ggcccatcca ggctaatcac 180 acgggcacag gcctgctact gaccctgcag ccagaacaga agttccagaa agtgaaggga 240 tttggagggg ccatgacaga tgctgctgct ctcaacatcc ttgccctgtc accccctgcc 300 caaaatttgc tacttaaatc gtacttctct gaagaaggaa tcggatataa catcatccgg 360 gtacccatgg ccagctgtga cttctccatc cgcacctaca cctatgcaga cacccctgat 420 gatttccagt tgcacaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attcaccgag ccctgcagtt ggcccagcgt cccgtttcac tccttgccag cccctggaca 540 tcacccactt ggctcaagac caatggagcg gtgaatggga aggggtcact caagggacag 600 cccggagaca tctaccacca gacctgggcc agatactttg tgaagttcct ggatgcctat 660 gctgagcaca agttacagtt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 ttgagtggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtgacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgac agacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagccaccc taggggagac acaccgcctg ttccccaaca ccatgctctt tgcctcagag 1020 gcctgtgtgg gctccaagtt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 atgcagtaca gccacagcat catcacgaac ctcctgtacc atgtggtcgg ctggaccgac 1140 tggaaccttg ccctgaaccc cgaaggagga cccaattggg tgcgtaactt tgtcgacagt 1200 cccatcattg tagacatcac caaggacacg ttttacaaac agcccatgtt ctaccacctt 1260 ggccacttca gcaagttcat tcctgagggc tcccagagag tggggctggt tgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg catcccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct cctctaagga tgtgcctctt accatcaagg atcctgctgt gggcttcctg 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca g 1491 <210> 280 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> GSSG linker <400> 280 ggctcgagcg gc 12 <210> 281 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> NanoLuc luciferase <400> 281 gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta caacctggac 60 caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt gtccgtaact 120 ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat ccatgtcatc 180 atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat ttttaaggtg 240 gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac actggtaatc 300 gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg catcgccgtg 360 ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa aattatcgac 420 gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa cggagtgacc 480 ggctggcggc tgtgcgaacg cattctggcg 510 <210> 282 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 282 taa 3 <210> 283 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 283 ttacagcggc cgcgactcta gatcataatc agccatacca catttgtaga ggttttactt 60 gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 120 gttgtt 126 <210> 284 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> SV40 polyadenylation signal <400> 284 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 285 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 285 aggcgt 6 <210> 286 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> F1 ori <400> 286 aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 60 tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 120 tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 180 acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 240 aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 300 cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 360 cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 420 cacccgccgc gcttaatgcg ccgctacagg gcgcgt 456 <210> 287 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 287 caggtggcac ttttcgggga aatgtg 26 <210> 288 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> AmpR promoter <400> 288 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 60 caataaccct gataaatgct tcaataatat tgaaaaagga agagt 105 <210> 289 <211> 358 <212> DNA <213> Artificial Sequence <220> <223> SV40 promoter <400> 289 ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 60 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 120 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 180 aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 240 ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 300 ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaa 358 <210> 290 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 290 gatcgatcaa gagacaggat gaggatcgtt tcgc 34 <210> 291 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> NeoR/KanR resistance gene <400> 291 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 292 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 292 gcgggactct ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 60 tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 120 gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cctaggggga 180 ggctaactga aacacggaag gagacaatac cggaaggaac ccgcgctatg a 231 <210> 293 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> HSV TK polyadenylation signal <400> 293 cggcaataaa aagacagaat aaaacgcacg gtgttgggtc gtttgttc 48 <210> 294 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 294 ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt 60 ggggccaata cgcccgcgtt tcttcctttt ccccacccca ccccccaagt tcgggtgaag 120 gcccagggct cgcagccaac gtcggggcgg caggccctgc catagcctca ggttactcat 180 atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc 240 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 300 accccgtaga aaagatcaaa ggatcttc 328 <210> 295 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Ori <400> 295 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 296 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 296 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60 ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgccat gcattagtta 120 ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccg 174 <210> 297 <211> 304 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer <400> 297 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300 catg 304 <210> 298 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> CMV promoter <400> 298 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180 tgggaggtct atataagcag agct 204 <210> 299 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 299 ggtttagtga accgtcagat cc 22 <210> 300 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Multiple cloning site (MSC) <400> 300 gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 60 gcgggcccgg gatccaccgg t 81 <210> 301 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 301 cgccacc 7 <210> 302 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> GBA signal peptide <400> 302 atggagtttt caagtccttc cagagaggaa tgtcccaagc ctttgagtag ggtaagcatc 60 atggctggca gcctcacagg attgcttcta cttcaggcag tgtcgtgggc atcaggt 117 <210> 303 <211> 1491 <212> DNA <213> Artificial Sequence <220> <223> GBA mature protein <400> 303 gcccgcccct gcatccctaa aagcttcggc tacagctcgg tggtgtgtgt ctgcaatgcc 60 acatactgtg actcctttga ccccccgacc tttcctgccc ttggtacctt cagccgctat 120 gagagtacac gcagtgggcg acggatggag ctgagtatgg ggcccatcca ggctaatcac 180 acgggcacag gcctgctact gaccctgcag ccagaacaga agttccagaa agtgaaggga 240 tttggagggg ccatgacaga tgctgctgct ctcaacatcc ttgccctgtc accccctgcc 300 caaaatttgc tacttaaatc gtacttctct gaagaaggaa tcggatataa catcatccgg 360 gtacccatgg ccagctgtga cttctccatc cgcacctaca cctatgcaga cacccctgat 420 gatttccagt tgcacaactt cagcctccca gaggaagata ccaagctcaa gatacccctg 480 attcaccgag ccctgcagtt ggcccagcgt cccgtttcac tccttgccag cccctggaca 540 tcacccactt ggctcaagac caatggagcg gtgaatggga aggggtcact caagggacag 600 cccggagaca tctaccacca gacctgggcc agatactttg tgaagttcct ggatgcctat 660 gctgagcaca agttacagtt ctgggcagtg acagctgaaa atgagccttc tgctgggctg 720 ttgagtggat accccttcca gtgcctgggc ttcacccctg aacatcagcg agacttcatt 780 gcccgtgacc taggtcctac cctcgccaac agtactcacc acaatgtccg cctactcatg 840 ctggatgacc aacgcttgct gctgccccac tgggcaaagg tggtactgac agacccagaa 900 gcagctaaat atgttcatgg cattgctgta cattggtacc tggactttct ggctccagcc 960 aaagccaccc taggggagac acaccgcctg ttccccaaca ccatgctctt tgcctcagag 1020 gcctgtgtgg gctccaagtt ctgggagcag agtgtgcggc taggctcctg ggatcgaggg 1080 atgcagtaca gccacagcat catcacgaac ctcctgtacc atgtggtcgg ctggaccgac 1140 tggaaccttg ccctgaaccc cgaaggagga cccaattggg tgcgtaactt tgtcgacagt 1200 cccatcattg tagacatcac caaggacacg ttttacaaac agcccatgtt ctaccacctt 1260 ggccacttca gcaagttcat tcctgagggc tcccagagag tggggctggt tgccagtcag 1320 aagaacgacc tggacgcagt ggcactgatg catcccgatg gctctgctgt tgtggtcgtg 1380 ctaaaccgct cctctaagga tgtgcctctt accatcaagg atcctgctgt gggcttcctg 1440 gagacaatct cacctggcta ctccattcac acctacctgt ggcgtcgcca g 1491 <210> 304 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> GSSG linker <400> 304 ggctcgagcg gc 12 <210> 305 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> NanoLuc luciferase <400> 305 gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta caacctggac 60 caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt gtccgtaact 120 ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat ccatgtcatc 180 atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat ttttaaggtg 240 gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac actggtaatc 300 gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg catcgccgtg 360 ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa aattatcgac 420 gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa cggagtgacc 480 ggctggcggc tgtgcgaacg cattctggcg 510 <210> 306 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 306 taa 3 <210> 307 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 307 ttactaatcc ccccccccta 20 <210> 308 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> Internal ribosome entry site (IRES) (non-coding) <400> 308 acgttactgg ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt 60 ccaccatatt gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga 120 cgagcattcc taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg 180 tgaaggaagc agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt 240 gcaggcagcg gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat 300 aagatacacc tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg 360 aaagagtcaa atggctctcc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg 420 taccccattg tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt 480 cgaggttaaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 540 cacgatgata at 552 <210> 309 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Enhancer protein L <400> 309 atggccacaa ccatggaaca agagacttgc gcgcactctc tcacttttga ggaatgccca 60 aaatgctctg ctctacaata ccgtaatgga ttttacctgc taaagtatga tgaagaatgg 120 tacccagagg agttattgac tgatggagag gatgatgtct ttgatcccga attagacatg 180 gaagtcgttt tcgagttaca g 201 <210> 310 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Stop codon <400> 310 taa 3 <210> 311 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 311 atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 60 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgtt 105 <210> 312 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> SV40 polyadenylation signal <400> 312 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 313 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 313 aggcgt 6 <210> 314 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> F1 ori <400> 314 aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 60 tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 120 tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 180 acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 240 aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 300 cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 360 cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 420 cacccgccgc gcttaatgcg ccgctacagg gcgcgt 456 <210> 315 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 315 caggtggcac ttttcgggga aatgtg 26 <210> 316 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> AmpR promoter <400> 316 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 60 caataaccct gataaatgct tcaataatat tgaaaaagga agagt 105 <210> 317 <211> 358 <212> DNA <213> Artificial Sequence <220> <223> SV40 promoter <400> 317 ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 60 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 120 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 180 aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 240 ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 300 ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaa 358 <210> 318 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 318 gatcgatcaa gagacaggat gaggatcgtt tcgc 34 <210> 319 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> NeoR/KanR resistance gene <400> 319 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 320 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 320 gcgggactct ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 60 tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 120 gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cctaggggga 180 ggctaactga aacacggaag gagacaatac cggaaggaac ccgcgctatg a 231 <210> 321 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> HSV TK polyadenylation signal <400> 321 cggcaataaa aagacagaat aaaacgcacg gtgttgggtc gtttgttc 48 <210> 322 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 322 ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt 60 ggggccaata cgcccgcgtt tcttcctttt ccccacccca ccccccaagt tcgggtgaag 120 gcccagggct cgcagccaac gtcggggcgg caggccctgc catagcctca ggttactcat 180 atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc 240 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 300 accccgtaga aaagatcaaa ggatcttc 328 <210> 323 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Ori <400> 323 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 324 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Linker region <400> 324 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60 ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgccat gcattagtta 120 ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccg 174 <210> 325 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 325 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 326 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 326 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 327 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 327 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 328 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <400> 328 Arg Lys Arg Arg 1 <210> 329 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> GSG linker <400> 329 Gly Ser Gly 1 <210> 330 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A cleavage site <400> 330 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 331 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 331 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 332 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 332 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 333 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 333 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 1 5 10 15 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 20 25 30 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 35 40 45 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 50 55 60 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 65 70 75 80 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 85 90 95 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 100 105 <210> 334 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 334 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 335 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 335 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 336 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 336 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 337 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <400> 337 Arg Lys Arg Arg 1 <210> 338 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> GSG linker <400> 338 Gly Ser Gly 1 <210> 339 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A cleavage site <400> 339 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 340 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 340 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 341 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 341 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 342 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 342 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 1 5 10 15 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 20 25 30 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 35 40 45 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 50 55 60 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 65 70 75 80 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 85 90 95 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 100 105 <210> 343 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Enhancer protein L <400> 343 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 344 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 344 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 345 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 345 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 346 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 346 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 347 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <400> 347 Arg Lys Arg Arg 1 <210> 348 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> GSG linker <400> 348 Gly Ser Gly 1 <210> 349 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A cleavage site <400> 349 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 350 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 350 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 351 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 351 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 352 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 352 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 1 5 10 15 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 20 25 30 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 35 40 45 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 50 55 60 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 65 70 75 80 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 85 90 95 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 100 105 <210> 353 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 353 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 354 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable heavy (VH) domain <400> 354 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr 20 25 30 Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val 50 55 60 Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 355 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> hIgG1 constant heavy (CH) domain <400> 355 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 356 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <400> 356 Arg Lys Arg Arg 1 <210> 357 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> GSG linker <400> 357 Gly Ser Gly 1 <210> 358 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A cleavage site <400> 358 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 359 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Albumin signal peptide <400> 359 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 360 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Adalimumab variable light (VL) chain <400> 360 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 361 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> hIgG kappa constant light (CL) chain <400> 361 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 1 5 10 15 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 20 25 30 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 35 40 45 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 50 55 60 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 65 70 75 80 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 85 90 95 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 100 105 <210> 362 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Enhancer protein L <400> 362 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 363 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> GBA signal peptide <400> 363 Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser 1 5 10 15 Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln 20 25 30 Ala Val Ser Trp Ala Ser Gly 35 <210> 364 <211> 497 <212> PRT <213> Artificial Sequence <220> <223> Mature GBA protein <400> 364 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Lys 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 365 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GSSG linker <400> 365 Gly Ser Ser Gly 1 <210> 366 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> NanoLuc luciferase <400> 366 Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala Gly 1 5 10 15 Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu Phe 20 25 30 Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu Ser 35 40 45 Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr Glu 50 55 60 Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys Val 65 70 75 80 Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr Gly 85 90 95 Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe Gly 100 105 110 Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr Val 115 120 125 Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu Ile 130 135 140 Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val Thr 145 150 155 160 Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala 165 170 <210> 367 <211> 264 <212> PRT <213> Artificial Sequence <220> <223> NeoR/KanR resistance gene <400> 367 Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 1 5 10 15 Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 20 25 30 Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 35 40 45 Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 50 55 60 Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 65 70 75 80 Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 85 90 95 Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 100 105 110 Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 115 120 125 Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 130 135 140 Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 145 150 155 160 Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 165 170 175 Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 180 185 190 Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 195 200 205 Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 210 215 220 Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 225 230 235 240 Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 245 250 255 Tyr Arg Leu Leu Asp Glu Phe Phe 260 <210> 368 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> GBA signal peptide <400> 368 Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser 1 5 10 15 Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln 20 25 30 Ala Val Ser Trp Ala Ser Gly 35 <210> 369 <211> 497 <212> PRT <213> Artificial Sequence <220> <223> Mature GBA protein <400> 369 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Lys 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 370 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GSSG linker <400> 370 Gly Ser Ser Gly 1 <210> 371 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> NanoLuc luciferase <400> 371 Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Arg Gln Thr Ala Gly 1 5 10 15 Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu Phe 20 25 30 Gln Asn Leu Gly Val Ser Val Thr Pro Ile Gln Arg Ile Val Leu Ser 35 40 45 Gly Glu Asn Gly Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr Glu 50 55 60 Gly Leu Ser Gly Asp Gln Met Gly Gln Ile Glu Lys Ile Phe Lys Val 65 70 75 80 Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu His Tyr Gly 85 90 95 Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Ile Asp Tyr Phe Gly 100 105 110 Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr Val 115 120 125 Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu Ile 130 135 140 Asn Pro Asp Gly Ser Leu Leu Phe Arg Val Thr Ile Asn Gly Val Thr 145 150 155 160 Gly Trp Arg Leu Cys Glu Arg Ile Leu Ala 165 170 <210> 372 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Enhancer protein L <400> 372 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 373 <211> 264 <212> PRT <213> Artificial Sequence <220> <223> NeoR/KanR resistance gene <400> 373 Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 1 5 10 15 Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 20 25 30 Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 35 40 45 Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 50 55 60 Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 65 70 75 80 Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 85 90 95 Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 100 105 110 Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 115 120 125 Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 130 135 140 Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 145 150 155 160 Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 165 170 175 Ser Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 180 185 190 Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 195 200 205 Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 210 215 220 Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 225 230 235 240 Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 245 250 255 Tyr Arg Leu Leu Asp Glu Phe Phe 260 <210> 374 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Pembrolizumab VH <400> 374 Gln Val Gln Leu Val Gln Ser Gly Val Glu Val Lys Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asn Tyr 20 25 30 Tyr Met Tyr Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met 35 40 45 Gly Gly Ile Asn Pro Ser Asn Gly Gly Thr Asn Phe Asn Glu Lys Phe 50 55 60 Lys Asn Arg Val Thr Leu Thr Thr Asp Ser Ser Thr Thr Thr Ala Tyr 65 70 75 80 Met Glu Leu Lys Ser Leu Gln Phe Asp Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Arg Asp Tyr Arg Phe Asp Met Gly Phe Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Thr Val Thr Val Ser Ser 115 120 <210> 375 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> Pembrolizumab VL <400> 375 Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Lys Gly Val Ser Thr Ser 20 25 30 Gly Tyr Ser Tyr Leu His Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro 35 40 45 Arg Leu Leu Ile Tyr Leu Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala 50 55 60 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser 65 70 75 80 Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Ser Arg 85 90 95 Asp Leu Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys 100 105 110 <210> 376 <211> 113 <212> PRT <213> Artificial Sequence <220> <223> Nivolumab VH <400> 376 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Asp Cys Lys Ala Ser Gly Ile Thr Phe Ser Asn Ser 20 25 30 Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Val Ile Trp Tyr Asp Gly Ser Lys Arg Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Phe 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Thr Asn Asp Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser 100 105 110 Ser <210> 377 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Nivolumab VL <400> 377 Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Tyr 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile 35 40 45 Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro 65 70 75 80 Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Ser Ser Asn Trp Pro Arg 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 378 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Trastuzumab VH <400> 378 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr 20 25 30 Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 379 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Trastuzumab VL <400> 379 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 380 <211> 123 <212> PRT <213> Artificial Sequence <220> <223> Bevacizumab VH <400> 380 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Phe Thr Asn Tyr 20 25 30 Gly Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Gly Trp Ile Asn Thr Tyr Thr Gly Glu Pro Thr Tyr Ala Ala Asp Phe 50 55 60 Lys Arg Arg Phe Thr Phe Ser Leu Asp Thr Ser Lys Ser Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Tyr Pro His Tyr Tyr Gly Ser Ser His Trp Tyr Phe Asp Val 100 105 110 Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 381 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Bevacizumab VL <400> 381 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Ser Ala Ser Gln Asp Ile Ser Asn Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Val Leu Ile 35 40 45 Tyr Phe Thr Ser Ser Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Ser Thr Val Pro Trp 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 382 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Ustekinumab VH <400> 382 Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Glu 1 5 10 15 Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe Thr Thr Tyr 20 25 30 Trp Leu Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu Asp Trp Ile 35 40 45 Gly Ile Met Ser Pro Val Asp Ser Asp Ile Arg Tyr Ser Pro Ser Phe 50 55 60 Gln Gly Gln Val Thr Met Ser Val Asp Lys Ser Ile Thr Thr Ala Tyr 65 70 75 80 Leu Gln Trp Asn Ser Leu Lys Ala Ser Asp Thr Ala Met Tyr Tyr Cys 85 90 95 Ala Arg Arg Arg Pro Gly Gln Gly Tyr Phe Asp Phe Trp Gly Gln Gly 100 105 110 Thr Leu Val Thr Val Ser Ser 115 <210> 383 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Ustekinumab VL <400> 383 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Ser Trp 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Glu Lys Ala Pro Lys Ser Leu Ile 35 40 45 Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn Ile Tyr Pro Tyr 85 90 95 Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 100 105 <210> 384 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Ocrelizumab VH <400> 384 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Phe Thr Ser Tyr 20 25 30 Asn Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Gly Ala Ile Tyr Pro Gly Asn Gly Asp Thr Ser Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Arg Phe Thr Ile Ser Val Asp Lys Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Val Val Tyr Tyr Ser Asn Ser Tyr Trp Tyr Phe Asp Val Trp 100 105 110 Gly Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 385 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Ocrelizumab VL <400> 385 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Pro Leu Ile Tyr 35 40 45 Ala Pro Ser Asn Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu 65 70 75 80 Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Phe Asn Pro Pro Thr 85 90 95 Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 386 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> Secukinumab VH <400> 386 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Trp Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Ala Ile Asn Gln Asp Gly Ser Glu Lys Tyr Tyr Val Gly Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Val Arg Asp Tyr Tyr Asp Ile Leu Thr Asp Tyr Tyr Ile His Tyr Trp 100 105 110 Tyr Phe Asp Leu Trp Gly Arg Gly Thr Leu Val Thr Val Ser Ser 115 120 125 <210> 387 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Secukinumab VL <400> 387 Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser 20 25 30 Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu 35 40 45 Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu 65 70 75 80 Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Ser Pro 85 90 95 Cys Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys 100 105 <210> 388 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Vedolizumab VH <400> 388 Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Val Ser Cys Lys Gly Ser Gly Tyr Thr Phe Thr Ser Tyr 20 25 30 Trp Met His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile 35 40 45 Gly Glu Ile Asp Pro Ser Glu Ser Asn Thr Asn Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Arg Val Thr Leu Thr Val Asp Ile Ser Ala Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Gly Gly Tyr Asp Gly Trp Asp Tyr Ala Ile Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 389 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Vedolizumab VL <400> 389 Asp Val Val Met Thr Gln Ser Pro Leu Ser Leu Pro Val Thr Pro Gly 1 5 10 15 Glu Pro Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Leu Ala Lys Ser 20 25 30 Tyr Gly Asn Thr Tyr Leu Ser Trp Tyr Leu Gln Lys Pro Gly Gln Ser 35 40 45 Pro Gln Leu Leu Ile Tyr Gly Ile Ser Asn Arg Phe Ser Gly Val Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr Cys Leu Gln Gly 85 90 95 Thr His Gln Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 110 <210> 390 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Ibalizumab VH <400> 390 Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Val Val Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr 20 25 30 Val Ile His Trp Val Arg Gln Lys Pro Gly Gln Gly Leu Asp Trp Ile 35 40 45 Gly Tyr Ile Asn Pro Tyr Asn Asp Gly Thr Asp Tyr Asp Glu Lys Phe 50 55 60 Lys Gly Lys Ala Thr Leu Thr Ser Asp Thr Ser Thr Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Glu Lys Asp Asn Tyr Ala Thr Gly Ala Trp Phe Ala Tyr Trp 100 105 110 Gly Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 391 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Ibalizumab VL <400> 391 Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly 1 5 10 15 Glu Arg Val Thr Met Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser 20 25 30 Thr Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln 35 40 45 Ser Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val 50 55 60 Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr 65 70 75 80 Ile Ser Ser Val Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln 85 90 95 Tyr Tyr Ser Tyr Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys 100 105 110 <210> 392 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> Nirsevimab VH <400> 392 Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser 1 5 10 15 Ser Val Met Val Ser Cys Gln Ala Ser Gly Gly Leu Leu Glu Asp Tyr 20 25 30 Ile Ile Asn Trp Val Arg Gln Ala Pro Gly Gln Gly Pro Glu Trp Met 35 40 45 Gly Gly Ile Ile Pro Val Leu Gly Thr Val His Tyr Gly Pro Lys Phe 50 55 60 Gln Gly Arg Val Thr Ile Thr Ala Asp Glu Ser Thr Asp Thr Ala Tyr 65 70 75 80 Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr Tyr Cys 85 90 95 Ala Thr Glu Thr Ala Leu Val Val Ser Glu Thr Tyr Leu Pro His Tyr 100 105 110 Phe Asp Asn Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 125 <210> 393 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Nirsevimab VL <400> 393 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ala Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Gln Ala Ser Gln Asp Ile Val Asn Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Val Ala Ser Asn Leu Glu Thr Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Ser Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Val Ala Thr Tyr Tyr Cys Gln Gln Tyr Asp Asn Leu Pro Leu 85 90 95 Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys 100 105 <210> 394 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Atoltivimab VH <400> 394 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Asn Asn Tyr 20 25 30 Gly Met His Trp Val Arg Gln Ala Pro Gly Met Gly Leu Glu Trp Val 35 40 45 Ala Val Ile Trp His Asp Gly Ser Asp Lys Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Asn Trp Asn Leu Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val 100 105 110 Thr Val Ser Ser 115 <210> 395 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Atoltivimab VL <400> 395 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Ile Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Thr Tyr 20 25 30 Leu His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Phe Ser Thr Pro Pro 85 90 95 Ile Asn Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 100 105 <210> 396 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Maftivimab VH <400> 396 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Ser Ser Ser Tyr 20 25 30 Ala Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Thr Ile Ser Gly Met Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Arg Gly Tyr Pro His Ser Phe Asp Ile Trp Gly Gln Gly Thr 100 105 110 Met Val Thr Val Ser Ser 115 <210> 397 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Maftivimab VL <400> 397 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Phe 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Leu Thr 85 90 95 Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys 100 105 <210> 398 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Odesivimab VH <400> 398 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr 20 25 30 Asp Met His Trp Val Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ala Ile Gly Thr Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala 85 90 95 Arg Thr Trp Phe Gly Glu Leu Tyr Phe Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr Val Ser Ser 115 <210> 399 <211> 113 <212> PRT <213> Artificial Sequence <220> <223> Odesivimab VL <400> 399 Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly 1 5 10 15 Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr Ser 20 25 30 Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln 35 40 45 Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val 50 55 60 Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr 65 70 75 80 Ile Thr Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln 85 90 95 Tyr Tyr Ser Ser Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile 100 105 110 Lys <210> 400 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Casirivimab VH <400> 400 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asp Tyr 20 25 30 Tyr Met Ser Trp Ile Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Tyr Ile Thr Tyr Ser Gly Ser Thr Ile Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Asp Arg Gly Thr Thr Met Val Pro Phe Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 401 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Casirivimab VL <400> 401 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Gln Ala Ser Gln Asp Ile Thr Asn Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Asn Leu Glu Thr Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Phe Thr Ile Ser Gly Leu Gln Pro 65 70 75 80 Glu Asp Ile Ala Thr Tyr Tyr Cys Gln Gln Tyr Asp Asn Leu Pro Leu 85 90 95 Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys 100 105 <210> 402 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Imdevimab VH <400> 402 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Ala Met Tyr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Val Ile Ser Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Thr Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Ser Gly Ser Asp Tyr Gly Asp Tyr Leu Leu Val Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 403 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Imdevimab VL <400> 403 Gln Ser Ala Leu Thr Gln Pro Ala Ser Val Ser Gly Ser Pro Gly Gln 1 5 10 15 Ser Ile Thr Ile Ser Cys Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr 20 25 30 Asn Tyr Val Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu 35 40 45 Met Ile Tyr Asp Val Ser Lys Arg Pro Ser Gly Val Ser Asn Arg Phe 50 55 60 Ser Gly Ser Lys Ser Gly Asn Thr Ala Ser Leu Thr Ile Ser Gly Leu 65 70 75 80 Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Cys Asn Ser Leu Thr Ser Ile 85 90 95 Ser Thr Trp Val Phe Gly Gly Gly Thr Lys Leu Thr Val Leu 100 105 110 <210> 404 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Brolucizumab VH <400> 404 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Phe Ser Leu Thr Asp Tyr 20 25 30 Tyr Tyr Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp 35 40 45 Val Gly Phe Ile Asp Pro Asp Asp Asp Pro Tyr Tyr Ala Thr Trp Ala 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Gly Gly Asp His Asn Ser Gly Trp Gly Leu Asp Ile Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 405 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Brolucizumab VL <400> 405 Glu Ile Val Met Thr Gln Ser Pro Ser Thr Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Ile Ile Thr Cys Gln Ala Ser Glu Ile Ile His Ser Trp 20 25 30 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Leu Ala Ser Thr Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Ala Glu Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Asp Asp Phe Ala Thr Tyr Tyr Cys Gln Asn Val Tyr Leu Ala Ser Thr 85 90 95 Asn Gly Ala Asn Phe Gly Gln Gly Thr Lys Leu Thr Val Leu 100 105 110 <210> 406 <211> 497 <212> PRT <213> Artificial Sequence <220> <223> Glucosylceramidase (GBA) <400> 406 Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val Val Cys 1 5 10 15 Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr Phe Pro 20 25 30 Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly Arg Arg 35 40 45 Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly Thr Gly 50 55 60 Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val Lys Gly 65 70 75 80 Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu Ala Leu 85 90 95 Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser Glu Glu 100 105 110 Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys Asp Phe 115 120 125 Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe Gln Leu 130 135 140 His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile Pro Leu 145 150 155 160 Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu Leu Ala 165 170 175 Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala Val Asn 180 185 190 Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His Gln Thr 195 200 205 Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu His Lys 210 215 220 Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala Gly Leu 225 230 235 240 Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu His Gln 245 250 255 Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn Ser Thr 260 265 270 His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu Leu Leu 275 280 285 Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala Lys Tyr 290 295 300 Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala Pro Ala 305 310 315 320 Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr Met Leu 325 330 335 Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln Ser Val 340 345 350 Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser Ile Ile 355 360 365 Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn Leu Ala 370 375 380 Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val Asp Ser 385 390 395 400 Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln Pro Met 405 410 415 Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly Ser Gln 420 425 430 Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala Val Ala 435 440 445 Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn Arg Ser 450 455 460 Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly Phe Leu 465 470 475 480 Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp Arg Arg 485 490 495 Gln <210> 407 <211> 415 <212> PRT <213> Artificial Sequence <220> <223> rFIX-Fc Coagulation Factor IX <400> 407 Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg 1 5 10 15 Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe 20 25 30 Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly 35 40 45 Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp 50 55 60 Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys 65 70 75 80 Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu 85 90 95 Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr 100 105 110 Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val 115 120 125 Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr 130 135 140 Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu 145 150 155 160 Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn 165 170 175 Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe 180 185 190 Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly 195 200 205 Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu 210 215 220 Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu 225 230 235 240 Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His 245 250 255 His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu 260 265 270 Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile 275 280 285 Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser 290 295 300 Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala 305 310 315 320 Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys 325 330 335 Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly 340 345 350 Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro 355 360 365 His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser 370 375 380 Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys 385 390 395 400 Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 405 410 415 <210> 408 <211> 506 <212> PRT <213> Artificial Sequence <220> <223> Taliglucerase <400> 408 Glu Phe Ala Arg Pro Cys Ile Pro Lys Ser Phe Gly Tyr Ser Ser Val 1 5 10 15 Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser Phe Asp Pro Pro Thr 20 25 30 Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu Ser Thr Arg Ser Gly 35 40 45 Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln Ala Asn His Thr Gly 50 55 60 Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln Lys Phe Gln Lys Val 65 70 75 80 Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala Ala Leu Asn Ile Leu 85 90 95 Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu Lys Ser Tyr Phe Ser 100 105 110 Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val Pro Met Ala Ser Cys 115 120 125 Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp Thr Pro Asp Asp Phe 130 135 140 Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp Thr Lys Leu Lys Ile 145 150 155 160 Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln Arg Pro Val Ser Leu 165 170 175 Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu Lys Thr Asn Gly Ala 180 185 190 Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro Gly Asp Ile Tyr His 195 200 205 Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu Asp Ala Tyr Ala Glu 210 215 220 His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu Asn Glu Pro Ser Ala 225 230 235 240 Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu Gly Phe Thr Pro Glu 245 250 255 His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly Pro Thr Leu Ala Asn 260 265 270 Ser Thr His His Asn Val Arg Leu Leu Met Leu Asp Asp Gln Arg Leu 275 280 285 Leu Leu Pro His Trp Ala Lys Val Val Leu Thr Asp Pro Glu Ala Ala 290 295 300 Lys Tyr Val His Gly Ile Ala Val His Trp Tyr Leu Asp Phe Leu Ala 305 310 315 320 Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg Leu Phe Pro Asn Thr 325 330 335 Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser Lys Phe Trp Glu Gln 340 345 350 Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met Gln Tyr Ser His Ser 355 360 365 Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly Trp Thr Asp Trp Asn 370 375 380 Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp Val Arg Asn Phe Val 385 390 395 400 Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp Thr Phe Tyr Lys Gln 405 410 415 Pro Met Phe Tyr His Leu Gly His Phe Ser Lys Phe Ile Pro Glu Gly 420 425 430 Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys Asn Asp Leu Asp Ala 435 440 445 Val Ala Leu Met His Pro Asp Gly Ser Ala Val Val Val Val Leu Asn 450 455 460 Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys Asp Pro Ala Val Gly 465 470 475 480 Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile His Thr Tyr Leu Trp 485 490 495 His Arg Gln Asp Leu Leu Val Asp Thr Met 500 505 <210> 409 <211> 398 <212> PRT <213> Artificial Sequence <220> <223> Agalsidase beta <400> 409 Leu Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp 1 5 10 15 Glu Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys 20 25 30 Ile Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu 35 40 45 Gly Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp 50 55 60 Met Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln 65 70 75 80 Arg Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys 85 90 95 Gly Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala 100 105 110 Gly Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe 115 120 125 Ala Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp 130 135 140 Ser Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu 145 150 155 160 Asn Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr 165 170 175 Met Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys 180 185 190 Asn His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile 195 200 205 Lys Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp 210 215 220 Val Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly 225 230 235 240 Asn Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp 245 250 255 Ala Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile 260 265 270 Ser Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile 275 280 285 Asn Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp 290 295 300 Asn Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val 305 310 315 320 Ala Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile 325 330 335 Ala Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe 340 345 350 Ile Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp 355 360 365 Thr Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu 370 375 380 Gln Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu 385 390 395 <210> 410 <211> 626 <212> PRT <213> Artificial Sequence <220> <223> Laronidase <400> 410 Ala Pro His Leu Val Gln Val Asp Ala Ala Arg Ala Leu Trp Pro Leu 1 5 10 15 Arg Arg Phe Trp Arg Ser Thr Gly Phe Cys Pro Pro Leu Pro His Ser 20 25 30 Gln Ala Asp Gln Tyr Val Leu Ser Trp Asp Gln Gln Leu Asn Leu Ala 35 40 45 Tyr Val Gly Ala Val Pro His Arg Gly Ile Lys Gln Val Arg Thr His 50 55 60 Trp Leu Leu Glu Leu Val Thr Thr Arg Gly Ser Thr Gly Arg Gly Leu 65 70 75 80 Ser Tyr Asn Phe Thr His Leu Asp Gly Tyr Leu Asp Leu Leu Arg Glu 85 90 95 Asn Gln Leu Leu Pro Gly Phe Glu Leu Met Gly Ser Ala Ser Gly His 100 105 110 Phe Thr Asp Phe Glu Asp Lys Gln Gln Val Phe Glu Trp Lys Asp Leu 115 120 125 Val Ser Ser Leu Ala Arg Arg Tyr Ile Gly Arg Tyr Gly Leu Ala His 130 135 140 Val Ser Lys Trp Asn Phe Glu Thr Trp Asn Glu Pro Asp His His Asp 145 150 155 160 Phe Asp Asn Val Ser Met Thr Met Gln Gly Phe Leu Asn Tyr Tyr Asp 165 170 175 Ala Cys Ser Glu Gly Leu Arg Ala Ala Ser Pro Ala Leu Arg Leu Gly 180 185 190 Gly Pro Gly Asp Ser Phe His Thr Pro Pro Arg Ser Pro Leu Ser Trp 195 200 205 Gly Leu Leu Arg His Cys His Asp Gly Thr Asn Phe Phe Thr Gly Glu 210 215 220 Ala Gly Val Arg Leu Asp Tyr Ile Ser Leu His Arg Lys Gly Ala Arg 225 230 235 240 Ser Ser Ile Ser Ile Leu Glu Gln Glu Lys Val Val Ala Gln Gln Ile 245 250 255 Arg Gln Leu Phe Pro Lys Phe Ala Asp Thr Pro Ile Tyr Asn Asp Glu 260 265 270 Ala Asp Pro Leu Val Gly Trp Ser Leu Pro Gln Pro Trp Arg Ala Asp 275 280 285 Val Thr Tyr Ala Ala Met Val Val Lys Val Ile Ala Gln His Gln Asn 290 295 300 Leu Leu Leu Ala Asn Thr Thr Ser Ala Phe Pro Tyr Ala Leu Leu Ser 305 310 315 320 Asn Asp Asn Ala Phe Leu Ser Tyr His Pro His Pro Phe Ala Gln Arg 325 330 335 Thr Leu Thr Ala Arg Phe Gln Val Asn Asn Thr Arg Pro Pro His Val 340 345 350 Gln Leu Leu Arg Lys Pro Val Leu Thr Ala Met Gly Leu Leu Ala Leu 355 360 365 Leu Asp Glu Glu Gln Leu Trp Ala Glu Val Ser Gln Ala Gly Thr Val 370 375 380 Leu Asp Ser Asn His Thr Val Gly Val Leu Ala Ser Ala His Arg Pro 385 390 395 400 Gln Gly Pro Ala Asp Ala Trp Arg Ala Ala Val Leu Ile Tyr Ala Ser 405 410 415 Asp Asp Thr Arg Ala His Pro Asn Arg Ser Val Ala Val Thr Leu Arg 420 425 430 Leu Arg Gly Val Pro Pro Gly Pro Gly Leu Val Tyr Val Thr Arg Tyr 435 440 445 Leu Asp Asn Gly Leu Cys Ser Pro Asp Gly Glu Trp Arg Arg Leu Gly 450 455 460 Arg Pro Val Phe Pro Thr Ala Glu Gln Phe Arg Arg Met Arg Ala Ala 465 470 475 480 Glu Asp Pro Val Ala Ala Ala Pro Arg Pro Leu Pro Ala Gly Gly Arg 485 490 495 Leu Thr Leu Arg Pro Ala Leu Arg Leu Pro Ser Leu Leu Leu Val His 500 505 510 Val Cys Ala Arg Pro Glu Lys Pro Pro Gly Gln Val Thr Arg Leu Arg 515 520 525 Ala Leu Pro Leu Thr Gln Gly Gln Leu Val Leu Val Trp Ser Asp Glu 530 535 540 His Val Gly Ser Lys Cys Leu Trp Thr Tyr Glu Ile Gln Phe Ser Gln 545 550 555 560 Asp Gly Lys Ala Tyr Thr Pro Val Ser Arg Lys Pro Ser Thr Phe Asn 565 570 575 Leu Phe Val Phe Ser Pro Asp Thr Gly Ala Val Ser Gly Ser Tyr Arg 580 585 590 Val Arg Ala Leu Asp Tyr Trp Ala Arg Pro Gly Pro Phe Ser Asp Pro 595 600 605 Val Pro Tyr Leu Glu Val Pro Val Pro Arg Gly Pro Pro Ser Pro Gly 610 615 620 Asn Pro 625 <210> 411 <211> 525 <212> PRT <213> Artificial Sequence <220> <223> Idursulfase <400> 411 Ser Glu Thr Gln Ala Asn Ser Thr Thr Asp Ala Leu Asn Val Leu Leu 1 5 10 15 Ile Ile Val Asp Asp Leu Arg Pro Ser Leu Gly Cys Tyr Gly Asp Lys 20 25 30 Leu Val Arg Ser Pro Asn Ile Asp Gln Leu Ala Ser His Ser Leu Leu 35 40 45 Phe Gln Asn Ala Phe Ala Gln Gln Ala Val Cys Ala Pro Ser Arg Val 50 55 60 Ser Phe Leu Thr Gly Arg Arg Pro Asp Thr Thr Arg Leu Tyr Asp Phe 65 70 75 80 Asn Ser Tyr Trp Arg Val His Ala Gly Asn Phe Ser Thr Ile Pro Gln 85 90 95 Tyr Phe Lys Glu Asn Gly Tyr Val Thr Met Ser Val Gly Lys Val Phe 100 105 110 His Pro Gly Ile Ser Ser Asn His Thr Asp Asp Ser Pro Tyr Ser Trp 115 120 125 Ser Phe Pro Pro Tyr His Pro Ser Ser Glu Lys Tyr Glu Asn Thr Lys 130 135 140 Thr Cys Arg Gly Pro Asp Gly Glu Leu His Ala Asn Leu Leu Cys Pro 145 150 155 160 Val Asp Val Leu Asp Val Pro Glu Gly Thr Leu Pro Asp Lys Gln Ser 165 170 175 Thr Glu Gln Ala Ile Gln Leu Leu Glu Lys Met Lys Thr Ser Ala Ser 180 185 190 Pro Phe Phe Leu Ala Val Gly Tyr His Lys Pro His Ile Pro Phe Arg 195 200 205 Tyr Pro Lys Glu Phe Gln Lys Leu Tyr Pro Leu Glu Asn Ile Thr Leu 210 215 220 Ala Pro Asp Pro Glu Val Pro Asp Gly Leu Pro Pro Val Ala Tyr Asn 225 230 235 240 Pro Trp Met Asp Ile Arg Gln Arg Glu Asp Val Gln Ala Leu Asn Ile 245 250 255 Ser Val Pro Tyr Gly Pro Ile Pro Val Asp Phe Gln Arg Lys Ile Arg 260 265 270 Gln Ser Tyr Phe Ala Ser Val Ser Tyr Leu Asp Thr Gln Val Gly Arg 275 280 285 Leu Leu Ser Ala Leu Asp Asp Leu Gln Leu Ala Asn Ser Thr Ile Ile 290 295 300 Ala Phe Thr Ser Asp His Gly Trp Ala Leu Gly Glu His Gly Glu Trp 305 310 315 320 Ala Lys Tyr Ser Asn Phe Asp Val Ala Thr His Val Pro Leu Ile Phe 325 330 335 Tyr Val Pro Gly Arg Thr Ala Ser Leu Pro Glu Ala Gly Glu Lys Leu 340 345 350 Phe Pro Tyr Leu Asp Pro Phe Asp Ser Ala Ser Gln Leu Met Glu Pro 355 360 365 Gly Arg Gln Ser Met Asp Leu Val Glu Leu Val Ser Leu Phe Pro Thr 370 375 380 Leu Ala Gly Leu Ala Gly Leu Gln Val Pro Pro Arg Cys Pro Val Pro 385 390 395 400 Ser Phe His Val Glu Leu Cys Arg Glu Gly Lys Asn Leu Leu Lys His 405 410 415 Phe Arg Phe Arg Asp Leu Glu Glu Asp Pro Tyr Leu Pro Gly Asn Pro 420 425 430 Arg Glu Leu Ile Ala Tyr Ser Gln Tyr Pro Arg Pro Ser Asp Ile Pro 435 440 445 Gln Trp Asn Ser Asp Lys Pro Ser Leu Lys Asp Ile Lys Ile Met Gly 450 455 460 Tyr Ser Ile Arg Thr Ile Asp Tyr Arg Tyr Thr Val Trp Val Gly Phe 465 470 475 480 Asn Pro Asp Glu Phe Leu Ala Asn Phe Ser Asp Ile His Ala Gly Glu 485 490 495 Leu Tyr Phe Val Asp Ser Asp Pro Leu Gln Asp His Asn Met Tyr Asn 500 505 510 Asp Ser Gln Gly Gly Asp Leu Phe Gln Leu Leu Met Pro 515 520 525 <210> 412 <211> 339 <212> PRT <213> Artificial Sequence <220> <223> HLA Class I alpha chain (mouse K2-D1) <400> 412 Gly Pro His Ser Met Arg Tyr Phe Glu Thr Ala Val Ser Arg Pro Gly 1 5 10 15 Leu Glu Glu Pro Arg Tyr Ile Ser Val Gly Tyr Val Asp Asn Lys Glu 20 25 30 Phe Val Arg Phe Asp Ser Asp Ala Glu Asn Pro Arg Tyr Glu Pro Arg 35 40 45 Ala Pro Trp Met Glu Gln Glu Gly Pro Glu Tyr Trp Glu Arg Glu Thr 50 55 60 Gln Lys Ala Lys Gly Gln Glu Gln Trp Phe Arg Val Ser Leu Arg Asn 65 70 75 80 Leu Leu Gly Tyr Tyr Asn Gln Ser Ala Gly Gly Ser His Thr Leu Gln 85 90 95 Gln Met Ser Gly Cys Asp Leu Gly Ser Asp Trp Arg Leu Leu Arg Gly 100 105 110 Tyr Leu Gln Phe Ala Tyr Glu Gly Arg Asp Tyr Ile Ala Leu Asn Glu 115 120 125 Asp Leu Lys Thr Trp Thr Ala Ala Asp Met Ala Ala Gln Ile Thr Arg 130 135 140 Arg Lys Trp Glu Gln Ser Gly Ala Ala Glu His Tyr Lys Ala Tyr Leu 145 150 155 160 Glu Gly Glu Cys Val Glu Trp Leu His Arg Tyr Leu Lys Asn Gly Asn 165 170 175 Ala Thr Leu Leu Arg Thr Asp Ser Pro Lys Ala His Val Thr His His 180 185 190 Pro Arg Ser Lys Gly Glu Val Thr Leu Arg Cys Trp Ala Leu Gly Phe 195 200 205 Tyr Pro Ala Asp Ile Thr Leu Thr Trp Gln Leu Asn Gly Glu Glu Leu 210 215 220 Thr Gln Asp Met Glu Leu Val Glu Thr Arg Pro Ala Gly Asp Gly Thr 225 230 235 240 Phe Gln Lys Trp Ala Ser Val Val Val Pro Leu Gly Lys Glu Gln Asn 245 250 255 Tyr Thr Cys Arg Val Tyr His Glu Gly Leu Pro Glu Pro Leu Thr Leu 260 265 270 Arg Trp Glu Pro Pro Pro Ser Thr Asp Ser Tyr Met Val Ile Val Ala 275 280 285 Val Leu Gly Val Leu Gly Ala Met Ala Ile Ile Gly Ala Val Val Ala 290 295 300 Phe Val Met Lys Arg Arg Arg Asn Thr Gly Gly Lys Gly Gly Asp Tyr 305 310 315 320 Ala Leu Ala Pro Gly Ser Gln Ser Ser Glu Met Ser Leu Arg Asp Cys 325 330 335 Lys Ala Arg <210> 413 <211> 100 <212> PRT <213> Mus musculus <400> 413 Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg His Pro Pro Glu 1 5 10 15 Asn Gly Lys Pro Asn Ile Leu Asn Cys Tyr Val Thr Gln Phe His Pro 20 25 30 Pro His Ile Glu Ile Gln Met Leu Lys Asn Gly Lys Lys Ile Pro Lys 35 40 45 Val Glu Met Ser Asp Met Ser Phe Ser Lys Asp Trp Ser Phe Tyr Ile 50 55 60 Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp Thr Tyr Ala Cys 65 70 75 80 Arg Val Lys His Ala Ser Met Ala Glu Pro Lys Thr Val Tyr Trp Asp 85 90 95 Arg Asp Met Arg 100 <210> 414 <211> 1916 <212> PRT <213> Mus musculus <400> 414 Met Asp Ala Glu Ser Ile Arg Leu Asn Asn Glu Asn Leu Trp Ala Trp 1 5 10 15 Leu Val Arg Leu Leu Ser Lys Asn Pro Glu Trp Leu Ser Ala Lys Leu 20 25 30 Arg Ser Phe Leu Pro Thr Met Asp Leu Asp Cys Ser Tyr Glu Pro Ser 35 40 45 Asn Pro Glu Val Ile His Arg Gln Leu Asn Arg Leu Phe Ala Gln Gly 50 55 60 Met Ala Thr Trp Lys Ser Phe Ile Asn Asp Leu Cys Phe Glu Leu Asp 65 70 75 80 Val Pro Leu Asp Met Glu Ile Pro Leu Val Ser Ile Trp Gly Pro Arg 85 90 95 Asp Glu Phe Ser Lys Gln Leu Gly Ala Gly Glu Glu Ser Cys Pro Gly 100 105 110 Pro Gln Leu Tyr His Gly Ala Lys Arg Pro Phe Gln Ser Tyr Gly Ser 115 120 125 Ser Pro Arg Arg Lys Asn Ser Lys Lys Gln Gln Leu Glu Leu Ala Lys 130 135 140 Lys Tyr Leu Lys Leu Leu Lys Thr Ser Ala Gln Gln Trp His Gly Gly 145 150 155 160 Val Cys Pro Gly Ala Trp Leu Thr Pro His Ser Pro Gln Thr Tyr Ile 165 170 175 Pro Pro Val Leu Gln Trp Ser Arg Ala Thr Ala Pro Leu Asp Ala Gln 180 185 190 Glu Gly Ala Thr Leu Gly Asp Pro Glu Ala Ala Asp Asn Ile Asp Val 195 200 205 Ser Ile Gln Asp Leu Phe Ser Phe Lys Ala His Lys Gly Pro Arg Val 210 215 220 Thr Val Leu Leu Gly Lys Ala Gly Met Gly Lys Thr Thr Leu Ala Tyr 225 230 235 240 Arg Leu Arg Trp Arg Trp Ala Gln Gly Gln Leu Asp Arg Phe Gln Ala 245 250 255 Leu Phe Leu Phe Glu Phe Arg Gln Leu Asn Met Ile Thr Gln Leu Pro 260 265 270 Thr Leu Pro Gln Leu Leu Phe Asp Leu Tyr Leu Met Pro Glu Ser Glu 275 280 285 Pro Asp Ala Val Phe Gln Tyr Leu Lys Glu Asn Ala Gln Glu Val Leu 290 295 300 Leu Ile Phe Asp Gly Leu Asp Glu Ala Leu His Ala Asp Ser Val Gly 305 310 315 320 Thr Asp Asn Ala Gly Ser Ala Leu Thr Leu Phe Ser Glu Leu Cys His 325 330 335 Gly Asn Leu Leu Pro Gly Cys Trp Val Met Thr Thr Ser Arg Pro Gly 340 345 350 Lys Leu Pro Ser Cys Val Pro Thr Glu Ala Ala Thr Val His Met Trp 355 360 365 Gly Phe Asp Gly Leu Arg Val Glu Lys Tyr Val Thr Cys Phe Phe Ser 370 375 380 Asp Leu Leu Ser Gln Glu Leu Ala Leu Lys Glu Met Arg Thr Asn Ala 385 390 395 400 Arg Leu Arg Gly Met Cys Ala Ile Pro Ala Leu Cys Thr Val Thr Cys 405 410 415 Phe Cys Leu Arg Arg Leu Leu Pro Gly Ser Ser Pro Gly Gln Ser Ala 420 425 430 Ala Leu Leu Pro Thr Ile Thr Gln Leu Tyr Leu Gln Met Val Glu Thr 435 440 445 Phe Ser Pro Ser Glu Thr Leu Leu Asp Thr Ser Ile Leu Gly Phe Gly 450 455 460 Lys Val Ala Leu Arg Gly Leu Asp Thr Gly Lys Val Val Phe Ser Val 465 470 475 480 Glu Asp Ile Ser Pro Gln Leu Met Ser Phe Gly Ala Val His Ser Leu 485 490 495 Leu Thr Ser Phe Cys Ile His Thr Arg Pro Gly His Glu Glu Ile Gly 500 505 510 Tyr Ala Phe Val His Leu Ser Leu Gln Glu Phe Phe Ala Ala Leu Tyr 515 520 525 Leu Met Ala Ser His Thr Val Asp Lys Asp Thr Leu Val Glu Tyr Val 530 535 540 Thr Leu Asn Ser His Trp Val Leu Arg Thr Lys Gly Arg Leu Gly Leu 545 550 555 560 Ser Asp His Leu Pro Ala Phe Leu Ala Gly Leu Ala Ser His Thr Cys 565 570 575 His Met Phe Leu Cys Gln Leu Ala Gln Gln Asp Arg Ala Trp Val Gly 580 585 590 Ser Arg Gln Ala Ala Val Ile Gln Val Leu Arg Lys Leu Ala Ser Arg 595 600 605 Lys Leu Thr Gly Pro Lys Met Ile Glu Leu Tyr His Cys Val Ala Glu 610 615 620 Thr Gln Asp Leu Glu Leu Ala Arg Phe Thr Ala Gln Ser Leu Pro Ser 625 630 635 640 Arg Leu Ser Phe His Asn Phe Pro Leu Thr His Ala Asp Leu Ala Ala 645 650 655 Leu Ala Asn Ile Leu Glu His Arg Asp Asp Pro Ile His Leu Asp Phe 660 665 670 Asp Gly Cys Pro Leu Glu Pro His Cys Pro Glu Ala Leu Val Gly Cys 675 680 685 Gly Gln Val Glu Asn Leu Ser Phe Lys Ser Arg Lys Cys Gly Asp Ala 690 695 700 Phe Ala Glu Ala Leu Cys Arg Ser Leu Pro Thr Met Gly Ser Leu Lys 705 710 715 720 Thr Leu Gly Leu Thr Gly Ser Arg Ile Thr Ala Gln Gly Ile Ser His 725 730 735 Leu Ile Gln Thr Leu Pro Leu Cys Ser Gln Leu Glu Glu Val Ser Leu 740 745 750 His Asp Asn Gln Leu Lys Asp Pro Glu Val Leu Ser Leu Val Glu Leu 755 760 765 Leu Pro Ser Leu Pro Lys Leu Gln Lys Leu Asp Leu Ser Arg Asn Ser 770 775 780 Phe Ser Arg Ser Ile Leu Leu Ser Leu Val Lys Val Ala Ile Thr Cys 785 790 795 800 Pro Thr Val Arg Lys Leu Gln Val Arg Glu Leu Asp Leu Ile Phe Tyr 805 810 815 Leu Ser Pro Val Thr Glu Thr Ala Thr Gln Gln Ser Gly Ala Ser Asp 820 825 830 Val Gln Gly Lys Asp Ser Leu Lys Glu Gly Gln Ser Arg Ser Leu Gln 835 840 845 Leu Arg Leu Gln Lys Cys Gln Leu Arg Ile Arg Asp Ala Glu Ala Leu 850 855 860 Val Glu Leu Phe Gln Lys Ser Pro Gln Leu Glu Glu Val Asn Leu Ser 865 870 875 880 Gly Asn His Leu Glu Asp Asp Gly Cys Arg Leu Val Ala Glu Ala Ala 885 890 895 Ser Gln Leu His Ile Ala Gln Lys Leu Asp Leu Ser Asp Asn Gly Leu 900 905 910 Ser Gln Thr Gly Val Thr Tyr Val Leu Lys Ala Met Ser Thr Cys Gly 915 920 925 Thr Leu Glu Asp Leu His Ile Ser Leu Leu Asn Asn Thr Val Val Leu 930 935 940 Thr Phe Ala Gln Glu Pro Arg Glu Gln Glu Gly Ser Cys Lys Gly Arg 945 950 955 960 Ala Pro Leu Ile Ser Phe Val Ser Pro Val Thr Ser Glu Leu Ser Gln 965 970 975 Arg Ser Arg Arg Ile Arg Leu Thr His Cys Gly Phe Leu Ala Lys His 980 985 990 Thr Glu Thr Leu Cys Glu Ala Leu Arg Ala Ser Cys Gln Thr His Asn 995 1000 1005 Leu Asp His Leu Asp Leu Ser Asp Asn Ser Leu Gly Gly Lys Gly 1010 1015 1020 Val Ile Leu Leu Thr Glu Leu Leu Pro Gly Leu Gly Pro Leu Lys 1025 1030 1035 Ser Leu Asn Leu Ser Arg Asn Gly Leu Ser Met Asp Ala Val Phe 1040 1045 1050 Ser Leu Val Gln Cys Leu Ser Ser Leu Gln Trp Val Phe His Leu 1055 1060 1065 Asp Val Ser Leu Glu Ser Asp Cys Ile Phe Leu Arg Gly Ala Gly 1070 1075 1080 Thr Ser Arg Asp Ala Leu Glu Pro Lys Phe Gln Thr Gly Val Gln 1085 1090 1095 Val Leu Glu Leu Ser Gln Arg Tyr Thr Ser Arg Ser Phe Cys Leu 1100 1105 1110 Gln Glu Cys Gln Leu Glu Pro Thr Ser Leu Thr Phe Leu Cys Ala 1115 1120 1125 Thr Leu Glu Lys Ser Pro Gly Pro Leu Glu Val Gln Leu Ser Cys 1130 1135 1140 Lys Ser Leu Ser Asp Asp Ser Leu Lys Ile Leu Leu Gln Cys Leu 1145 1150 1155 Pro Gln Leu Pro Gln Leu Ser Leu Leu Gln Leu Arg His Thr Val 1160 1165 1170 Leu Ser Ser Arg Ser Pro Phe Leu Leu Ala Asp Ile Phe Asn Leu 1175 1180 1185 Cys Pro Arg Val Arg Lys Val Thr Leu Arg Ser Leu Cys His Ala 1190 1195 1200 Val Leu His Phe Asp Ser Asn Glu Glu Gln Glu Gly Val Cys Cys 1205 1210 1215 Gly Phe Pro Gly Cys Ser Leu Ser Gln Glu His Met Glu Thr Leu 1220 1225 1230 Cys Cys Ala Leu Ser Lys Cys Asn Ala Leu Ser Gln Leu Asp Leu 1235 1240 1245 Thr Asp Asn Leu Leu Gly Asp Ile Gly Leu Arg Cys Leu Leu Glu 1250 1255 1260 Cys Leu Pro Gln Leu Pro Ile Ser Gly Trp Leu Asp Leu Ser His 1265 1270 1275 Asn Asn Ile Ser Gln Glu Gly Ile Leu Tyr Leu Leu Glu Thr Leu 1280 1285 1290 Pro Ser Tyr Pro Asn Ile Gln Glu Val Ser Val Ser Leu Ser Ser 1295 1300 1305 Glu Gln Ile Phe Arg Met Cys Phe Ser Lys Lys Glu Gly Ala Gly 1310 1315 1320 Thr Ser Leu Arg Leu Cys Glu Cys Ser Phe Ser Pro Glu Gln Val 1325 1330 1335 Ser Lys Leu Ala Ser Ser Leu Ser Gln Ala Gln Gln Leu Thr Glu 1340 1345 1350 Leu Trp Leu Thr Lys Cys His Leu Asp Leu Pro Gln Leu Thr Met 1355 1360 1365 Leu Leu Asn Leu Val Asn Arg Pro Thr Gly Leu Leu Gly Leu Arg 1370 1375 1380 Leu Glu Glu Pro Trp Val Asp Ser Val Ser Leu Pro Ala Leu Met 1385 1390 1395 Glu Val Cys Ala Gln Ala Ser Gly Cys Leu Thr Glu Leu Ser Ile 1400 1405 1410 Ser Glu Ile Gln Arg Lys Leu Trp Leu Gln Leu Glu Phe Pro His 1415 1420 1425 Gln Glu Gly Asn Ser Asp Ser Met Ala Leu Arg Leu Ala His Cys 1430 1435 1440 Asp Leu Glu Thr Glu His Ser His Leu Met Ile Gln Leu Val Glu 1445 1450 1455 Thr Tyr Ala Arg Leu Gln Gln Leu Ser Leu Ser Gln Val Ser Phe 1460 1465 1470 Asn Asp Asn Asp Gly Thr Ser Ser Lys Leu Leu Gln Asn Ile Leu 1475 1480 1485 Leu Ser Ser Cys Glu Leu Lys Ser Phe Arg Leu Thr Phe Ser Gln 1490 1495 1500 Val Ser Thr Lys Ser Leu Thr His Leu Ala Phe Gly Leu Gly His 1505 1510 1515 Cys His His Leu Glu Glu Leu Asp Phe Ser Asn Asn Ser Leu Arg 1520 1525 1530 Glu Glu Asp Thr Glu Leu Leu Met Gly Ala Leu Gln Gly Thr Cys 1535 1540 1545 Arg Leu Lys Lys Leu His Leu Ser Phe Leu Pro Leu Gly Ala Ser 1550 1555 1560 Ser Leu Ala Leu Leu Ile Gln Gly Leu Ser Arg Met Thr Leu Leu 1565 1570 1575 Gln Asp Leu Cys Leu Ser His Asn Gln Ile Gly Asp Val Gly Thr 1580 1585 1590 Gln Cys Leu Ala Ala Ile Leu Pro Lys Leu Pro Glu Leu Arg Lys 1595 1600 1605 Phe Asp Leu Ser His Asn Gln Ile Gly Asp Val Gly Thr Gln Cys 1610 1615 1620 Leu Ala Ala Ile Leu Pro Lys Leu Pro Glu Leu Arg Lys Phe Asn 1625 1630 1635 Leu Ser His Asn Gln Ile Gly His Val Gly Thr Gln Cys Leu Ala 1640 1645 1650 Ala Ile Leu Pro Lys Leu Pro Glu Leu Arg Lys Phe Asp Leu Ser 1655 1660 1665 Arg Asn Gln Ile Gly Asp Val Gly Thr Gln Cys Leu Ala Ala Ile 1670 1675 1680 Leu Pro Lys Leu Pro Glu Leu Arg Lys Phe Asp Leu Ser Gly Asn 1685 1690 1695 Arg Ile Gly Pro Ala Gly Gly Val Gln Leu Val Lys Ser Leu Thr 1700 1705 1710 His Phe Glu His Leu Glu Glu Ile Lys Leu Gly Asn Asn Ala Leu 1715 1720 1725 Gly Glu Pro Thr Ala Leu Glu Leu Ala Gln Arg Leu Pro Pro Gln 1730 1735 1740 Leu Arg Val Leu Cys Leu Pro Ser Ser His Leu Gly Pro Glu Gly 1745 1750 1755 Ala Leu Gly Leu Ala Gln Ala Leu Glu Gln Cys Pro His Ile Glu 1760 1765 1770 Glu Val Ser Leu Ala Glu Asn Asn Leu Ala Gly Gly Val Pro Arg 1775 1780 1785 Phe Ser Lys Arg Leu Pro Leu Leu Arg Gln Ile Asp Leu Glu Phe 1790 1795 1800 Cys Lys Ile Glu Asp Gln Ala Ala Arg His Leu Ala Ala Asn Leu 1805 1810 1815 Thr Leu Phe Pro Ala Leu Glu Lys Leu Leu Leu Ser Gly Asn Leu 1820 1825 1830 Leu Gly Asp Glu Val Ala Ala Glu Leu Ala Gln Val Leu Pro Gln 1835 1840 1845 Met Gly Gln Leu Lys Lys Val Asn Leu Glu Trp Asn Arg Ile Thr 1850 1855 1860 Ala Arg Gly Ala Gln Leu Leu Ala Gln Gly Leu Val Gln Gly Ser 1865 1870 1875 Cys Val Pro Val Ile Arg Leu Trp Asn Asn Pro Ile Leu Asn Asp 1880 1885 1890 Val Ala Gln Ser Leu Gln Ser Gln Glu Pro Arg Leu Asp Phe Ser 1895 1900 1905 Ile Thr Asp Gln Gln Thr Leu Arg 1910 1915 <210> 415 <211> 365 <212> PRT <213> Homo sapiens <400> 415 Met Ala Val Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ser Gly Ala 1 5 10 15 Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe 20 25 30 Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala 35 40 45 Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala 50 55 60 Ala Ser Gln Lys Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly 65 70 75 80 Pro Glu Tyr Trp Asp Gln Glu Thr Arg Asn Met Lys Ala His Ser Gln 85 90 95 Thr Asp Arg Ala Asn Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser 100 105 110 Glu Asp Gly Ser His Thr Ile Gln Ile Met Tyr Gly Cys Asp Val Gly 115 120 125 Pro Asp Gly Arg Phe Leu Arg Gly Tyr Arg Gln Asp Ala Tyr Asp Gly 130 135 140 Lys Asp Tyr Ile Ala Leu Asn Glu Asp Leu Arg Ser Trp Thr Ala Ala 145 150 155 160 Asp Met Ala Ala Gln Ile Thr Lys Arg Lys Trp Glu Ala Val His Ala 165 170 175 Ala Glu Gln Arg Arg Val Tyr Leu Glu Gly Arg Cys Val Asp Gly Leu 180 185 190 Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Pro 195 200 205 Pro Lys Thr His Met Thr His His Pro Ile Ser Asp His Glu Ala Thr 210 215 220 Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Glu Ile Thr Leu Thr 225 230 235 240 Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu 245 250 255 Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val 260 265 270 Val Pro Ser Gly Glu Glu Gln Arg Tyr Thr Cys His Val Gln His Glu 275 280 285 Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Leu Ser Ser Gln Pro 290 295 300 Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Leu Gly Ala 305 310 315 320 Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser 325 330 335 Ser Asp Arg Lys Gly Gly Ser Tyr Thr Gln Ala Ala Ser Ser Asp Ser 340 345 350 Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val 355 360 365 <210> 416 <211> 99 <212> PRT <213> Homo sapiens <400> 416 Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg His Pro Ala Glu 1 5 10 15 Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser Gly Phe His Pro 20 25 30 Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu Arg Ile Glu Lys 35 40 45 Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp Ser Phe Tyr Leu 50 55 60 Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp Glu Tyr Ala Cys 65 70 75 80 Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile Val Lys Trp Asp 85 90 95 Arg Asp Met <210> 417 <211> 1866 <212> PRT <213> Homo sapiens <400> 417 Met Asp Pro Val Gly Leu Gln Leu Gly Asn Lys Asn Leu Trp Ser Cys 1 5 10 15 Leu Val Arg Leu Leu Thr Lys Asp Pro Glu Trp Leu Asn Ala Lys Met 20 25 30 Lys Phe Phe Leu Pro Asn Thr Asp Leu Asp Ser Arg Asn Glu Thr Leu 35 40 45 Asp Pro Glu Gln Arg Val Ile Leu Gln Leu Asn Lys Leu His Val Gln 50 55 60 Gly Ser Asp Thr Trp Gln Ser Phe Ile His Cys Val Cys Met Gln Leu 65 70 75 80 Glu Val Pro Leu Asp Leu Glu Val Leu Leu Leu Ser Thr Phe Gly Tyr 85 90 95 Asp Asp Gly Phe Thr Ser Gln Leu Gly Ala Glu Gly Lys Ser Gln Pro 100 105 110 Glu Ser Gln Leu His His Gly Leu Lys Arg Pro His Gln Ser Cys Gly 115 120 125 Ser Ser Pro Arg Arg Lys Gln Cys Lys Lys Gln Gln Leu Glu Leu Ala 130 135 140 Lys Lys Tyr Leu Gln Leu Leu Arg Thr Ser Ala Gln Gln Arg Tyr Arg 145 150 155 160 Ser Gln Ile Pro Gly Ser Gly Gln Pro His Ala Phe His Gln Val Tyr 165 170 175 Val Pro Pro Ile Leu Arg Arg Ala Thr Ala Ser Leu Asp Thr Pro Glu 180 185 190 Gly Ala Ile Met Gly Asp Val Lys Val Glu Asp Gly Ala Asp Val Ser 195 200 205 Ile Ser Asp Leu Phe Asn Thr Arg Val Asn Lys Gly Pro Arg Val Thr 210 215 220 Val Leu Leu Gly Lys Ala Gly Met Gly Lys Thr Thr Leu Ala His Arg 225 230 235 240 Leu Cys Gln Lys Trp Ala Glu Gly His Leu Asn Cys Phe Gln Ala Leu 245 250 255 Phe Leu Phe Glu Phe Arg Gln Leu Asn Leu Ile Thr Arg Phe Leu Thr 260 265 270 Pro Ser Glu Leu Leu Phe Asp Leu Tyr Leu Ser Pro Glu Ser Asp His 275 280 285 Asp Thr Val Phe Gln Tyr Leu Glu Lys Asn Ala Asp Gln Val Leu Leu 290 295 300 Ile Phe Asp Gly Leu Asp Glu Ala Leu Gln Pro Met Gly Pro Asp Gly 305 310 315 320 Pro Gly Pro Val Leu Thr Leu Phe Ser His Leu Cys Asn Gly Thr Leu 325 330 335 Leu Pro Gly Cys Arg Val Met Ala Thr Ser Arg Pro Gly Lys Leu Pro 340 345 350 Ala Cys Leu Pro Ala Glu Ala Ala Met Val His Met Leu Gly Phe Asp 355 360 365 Gly Pro Arg Val Glu Glu Tyr Val Asn His Phe Phe Ser Ala Gln Pro 370 375 380 Ser Arg Glu Gly Ala Leu Val Glu Leu Gln Thr Asn Gly Arg Leu Arg 385 390 395 400 Ser Leu Cys Ala Val Pro Ala Leu Cys Gln Val Ala Cys Leu Cys Leu 405 410 415 His His Leu Leu Pro Asp His Ala Pro Gly Gln Ser Val Ala Leu Leu 420 425 430 Pro Asn Met Thr Gln Leu Tyr Met Gln Met Val Leu Ala Leu Ser Pro 435 440 445 Pro Gly His Leu Pro Thr Ser Ser Leu Leu Asp Leu Gly Glu Val Ala 450 455 460 Leu Arg Gly Leu Glu Thr Gly Lys Val Ile Phe Tyr Ala Lys Asp Ile 465 470 475 480 Ala Pro Pro Leu Ile Ala Phe Gly Ala Thr His Ser Leu Leu Thr Ser 485 490 495 Phe Cys Val Cys Thr Gly Pro Gly His Gln Gln Thr Gly Tyr Ala Phe 500 505 510 Thr His Leu Ser Leu Gln Glu Phe Leu Ala Ala Leu His Leu Met Ala 515 520 525 Ser Pro Lys Val Asn Lys Asp Thr Leu Thr Gln Tyr Val Thr Leu His 530 535 540 Ser Arg Trp Val Gln Arg Thr Lys Ala Arg Leu Gly Leu Ser Asp His 545 550 555 560 Leu Pro Thr Phe Leu Ala Gly Leu Ala Ser Cys Thr Cys Arg Pro Phe 565 570 575 Leu Ser His Leu Ala Gln Gly Asn Glu Asp Cys Val Gly Ala Lys Gln 580 585 590 Ala Ala Val Val Gln Val Leu Lys Lys Leu Ala Thr Arg Lys Leu Thr 595 600 605 Gly Pro Lys Val Val Glu Leu Cys His Cys Val Asp Glu Thr Gln Glu 610 615 620 Pro Glu Leu Ala Ser Leu Thr Ala Gln Ser Leu Pro Tyr Gln Leu Pro 625 630 635 640 Phe His Asn Phe Pro Leu Thr Cys Thr Asp Leu Ala Thr Leu Thr Asn 645 650 655 Ile Leu Glu His Arg Glu Ala Pro Ile His Leu Asp Phe Asp Gly Cys 660 665 670 Pro Leu Glu Pro His Cys Pro Glu Ala Leu Val Gly Cys Gly Gln Ile 675 680 685 Glu Asn Leu Ser Phe Lys Ser Arg Lys Cys Gly Asp Ala Phe Ala Glu 690 695 700 Ala Leu Ser Arg Ser Leu Pro Thr Met Gly Arg Leu Gln Met Leu Gly 705 710 715 720 Leu Ala Gly Ser Lys Ile Thr Ala Arg Gly Ile Ser His Leu Val Lys 725 730 735 Ala Leu Pro Leu Cys Pro Gln Leu Lys Glu Val Ser Phe Arg Asp Asn 740 745 750 Gln Leu Ser Asp Gln Val Val Leu Asn Ile Val Glu Val Leu Pro His 755 760 765 Leu Pro Arg Leu Arg Lys Leu Asp Leu Ser Ser Asn Ser Ile Cys Val 770 775 780 Ser Thr Leu Leu Cys Leu Ala Arg Val Ala Val Thr Cys Pro Thr Val 785 790 795 800 Arg Met Leu Gln Ala Arg Glu Ala Asp Leu Ile Phe Leu Leu Ser Pro 805 810 815 Pro Thr Glu Thr Thr Ala Glu Leu Gln Arg Ala Pro Asp Leu Gln Glu 820 825 830 Ser Asp Gly Gln Arg Lys Gly Ala Gln Ser Arg Ser Leu Thr Leu Arg 835 840 845 Leu Gln Lys Cys Gln Leu Gln Val His Asp Ala Glu Ala Leu Ile Ala 850 855 860 Leu Leu Gln Glu Gly Pro His Leu Glu Glu Val Asp Leu Ser Gly Asn 865 870 875 880 Gln Leu Glu Asp Glu Gly Cys Arg Leu Met Ala Glu Ala Ala Ser Gln 885 890 895 Leu His Ile Ala Arg Lys Leu Asp Leu Ser Asn Asn Gly Leu Ser Val 900 905 910 Ala Gly Val His Cys Val Leu Arg Ala Val Ser Ala Cys Trp Thr Leu 915 920 925 Ala Glu Leu His Ile Ser Leu Gln His Lys Thr Val Ile Phe Met Phe 930 935 940 Ala Gln Glu Pro Glu Glu Gln Lys Gly Pro Gln Glu Arg Ala Ala Phe 945 950 955 960 Leu Asp Ser Leu Met Leu Gln Met Pro Ser Glu Leu Pro Leu Ser Ser 965 970 975 Arg Arg Met Arg Leu Thr His Cys Gly Leu Gln Glu Lys His Leu Glu 980 985 990 Gln Leu Cys Lys Ala Leu Gly Gly Ser Cys His Leu Gly His Leu His 995 1000 1005 Leu Asp Phe Ser Gly Asn Ala Leu Gly Asp Glu Gly Ala Ala Arg 1010 1015 1020 Leu Ala Gln Leu Leu Pro Gly Leu Gly Ala Leu Gln Ser Leu Asn 1025 1030 1035 Leu Ser Glu Asn Gly Leu Ser Leu Asp Ala Val Leu Gly Leu Val 1040 1045 1050 Arg Cys Phe Ser Thr Leu Gln Trp Leu Phe Arg Leu Asp Ile Ser 1055 1060 1065 Phe Glu Ser Gln His Ile Leu Leu Arg Gly Asp Lys Thr Ser Arg 1070 1075 1080 Asp Met Trp Ala Thr Gly Ser Leu Pro Asp Phe Pro Ala Ala Ala 1085 1090 1095 Lys Phe Leu Gly Phe Arg Gln Arg Cys Ile Pro Arg Ser Leu Cys 1100 1105 1110 Leu Ser Glu Cys Pro Leu Glu Pro Pro Ser Leu Thr Arg Leu Cys 1115 1120 1125 Ala Thr Leu Lys Asp Cys Pro Gly Pro Leu Glu Leu Gln Leu Ser 1130 1135 1140 Cys Glu Phe Leu Ser Asp Gln Ser Leu Glu Thr Leu Leu Asp Cys 1145 1150 1155 Leu Pro Gln Leu Pro Gln Leu Ser Leu Leu Gln Leu Ser Gln Thr 1160 1165 1170 Gly Leu Ser Pro Lys Ser Pro Phe Leu Leu Ala Asn Thr Leu Ser 1175 1180 1185 Leu Cys Pro Arg Val Lys Lys Val Asp Leu Arg Ser Leu His His 1190 1195 1200 Ala Thr Leu His Phe Arg Ser Asn Glu Glu Glu Glu Gly Val Cys 1205 1210 1215 Cys Gly Arg Phe Thr Gly Cys Ser Leu Ser Gln Glu His Val Glu 1220 1225 1230 Ser Leu Cys Trp Leu Leu Ser Lys Cys Lys Asp Leu Ser Gln Val 1235 1240 1245 Asp Leu Ser Ala Asn Leu Leu Gly Asp Ser Gly Leu Arg Cys Leu 1250 1255 1260 Leu Glu Cys Leu Pro Gln Val Pro Ile Ser Gly Leu Leu Asp Leu 1265 1270 1275 Ser His Asn Ser Ile Ser Gln Glu Ser Ala Leu Tyr Leu Leu Glu 1280 1285 1290 Thr Leu Pro Ser Cys Pro Arg Val Arg Glu Ala Ser Val Asn Leu 1295 1300 1305 Gly Ser Glu Gln Ser Phe Arg Ile His Phe Ser Arg Glu Asp Gln 1310 1315 1320 Ala Gly Lys Thr Leu Arg Leu Ser Glu Cys Ser Phe Arg Pro Glu 1325 1330 1335 His Val Ser Arg Leu Ala Thr Gly Leu Ser Lys Ser Leu Gln Leu 1340 1345 1350 Thr Glu Leu Thr Leu Thr Gln Cys Cys Leu Gly Gln Lys Gln Leu 1355 1360 1365 Ala Ile Leu Leu Ser Leu Val Gly Arg Pro Ala Gly Leu Phe Ser 1370 1375 1380 Leu Arg Val Gln Glu Pro Trp Ala Asp Arg Ala Arg Val Leu Ser 1385 1390 1395 Leu Leu Glu Val Cys Ala Gln Ala Ser Gly Ser Val Thr Glu Ile 1400 1405 1410 Ser Ile Ser Glu Thr Gln Gln Gln Leu Cys Val Gln Leu Glu Phe 1415 1420 1425 Pro Arg Gln Glu Glu Asn Pro Glu Ala Val Ala Leu Arg Leu Ala 1430 1435 1440 His Cys Asp Leu Gly Ala His His Ser Leu Leu Val Gly Gln Leu 1445 1450 1455 Met Glu Thr Cys Ala Arg Leu Gln Gln Leu Ser Leu Ser Gln Val 1460 1465 1470 Asn Leu Cys Glu Asp Asp Asp Ala Ser Ser Leu Leu Leu Gln Ser 1475 1480 1485 Leu Leu Leu Ser Leu Ser Glu Leu Lys Thr Phe Arg Leu Thr Ser 1490 1495 1500 Ser Cys Val Ser Thr Glu Gly Leu Ala His Leu Ala Ser Gly Leu 1505 1510 1515 Gly His Cys His His Leu Glu Glu Leu Asp Leu Ser Asn Asn Gln 1520 1525 1530 Phe Asp Glu Glu Gly Thr Lys Ala Leu Met Arg Ala Leu Glu Gly 1535 1540 1545 Lys Trp Met Leu Lys Arg Leu Asp Leu Ser His Leu Leu Leu Asn 1550 1555 1560 Ser Ser Thr Leu Ala Leu Leu Thr His Arg Leu Ser Gln Met Thr 1565 1570 1575 Cys Leu Gln Ser Leu Arg Leu Asn Arg Asn Ser Ile Gly Asp Val 1580 1585 1590 Gly Cys Cys His Leu Ser Glu Ala Leu Arg Ala Ala Thr Ser Leu 1595 1600 1605 Glu Glu Leu Asp Leu Ser His Asn Gln Ile Gly Asp Ala Gly Val 1610 1615 1620 Gln His Leu Ala Thr Ile Leu Pro Gly Leu Pro Glu Leu Arg Lys 1625 1630 1635 Ile Asp Leu Ser Gly Asn Ser Ile Ser Ser Ala Gly Gly Val Gln 1640 1645 1650 Leu Ala Glu Ser Leu Val Leu Cys Arg Arg Leu Glu Glu Leu Met 1655 1660 1665 Leu Gly Cys Asn Ala Leu Gly Asp Pro Thr Ala Leu Gly Leu Ala 1670 1675 1680 Gln Glu Leu Pro Gln His Leu Arg Val Leu His Leu Pro Phe Ser 1685 1690 1695 His Leu Gly Pro Gly Gly Ala Leu Ser Leu Ala Gln Ala Leu Asp 1700 1705 1710 Gly Ser Pro His Leu Glu Glu Ile Ser Leu Ala Glu Asn Asn Leu 1715 1720 1725 Ala Gly Gly Val Leu Arg Phe Cys Met Glu Leu Pro Leu Leu Arg 1730 1735 1740 Gln Ile Asp Leu Val Ser Cys Lys Ile Asp Asn Gln Thr Ala Lys 1745 1750 1755 Leu Leu Thr Ser Ser Phe Thr Ser Cys Pro Ala Leu Glu Val Ile 1760 1765 1770 Leu Leu Ser Trp Asn Leu Leu Gly Asp Glu Ala Ala Ala Glu Leu 1775 1780 1785 Ala Gln Val Leu Pro Gln Met Gly Arg Leu Lys Arg Val Asp Leu 1790 1795 1800 Glu Lys Asn Gln Ile Thr Ala Leu Gly Ala Trp Leu Leu Ala Glu 1805 1810 1815 Gly Leu Ala Gln Gly Ser Ser Ile Gln Val Ile Arg Leu Trp Asn 1820 1825 1830 Asn Pro Ile Pro Cys Asp Met Ala Gln His Leu Lys Ser Gln Glu 1835 1840 1845 Pro Arg Leu Asp Phe Ala Phe Phe Asp Asn Gln Pro Gln Ala Pro 1850 1855 1860 Trp Gly Thr 1865 <210> 418 <211> 313 <212> PRT <213> Mus musculus <400> 418 Met Trp Glu Leu Glu Lys Asp Val Tyr Val Val Glu Val Asp Trp Thr 1 5 10 15 Pro Asp Ala Pro Gly Glu Thr Val Asn Leu Thr Cys Asp Thr Pro Glu 20 25 30 Glu Asp Asp Ile Thr Trp Thr Ser Asp Gln Arg His Gly Val Ile Gly 35 40 45 Ser Gly Lys Thr Leu Thr Ile Thr Val Lys Glu Phe Leu Asp Ala Gly 50 55 60 Gln Tyr Thr Cys His Lys Gly Gly Glu Thr Leu Ser His Ser His Leu 65 70 75 80 Leu Leu His Lys Lys Glu Asn Gly Ile Trp Ser Thr Glu Ile Leu Lys 85 90 95 Asn Phe Lys Asn Lys Thr Phe Leu Lys Cys Glu Ala Pro Asn Tyr Ser 100 105 110 Gly Arg Phe Thr Cys Ser Trp Leu Val Gln Arg Asn Met Asp Leu Lys 115 120 125 Phe Asn Ile Lys Ser Ser Ser Ser Ser Pro Asp Ser Arg Ala Val Thr 130 135 140 Cys Gly Met Ala Ser Leu Ser Ala Glu Lys Val Thr Leu Asp Gln Arg 145 150 155 160 Asp Tyr Glu Lys Tyr Ser Val Ser Cys Gln Glu Asp Val Thr Cys Pro 165 170 175 Thr Ala Glu Glu Thr Leu Pro Ile Glu Leu Ala Leu Glu Ala Arg Gln 180 185 190 Gln Asn Lys Tyr Glu Asn Tyr Ser Thr Ser Phe Phe Ile Arg Asp Ile 195 200 205 Ile Lys Pro Asp Pro Pro Lys Asn Leu Gln Met Lys Pro Leu Lys Asn 210 215 220 Ser Gln Val Glu Val Ser Trp Glu Tyr Pro Asp Ser Trp Ser Thr Pro 225 230 235 240 His Ser Tyr Phe Ser Leu Lys Phe Phe Val Arg Ile Gln Arg Lys Lys 245 250 255 Glu Lys Met Lys Glu Thr Glu Glu Gly Cys Asn Gln Lys Gly Ala Phe 260 265 270 Leu Val Glu Lys Thr Ser Thr Glu Val Gln Cys Lys Gly Gly Asn Val 275 280 285 Cys Val Gln Ala Gln Asp Arg Tyr Tyr Asn Ser Ser Cys Ser Lys Trp 290 295 300 Ala Cys Val Pro Cys Arg Val Arg Ser 305 310 <210> 419 <211> 306 <212> PRT <213> Homo sapiens <400> 419 Ile Trp Glu Leu Lys Lys Asp Val Tyr Val Val Glu Leu Asp Trp Tyr 1 5 10 15 Pro Asp Ala Pro Gly Glu Met Val Val Leu Thr Cys Asp Thr Pro Glu 20 25 30 Glu Asp Gly Ile Thr Trp Thr Leu Asp Gln Ser Ser Glu Val Leu Gly 35 40 45 Ser Gly Lys Thr Leu Thr Ile Gln Val Lys Glu Phe Gly Asp Ala Gly 50 55 60 Gln Tyr Thr Cys His Lys Gly Gly Glu Val Leu Ser His Ser Leu Leu 65 70 75 80 Leu Leu His Lys Lys Glu Asp Gly Ile Trp Ser Thr Asp Ile Leu Lys 85 90 95 Asp Gln Lys Glu Pro Lys Asn Lys Thr Phe Leu Arg Cys Glu Ala Lys 100 105 110 Asn Tyr Ser Gly Arg Phe Thr Cys Trp Trp Leu Thr Thr Ile Ser Thr 115 120 125 Asp Leu Thr Phe Ser Val Lys Ser Ser Arg Gly Ser Ser Asp Pro Gln 130 135 140 Gly Val Thr Cys Gly Ala Ala Thr Leu Ser Ala Glu Arg Val Arg Gly 145 150 155 160 Asp Asn Lys Glu Tyr Glu Tyr Ser Val Glu Cys Gln Glu Asp Ser Ala 165 170 175 Cys Pro Ala Ala Glu Glu Ser Leu Pro Ile Glu Val Met Val Asp Ala 180 185 190 Val His Lys Leu Lys Tyr Glu Asn Tyr Thr Ser Ser Phe Phe Ile Arg 195 200 205 Asp Ile Ile Lys Pro Asp Pro Pro Lys Asn Leu Gln Leu Lys Pro Leu 210 215 220 Lys Asn Ser Arg Gln Val Glu Val Ser Trp Glu Tyr Pro Asp Thr Trp 225 230 235 240 Ser Thr Pro His Ser Tyr Phe Ser Leu Thr Phe Cys Val Gln Val Gln 245 250 255 Gly Lys Ser Lys Arg Glu Lys Lys Asp Arg Val Phe Thr Asp Lys Thr 260 265 270 Ser Ala Thr Val Ile Cys Arg Lys Asn Ala Ser Ile Ser Val Arg Ala 275 280 285 Gln Asp Arg Tyr Tyr Ser Ser Ser Trp Ser Glu Trp Ala Ser Val Pro 290 295 300 Cys Ser 305 <210> 420 <211> 883 <212> PRT <213> Artificial Sequence <220> <223> Alglucosidase alfa <400> 420 Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro 1 5 10 15 Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu 20 25 30 Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu 35 40 45 Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr 50 55 60 Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr 65 70 75 80 Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu 85 90 95 Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe 100 105 110 Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr 115 120 125 Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe 130 135 140 Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg 145 150 155 160 Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe 165 170 175 Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala 180 185 190 Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr 195 200 205 Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly 210 215 220 Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly 225 230 235 240 Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser 245 250 255 Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile 260 265 270 Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val 275 280 285 Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu 290 295 300 Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu 305 310 315 320 Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu 325 330 335 Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe 340 345 350 Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg 355 360 365 Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly 370 375 380 Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr 385 390 395 400 Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr 405 410 415 Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp 420 425 430 Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile 435 440 445 Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys 450 455 460 Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly 465 470 475 480 Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu 485 490 495 Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile 500 505 510 Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val 515 520 525 Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp 530 535 540 Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro 545 550 555 560 Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp 565 570 575 Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp 580 585 590 Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu 595 600 605 Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln 610 615 620 Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu 625 630 635 640 Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg 645 650 655 Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp 660 665 670 His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln 675 680 685 Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr 690 695 700 Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro 705 710 715 720 Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val 725 730 735 Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly 740 745 750 Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg 755 760 765 Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala 770 775 780 Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu 785 790 795 800 Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile 805 810 815 Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu 820 825 830 Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu 835 840 845 Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys 850 855 860 Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val 865 870 875 880 Ser Trp Cys <210> 421 <211> 1438 <212> PRT <213> Artificial Sequence <220> <223> B-domain deleted human Factor VIII (BDD FVIII) <400> 421 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His 740 745 750 Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile 755 760 765 Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp 770 775 780 Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 785 790 795 800 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly 805 810 815 Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser 820 825 830 Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser 835 840 845 Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 850 855 860 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr 865 870 875 880 Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile 885 890 895 Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe 900 905 910 Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His 915 920 925 Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe 930 935 940 Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro 945 950 955 960 Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln 965 970 975 Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr 980 985 990 Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro 995 1000 1005 Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg 1010 1015 1020 Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu 1025 1030 1035 Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met 1040 1045 1050 Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val 1055 1060 1065 Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn 1070 1075 1080 Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys 1085 1090 1095 Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His 1100 1105 1110 Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln 1115 1120 1125 Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile 1130 1135 1140 Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg 1145 1150 1155 Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro 1160 1165 1170 Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His 1175 1180 1185 Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr 1190 1195 1200 Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 1205 1210 1215 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe 1220 1225 1230 Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro 1235 1240 1245 Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser 1250 1255 1260 Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn 1265 1270 1275 Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp 1280 1285 1290 Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr 1295 1300 1305 Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn 1310 1315 1320 Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val 1325 1330 1335 Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly 1340 1345 1350 Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile 1355 1360 1365 Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn 1370 1375 1380 Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro 1385 1390 1395 Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg 1400 1405 1410 Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu 1415 1420 1425 Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1430 1435 <210> 422 <211> 2791 <212> PRT <213> Artificial Sequence <220> <223> Von Willebrand Factor, recombinant <400> 422 Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr Ala Arg Cys Ser Leu Phe 1 5 10 15 Gly Ser Asp Phe Val Asn Thr Phe Asp Gly Ser Met Tyr Ser Phe Ala 20 25 30 Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly Cys Gln Lys Arg Ser Phe 35 40 45 Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys Arg Val Ser Leu Ser Val 50 55 60 Tyr Leu Gly Glu Phe Phe Asp Ile His Leu Phe Val Asn Gly Thr Val 65 70 75 80 Thr Gln Gly Asp Gln Arg Val Ser Met Pro Tyr Ala Ser Lys Gly Leu 85 90 95 Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys Leu Ser Gly Glu Ala Tyr 100 105 110 Gly Phe Val Ala Arg Ile Asp Gly Ser Gly Asn Phe Gln Val Leu Leu 115 120 125 Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly Leu Cys Gly Asn Phe Asn 130 135 140 Ile Phe Ala Glu Asp Asp Phe Met Thr Gln Glu Gly Thr Leu Thr Ser 145 150 155 160 Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala Leu Ser Ser Gly Glu Gln 165 170 175 Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser Ser Cys Asn Ile Ser Ser 180 185 190 Gly Glu Met Gln Lys Gly Leu Trp Glu Gln Cys Gln Leu Leu Lys Ser 195 200 205 Thr Ser Val Phe Ala Arg Cys His Pro Leu Val Asp Pro Glu Pro Phe 210 215 220 Val Ala Leu Cys Glu Lys Thr Leu Cys Glu Cys Ala Gly Gly Leu Glu 225 230 235 240 Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala Arg Thr Cys Ala Gln Glu 245 250 255 Gly Met Val Leu Tyr Gly Trp Thr Asp His Ser Ala Cys Ser Pro Val 260 265 270 Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys Val Ser Pro Cys Ala Arg 275 280 285 Thr Cys Gln Ser Leu His Ile Asn Glu Met Cys Gln Glu Arg Cys Val 290 295 300 Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu Leu Asp Glu Gly Leu Cys 305 310 315 320 Val Glu Ser Thr Glu Cys Pro Cys Val His Ser Gly Lys Arg Tyr Pro 325 330 335 Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn Thr Cys Ile Cys Arg Asn 340 345 350 Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys Pro Gly Glu Cys Leu Val 355 360 365 Thr Gly Gln Ser His Phe Lys Ser Phe Asp Asn Arg Tyr Phe Thr Phe 370 375 380 Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg Asp Cys Gln Asp His Ser 385 390 395 400 Phe Ser Ile Val Ile Glu Thr Val Gln Cys Ala Asp Asp Arg Asp Ala 405 410 415 Val Cys Thr Arg Ser Val Thr Val Arg Leu Pro Gly Leu His Asn Ser 420 425 430 Leu Val Lys Leu Lys His Gly Ala Gly Val Ala Met Asp Gly Gln Asp 435 440 445 Val Gln Leu Pro Leu Leu Lys Gly Asp Leu Arg Ile Gln His Thr Val 450 455 460 Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu Asp Leu Gln Met Asp Trp 465 470 475 480 Asp Gly Arg Gly Arg Leu Leu Val Lys Leu Ser Pro Val Tyr Ala Gly 485 490 495 Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn Gly Asn Gln Gly Asp Asp 500 505 510 Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro Arg Val Glu Asp Phe Gly 515 520 525 Asn Ala Trp Lys Leu His Gly Asp Cys Gln Asp Leu Gln Lys Gln His 530 535 540 Ser Asp Pro Cys Ala Leu Asn Pro Arg Met Thr Arg Phe Ser Glu Glu 545 550 555 560 Ala Cys Ala Val Leu Thr Ser Pro Thr Phe Glu Ala Cys His Arg Ala 565 570 575 Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys Arg Tyr Asp Val Cys Ser 580 585 590 Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly Ala Leu Ala Ser Tyr Ala 595 600 605 Ala Ala Cys Ala Gly Arg Gly Val Arg Val Ala Trp Arg Glu Pro Gly 610 615 620 Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln Val Tyr Leu Gln Cys Gly 625 630 635 640 Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu Ser Tyr Pro Asp Glu Glu 645 650 655 Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe Cys Pro Pro Gly Leu Tyr 660 665 670 Met Asp Glu Arg Gly Asp Cys Val Pro Lys Ala Gln Cys Pro Cys Tyr 675 680 685 Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp Ile Phe Ser Asp His His 690 695 700 Thr Met Cys Tyr Cys Glu Asp Gly Phe Met His Cys Thr Met Ser Gly 705 710 715 720 Val Pro Gly Ser Leu Leu Pro Asp Ala Val Leu Ser Ser Pro Leu Ser 725 730 735 His Arg Ser Lys Arg Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu 740 745 750 Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys 755 760 765 Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser 770 775 780 Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys Val 785 790 795 800 Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro 805 810 815 Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg 820 825 830 Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile 835 840 845 Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro 850 855 860 Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro 865 870 875 880 Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser 885 890 895 Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile 900 905 910 Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu 915 920 925 Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu 930 935 940 Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser Val 945 950 955 960 Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn 965 970 975 Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val 980 985 990 Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln 995 1000 1005 Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr 1010 1015 1020 Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys 1025 1030 1035 Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val 1040 1045 1050 Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser 1055 1060 1065 Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala 1070 1075 1080 Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val Thr Trp 1085 1090 1095 Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu 1100 1105 1110 Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn Ser Cys Ala 1115 1120 1125 Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys 1130 1135 1140 Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly 1145 1150 1155 Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp 1160 1165 1170 Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys 1175 1180 1185 Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys 1190 1195 1200 His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro 1205 1210 1215 Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr 1220 1225 1230 Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Asp Phe 1235 1240 1245 Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu Asp Gly Ser 1250 1255 1260 Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu Lys Ala Phe Val 1265 1270 1275 Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys Trp Val Arg 1280 1285 1290 Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala Tyr Ile Gly 1295 1300 1305 Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg Ile Ala Ser 1310 1315 1320 Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr Ser Glu Val 1325 1330 1335 Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile Asp Arg Pro 1340 1345 1350 Glu Ala Ser Arg Ile Thr Leu Leu Leu Met Ala Ser Gln Glu Pro 1355 1360 1365 Gln Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gln Gly Leu Lys 1370 1375 1380 Lys Lys Lys Val Ile Val Ile Pro Val Gly Ile Gly Pro His Ala 1385 1390 1395 Asn Leu Lys Gln Ile Arg Leu Ile Glu Lys Gln Ala Pro Glu Asn 1400 1405 1410 Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu Gln Gln Arg 1415 1420 1425 Asp Glu Ile Val Ser Tyr Leu Cys Asp Leu Ala Pro Glu Ala Pro 1430 1435 1440 Pro Pro Thr Leu Pro Pro Asp Met Ala Gln Val Thr Val Gly Pro 1445 1450 1455 Gly Leu Leu Gly Val Ser Thr Leu Gly Pro Lys Arg Asn Ser Met 1460 1465 1470 Val Leu Asp Val Ala Phe Val Leu Glu Gly Ser Asp Lys Ile Gly 1475 1480 1485 Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe Met Glu Glu Val Ile 1490 1495 1500 Gln Arg Met Asp Val Gly Gln Asp Ser Ile His Val Thr Val Leu 1505 1510 1515 Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe Ser Glu Ala 1520 1525 1530 Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu Ile Arg Tyr 1535 1540 1545 Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu Arg Tyr Leu 1550 1555 1560 Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg Glu Gln Ala 1565 1570 1575 Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala Ser Asp Glu 1580 1585 1590 Ile Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro Ile Gly Val 1595 1600 1605 Gly Pro Asn Ala Asn Val Gln Glu Leu Glu Arg Ile Gly Trp Pro 1610 1615 1620 Asn Ala Pro Ile Leu Ile Gln Asp Phe Glu Thr Leu Pro Arg Glu 1625 1630 1635 Ala Pro Asp Leu Val Leu Gln Arg Cys Cys Ser Gly Glu Gly Leu 1640 1645 1650 Gln Ile Pro Thr Leu Ser Pro Ala Pro Asp Cys Ser Gln Pro Leu 1655 1660 1665 Asp Val Ile Leu Leu Leu Asp Gly Ser Ser Ser Phe Pro Ala Ser 1670 1675 1680 Tyr Phe Asp Glu Met Lys Ser Phe Ala Lys Ala Phe Ile Ser Lys 1685 1690 1695 Ala Asn Ile Gly Pro Arg Leu Thr Gln Val Ser Val Leu Gln Tyr 1700 1705 1710 Gly Ser Ile Thr Thr Ile Asp Val Pro Trp Asn Val Val Pro Glu 1715 1720 1725 Lys Ala His Leu Leu Ser Leu Val Asp Val Met Gln Arg Glu Gly 1730 1735 1740 Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe Ala Val Arg Tyr 1745 1750 1755 Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala Ser Lys Ala 1760 1765 1770 Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser Val Asp Ala 1775 1780 1785 Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val Phe Pro Ile 1790 1795 1800 Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg Ile Leu Ala 1805 1810 1815 Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln Arg Ile Glu 1820 1825 1830 Asp Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe Leu His Lys 1835 1840 1845 Leu Cys Ser Gly Phe Val Arg Ile Cys Met Asp Glu Asp Gly Asn 1850 1855 1860 Glu Lys Arg Pro Gly Asp Val Trp Thr Leu Pro Asp Gln Cys His 1865 1870 1875 Thr Val Thr Cys Gln Pro Asp Gly Gln Thr Leu Leu Lys Ser His 1880 1885 1890 Arg Val Asn Cys Asp Arg Gly Leu Arg Pro Ser Cys Pro Asn Ser 1895 1900 1905 Gln Ser Pro Val Lys Val Glu Glu Thr Cys Gly Cys Arg Trp Thr 1910 1915 1920 Cys Pro Cys Val Cys Thr Gly Ser Ser Thr Arg His Ile Val Thr 1925 1930 1935 Phe Asp Gly Gln Asn Phe Lys Leu Thr Gly Ser Cys Ser Tyr Val 1940 1945 1950 Leu Phe Gln Asn Lys Glu Gln Asp Leu Glu Val Ile Leu His Asn 1955 1960 1965 Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly Cys Met Lys Ser Ile 1970 1975 1980 Glu Val Lys His Ser Ala Leu Ser Val Glu Leu His Ser Asp Met 1985 1990 1995 Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro Tyr Val Gly 2000 2005 2010 Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met His Glu Val 2015 2020 2025 Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr Pro Gln Asn 2030 2035 2040 Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe Ala Ser Lys 2045 2050 2055 Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly Ala Asn Asp 2060 2065 2070 Phe Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp Lys Thr Leu 2075 2080 2085 Val Gln Glu Trp Thr Val Gln Arg Pro Gly Gln Thr Cys Gln Pro 2090 2095 2100 Ile Leu Glu Glu Gln Cys Leu Val Pro Asp Ser Ser His Cys Gln 2105 2110 2115 Val Leu Leu Leu Pro Leu Phe Ala Glu Cys His Lys Val Leu Ala 2120 2125 2130 Pro Ala Thr Phe Tyr Ala Ile Cys Gln Gln Asp Ser Cys His Gln 2135 2140 2145 Glu Gln Val Cys Glu Val Ile Ala Ser Tyr Ala His Leu Cys Arg 2150 2155 2160 Thr Asn Gly Val Cys Val Asp Trp Arg Thr Pro Asp Phe Cys Ala 2165 2170 2175 Met Ser Cys Pro Pro Ser Leu Val Tyr Asn His Cys Glu His Gly 2180 2185 2190 Cys Pro Arg His Cys Asp Gly Asn Val Ser Ser Cys Gly Asp His 2195 2200 2205 Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp Lys Val Met Leu Glu 2210 2215 2220 Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln Cys Ile Gly Glu 2225 2230 2235 Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val Pro Asp His 2240 2245 2250 Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg Lys Val Asn 2255 2260 2265 Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro Thr Cys Gly 2270 2275 2280 Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp Gln Cys Cys 2285 2290 2295 Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys Asp Leu Pro 2300 2305 2310 Pro Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr Leu Thr Asn 2315 2320 2325 Pro Gly Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys Arg Lys Glu 2330 2335 2340 Glu Cys Lys Arg Val Ser Pro Pro Ser Cys Pro Pro His Arg Leu 2345 2350 2355 Pro Thr Leu Arg Lys Thr Gln Cys Cys Asp Glu Tyr Glu Cys Ala 2360 2365 2370 Cys Asn Cys Val Asn Ser Thr Val Ser Cys Pro Leu Gly Tyr Leu 2375 2380 2385 Ala Ser Thr Ala Thr Asn Asp Cys Gly Cys Thr Thr Thr Thr Cys 2390 2395 2400 Leu Pro Asp Lys Val Cys Val His Arg Ser Thr Ile Tyr Pro Val 2405 2410 2415 Gly Gln Phe Trp Glu Glu Gly Cys Asp Val Cys Thr Cys Thr Asp 2420 2425 2430 Met Glu Asp Ala Val Met Gly Leu Arg Val Ala Gln Cys Ser Gln 2435 2440 2445 Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly Phe Thr Tyr Val Leu 2450 2455 2460 His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro Ser Ala Cys Glu 2465 2470 2475 Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser Ser Trp Lys 2480 2485 2490 Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro Cys Leu Ile 2495 2500 2505 Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile Gln Gln Arg 2510 2515 2520 Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys Pro Ser Gly 2525 2530 2535 Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro Ser Cys Arg 2540 2545 2550 Cys Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr Val Ile Gly 2555 2560 2565 Pro Gly Lys Thr Val Met Ile Asp Val Cys Thr Thr Cys Arg Cys 2570 2575 2580 Met Val Gln Val Gly Val Ile Ser Gly Phe Lys Leu Glu Cys Arg 2585 2590 2595 Lys Thr Thr Cys Asn Pro Cys Pro Leu Gly Tyr Lys Glu Glu Asn 2600 2605 2610 Asn Thr Gly Glu Cys Cys Gly Arg Cys Leu Pro Thr Ala Cys Thr 2615 2620 2625 Ile Gln Leu Arg Gly Gly Gln Ile Met Thr Leu Lys Arg Asp Glu 2630 2635 2640 Thr Leu Gln Asp Gly Cys Asp Thr His Phe Cys Lys Val Asn Glu 2645 2650 2655 Arg Gly Glu Tyr Phe Trp Glu Lys Arg Val Thr Gly Cys Pro Pro 2660 2665 2670 Phe Asp Glu His Lys Cys Leu Ala Glu Gly Gly Lys Ile Met Lys 2675 2680 2685 Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu Glu Pro Glu Cys Asn 2690 2695 2700 Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys Lys 2705 2710 2715 Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala 2720 2725 2730 Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln 2735 2740 2745 Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala 2750 2755 2760 Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn 2765 2770 2775 Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys 2780 2785 2790

Claims

하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 상기 하나 이상의 벡터는:
a) 상기 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며,
i) 상기 인핸서 단백질은 핵세포질 수송(NCT: nucleocytoplasmic transport)의 억제제이고/이거나
ii) 상기 인핸서 단백질은 피코르나바이러스 리더(L: leader) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 헤르페스 바이러스(HSV: herpes simplex virus) ICP27 단백질 및 랍도바이러스 매트릭스(M: matrix) 단백질로 이루어진 군으로부터 선택되며,
상기 제1 폴리뉴클레오타이드 및 상기 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되는, 방법.
제1항에 있어서, 상기 인핸서 단백질은 핵세포질 수송(NCT)의 억제제인, 방법.
제2항에 있어서, 상기 NCT 억제제는 바이러스 단백질인, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 NCT 억제제는 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되는, 방법.
제4항에 있어서, 상기 NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 라이노바이러스 3C 프로테아제 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 코로나바이러스 ORF6 단백질 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 에볼라바이러스 VP24 단백질 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 헤르페스 바이러스(HSV) ICP27 단백질 또는 이의 기능적 변이체인, 방법.
제4항에 있어서, 상기 NCT 억제제는 랍도바이러스 매트릭스(M) 단백질 또는 이의 기능적 변이체인, 방법.
제5항에 있어서, 상기 L 단백질은 타일러 바이러스의 L 단백질 또는 이의 기능적 변이체인, 방법.
제5항에 있어서, 상기 L 단백질은 서열번호 1과 적어도 90% 동일성을 공유하는, 방법.
제5항에 있어서, 상기 L 단백질은 뇌심근염 바이러스(EMCV: encephalomyocarditis virus)의 L 단백질 또는 이의 기능적 변이체인, 방법.
제5항에 있어서, 상기 L 단백질은 서열번호 2와 적어도 90% 동일성을 공유하는, 방법.
제5항에 있어서, 상기 L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 이의 기능적 변이체로 이루어진 군으로부터 선택되는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 시스템은 발현 카세트를 포함하는 단일 벡터를 포함하며, 상기 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는, 방법.
제18항에 있어서, 상기 발현 카세트는 상기 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 상기 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 방법.
제18항에 있어서, 상기 발현 카세트는 상기 제1 폴리뉴클레오타이드와 상기 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 방법.
제20항에 있어서, 상기 발현 카세트는 리보솜 스키핑 부위를 인코딩하는 폴리뉴클레오타이드에 의해 연결된 상기 제1 폴리뉴클레오타이드 및 상기 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하며, 상기 코딩 폴리뉴클레오타이드는 상기 공유 프로모터에 작동가능하게 연결되는, 방법.
제20항에 있어서, 상기 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 상기 인핸서 단백질을 인코딩하는 상기 코딩 폴리뉴클레오타이드 및 상기 표적 단백질은 리보솜 스키핑 부위에 의해 연결되고, 상기 코딩 폴리뉴클레오타이드는 상기 공유 프로모터에 작동가능하게 연결되는, 방법.
제18항 내지 제22항 중 어느 한 항에 있어서, 상기 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 상기 표적 단백질 및 상기 인핸서 단백질 둘 다를 인코딩하는 단일 전령 RNA의 전사를 위해 구성되고; 여기서, 상기 전령 RNA의 번역은 상기 표적 단백질 및 상기 L 단백질을 별개의 폴리펩타이드로서 발현시키는 결과를 가져오는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 시스템은 하나의 벡터를 포함하는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 시스템은:
a) 제1 프로모터에 작동가능하게 연결된 상기 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및
b) 제2 프로모터에 작동가능하게 연결된 상기 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함하는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 시스템은 2개의 벡터를 포함하는, 방법.
제1항 내지 제26항 중 어느 한 항에 있어서, 상기 제1 폴리뉴클레오타이드 또는 상기 제2 폴리뉴클레오타이드, 또는 둘 다는 내부 리보솜 진입 부위(IRES: internal ribosome entry site)에 작동가능하게 연결되는, 방법.
제1항 내지 제27항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 상기 제1 폴리뉴클레오타이드 또는 상기 제2 폴리뉴클레오타이드 중 하나 또는 둘 다의 전사를 위해 구성된 T7 프로모터를 포함하는, 방법.
제1항 내지 제28항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 인코딩하는 폴리뉴클레오타이드 서열을 포함하는, 방법.
벡터를 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 상기 벡터는:
a) 상기 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 인핸서 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며,
i) 상기 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나
ii) 상기 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 헤르페스 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 매트릭스(M) 단백질로 이루어진 군으로부터 선택되고,
상기 제1 폴리뉴클레오타이드 및 상기 제2 폴리뉴클레오타이드는 적어도 하나의 프로모터에 작동가능하게 연결되는, 방법.
제30항에 있어서, 상기 발현 카세트는 상기 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 상기 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는, 방법.
제30항에 있어서, 상기 발현 카세트는 상기 제1 폴리뉴클레오타이드와 상기 제2 폴리뉴클레오타이드 둘 다에 작동가능하게 연결된 공유 프로모터를 포함하는, 방법.
제1항 내지 제32항 중 어느 한 항에 있어서, 상기 표적 단백질은 치료 단백질인, 방법.
제1항 내지 제33항 중 어느 한 항에 있어서, 상기 표적 단백질은 면역원성 단백질인, 방법.
제1항 내지 제34항 중 어느 한 항에 있어서, 상기 표적 단백질은 항체, 나노바디, 수용체, 이중특이적 T 세포 관여제(BiTE: bi-specific T-cell engager), 성장 인자, 호르몬, 효소, 면역조절 단백질, 항원, 구조 단백질, 혈액 단백질, 항미생물 폴리펩타이드, 항바이러스 폴리펩타이드, 종양 억제인자, 전사 인자, 또는 번역 인자인, 방법.
제35항에 있어서, 상기 표적 단백질은 항체인, 방법.
제35항에 있어서, 상기 표적 단백질은 혈액 단백질인, 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 대상체에서 면역 반응을 이끌어내는 방법.
제1항 내지 제38항 중 어느 한 항에 있어서, 상기 방법은 상기 대상체의 질병을 치료하고, 상기 질병은 상기 표적 단백질에 의해 유발되거나, 관련되거나, 연관되는, 방법.
제39항에 있어서, 상기 방법은 상기 대상체의 질병을 치료하고, 상기 대상체에서의 상기 표적 단백질의 발현 수준은 대조군 대상체에서의 상기 표적 단백질의 발현 수준보다 낮고, 상기 대조군 대상체는 상기 질병을 갖지 않는, 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 상기 표적 단백질은 압식시맙, 알렘투주맙, 알리로쿠맙, 아미반타맙, 아테졸리주맙, 아벨루맙, 바실릭시맙, 벨리무맙, 벤랄리주맙, 베바시주맙, 베즐로톡수맙, 블리나투모맙, 브렌툭시맙 베도틴, 브로달루맙, 브롤루시주맙, 부로수맙, 카나키누맙, 카플라시주맙, 카프로맙, 카투막소맙, 세미플리맙, 세르톨리주맙 페골, 세툭시맙, 크리잔리주맙, 다클리주맙, 다라투무맙, 데노수맙, 디누툭시맙, 두필루맙, 더발루맙, 에쿨리주맙, 엘로투주맙, 에마팔루맙, 에미시주맙, 엔포르투맙 베도틴, 엡티네주맙, 에레누맙, 에르투막소맙, 에타라시주맙, 에볼로쿠맙, 프레마네주맙, 갈카네주맙, 젬투주맙 오조가미신, 골리무맙, 구셀쿠맙, 이발리주맙, 이브리투모맙 티욱세탄, 이다루시주맙, 임시로맙, 인플릭시맙, 이노투주맙 오조가미신, 이필리무맙, 이사툭시맙, 이톨리주맙, 익세키주맙, 라나델루맙, 로키베트맙, 메폴리주맙, 모가물리주맙, 목세투모맙 파수도톡스, 나탈리주맙, 네시투무맙, 니모투주맙, 니볼루맙, 오빌톡사시맙, 오비누투주맙, 오크렐리주맙, 오파투무맙, 올라라투맙, 오말리주맙, 팔리비주맙, 파니투무맙, 펨브롤리주맙, 페르투주맙, 폴라투주맙 베도틴, 라코투모맙, 라무시루맙, 라니비주맙, 락시바쿠맙, 라불리주맙, 레슬리주맙, 리산키주맙, 리툭시맙, Rmab, 로모소주맙, 로벨리주맙, 루플리주맙, 사시투주맙 고비테칸, 사릴루맙, 세쿠키누맙, 실툭시맙, 탈케타맙, 테클리스타맙, 테프로투무맙, 틸드라키주맙, 토실리주맙, 토시투모맙, 트라스투주맙, 트라스투주맙 듀오카마진, 트라스투주맙 엠탄신, 우스테키누맙 및 베돌리주맙, 블리나투모맙, 에미시주맙, 솔리토맙, 애드넥틴, 안티칼린, 아비머, 피노머, 쿠니츠 도메인, 노틴, 아피바디, DARPin, 혈전용해제, 트랜스페린, t-PA, 히루딘, C1 에스테라제 억제제, 항트롬빈, 혈장 칼리크레인 억제제, 플라스민, 프로트롬빈 복합체, 보체 성분, 프리알부민(트랜스티레틴), 알파 1 항트립신, 알파-1-산 당단백질, 알파-1-태아단백질, 알파2-마크로글로불린, 감마 글로불린, 베타-2 마이크로글로불린, 합토글로빈, 세룰로플라스민, 보체 성분 3, 보체 성분 4, C 반응성 단백질(CRP), 지질단백질(킬로미크론, VLDL, LDL, HDL), 트랜스페린, 프로트롬빈, 만노스 결합 렉틴(MBL), 알부민, 글로불린, 피브리노겐, 조절 인자 및 응고 인자, 예를 들어, 인자 I, 인자 II, 인자 III, 인자 IV, 인자 V, 인자 VI, 인자 VII, 인자 IX, 인자 X, 인자 XI, 인자 XII, 인자 XIII, 폰 빌레브란트 인자, 프리칼리크레인, 피츠제럴드 인자, 피브로넥틴, 항트롬빈 III, 헤파린 보조 인자 II, 단백질 C, 단백질 S, 단백질 Z, 단백질 Z-관련 프로테아제 억제제, 플라스미노겐, 알파 2-항플라스민, 조직 플라스미노겐 활성화제, 유로키나제, 플라스미노겐 활성화제 억제제-1, 플라스미노겐 활성화제 억제제-2, 암 응혈원, EPO, IGF-1, G-CSF, GM-GCF, BMP-2, BMP-7, KGF, PDGF-BB, TMP, 아드레노메둘린(AM), 안지오포이에틴(Ang), 자가분비 운동성 인자, 골 형태형성 단백질(BMPs), 섬모 신경영양 인자 패밀리, 섬모 신경 영양 인자(CNTF), 백혈병 억제 인자(LIF), 인터류킨-6(IL-6), 집락 자극 인자, 대식세포 집락 자극 인자(M-CSF), 과립구 집락 자극 인자(G-CSF), 과립구 대식세포 집락 자극 인자(GM-CSF), 표피 성장 인자(EGF), 에프린스 - 에프린 A1, 에프린 A2, 에프린 A3, 에프린 A4, 에프린 A5, 에프린 B1, 에프린 B2, 에프린 B3, 에리스로포이에틴(EPO), 섬유아세포 성장인자(FGF) 1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23의 각각, 소 태아 성장 호르몬(FBS), 리간드의 GDNF 패밀리, 신경교세포주 유래 신경영양인자(GDNF), 뉴투린, 페르세핀, 아르테민, 성장 분화 인자-9(GDF9), 간세포 성장 인자(HGF), 간암 유래 성장 인자(HDGF), 인슐린, 인슐린 유사 성장 인자, 인슐린 유사 성장 인자-1(IGF-1), 인슐린 유사 성장 인자-2(IGF-2), 인터류킨-1(IL-1), IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, 각질세포 성장 인자(KGF), 이동 자극 인자(MSF), 간세포 성장 인자 유사 단백질(HGFLP)로도 알려진 대식세포 자극 단백질(MSP), 미오스타틴(GDF-8), 뉴레귤린 1(NRG1) 뉴레귤린 2(NRG2), 뉴레귤린 3(NRG3), 뉴레귤린 4(NRG4), 뉴로트로핀, 뇌유래 신경영양 인자(BDNF), 신경 성장 인자(NGF), 뉴로트로핀-3(NT-3), 뉴로트로핀-4(NT-4), 태반성장인자(PGF), 혈소판유래 성장 인자(PDGF), 레날라제(RNLS), T-세포 성장 인자(TCGF), 트롬보포이에틴(TPO), 형질전환 성장 인자 알파(TGF-α), 형질전환 성장 인자 베타(TGF-β), 혈관 내피 성장 인자(VEGF), Wnt 신호전달 경로, 글루카곤 유사 펩타이드-1, 인슐린, 인간 성장 호르몬, 난포 자극 호르몬, 칼시토닌, 루트로핀, 글루카곤 유사 펩타이드-2, 렙틴, 부갑상선 호르몬, 융모성 생식선 자극 호르몬, 갑상선 자극 호르몬 및 글루카곤, 알파-글리코시다제, 글루코세레브로시다제, 이두로네이트-2-황산염, 알파-갈락토시다제, 요산염 산화효소, N-아세틸-갈락토시다제, 카르복시펩티다제, 히알루로니다제, DNA 분해효소, 아스파라기나제, 요산분해효소, 아데노신 데아미나제 및 다른 엔테로키나제, 사이클라제, 카스파제, 카텝신, 산화환원효소, 전이효소, 가수분해효소, 분해효소, 이성질화효소 및 연결효소, 아갈시다제 베타, 아갈시다제 알파, 이미글루세라제, 탈리굴세라제 알파, 벨라글루세라제 알파, 알글루세라제, 세벨리파제 알파, 라로니다제, 이두설파제, 엘로설파제 알파, 갈설파제, 알글루코시다제 알파, C3 억제제, 헐러 및 헌터 교정 인자, 이온 채널, 간극 연접, 이온성 수용체, 수송체, 세포 표면 수용체, 도파민 수용체 1(DRD1), 낭포성 섬유증 막횡단 전도 조절자(CFTR), C1 에스테라제 억제제(C1-Inh), IL2 유도성 T 세포 키나제(ITK), 및 NADase로 이루어진 군으로부터 선택되는, 방법.
제1항 내지 제35항 및 제38항 내지 제41항 중 어느 한 항에 있어서, 상기 표적 단백질은 항체인, 방법.
제1항 내지 제35항 및 제38항 내지 제41항 중 어느 한 항에 있어서, 상기 표적 단백질은 아달리무맙인, 방법.
제43항에 있어서, 아달리무맙의 중쇄는 서열번호 132의 아미노산 서열을 갖는, 방법.
제43항에 있어서, 아달리무맙의 경쇄는 서열번호 133의 아미노산 서열을 갖는, 방법.
제43항에 있어서, 아달리무맙의 중쇄는 서열번호 134의 핵산 서열에 의해 인코딩되는, 방법.
제43항에 있어서, 아달리무맙의 경쇄는 서열번호 135의 핵산 서열에 의해 인코딩되는, 방법.
제1항 내지 제47항 중 어느 한 항에 있어서, 벡터를 투여하는 단계를 포함하며, 상기 인핸서 단백질은 상기 대상체에서 상기 표적 단백질의 활성을 증가시키는, 방법.
제1항 내지 제48항 중 어느 한 항에 있어서, 벡터를 투여하는 단계를 포함하며, 상기 인핸서 단백질은 상기 대상체에서 상기 표적 단백질의 발현 수준을 낮추는, 방법.
제1항 내지 제49항 중 어느 한 항에 있어서, 벡터를 투여하는 단계를 포함하며, 상기 인핸서 단백질은 상기 대상체의 주사 부위에서 상기 표적 단백질의 발현의 균일성을 증가시키는, 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 벡터를 투여하는 단계를 포함하며, 상기 인핸서 단백질은 상기 대상체의 세포 또는 상기 대상체에서 활성 표적 단백질의 지속 기간을 증가시키는, 방법.
하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 아달리무맙 단백질을 발현시키는 방법으로서, 상기 하나 이상의 벡터는:
a) 아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 아달리무맙 단백질과 상기 L 단백질은 동시 발현되는, 방법.
제52항에 있어서, 상기 제1 폴리뉴클레오타이드는 서열번호 124의 아달리무맙 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및 서열번호 129의 아달리무맙 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.
제52항 또는 제53항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 세포 또는 상기 대상체에서 상기 아달리무맙 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.
제52항 내지 제54항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 상기 대상체의 세포 또는 상기 대상체에서 상기 아달리무맙 단백질의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.
제52항 내지 제55항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 상기 아달리무맙 단백질이 상기 대상체의 세포 또는 상기 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.
제52항 내지 제56항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 상기 대상체의 조직 또는 상기 대상체에서 상기 표적 단백질의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.
제52항 내지 제57항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 상기 표적 단백질의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.
제52항 내지 제58항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 아달리무맙 단백질의 동시 발현은 아달리무맙의 EC₅₀을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.
제52항 내지 제59항 중 어느 한 항에 있어서, 상기 벡터 시스템은 서열번호 191 내지 216의 세트의 폴리뉴클레오타이드 서열 또는 서열번호 217 내지 242의 세트의 서열을 포함하는, 방법.
제52항 내지 제60항 중 어느 한 항에 있어서, 상기 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.
제52항 내지 제61항 중 어느 한 항에 있어서, 상기 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.
제62항에 있어서, 상기 LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제62항에 있어서, 상기 LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제62항에 있어서, 상기 LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.
제52항 내지 제65항 중 어느 한 항에 있어서, 상기 시스템은 근육내 또는 피하로 전달되는, 방법.
하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 글루코실세라미다제(GBA) 단백질을 발현시키는 방법으로서, 상기 하나 이상의 벡터는:
a) 글루코실세라미다제(GBA) 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 글루코실세라미다제(GBA) 단백질을 인코딩하는 상기 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 상기 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 GBA 단백질과 상기 L 단백질은 동시 발현되는, 방법.
제67항에 있어서, 상기 제1 폴리뉴클레오타이드는 서열번호 406의 GBA 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.
제67항 또는 제68항에 있어서, 상기 리더 단백질과 상기 GBA 단백질의 동시 발현은 상기 대상체의 세포 또는 상기 대상체에서 상기 GBA 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.
제67항 내지 제69항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 GBA 단백질의 동시 발현은 상기 대상체의 세포 또는 상기 대상체에서 GBA의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.
제67항 내지 제70항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 GBA 단백질의 동시 발현은 GBA가 대상체의 세포 또는 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.
제67항 내지 제71항 중 어느 한 항에 있어서, 상기 인핸서 단백질의 동시 발현은 상기 대상체의 조직 또는 상기 대상체에서 GBA의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.
제67항 내지 제72항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 GBA 단백질의 동시 발현은 GBA의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.
제67항 내지 제73항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 GBA 단백질의 동시 발현은 최대 반응의 50%(EC₅₀)를 생성하는 데 효과적인 GBA의 농도를 감소시키는, 방법.
제67항 내지 제74항 중 어느 한 항에 있어서, 상기 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.
제67항 내지 제75항 중 어느 한 항에 있어서, 상기 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.
제76항에 있어서, 상기 LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제76항에 있어서, 상기 LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제76항에 있어서, 상기 LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.
제67항 내지 제79항 중 어느 한 항에 있어서, 상기 시스템은 근육내 또는 피하로 전달되는, 방법.
하나 이상의 벡터를 포함하는 벡터 시스템을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 표적 단백질을 발현시키는 방법으로서, 상기 하나 이상의 벡터는:
a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 표적 단백질을 인코딩하는 상기 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 상기 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 표적 단백질과 상기 L 단백질은 동시 발현되는, 방법.
제81항에 있어서, 상기 제1 폴리뉴클레오타이드는 표 8의 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및/또는 표 8의 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.
제81항에 있어서, 상기 제1 폴리뉴클레오타이드는 표 9의 단백질 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 방법.
제81항 내지 제83항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 세포 또는 대상체에서 상기 표적 단백질의 발현 수준을 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90% 만큼 감소시키는, 방법.
제81항 내지 제84항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 상기 대상체의 세포 또는 상기 대상체에서 상기 표적 단백질의 활성을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 증가시키는, 방법.
제81항 내지 제85항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 상기 표적 단백질이 상기 대상체의 세포 또는 상기 대상체에서 발견되는 기간을 약 2배, 약 3배, 약 4배, 약 5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배, 약 13배, 약 14배, 약 15배, 약 16배 약 17배, 약 18배, 약 19배, 또는 약 20배 만큼 증가시키는, 방법.
제81항 내지 제85항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 상기 대상체의 조직 또는 상기 대상체에서 상기 표적 단백질의 변동 계수(CV%)를 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.1배, 약 2.2배, 약 2.3배, 약 2.4배, 약 2.5배, 약 2.7배, 약 2.8배, 약 2.9배, 또는 약 3배 만큼 증가시키는, 방법.
제81항 내지 제87항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 상기 표적 단백질의 분해를 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.
제81항 내지 제88항 중 어느 한 항에 있어서, 상기 리더 단백질과 상기 표적 단백질의 동시 발현은 표적의 EC₅₀을 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 60배, 약 70배, 약 80배, 약 90배, 약 100배, 약 150배, 약 200배, 또는 약 300배 만큼 감소시키는, 방법.
제81항 내지 제89항 중 어느 한 항에 있어서, 상기 벡터 시스템은 아데노바이러스 유전자 E4, E2A, VA 및 AAV의 Cap 단백질을 인코딩하는 하나 이상의 폴리뉴클레오타이드를 포함하는, 방법.
제81항 내지 제90항 중 어느 한 항에 있어서, 상기 벡터 시스템은 지질 나노입자(LNP)를 통해 투여되는, 방법.
제81항 내지 제91항 중 어느 한 항에 있어서, 상기 LNP는 PEG화된 지질, 콜레스테롤, 및 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제92항에 있어서, 상기 LNP는 약 0.5% 내지 약 2%의 PEG화된 지질, 약 35% 내지 약 45%의 콜레스테롤, 및 약 5% 내지 약 65%의 하나 이상의 이온화 가능한 지질을 포함하는, 방법.
제92항에 있어서, 상기 LNP는 약 1% DMG-PEG(2000), 약 40% 콜레스테롤, 약 10% DOPC 및 약 50% DLin-KC2-DMA의 비율로 DMG-PEG(2000), 콜레스테롤, DOPC 및 DLin-KC2-DMA를 포함하는, 방법.
제81항 내지 제94항 중 어느 한 항에 있어서, 상기 시스템은 근육내 또는 피하로 전달되는, 방법.
임의의 선행하는 청구항에 따른 방법에 사용하기 위한 벡터 시스템.
하나 이상의 벡터를 포함하는 벡터 시스템을 포함하는 조성물로서, 상기 하나 이상의 벡터는:
a) 아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 아달리무맙 단백질을 인코딩하는 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 아달리무맙 단백질과 상기 L 단백질은 동시 발현되는, 조성물.
제97항에 있어서, 상기 제1 폴리뉴클레오타이드는 서열번호 124의 아달리무맙 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및 서열번호 129의 아달리무맙 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 조성물.
하나 이상의 벡터를 포함하는 벡터 시스템을 포함하는 조성물로서, 상기 하나 이상의 벡터는:
a) 글루코실세라미다제(GBA) 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 글루코실세라미다제(GBA) 단백질을 인코딩하는 상기 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 상기 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 GBA 단백질과 상기 L 단백질은 동시 발현되는, 조성물.
제99항에 있어서, 상기 제1 폴리뉴클레오타이드는 서열번호 406의 GBA 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 조성물.
하나 이상의 벡터를 포함하는 조성물로서:
a) 표적 단백질을 인코딩하는 제1 폴리뉴클레오타이드; 및
b) 서열번호 1 내지 6 및 서열번호 24로 이루어진 군으로부터 선택된 아미노산 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 피코르나바이러스 리더(L) 단백질을 인코딩하는 제2 폴리뉴클레오타이드를 포함하며;
상기 표적 단백질을 인코딩하는 상기 제1 폴리뉴클레오타이드 및 상기 L 단백질을 인코딩하는 상기 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되어 있고; 상기 표적 단백질과 상기 L 단백질은 동시 발현되는, 조성물.
제101항에 있어서, 상기 제1 폴리뉴클레오타이드는 표 8의 가변 중쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열; 및/또는 표 8의 가변 경쇄 서열 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 조성물.
제102항에 있어서, 상기 제1 폴리뉴클레오타이드는 표 9의 단백질 서열, 또는 여기에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는, 조성물.