KR20180118659A

KR20180118659A - 최적화된 viii 인자 유전자

Info

Publication number: KR20180118659A
Application number: KR1020187025354A
Authority: KR
Inventors: 시위안 탄; 통야오 류
Original assignee: 바이오버라티브 테라퓨틱스 인크.
Priority date: 2016-02-01
Filing date: 2017-01-31
Publication date: 2018-10-31
Also published as: LT3411478T; US20240124555A1; US20190185543A1; IL260796A; AU2017214378A1; CN116218863A; HK1257078A1; JP7217630B2; EP3411478B1; ES2926585T3; CA3012695A1; PL3411478T3; US11753461B2; DK3411478T3; EP4137570A1; HUE059941T2; CN109072214B; MX2023001394A; SI3411478T1; RS63548B1

Abstract

본 개시내용은 코돈 최적화된 VIII 인자 서열, 코돈 최적화된 VIII 인자 서열을 포함하는 벡터 및 숙주 세포, 코돈 최적화된 VIII 인자 서열에 의해 코딩된 폴리펩타이드, 및 이러한 폴리펩타이드를 제조하는 방법을 제공한다. 본 개시내용은 또한 코돈 최적화된 VIII 인자 핵산 서열 또는 이에 의해 코딩된 폴리펩타이드를 대상체에게 투여하는 단계를 포함하는 출혈 장애, 예컨대 혈우병을 치료하는 방법을 제공한다.

Description

최적화된 VIII 인자 유전자

전자로 제출된 서열 목록의 참조

ASCII 텍스트 파일(명칭: 2159_469PC02_SequenceListing_ST25.txt; 크기: 204,138바이트; 및 생성일: 2017년 1월 31일)의 전자로 제출된 서열 목록의 내용은 본 명세서에 그 전문이 참고로 포함된다.

혈액 응고 경로는, 부분적으로, 혈소판의 표면에서 VIIIa 인자(FVIIIa) 및 IXa 인자(FIXa)의 효소 복합체(Xase 복합체)의 형성을 수반한다. FIXa는 이의 보인자 FVIIIa가 없는 비교적 약한 촉매 활성을 갖는 세린 프로테아제이다. Xase 복합체는 X 인자(FX)를 Xa 인자(FXa)로 절단하고, 이는 결국 Va 인자(FVa)와 상호작용하여 프로트롬빈을 절단하고 트롬빈을 생성한다. A 혈우병은 FVIII 활성의 결핍증을 발생시키는 FVIII(FVIII) 유전자에서의 돌연변이 및/또는 결실에 의해 야기된 출혈 장애이다(Peyvandi et al. 2006). 몇몇 경우에, 환자는 FVIII 저해제, 예컨대 항-FVIII 항체의 존재 하에 FVIII의 감소한 수준을 갖는다.

A 혈우병은 자발적인 대출혈 및 과도한 출혈을 특징으로 한다. 시간이 지나면서, 대개 유아기에 시작하는 근육 및 관절로의 반복 출혈은 혈우병성 관절증 및 비가역적인 관절 손상을 발생시킨다. 이 손상은 진행성이고, 매우 제한된 관절 이동성, 근육 위축증 및 만성 통증을 발생시킬 수 있다(Rodriguez-Merchan, E.C., Semin. Thromb. Hemost. 29:87-96 (2003)(본 명세서에 그 전문이 참고로 포함됨).

질환은 자발적인 출혈을 막도록 정상 수준의 1% 내지 5%로 FVIII 활성의 복원을 표적화하는 대체 치료에 의해 치료될 수 있다(예를 들어, 문헌[Mannucci, P.M., et al., N. Engl. J. Med.344:1773-9 (2001)](본 명세서에 그 전문이 참고로 포함됨) 참조). 요구 시 출혈 삽화를 치료하거나 예방학적으로 치료함으로써 출혈 삽화가 생기는 것을 방지하기 위해 이용 가능한 혈장 유래된 및 재조합 FVIII 제품이 존재한다. 이 제품의 반감기(10시간 내지 12시간)에 기초하여(White G.C., et al.,Thromb. Haemost. 77:660-7 (1997); Morfini, M., Haemophilia 9 (suppl 1):94-99;discussion 100 (2003)), 치료 섭생은 흔히 예방에 대해 매주 2회 내지 3회 및 요구 시 치료에 대해 매일 1회 내지 3회의 빈번한 정맥내 투여를 요한다(Manco-Johnson, M.J., et al., N. Engl. J. Med. 357:535-544 (2007))(이들의 각각은 본 명세서에 그 전문이 참고로 포함됨). 이러한 빈번한 투여는 불편하고 고비용이다.

환자에게 저비용 재조합 FVIII 단백질을 제공하는 데 있어서 주요 장애는 상업용 제조의 고비용이다. FVIII 단백질은, 유사하게 크기화된 단백질보다 적은 2차 내지 3차 규모로, 비상동성 발현 시스템에서 불량하게 발현한다. (Lynch et al., Hum. Gene. Ther.; 4:259-72 (1993). FVIII의 불량한 발현은 부분적으로 FVIII 발현을 저해하는 FVIII 코딩 서열에서의 시스 작용성 유전요소, 예컨대 전사 슬라이언서 유전요소(Hoeben et al., Blood 85:2447-2454 (1995)), 매트릭스 부착 유사 서열(MAR)(Fallux et al., Mol. Cell. Biol. 16:4264-4272 (1996)), 및 전사 연장 저해 유전요소(Koeberl et al., Hum. Gene. Ther.; 6:469-479 (1995))의 존재로 인한다.

FVIII 발현의 생물학의 본 발명자들의 이해의 진전은 더 강력한 FVIII 변이체의 개발을 발생시켰다. 예를 들어, 생화학 연구는 FVIII B 도메인이 FVIII 보인자 활성에 필요하지 않다는 것을 입증하였다. B 도메인의 결실은 전장 야생형 FVIII에 비해 mRNA 수준의 17배 증가 및 분비된 단백질의 30% 증가를 발생시켰다. (Toole et al., Proc Natl Acad Sci USA 83:5939-42 (1986)). 이것은 B 도메인 결실된(BDD) FVIII 단백질 농축액의 개발을 발생시키고, 이것은 현재 클리닉에서 널리 사용된다. 그러나, 최근의 연구는 전장 및 BDD hFVIII가 ER 내강에서 미스폴딩하여서 비폴딩된 단백질 반응(UPR)의 활성화 및 쥣과 간세포의 아폽토시스를 발생시킨다는 것을 나타낸다.

따라서, 비상동성 시스템에서 효율적으로 발현하는 FVIII 서열에 대한 당해 분야에서의 수요가 존재한다.

FVIII 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 분자가 개시된다. 일 양태에서, 본 개시내용은, VIII 인자(FVIII) 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는, 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고; 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다.

본 개시내용은 또한 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고; 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 일 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 또 다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다.

몇몇 실시형태에서, 본 개시내용은 대상체에서 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법을 제공하고, 상기 방법은 본 명세서에 개시된 단리된 핵산 분자 또는 벡터를 이를 요하는 대상체에게 투여하는 단계를 포함하고, 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 분자 또는 기준 핵산 분자를 포함하는 벡터에 대해 증가한다.

몇몇 실시형태에서, 본 개시내용은 출혈 장애를 치료를 요하는 대상체에게 본 명세서에 개시된 핵산 분자, 벡터, 또는 폴리펩타이드를 투여하는 단계를 포함하는 출혈 장애를 치료하는 방법을 제공한다.

실시형태

E1. VIII 인자(FVIII) 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서; 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는, 단리된 핵산 분자.

E2. E1에 있어서, 제1 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 4의 58번 내지 1791번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E3. E1 또는 E2에 있어서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는, 단리된 핵산 분자.

E4. E1 또는 E2에 있어서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E5. FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는, 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서; 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는, 단리된 핵산 분자.

E6. E5에 있어서, 제2 핵산 서열은 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E7. E5 또는 E6에 있어서, 제1 핵산 서열은 서열 번호 5의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 6의 58번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는, 단리된 핵산 분자.

E8. E5 또는 E6에 있어서, 제1 핵산 서열은 서열 번호 5의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 6의 58번 내지 1791번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E9. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E10. E9에 있어서, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E11. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E12. E10에 있어서, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E13. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E14. E13에 있어서, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E15. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E16. E15에 있어서, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E17. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E18. E17에 있어서, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E19. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E20. E19에 있어서, 뉴클레오타이드 서열은 뉴클레오타이드 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E21. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E22. E21에 있어서, 뉴클레오타이드 서열은 뉴클레오타이드 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E23. FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.

E24. E23에 있어서, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함하는, 단리된 핵산 분자.

E25. E1 내지 E24 중 어느 하나에 있어서, 뉴클레오타이드 서열은 신호 펩타이드를 코딩하는 핵산 서열을 추가로 포함하는, 단리된 핵산 분자.

E26. E25에 있어서, 신호 펩타이드는 FVIII 신호 펩타이드인, 단리된 핵산 분자.

E27. E25 또는 E26에 있어서, 신호 펩타이드를 코딩하는 핵산 서열은 코돈 최적화된, 단리된 핵산 분자.

E28. E25 내지 E27 중 어느 하나에 있어서, 신호 펩타이드를 코딩하는 핵산 서열은 (ⅰ) 서열 번호 1의 1번 내지 57번 뉴클레오타이드; (ⅱ) 서열 번호 2의 1번 내지 57번 뉴클레오타이드; (ⅲ) 서열 번호 3의 1번 내지 57번 뉴클레오타이드; (ⅳ) 서열 번호 4의 1번 내지 57번 뉴클레오타이드; (ⅴ) 서열 번호 5의 1번 내지 57번 뉴클레오타이드; (ⅵ) 서열 번호 6의 1번 내지 57번 뉴클레오타이드; (ⅶ) 서열 번호 70의 1번 내지 57번 뉴클레오타이드; (ⅷ) 서열 번호 71의 1번 내지 57번 뉴클레오타이드; 또는 (ⅸ) 서열 번호 68의 1번 내지 57번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는, 단리된 핵산 분자.

E29. E1 내지 E28 중 어느 하나에 있어서, 핵산 분자는 하기로 이루어진 군으로부터 선택된 하나 이상의 특성을 포함하는, 단리된 핵산 분자:

(a) 핵산 분자 또는 이의 부분의 인간 코돈 적응 지수는 서열 번호 16에 대해 증가함;

(b) 뉴클레오타이드 서열 또는 이의 부분의 최적 코돈의 빈도는 서열 번호 16에 대해 증가함;

(c) 뉴클레오타이드 서열 또는 이의 부분은 서열 번호 16에서 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유함;

(d) 뉴클레오타이드 서열 또는 이의 부분의 상대 동의적 코돈 사용빈도는 서열 번호 16에 대해 증가함;

(e) 뉴클레오타이드 서열 또는 이의 부분의 코돈의 유효 수는 서열 번호 16에 대해 감소함;

(f) 뉴클레오타이드 서열은 서열 번호 16에 대해 더 적은 MARS/ARS 서열(서열 번호 21 및 22)을 함유함;

(g) 뉴클레오타이드 서열은 서열 번호 16에 대해 더 적은 탈안정화 유전요소(서열 번호 23 및 24)를 함유함; 및

(h) 임의의 이들의 조합.

E30. E1 내지 E29 중 어느 하나에 있어서, 비상동성 뉴클레오타이드 서열을 추가로 포함하는, 단리된 핵산 분자.

E31. E30에 있어서, 비상동성 뉴클레오타이드 서열은 반감기 연장제인 비상동성 아미노산 서열을 코딩하는, 단리된 핵산 분자.

E32. E30 또는 E31에 있어서, 비상동성 아미노산 서열은 면역글로불린 불변 영역 또는 이의 부분, 트랜스페린, 알부민 또는 PAS 서열인, 단리된 핵산 분자.

E33. E30 또는 E31에 있어서, 비상동성 아미노산 서열은 Fc 영역인, 단리된 핵산 분자.

E34. E30 내지 E33 중 어느 하나에 있어서, 비상동성 아미노산 서열은 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열의 N 말단 또는 C 말단에 연결되거나, 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열에서의 2개의 아미노산 사이에 삽입된, 단리된 핵산 분자.

E35. E34에 있어서, 비상동성 아미노산 서열은 표 3으로부터 선택된 하나 이상의 삽입 부위에서 2개의 아미노산 사이에 삽입된, 단리된 핵산 분자.

E36. E30 내지 E35 중 어느 하나에 있어서, FVIII를 포함하는 단량체-이합체 하이브리드 분자를 코딩하는, 단리된 핵산 분자.

E37. E1 내지 E36 중 어느 하나에 있어서, FVIII 폴리펩타이드는 전장 FVIII 또는 B 도메인 결실된 FVIII인, 단리된 핵산 분자.

E38. E1 내지 E37 중 어느 하나에 있어서, 적어도 하나의 전사 제어 서열에 작동적으로 연결된, 단리된 핵산 분자.

E39. E1 내지 E38 중 어느 하나의 핵산 분자를 포함하는 벡터.

E40. E39에 있어서, 벡터는 바이러스 벡터인, 벡터.

E41. E1 내지 E32 중 어느 하나의 핵산 분자 또는 E39 또는 E40의 벡터를 포함하는 숙주 세포.

E42. E41에 있어서, 숙주 세포는 CHO 세포, HEK293 세포, BHK21 세포, PER.C6 세포, NS0 세포 및 CAP 세포로 이루어진 군으로부터 선택된, 숙주 세포.

E43. E1 내지 E37 중 어느 하나의 핵산 분자 또는 E39 또는 E40의 벡터에 의해 코딩되거나, E41 또는 E42의 숙주 세포에 의해 생산된, 폴리펩타이드.

E44. FVIII 활성을 갖는 폴리펩타이드를 제조하는 방법으로서, FVIII 활성을 갖는 폴리펩타이드가 생산되는 조건 하에 E41 또는 E42의 숙주 세포를 배양하는 단계; 및 FVIII 활성을 갖는 폴리펩타이드를 회수하는 단계를 포함하는, 방법.

E45. E44에 있어서, FVIII 활성을 갖는 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 뉴클레오타이드 서열을 포함하는 동일한 조건 하에 배양된 숙주 세포에 대해 증가한, 방법.

E46. 대상체에서 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법으로서, E1 내지 E38 중 어느 하나의 단리된 핵산 분자 또는 E39 또는 E40의 벡터를 이를 요하는 대상체에게 투여하는 단계를 포함하고, 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 분자 또는 기준 핵산 분자를 포함하는 벡터에 대해 증가한, 방법.

E47. FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법으로서, FVIII 활성을 갖는 폴리펩타이드가 핵산 분자에 의해 발현되는 조건 하에 E41 또는 E42의 숙주 세포를 배양하는 단계를 포함하고, FVIII 활성을 갖는 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 서열을 포함하는 동일한 조건 하에 배양된 숙주 세포에 대해 증가한, 방법.

E48. E44 내지 E47 중 어느 하나에 있어서, FVIII 폴리펩타이드의 발현은 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배, 또는 적어도 약 100배 증가한, 방법.

E49. FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법으로서, FVIII 활성을 갖는 폴리펩타이드가 핵산 분자에 의해 생산되는 조건 하에 E41 또는 E42의 숙주 세포를 배양하는 단계를 포함하고, FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 서열을 포함하는 동일한 조건 하에 배양된 숙주 세포에 대해 증가한, 방법.

E50. E1 내지 E38 중 어느 하나의 핵산 분자, E39 또는 E40의 벡터 또는 E43의 폴리펩타이드를 이를 요하는 대상체에게 투여하는 단계를 포함하는 출혈 장애를 치료하는 방법.

E51. E50에 있어서, 출혈 장애는 FVIII에서의 결핍증을 특징으로 하는, 방법.

E52. E50에 있어서, 출혈 장애는 혈우병인, 방법.

E53. E50에 있어서, 출혈 장애는 A 혈우병인, 방법.

E54. E50 내지 E53 중 어느 하나에 있어서, 투여 후 24시간에 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 증가한, 방법.

E55. E54에 있어서, 혈장 FVIII 활성은 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배, 또는 적어도 약 100배 증가한, 방법.

E56. E39 또는 40에 있어서, 벡터는 렌티바이러스 벡터인, 벡터.

E57. E39, E40 및 E56 중 어느 하나에 있어서, 조직 특이적 촉진자, 조직 특이적 증강자, 또는 조직 특이적 촉진자 및 조직 특이적 증강자 둘 다를 추가로 포함하는, 벡터.

E58. E57에 있어서, 조직 특이적 촉진자 및/또는 조직 특이적 증강자는 간 세포에서 전이유전자의 발현을 선택적으로 증대시키는, 벡터.

E59. E57 또는 E58에 있어서, 조직 특이적 촉진자는 마우스 타이레틴 촉진자(mTTR), 내인성 인간 VIII 인자 촉진자(F8), 인간 알파-1-안티트립신 촉진자(hAAT), 인간 알부민 최소 촉진자 및 마우스 알부민 촉진자로 이루어진 군으로부터 선택된 촉진자 서열을 포함하는, 벡터.

E60. E57 내지 E59 중 어느 하나에 있어서, 조직 특이적 촉진자는 mTTR 촉진자를 포함하는, 벡터.

E61. E56 내지 E60 중 어느 하나의 벡터를 이를 요하는 대상체에게 투여하는 단계를 포함하는 출혈 장애를 치료하는 방법.

도 1a 내지 도 1j는 B 도메인 결실된 VIII 인자를 코딩하는 코돈 최적화된 뉴클레오타이드 서열(서열 번호 17)을 제공한다. 도 1a는 coFVIII-3의 뉴클레오타이드 서열(서열 번호 1)을 보여준다. 도 1b는 coFVIII-4의 뉴클레오타이드 서열(서열 번호 2)을 보여준다. 도 1c는 coFVIII-5의 뉴클레오타이드 서열(서열 번호 70)을 보여준다. 도 1d는 coFVIII-6의 뉴클레오타이드 서열(서열 번호 71)을 보여준다. 도 1e는 coFVIII-52의 뉴클레오타이드 서열(서열 번호 3)을 보여준다. 도 1f는 coFVIII-62의 뉴클레오타이드 서열(서열 번호 4)을 보여준다. 도 1g는 coFVIII-25의 뉴클레오타이드 서열(서열 번호 5)을 보여준다. 도 1h는 coFVIII-26의 뉴클레오타이드 서열(서열 번호 6)을 보여준다. 도 1i 및 도 1j는 각각 B 도메인 결실된 (BDD-FVIII)의 뉴클레오타이드 및 아미노산 서열(각각 서열 번호 16 및 17)을 보여준다.
도 2a 내지 도 2j는 BDD-FVIII를 코딩하는 코돈 최적화된 뉴클레오타이드 서열에서의 코돈 사용빈도 바이어스 조정을 보여준다. 도 2a는 BDD-FVIII을 코딩하는 (코돈 최적화 전) 야생형 뉴클레오타이드 서열, 예를 들어 비최적화된 BDD-FVIII에서의 코돈의 상대 빈도를 보여준다. 비최적화된 BDD-FVIII 서열의 인간 코돈 적응 지수(CAI)는 74%이다. 도 2b는 88%의 인간 CAI를 갖는 coFVIII-1 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2c는 91%의 인간 CAI를 갖는 coFVIII-3 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2d는 97%의 인간 CAI를 갖는 coFVIII-4 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2e는 83%의 인간 CAI를 갖는 coFVIII-5 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2f는 83%의 인간 CAI를 갖는 coFVIII-6 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2g는 91%의 인간 CAI를 갖는 coFVIII-52 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2h는 91%의 인간 CAI를 갖는 coFVIII-62 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2i는 88%의 인간 CAI를 갖는 coFVIII-25 변이체 서열에서의 코돈의 상대 빈도를 보여준다. 도 2j는 88%의 인간 CAI를 갖는 coFVIII-26 변이체 서열에서의 코돈의 상대 빈도를 보여준다.
도 3은, coFVIII-1 번역 시작 부위의 상류에 배치되고, 합성 증강자, mTIR 증강자 및 mTIR 촉진자를 포함하는, ET 증대된 타이레틴교환 촉진자의 제어 하에 pcDNA3 골격에서 coFVIII-1을 포함하는 FVIII-303의 플라스미드 지도를 제공한다.
도 4는 5㎍의 FVIII-303(coFVIII-1; 원) 또는 5㎍의 FVIII-311(BDD-FVIII; 정사각형)의 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성의 그래프 표시를 보여준다. FVIII 혈장 활성은 주사 후 24시간, 48시간 및 72시간에 FVIII 특이적 비색 검정에 의해 결정된다. FVIII-311의 발현 수준으로 정규화된 72시간에서의 상대 활성 수준이 도시되어 있다.
도 5는, coFVIII-52 번역 시작 부위의 상류에 배치되고, 합성 증강자, mTTR 증강자 및 mTTR 촉진자를 포함하는, ET 촉진자의 제어 하에 렌티바이러스 플라스미드에서 coFVIII-52를 포함하는 pLV-coFVIII-52의 플라스미드 지도를 보여준다.
도 6a 내지 도 6c는 뉴클레오타이드를 코딩하는 다양한 FVIII의 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성의 그래프 표시를 보여준다. FVIII 혈장 활성은 주사 후 24시간, 48시간 및 72시간에 FVIII 특이적 비색 검정에 의해 결정된다. 도 6a는 5㎍의 LV-coFVIII-1(채워진 원), 5㎍의 LV-coFVIII-3(삼각형), 5㎍의 LV-coFVIII-4(역삼각형), 5㎍의 LV-coFVIII-5(다이아몬드) 또는 5㎍의 LV-coFVIII-6(빈 원)의 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성을 보여준다. 도 6b는 5㎍의 LV-coFVIII-1(원), 5㎍의 LV-coFVIII-25(삼각형) 또는 5㎍의 LV-coFVIII-26(역삼각형)의 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성을 보여준다. 도 6c는 20㎍의 LV-2116(코돈 비최적화된(WT) BDD-FVIII 뉴클레오타이드 서열; 빈 원), 20㎍의 LV-coFVIII-1(삼각형), 20㎍의 LV-coFVIII-52(정사각형) 또는 20㎍의 LV-coFVIII-62(채워진 원)의 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성을 보여준다. 72시간에서의 상대 활성 수준은 표시된 바대로 LV-coFVIII-1(도 6a, 도 6b 및 도 6c) 및/또는 LV-2116(도 6c)의 발현 수준으로 정규화된 각각의 플라스미드에 대해 도시되어 있다.
도 7은, FVIII 특이적 비색 검정에 의해 측정된, LV-2116(BDD-FVIII) 대조군과 비교된, coFVIII-1, coFVIII-5, coFVIII-52, coFVIII-6 또는 coFVIII-62를 포함하는 1E8TU/마우스 렌티바이러스 벡터에 의한 주사 후 24일에 HemA 마우스에서의 혈장 FVIII 활성을 보여준다. 오차 막대는 표준 편차를 나타낸다.
도 8a 내지 도 8c는 XTEN에 융합된 BDD-FVIII를 코딩하는 다양한 코돈 최적화된 뉴클레오타이드 서열을 제공한다. 도 8a는 coFVIII-52-XTEN의 뉴클레오타이드 서열(서열 번호 19)을 보여주고, 여기서 144개의 아미노산을 갖는 XTEN을 코딩하는 뉴클레오타이드 서열("XTEN₁₄₄"; 서열 번호 18; 밑줄)은 coFVIII-52 뉴클레오타이드 서열 내에 삽입된다. 도 8b는 coFVIII-1-XTEN의 뉴클레오타이드 서열(서열 번호 20)을 보여주고, 여기서 144개의 아미노산을 갖는 XTEN을 코딩하는 뉴클레오타이드 서열("XTEN₁₄₄"; 서열 번호 18; 밑줄)은 coFVIII-1 뉴클레오타이드 서열 내에 삽입된다. 도 8c는 coFVIII-6-XTEN의 뉴클레오타이드 서열(서열 번호 72)을 보여주고, 여기서 144개의 아미노산을 갖는 XTEN을 코딩하는 뉴클레오타이드 서열("XTEN₁₄₄"; 서열 번호 18; 밑줄)은 coFVIII-6 뉴클레오타이드 서열(예를 들어, 성숙 FVIII 서열에 상응하는 745번 아미노산 잔기) 내에 삽입된다.
도 9는 ET 촉진자의 제어 하에 렌티바이러스 벡터에서 coFVIII-52-XTEN을 포함하는 pLV-coFVIII-52-XTEN의 플라스미드 지도를 제공한다. 본 명세서에 기재된 바와 같은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 남은 코돈 최적화된 핵산 분자의 각각을 포함하는 렌티바이러스 벡터는, 동일한 XTEN 서열이 FVIII의 B 도메인을 대체하도록 삽입되는, pLV-coFVIII-52-XTEN과 동일한 방식으로 작제된다.
도 10a 및 도 10b는 BDD-FVIII를 코딩하는 다양한 코돈 최적화된 뉴클레오타이드 서열을 포함하는 플라스미드 DNA(도 10a) 또는 렌티바이러스 벡터(도 10b)에 의한 주사 후 HemA 마우스에서의 FVIII 활성을 보여준다. 도 10a는 5㎍의 FVIII-311(코돈 비최적화된, BDD-FVIII 코딩 뉴클레오타이드 서열; 정사각형), 5㎍의 FVIII-303(coFVIII-1; 작은 원) 또는 FVIII-306(coFVIII-1-XTEN₁₄₄; 큰 원)에 의한 수력 주사 후 HemA 마우스에서의 FVIII 혈장 활성의 그래프 표시를 보여준다. FVIII-311로 정규화된 72시간에서의 상대 활성이 각각의 플라스미드에 대해 도시되어 있다. 도 10b는, FVIII 특이적 비색 검정에 의해 측정된, LV-2116(BDD-FVIII) 대조군과 비교된, coFVIII-52 또는 coFVIII-52-XTEN을 포함하는 렌티바이러스 벡터의 1E8TU/마우스에 의한 주사 후 21일에 HemA 마우스에서의 혈장 FVIII 활성을 보여준다. 오차 막대는 표준 편차를 나타낸다.
도 11a는 전장 성숙 인간 VIII 인자의 아미노산 서열을 보여준다. 도 11b는 전장 인간 폰 빌레브란트 인자의 아미노산 서열(서열 번호 44)을 보여준다. 도 11c 및 도 11d는 42개의 아미노산을 갖는 XTEN 폴리펩타이드의 각각 아미노산 및 뉴클레오타이드 서열(XTEN AE42-4; 각각 서열 번호 46 및 47)을 보여준다. 144개의 아미노산을 갖는 다양한 XTEN 폴리펩타이드의 아미노산 서열은 도 11e, 도 11g, 도 11i, 도 11k, 도 11m, 도 11o, 도 11q, 도 11s, 도 11u 및 도 11w(각각 서열 번호 48, 50, 52, 54, 56, 58, 60, 62, 64 및 66)에 도시되어 있고, 상응하는 뉴클레오타이드 서열은 도 11f, 도 11h, 도 11j, 도 11l, 도 11n, 도 11p, 도 11r, 도 11t, 도 11v 및 도 11x(각각 서열 번호 49, 51, 53, 55, 57, 59, 61, 63, 65 및 67)에 도시되어 있다. 도 11y는 ET 촉진자의 뉴클레오타이드 서열(서열 번호 69)을 보여준다. 도 11z는 coFVIII-1에 대한 뉴클레오타이드 서열(서열 번호 68)(국제 공보 WO 제2014/127215호, 서열 번호 1 참조)을 보여준다.
도 12a는 약 1.5 E10 TU/㎏의 LV-wtBDD-FVIII(원), LV-coFVIII-6(정사각형) 또는 LV-coFVIII-6XTEN(삼각형)의 IV 투여 후 14일령 HemA 마우스에서의 FVIII 혈장 활성(IU/㎖)의 그래프 표시이다. 도 12b는 wtBDD-FVIII, coFVIII-1, coFVIII-3, coFVIII-4, coFVIII-5, coFVIII-6, coFVIII-52, coFVIII-62, coFVIII-25 또는 coFVIII-26을 발현하는 약 1.5 E10 TU/㎏의 렌티바이러스 벡터의 IV에 의해 투여된 14일령 HemA 마우스의 치료 후 150일에 벡터 카피수(VCN)의 그래프 표시이다. 도 12c는 wtBDD-FVIII, coFVIII-1, coFVIII-3, coFVIII-4, coFVIII-5, coFVIII-6, coFVIII-52, coFVIII-62, coFVIII-25 또는 coFVIII-26을 발현하는 약 1.5 E10 TU/㎏의 렌티바이러스 벡터의 IV에 의해 투여된 14일령 HemA 마우스의 치료 후 21일에 FVIII 혈장 활성(IU/㎖)의 그래프 표시이다.
도 13a 및 도 13b는 coFVIII-5 변이체를 발현하는 렌티바이러스에 의해 치료된 5마리의 HemA 마우스에서 FVIII 혈장 활성 수준(도 13a) 및 항-FVIII 항체 수준(도 13b)을 예시하는 그래프 표시이다. 14일령 HemA 한배 새끼는 정맥내 주사에 의해 coFVIII-5 변이체를 발현하는 대략 1.5 E10 TU/㎏의 렌티바이러스가 투여된다. 각각의 마우스는 숫자로 지정된다(즉, 1, 2, 3, 4 및 5; 도 13a 및 도 13b).
도 14는 렌티바이러스 치료 후 21일에 FVIII 혈장 활성에 의해 입증된 바와 같은 LV-FVIII 발현 수준과 항-FVIII 항체의 존재 사이의 상관관계의 그래프 도시이다. 각각의 데이터 점은 단일 HemA 마우스에 상응한다. 각각의 마우스는 본 명세서에 개시된 coFVIII 변이체 중 하나를 발현하는 렌티바이러스의 정맥내 주사에 의해 1.5 E10 TU/㎏ 용량을 받는다. 수평 선은 평균 FVIII 혈장 활성을 나타낸다.
도 15는 렌티바이러스 치료 후 150일에 세포마다 벡터 카피수(VCN)와 항-FVIII 항체의 존재 사이의 상관관계의 그래프 도시이다. 각각의 데이터 점은 단일 HemA 마우스에 상응한다. 각각의 마우스는 본 명세서에 개시된 coFVIII 변이체 중 하나를 발현하는 렌티바이러스의 정맥내 주사에 의해 1.5 E10 TU/㎏ 용량을 받는다. 수평 선은 평균 VCN을 나타낸다.
도 16a 및 도 16b는 coFVIII-52 변이체를 발현하는 렌티바이러스에 의해 치료된 2마리의 HemA 마우스(coFVIII-52-A 및 coFVIII-52-B)에서의 FVIII 혈장 활성 수준(도 16a) 및 항-FVIII 항체 수준(도 16b)을 예시하는 그래프 표시이다. 14일령 HemA 한배 새끼는 정맥내 주사에 의해 coFVIII-52 변이체를 발현하는 대략 1.5 E10 TU/㎏의 렌티바이러스가 투여된다. 도 16c 및 도 16d는 도 16a 및 도 16b의 coFVIII-52-A(도 16c) 및 coFVIII-52-B(도 16d) 마우스로부터 수집된 간 조직에서의 FVIII 발현에 대한 RNA 인시츄 혼성화 염색(어두운 염색)을 보여주는 영상이다.
도 17은 야생형 B 도메인 결실된 FVIII(wtBDD-FVIII; 삼각형), coFVIII-52XTEN(원) 또는 coFVIII-6XTEN(역삼각형) 변이체를 발현하는 렌티바이러스에 의해 치료된 HemA 신생아 마우스에서의 장기간 FVIII 발현을 보여주는 그래프 표시이다. 신생아 HemA 마우스는 wtBDD-FVIII, coFVIII-52XTEN 또는 coFVIII-6XTEN을 발현하는 대략 1.5 A10TU/㎏의 렌티바이러스의 정맥내 주사에 의해 투여된다. FVIII 혈장 활성은 대략 16주에 걸쳐 측정된다.
도 18은 XTEN에 융합된 VIII 인자를 코딩하는 뉴클레오타이드(서열 번호 72; LV-coFVIII-6-XTEN)를 포함하는 1.3 x 10⁹ 형질도입 단위/㎏ 렌티바이러스 벡터의 투여 후 HemA 개 신생아(S3 또는 K4)에서의 순환 FVIII 수준의 그래프 표시이다. 실선에 의해 연결된 정사각형은 aPTT-S3 샘플을 나타내고, 파선에 의해 연결된 삼각형은 aPTT-K4 샘플을 나타낸다. y-축은 정상의 %로서의 혈장 FVIII 활성을 보여주고, 여기서 정상 인간 FVIII 활성은 100%이다. x-축은 렌티바이러스 치료 후 일자를 보여주고, 여기서 렌티바이러스 치료는 0일에 투여된다.
도 19a 내지 도 19c는 나이브 HemA 개(도 19a), 렌티바이러스 치료 후 2주에 개 S3(도 19b) 및 렌티바이러스 치료 후 2주에 개 K4(도 19c)에 대한 회전 혈전탄성측정법(rotational thromboelastometry: ROTEM) 검정에 의해 모니터링된 전혈 지혈의 그래프 표시이다. 도 19a 내지 도 19c의 각각에 대해 응고 시간(CT)은 초(s)로 표시되고, 혈전 형성 시간(CFT)은 초(s)로 표시되고, 알파 각(α)은 도(°)로 표시되고, CT 5분 후 진폭(A5)은 밀리미터(㎜)로 표시되고, CT 20분 후 진폭(A20)은 밀리미터(㎜)로 표시되고, 최대 혈전 단단함(MCF)은 밀리미터(㎜)로 표시된다. 도 19d는 도 19a 내지 도 19c에 표시된 매개변수 CT, CFT, α, A5, A2 및 MCF의 각각에 대한 정상 범위를 요약한 표이다.

본 개시내용은 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 기재한다. 본 개시내용은 VIII 인자 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 분자, 최적화된 핵산 분자를 포함하는 벡터 및 숙주 세포, 최적화된 핵산 분자에 의해 코딩된 폴리펩타이드, 및 이러한 폴리펩타이드를 제조하는 방법에 관한 것이다. 본 개시내용은 또한 최적화된 VIII 인자 핵산 서열, 최적화된 핵산 서열을 포함하는 벡터 또는 이에 의해 코딩된 폴리펩타이드를 대상체에게 투여하는 단계를 포함하는 출혈 장애, 예컨대 혈우병을 치료하는 방법에 관한 것이다. 본 개시내용은, 재조합 VIII 인자를 제조하는 방법에서 숙주 세포에서의 증가한 발현, VIII 인자 단백질의 개선된 수율을 입증하고, 유전자 치료 방법에서 사용될 때 잠재적으로 더 큰 치료학적 효능을 발생시키는, 최적화된 VIII 인자 서열을 제공함으로써 당해 분야에서의 중요한 수요를 충족시킨다. 소정의 실시형태에서, 본 개시내용은 서열 번호 1 내지 14, 70 및 71로부터 선택된 뉴클레오타이드 서열에 대한 서열 상동성을 갖는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 기재한다.

본 개시내용의 예시적인 작제물은 동반된 도면 및 서열 목록에 예시되어 있다. 본 명세서 및 청구항의 명확한 이해를 제공하기 위해, 하기 정의가 하기 제공된다.

I. 정의

용어 "일" 또는 "하나" 집합체는 그 집합체의 하나 이상을 의미한다는 것이 주목되어야 한다: 예를 들어, "뉴클레오타이드 서열"은 하나 이상의 뉴클레오타이드 서열을 나타내는 것으로 이해된다. 그러므로, 용어 "일"(또는 "하나"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호 교환되어 사용될 수 있다.

용어 "약"은 대략, 거의, 약 또는 이의 영역을 의미하도록 본 명세서에서 사용된다. 용어 "약"이 숫자 범위와 연결된 사용될 때, 이것은 기재된 숫자 값보다 높고 낮게 경계를 연장함으로써 그 범위를 수식한다. 일반적으로, 용어 "약"은 10% 위 또는 아래(더 높거나 더 낮은)의 변량으로 언급된 값보다 높고 낮은 숫자 값을 수식하도록 본 명세서에서 사용된다.

본 개시내용의 목적을 위해 용어 "단리된"은 이의 원래의 환경(이것이 자연에서 존재하는 환경)으로부터 제거된 생물학적 재료(세포, 폴리펩타이드, 폴리뉴클레오타이드, 또는 이의 단편, 변이체 또는 유도체)를 지칭한다. 예를 들어, 식물 또는 동물에서 자연 상태에 존재하는 폴리뉴클레오타이드는 단리되지 않지만, 이것이 자연에서 존재하는 인접한 핵산으로부터 분리된 동일한 폴리뉴클레오타이드는 "단리된" 것으로 생각된다. 정제의 특정한 수준이 필요하지 않다. 재조합으로 생산된 폴리펩타이드 및 숙주 세포에서 발현된 단백질은, 임의의 적합한 기법에 의해 분리되거나, 분획화되거나 또는 부분적으로 또는 실질적으로 정제된 네이티브 또는 재조합 폴리펩타이드인 것처럼, 본 개시내용의 목적을 위해 단리된 것으로 생각된다.

"핵산", "핵산 분자", "올리고뉴클레오타이드" 및 "폴리뉴클레오타이드"는 상호 교환되어 사용되고, 리보뉴클레오사이드(아데노신, 구아노신, 우리딘 또는 사이티딘; "RNA 분자") 또는 데옥시리보뉴클레오사이드(데옥시아데노신, 데옥시구아노신, 데옥시타이미딘 또는 데옥시사이티딘; "DNA 분자")의 포스페이트 에스터 중합체 형태, 또는 임의의 이의 포스포에스터 유사체, 예컨대 단일 가닥 형태, 또는 이중 가닥 나선의 포스포로티오에이트 및 티오에스터를 의미한다. 이중 가닥 DNA-DNA, DNA-RNA 및 RNA-RNA 나선이 가능하다. 용어 핵산 분자, 및 특히 DNA 또는 RNA 분자는 오직 분자의 1차 및 2차 구조를 의미하고, 이것을 임의의 특정한 3차 형태로 제한하지 않는다. 따라서, 이 용어는 선형 또는 원형 DNA 분자(예를 들어, 제한 단편)로 특히 발견되는 이중 가닥 DNA, 플라스미드, 슈퍼코일 DNA 및 염색체를 포함한다. 특정한 이중 가닥 DNA 분자의 구조를 기재하는 데 있어서, 서열은 DNA의 비전사된 가닥(즉, mRNA에 서열 상동성을 갖는 가닥)을 따라 오직 5'→3' 방향의 서열을 주는 일반 관계에 따라 본 명세서에 기재될 수 있다. "재조합 DNA 분자"는 분자 생물학적 조작을 겪은 DNA 분자이다. DNA는 cDNA, 게놈 DNA, 플라스미드 DNA, 합성 DNA 및 반합성 DNA를 포함하지만, 이들로 제한되지는 않는다. 본 개시내용의 "핵산 조성물"은 본 명세서에 기재된 바와 같은 하나 이상의 핵산을 포함한다.

본 명세서에 사용된 바와 같은, "코딩 영역" 또는 "코딩 서열"은 아미노산으로 번역 가능한 코돈으로 이루어진 폴리뉴클레오타이드의 부분이다. "중단 코돈"(TAG, TGA 또는 TAA)이 통상적으로 아미노산으로 번역되지 않지만, 이것은 코딩 영역의 부분인 것으로 생각될 수 있지만, 임의의 플랭킹 서열, 예를 들어 촉진자, 리보솜 결합 부위, 전사 종결자, 인트론 등은 코딩 영역의 부분이 아니다. 코딩 영역의 경계는 통상적으로 생성된 폴리펩타이드의 아미노 말단을 코딩하는 5' 말단에서의 출발 코돈 및 생성된 폴리펩타이드의 카복실 말단을 코딩하는 3' 말단에서의 번역 중단 코돈에 의해 결정된다. 2개 이상의 코딩 영역은 단일 폴리뉴클레오타이드 작제물에서, 예를 들어 단일 벡터 상에, 또는 별개의 폴리뉴클레오타이드 작제물에서, 예를 들어 별개의(상이한) 벡터 상에 존재할 수 있다. 이후, 단일 벡터가 단지 단일 코딩 영역을 함유할 수 있거나, 2개 이상의 코딩 영역을 포함하는 것이 된다.

포유류 세포에 의해 분비된 소정의 단백질은 조면 소포체에 걸쳐 성장하는 단백질 사슬의 배출이 개시되면 성숙 단백질로부터 절단되는 분비 신호 펩타이드와 회합된다. 당해 분야의 숙련자는 신호 펩타이드가 일반적으로 폴리펩타이드의 N 말단에 융합되고, 완전한 또는 "전장" 폴리펩타이드로부터 절단되어서 폴리펩타이드의 분비된 또는 "성숙" 형태를 생성한다는 것을 알고 있다. 소정의 실시형태에서, 네이티브 신호 펩타이드 또는 그 서열의 기능적 유도체는 이것과 작동적으로 회합된 폴리펩타이드의 분비를 지시하는 능력을 보유한다. 대안적으로, 비상동성 포유류 신호 펩타이드, 예를 들어 인간 조직 플라스미노겐 활성자(TPA) 또는 마우스 ß-글루쿠로니다제 신호 펩타이드, 또는 이의 기능적 유도체를 사용할 수 있다.

용어 "하류"는 기준 뉴클레오타이드 서열에 3'에 위치한 뉴클레오타이드 서열을 의미한다. 소정의 실시형태에서, 하류 뉴클레오타이드 서열은 전사의 출발점 뒤의 서열을 의미한다. 예를 들어, 유전자의 번역 개시 코돈은 전사의 시작 부위의 하류에 위치한다.

용어 "상류"는 기준 뉴클레오타이드 서열에 5'에 위치한 뉴클레오타이드 서열을 의미한다. 소정의 실시형태에서, 상류 뉴클레오타이드 서열은 코딩 영역의 5' 측 또는 전사의 출발점에 위치한 서열을 의미한다. 예를 들어, 대부분의 촉진자는 전사의 시작 부위의 상류에 위치한다.

본 명세서에 사용된 바와 같은, 용어 "유전자 조절 영역" 또는 "조절 영역"은 코딩 영역의 상류(5' 비코딩 서열)에, 내에 또는 하류(3' 비코딩 서열)에 위치하고, 회합된 코딩 영역의 전사, RNA 가공처리, 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 의미한다. 조절 영역은 촉진자, 번역 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 가공처리 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함할 수 있다. 코딩 영역이 진핵생물 세포에서의 발현에 의도되는 경우, 폴리아데닐화 신호 및 전사 종결 서열은 보통 코딩 서열에 3'에 위치할 것이다.

유전자 산물, 예를 들어 폴리펩타이드를 코딩하는 폴리뉴클레오타이드는 하나 이상의 코딩 영역과 작동적으로 회합된 촉진자 및/또는 다른 발현(예를 들어, 전사 또는 번역) 제어 유전요소를 포함할 수 있다. 작동 가능한 회합에서, 유전자 산물에 대한 코딩 영역, 예를 들어 폴리펩타이드는 조절 영역(들)의 영향 또는 제어 하에 유전자 산물의 발현을 두는 방식으로 하나 이상의 조절 영역과 회합된다. 예를 들어, 코딩 영역 및 촉진자는, 촉진자 기능의 유도가 코딩 영역에 의해 코딩된 유전자 산물을 코딩하는 mRNA의 전사를 발생시키는 경우, 및 촉진자와 코딩 영역 사이의 연결의 성질이 전사되는 DNA 주형의 능력을 방해하거나 유전자 산물의 발현을 지시하는 촉진자의 능력을 방해하지 않는 경우 "작동적으로 회합"된다. 촉진자, 예를 들어 증강자, 조작자, 억제자 및 전사 종결 신호 이외의, 다른 발현 제어 유전요소는 유전자 산물 발현을 지시하도록 코딩 영역과 또한 작동적으로 회합될 수 있다.

"전사 제어 서열"은 숙주 세포에서 코딩 서열의 발현을 제공하는 DNA 조절 서열, 예컨대 촉진자, 증강자, 종결자 등을 의미한다. 다양한 전사 제어 영역은 당해 분야의 숙련자에게 공지되어 있다. 이것은, 제한 없이, 척추동물 세포에서 기능하는 전사 제어 영역, 예컨대 사이토메갈로바이러스(인트론-A와 함께 즉시 초기 촉진자), 유인원 바이러스 40(초기 촉진자) 및 레트로바이러스(예컨대, 라우스 육종 바이러스)(이들로 제한되지는 않음)로부터의 촉진자 및 증강자 분절을 포함한다. 다른 전사 제어 영역은 액틴, 열 쇼크 단백질, 소 성장 호르몬 및 토끼 ß-글로빈과 같은 척추동물 유전자로부터 유래된 것, 및 진핵생물 세포에서 유전자 발현을 제어할 수 있는 다른 서열을 포함한다. 추가 적합한 전사 제어 영역은 조직 특이적 촉진자 및 증강자, 및 림포카인 유도성 촉진자(예를 들어, 인터페론 또는 인터류킨에 의해 유도 가능한 촉진자)를 포함한다.

유사하게, 다양한 번역 제어 유전요소는 당해 분야의 숙련자에게 공지되어 있다. 이것은 리보솜 결합 부위, 번역 개시 및 종결 코돈 및 피코르나바이러스로부터 유래된 유전요소(특히 내부 리보솜 진입 부위 또는 IRES, CITE 서열이라고도 칭함)를 포함하지만, 이들로 제한되지는 않는다.

본 명세서에 사용된 바와 같은, 용어 "발현"은 폴리뉴클레오타이드가 유전자 산물, 예를 들어 RNA 또는 폴리펩타이드를 생산하는 과정을 의미한다. 이것은 제한 없이 메신저 RNA(mRNA), 운반 RNA(tRNA), 작은 헤어핀 RNA(shRNA), 작은 간섭 RNA(siRNA) 또는 임의의 다른 RNA 산물로의 폴리뉴클레오타이드의 전사, 및 폴리펩타이드로의 mRNA의 번역을 포함한다. 발현은 "유전자 산물"을 생산한다. 본 명세서에 사용된 바와 같은, 유전자 산물은 핵산, 예를 들어 유전자의 전사에 의해 생산된 메신저 RNA 또는 전사체로부터 번역된 폴리펩타이드일 수 있다. 본 명세서에 기재된 유전자 산물은 전사 후 변형, 예를 들어 폴리아데닐화 또는 스플라이싱을 갖는 핵산, 또는 번역 후 변형, 예를 들어 메틸화, 글라이코실화, 지질의 첨가, 다른 단백질 아단위와의 회합 또는 단백질분해 절단을 갖는 폴리펩타이드를 추가로 포함한다. 본 명세서에 사용된 바와 같은, 용어 "수율"은 유전자의 발현에 의해 생성된 폴리펩타이드의 양을 의미한다.

"벡터"는 핵산의 클로닝 및/또는 이것의 숙주 세포로의 운반을 위한 임의의 비히클을 의미한다. 벡터는 부착된 분절의 복제를 발생시키도록 또 다른 핵산 분절이 부착될 수 있는 레플리콘일 수 있다. "레플리콘"은 생체내 복제의 자율 단위로서 작용하는, 즉 그 자체의 제어 하에 복제할 수 있는 임의의 유전자 유전요소(예를 들어, 플라스미드, 파지, 코스미드, 염색체, 바이러스)를 의미한다. 용어 "벡터"는 시험관내, 세포외 또는 생체내 세포로 핵산을 도입하기 위한 바이러스 비히클 및 비바이러스 비히클 둘 다를 포함한다. 많은 수의 벡터는 공지되어 있고, 예를 들어 플라스미드, 변형된 진핵생물 바이러스 또는 변형된 박테리아 바이러스를 포함하여 당해 분야에 사용된다. 적합한 벡터로의 폴리뉴클레오타이드의 삽입은 상보성 응착성 말단을 갖는 선택된 벡터로 적절한 폴리뉴클레오타이드 단편을 결찰함으로써 달성될 수 있다.

벡터는 벡터를 도입한 세포의 선택 또는 확인을 제공하는 선택 가능한 마커 또는 리포터를 코딩하도록 조작될 수 있다. 선택 가능한 마커 또는 리포터의 발현은 벡터에 함유된 다른 코딩 영역을 도입하고 발현시키는 숙주 세포의 확인 및/또는 선택을 허용한다. 당해 분야에서 공지되고 사용된 선택 가능한 마커 유전자의 예는 암피실린, 스트렙타비딘, 겐타마이신, 카나마이신, 하이그로마이신, 비알라포스 제초제, 설폰아미드 등에 내성을 제공하는 유전자; 및 표현형 마커로서 사용되는 유전자, 즉 안토시아닌 조절 유전자, 아이소펜타닐 전환효소 유전자 등을 포함한다. 당해 분야에서 공지되고 사용된 리포터의 예는 루시퍼라제(Luc), 녹색 형광성 단백질(GFP), 클로르암페니콜 아세틸전환효소(CAT), β-갈락토시다제(LacZ), β-글루쿠로니다제(Gus) 등을 포함한다. 선택 가능한 마커는 또한 리포터인 것으로 생각될 수 있다.

용어 "선택 가능한 마커"는 확인 인자, 보통 마커 유전자의 효과에 기초하여 선택될 수 있는 항생제 또는 화학물질 내성 유전자, 즉 항생제에 대한 내성, 제초제에 대한 내성, 비색 마커, 효소, 형광성 마커 등을 의미하고, 여기서 효과는 관심 대상의 핵산의 유전성을 추적하고/하거나, 관심 대상의 핵산을 유전한 세포 또는 유기체를 확인하도록 이용된다. 당해 분야에서 공지되고 사용된 선택 가능한 마커 유전자의 예는 암피실린, 스트렙타비딘, 겐타마이신, 카나마이신, 하이그로마이신, 비알라포스 제초제, 설폰아미드 등에 내성을 제공하는 유전자; 및 표현형 마커로서 사용되는 유전자, 즉 안토시아닌 조절 유전자, 아이소펜타닐 전환효소 유전자 등을 포함한다.

용어 "리포터 유전자"는 리포터 유전자의 효과에 기초하여 확인될 수 있는 확인 인자를 코딩하는 핵산을 의미하고, 여기서 효과는 관심 대상의 핵산의 유전성을 추적하고/하거나, 관심 대상의 핵산을 유전한 세포 또는 유기체를 확인하고/하거나, 유전자 발현 유도 또는 전사를 측정하도록 이용된다. 당해 분야에서 공지되고 사용된 리포터 유전자의 예는 루시퍼라제(Luc), 녹색 형광성 단백질(GFP), 클로르암페니콜 아세틸전환효소(CAT), β-갈락토시다제(LacZ), β-글루쿠로니다제(Gus) 등을 포함한다. 선택 가능한 마커 유전자는 또한 리포터 유전자인 것으로 생각될 수 있다.

"촉진자" 및 "촉진자 서열"은 상호 교환되어 사용되고, 코딩 서열 또는 기능성 RNA의 발현을 제어할 수 있는 DNA 서열을 의미한다. 일반적으로, 코딩 서열은 촉진자 서열에 3'에 위치한다. 촉진자는 이의 전체에서 네이티브 유전자로부터 유래될 수 있거나, 자연에서 발견된 상이한 촉진자로부터 유래된 상이한 유전요소로 구성될 수 있거나, 심지어 합성 DNA 분절을 포함할 수 있다. 당해 분야의 숙련자에 의해 상이한 촉진자가 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경학적 또는 생리학적 조건에 반응하여 유전자의 발현을 지시할 수 있는 것이 이해된다. 대부분의 세포 유형에서 유전자가 발현되게 하는 촉진자는 대부분의 때에 "구성적 촉진자"라 흔히 칭해진다. 특이적 세포 유형에서 유전자가 발현되게 하는 촉진자는 "세포 특이적 촉진자" 또는 "조직 특이적 촉진자"라 흔히 칭해진다. 특정한 발생 또는 세포 분화 단계에서 유전자가 발현되게 하는 촉진자는 "발생적 특이적 촉진자" 또는 "세포 분화 특이적 촉진자"라 흔히 칭해진다. 촉진자를 유도하는 물질, 생물학적 분자, 화학, 리간드, 광 등에 의한 세포의 노출 또는 처리 후 유전자가 발현되게 하거나 유도하는 촉진자는 "유도성 촉진자" 또는 "조절 가능한 촉진자"라 흔히 칭해진다. 대부분의 경우에 조절 서열의 정확한 경계가 완전히 한정되지 않으므로, 상이한 길이의 DNA 단편이 동일한 촉진자 활성을 가질 수 있는 것으로 추가로 인식된다.

촉진자 서열은 통상적으로 전사 개시 부위에 의해 이의 3' 말단에서 결합되고, 배경 위의 검출 가능한 수준에서 전사를 개시시키기 위해 필요한 염기 또는 유전요소의 최소 수를 포함하도록 상류(5' 방향)로 연장한다. (편리하게는 예를 들어 뉴클레아제 S1에 의한 맵핑에 의해 한정된) 전사 개시 부위, 및 RNA 중합효소의 결합을 담당하는 단백질 결합 도메인(공통 서열)이 촉진자 서열 내에 발견될 것이다.

용어 "제한 엔도뉴클레아제" 및 "제한 효소"는 상호 교환되어 사용되고, 이중 가닥 DNA 내의 특이적 뉴클레오타이드 서열을 결합하고 절단하는 효소를 의미한다.

용어 "플라스미드"는 보통 원형 이중 가닥 DNA 분자의 형태의 세포의 중추 대사의 부분이 아닌 유전자를 대개 운반하는 염색체외 유전요소를 의미한다. 이러한 유전요소는, 세포로 적절한 3' 비번역된 서열을 따라 선택된 유전자 산물에 대한 DNA 서열 및 촉진자 단편을 도입할 수 있는, 독특한 구성으로 다수의 뉴클레오타이드 서열이 연결되거나 재조합된, 임의의 공급원로부터 유래된, 단일 또는 이중 가닥 DNA 또는 RNA의 선형, 원형 또는 슈퍼코일링된, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있다.

사용될 수 있는 진핵생물 바이러스 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터, 아데노 연관된 바이러스 벡터, 폭스바이러스, 예를 들어 백시니아 바이러스 벡터, 바큘로바이러스 벡터 또는 헤르페스바이러스 벡터를 포함하지만, 이들로 제한되지는 않는다. 비바이러스 벡터는 플라스미드, 리포솜, 전기로 하전된 지질(사이토펙틴), DNA-단백질 복합체 및 바이오중합체를 포함한다.

"클로닝 벡터"는 순차적으로 복제하는 핵산의 단위 길이이고, 부착된 분절의 복제를 발생시키도록 또 다른 핵산 분절이 부착할 수 있는 복제 기원, 예컨대 플라스미드, 파지 또는 코스미드를 포함하는 "레플리콘"을 의미한다. 소정의 클로닝 벡터는 하나의 세포 유형, 예를 들어 박테리아에서의 복제 및 또 다른, 예를 들어 진핵생물 세포에서의 발현을 할 수 있다. 클로닝 벡터는 통상적으로 벡터를 포함하는 세포의 선택에 사용될 수 있는 하나 이상의 서열 및/또는 관심 대상의 핵산 서열의 삽입을 위한 하나 이상의 다수의 클로닝 부위를 포함한다.

용어 "발현 벡터"는 숙주 세포로의 삽입 후 삽입된 핵산 서열의 발현을 허용하도록 설계된 비히클을 의미한다. 삽입된 핵산 서열은 상기 기재된 바와 같은 조절 영역과 회합되어 작동적으로 위치한다.

벡터는 당해 분야에 널리 공지된 방법, 예를 들어 형질주입, 전기천공, 미량주사, 형질도입, 세포 융합, DEAE 덱스트란, 인산칼슘 침전, 리포펙션(리소좀 융합), 유전자 총의 사용 또는 DNA 벡터 운반체에 의해 숙주 세포로 도입된다.

본 명세서에 사용된 바와 같은, "배양", "에 대한 배양" 및 "배양하는"은 세포 성장 또는 분할을 허용하는 시험관내 조건 하에 세포를 배양하거나, 세포를 살아 있는 상태로 유지시키는 것을 의미한다. 본 명세서에 사용된 바와 같은, "배양된 세포"는 시험관내 증식된 세포를 의미한다.

본 명세서에 사용된 바와 같은, 용어 "폴리펩타이드"는 단일 "폴리펩타이드", 및 복수 "폴리펩타이드들"을 포함하도록 의도되고, 아미드 결합(펩타이드 결합으로도 공지됨)에 의해 직선으로 연결된 단량체(아미노산)로 이루어진 분자를 의미한다. 용어 "폴리펩타이드"는 2개 이상의 아미노산의 임의의 사슬 또는 사슬들을 의미하고, 생성물의 특정한 길이를 의미하지 않는다. 따라서, 펩타이드, 다이펩타이드, 트라이펩타이드, 올리고펩타이드, "단백질", "아미노산 사슬" 또는 2개 이상의 아미노산의 사슬 또는 사슬들을 의미하기 위해 사용된 임의의 다른 용어는 "폴리펩타이드"의 정의 내에 포함되고, 용어 "폴리펩타이드"는 임의의 이들 용어 대신에 또는 이것과 상호 교환되어 사용될 수 있다. 용어 "폴리펩타이드"는 제한 없이 글라이코실화, 아세틸화, 인산화, 아미드화, 공지된 보호기/차단기에 의한 유도체화, 단백질분해 절단, 또는 비천연 발생 아미노산에 의한 변형을 포함하는 폴리펩타이드의 발현 후 변형의 산물을 의미하는 것으로 또한 의도된다. 폴리펩타이드는 자연 생물학적 공급원 또는 제조된 재조합 기술로부터 유래될 수 있지만, 지정된 핵산 서열로부터 반드시 번역되지 않는다. 이것은 화학 합성을 포함하는 임의의 방식에 의해 생산될 수 있다.

용어 "아미노산"은 알라닌(Ala 또는 A); 아르기닌(Arg 또는 R); 아스파라긴(Asn 또는 N); 아스파르트산(Asp 또는 D); 시스테인(Cys 또는 C); 글루타민(Gln 또는 Q); 글루탐산(Glu 또는 E); 글라이신(Gly 또는 G); 히스티딘(His 또는 H); 아이소류신(Ile 또는 I): 류신(Leu 또는 L); 라이신(Lys 또는 K); 메티오닌(Met 또는 M); 페닐알라닌(Phe 또는 F); 프롤린(Pro 또는 P); 세린(Ser 또는 S); 트레오닌(Thr 또는 T); 트립토판(Trp 또는 W); 타이로신(Tyr 또는 Y); 및 발린(Val 또는 V)을 포함한다. 비전통적인 아미노산은 또한 본 개시내용의 범위 내에 있고, 노르류신, 오미틴, 노르발린, 호모세린 및 다른 아미노산 잔기 유사체, 예컨대 문헌[Ellman et al. Meth. Enzym. 202:301-336 (1991)]에 기재된 것을 포함한다. 이러한 비천연 발생 아미노산 잔기를 생성하기 위해, 문헌[Noren et al. Science 244:182 (1989)] 및 상기 Ellman 등의 문헌의 절차를 이용할 수 있다. 간단히 말하면, 이 절차는 비천연 발생 아미노산 잔기에 의한 억제자 tRNA의 화학 활성화, 이어서 RNA의 시험관내 전사 및 번역을 수반한다. 비전통적인 아미노산의 도입은 당해 분야에 공지된 펩타이드 화학을 이용하여 또한 달성될 수 있다. 본 명세서에 사용된 바와 같은, 용어 "극성 아미노산"은 0의 순 전하를 갖지만 이의 측쇄의 상이한 부분에서 0이 아닌 부분 전하를 갖는 아미노산(예를 들어, M, F, W, S, Y, N, Q, C)을 포함한다. 이 아미노산은 소수성 상호작용 및 정전기 상호작용에 참여할 수 있다. 본 명세서에 사용된 바와 같은, 용어 "하전된 아미노산"은 이의 측쇄에서 0이 아닌 순 전하를 가질 수 있는 아미노산(예를 들어, R, K, H, E, D)을 포함한다. 이 아미노산은 소수성 상호작용 및 정전기 상호작용에 참여할 수 있다.

폴리펩타이드의 단편 또는 변이체, 및 임의의 이들의 조합이 본 개시내용에 또한 포함된다. 용어 "단편" 또는 "변이체"는, 본 개시내용의 폴리펩타이드 결합 도메인 또는 결합 분자를 언급할 때, 기준 폴리펩타이드의 적어도 약간의 특성(예를 들어, FcRn 결합 도메인 또는 Fc 변이체에 대한 FcRn 결합 친화도, FVIII 변이체에 대한 응고 활성 또는 VWF 단편에 대한 FVIII 결합 활성)을 보유하는 임의의 폴리펩타이드를 포함한다. 폴리펩타이드의 단편은 본 명세서에서 그 외 기재된 특이적 항체 단편 이외에 단백질분해 단편, 및 결실 단편을 포함하지만, 천연 발생 전장 폴리펩타이드(또는 성숙 폴리펩타이드)를 포함하지 않는다. 본 개시내용의 폴리펩타이드 결합 도메인 또는 결합 분자의 변이체는 상기 기재된 바와 같은 단편, 및 또한 아미노산 치환, 결실 또는 삽입으로 인해 변경된 아미노산 서열을 갖는 폴리펩타이드를 포함한다. 변이체는 천연 또는 비천연 발생일 수 있다. 비천연 발생 변이체는 분야 공지된 돌연변이유발 기법을 이용하여 제조될 수 있다. 변이체 폴리펩타이드는 보존적 또는 비보존적 아미노산 치환, 결실 또는 부가를 포함할 수 있다.

"보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기에 의해 대체된 것이다. 염기성 측쇄(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄(예를 들어, 아스파르트산, 글루탐산), 비하전된 극성 측쇄(예를 들어, 글라이신, 아스파라긴, 글루타민, 세린, 트레오닌, 타이로신, 시스테인), 비극성 측쇄(예를 들어, 알라닌, 발린, 류신, 아이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지된 측쇄(예를 들어, 트레오닌, 발린, 아이소류신) 및 방향족 측쇄(예를 들어, 타이로신, 페닐알라닌, 트립토판, 히스티딘)를 포함하는 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 당해 분야에 정의되어 있다. 따라서, 폴리펩타이드에서의 아미노산이 동일한 측쇄 패밀리로부터의 또 다른 아미노산에 의해 대체되는 경우, 치환은 보존적인 것으로 생각된다. 또 다른 실시형태에서, 아미노산의 스트링은 측쇄 패밀리 구성원의 조성 및/또는 순서가 다른 구조적으로 유사한 스트링에 의해 보존적으로 대체될 수 있다.

당해 분야에 공지된 바와 같은 용어 "동일성 백분율"은, 서열을 비교함으로써 결정된 바와 같은, 2개 이상의 폴리펩타이드 서열 또는 2개 이상의 폴리뉴클레오타이드 서열 사이의 관계이다. 당해 분야에서, "동일성"은 또한, 이러한 서열의 스트링 사이의 매치에 의해 결정된 바대로, 그 경우에서처럼, 폴리펩타이드 또는 폴리뉴클레오타이드 서열 사이의 서열 관련성의 정도를 의미한다. "동일성"은 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988); Biocomputing : Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991)]에 기재된 것(이들로 제한되지는 않음)을 포함하는 공지된 방법에 의해 용이하게 계산될 수 있다. 동일성을 결정하기 위한 바람직한 방법은 시험된 서열 사이의 최고의 매치를 주도록 설계된다. 동일성을 결정하기 위한 방법은 공공으로 이용 가능한 컴퓨터 프로그램에서 코드화된다. 서열 정렬 및 동일성 백분율 계산은 서열 분석 소프트웨어, 예컨대 LASERGENE bioinformatics computing suite의 Megalign 프로그램(DNASTAR Inc.(위스콘신주 매디슨)), 프로그램의 GCG 스위트(Wisconsin Package 버전 9.0, Genetics Computer Group (GCG)(위스콘신주 매디슨)), BLASTP, BLASTN, BLASTX(Altschul et al., J. Mol . Biol . 215:403 (1990)) 및 DNASTAR(DNASTAR, Inc.(미국 위스콘신주 53715 매디슨 스트리트 에스. 파크 1228))을 이용하여 수행될 수 있다. 본 출원의 맥락 내에, 서열 분석 소프트웨어가 분석에 사용되는 경우, 분석의 이 결과가, 달리 기재되지 않는 한, 언급된 프로그램의 "디폴트 값"에 기초한다고 이해될 것이다. 본 명세서에 사용된 바와 같은, "디폴트 값"은 처음에 초기설정될 때 소프트웨어에 의해 원래 로딩하는 값 또는 매개변수의 임의의 세트를 의미할 것이다. 본 개시내용의 최적화된 BDD FVIII 서열과 기준 서열 사이의 동일성(%)을 결정할 목적을 위해, 본 개시내용의 최적화된 BDD FVIII 서열에서의 뉴클레오타이드에 상응하는 기준 서열에서의 뉴클레오타이드만을 사용하여 동일성(%)을 계산한다. 예를 들어, B 도메인을 함유하는 전장 FVIII 뉴클레오타이드 서열을 본 개시내용의 최적화된 B 도메인 결실된(BDD) FVIII 뉴클레오타이드 서열과 비교할 때, A1, A2, A3, C1 및 C2 도메인을 포함하는 정렬의 부분을 사용하여 동일성(%)을 계산한다. (정렬에서의 큰 "갭"을 생성시키는) B 도메인을 코딩하는 전장 FVIII 서열의 부분에서의 뉴클레오타이드는 미스매치로서 계산되지 않을 것이다. 또한, 본 개시내용의 최적화된 BDD FVIII 서열, 또는 이의 지정된 부분(예를 들어, 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드)과 기준 서열 사이의 동일성(%)을 결정하는 데 있어서, 동일성(%)은 본 명세서에서 언급된 바와 같은 최적화된 BDD-FVIII 서열, 또는 이의 지정된 부분의 완전한 서열에서의 뉴클레오타이드의 전체 수로 매칭된 뉴클레오타이드의 수를 나눈 것을 정렬함으로써 계산될 것이다.

본 명세서에 사용된 바와 같은, "본 개시내용의 최적화된 BDD FVIII 서열에서의 뉴클레오타이드에 상응하는 뉴클레오타이드"는 기준 FVIII 서열과의 동일성을 최대화하기 위해 본 개시내용의 최적화된 BDD FVIII 서열의 정렬에 의해 확인된다. 기준 FVIII 서열에서의 동등한 아미노산을 확인하기 위해 사용된 수는 본 개시내용의 최적화된 BDD FVIII 서열에서의 상응하는 아미노산을 확인하기 위해 사용된 수에 기초한다.

"융합" 또는 "키메라" 단백질은 성질상 자연에서 연결되지 않는 제2 아미노산 서열에 연결된 제1 아미노산 서열을 의미한다. 별개의 단백질에 보통 존재하는 아미노산 서열은 융합 폴리펩타이드에 함께 놓일 수 있거나, 동일한 단백질에 보통 존재하는 아미노산 서열은 융합 폴리펩타이드에서의 새로운 배열에, 예를 들어 Ig Fc 도메인에 의한 본 개시내용의 VIII 인자 도메인의 융합에 위치할 수 있다. 융합 단백질은 예를 들어 화학 합성에 의해 또는 펩타이드 영역이 원하는 관계에서 코딩된 폴리뉴클레오타이드를 생성하고 번역함으로써 생성된다. 키메라 단백질은 공유, 비펩타이드 결합 또는 비공유 결합에 의해 제1 아미노산 서열과 회합된 제2 아미노산 서열을 추가로 포함할 수 있다.

본 명세서에 사용된 바와 같은, 용어 "삽입 부위"는 비상동성 모이어티가 삽입될 수 있는 위치의 바로 상류인 FVIII 폴리펩타이드, 또는 이의 단편, 변이체 또는 유도체에서의 위치를 의미한다. "삽입 부위"는 숫자로서 지정되고, 숫자는 삽입의 위치에 바로 N 말단인 삽입 부위가 상응하는 성숙 네이티브 FVIII(서열 번호 15; 도 11a)에서의 아미노산의 수이다. 예를 들어, 구절 "a3은 서열 번호 15의 1656번 아미노산에 상응하는 삽입 부위에서의 비상동성 모이어티를 포함한다"는 비상동성 모이어티가 서열 번호 15의 1656번 아미노산 및 1657번 아미노산에 상응하는 2개의 아미노산 사이에 위치한다는 것을 나타낸다.

본 명세서에 사용된 바와 같은, 구절 "아미노산의 바로 하류"는 아미노산의 말단 카복실기의 바로 옆의 위치를 의미한다. 유사하게, 구절 "아미노산의 바로 상류"는 아미노산의 말단 아민기의 바로 옆의 위치를 의미한다.

본 명세서에 사용된 바와 같은, 용어 "삽입된", "삽입되는", "로 삽입된" 또는 문법상 관련된 용어는 네이티브 성숙 인간 FVIII에서 유사한 위치에 대한 재조합 FVIII 폴리펩타이드에서의 비상동성 모이어티의 위치를 의미한다. 본 명세서에 사용된 바와 같은, 상기 용어는 네이티브 성숙 인간 FVIII에 대한 재조합 FVIII 폴리펩타이드의 특징을 의미하고, 재조합 FVIII 폴리펩타이드가 제조되는 임의의 방법 또는 공정을 표시하거나 함축하거나 암시하지 않는다.

본 명세서에 사용된 바와 같은, 용어 "반감기"는 생체내 특정한 폴리펩타이드의 생물학적 반감기를 의미한다. 반감기는 순환으로부터 청소되는 대상체 및/또는 동물에서의 다른 조직에 투여되는 분량의 반에 필요한 시간에 의해 표시될 수 있다. 소정의 폴리펩타이드의 청소율 곡선이 시간의 함수로서 작도될 때, 곡선은 보통 신속한 α-상 및 더 긴 β-상에 의해 이상성이다. α-상은 통상적으로 혈관내 공간과 혈관외 공간 사이의 투여된 Fc 폴리펩타이드의 평형을 나타내고, 부분적으로 폴리펩타이드의 크기에 의해 결정된다. β-상은 통상적으로 혈관내 공간에서의 폴리펩타이드의 이화작용을 나타낸다. 몇몇 실시형태에서, FVIII 및 FVIII를 포함하는 키메라 단백질은 단상성이고, 이에 따라 알파 상을 갖지 않고, 단지 단일 베타 상을 갖는다. 따라서, 소정의 실시형태에서, 본 명세서에 사용된 바와 같은 용어 반감기는 β-상에서의 폴리펩타이드의 반감기를 의미한다.

본 명세서에 사용된 바와 같은, 용어 "연결된"은 각각 제2 아미노산 서열 또는 뉴클레오타이드 서열에 공유로 또는 비공유로 연결된 제1 아미노산 서열 또는 뉴클레오타이드 서열을 의미한다. 제1 아미노산 또는 뉴클레오타이드 서열은 제2 아미노산 또는 뉴클레오타이드 서열에 직접적으로 연결되거나 병치될 수 있거나, 대안적으로 중재하는 서열은 제1 서열을 제2 서열에 공유로 연결할 수 있다. 용어 "연결된"은 C 말단 또는 N 말단에서의 제2 아미노산 서열에 대한 제1 아미노산 서열의 융합을 의미할 뿐만 아니라, 제2 아미노산 서열(또는 각각 제1 아미노산 서열)에서의 임의의 2개의 아미노산으로의 전체 제1 아미노산 서열(또는 제2 아미노산 서열)의 삽입을 포함한다. 일 실시형태에서, 제1 아미노산 서열은 펩타이드 결합 또는 링커에 의해 제2 아미노산 서열에 연결될 수 있다. 제1 뉴클레오타이드 서열은 포스포디에스터 결합 또는 링커에 의해 제2 뉴클레오타이드 서열에 연결될 수 있다. 링커는 펩타이드 또는 폴리펩타이드(폴리펩타이드 사슬의 경우) 또는 뉴클레오타이드 또는 뉴클레오타이드 사슬(뉴클레오타이드 사슬의 경우) 또는 임의의 화학 모이어티(폴리펩타이드 및 폴리뉴클레오타이드 사슬 둘 다의 경우)일 수 있다. 용어 "연결된"은 또한 하이폰(-)으로 표시된다.

본 명세서에 사용된 바와 같은, 용어 "회합된"은 제1 아미노산 사슬과 제2 아미노산 사슬 사이에 형성된 공유 또는 비공유 결합을 의미한다. 일 실시형태에서, 용어 "회합된"은 공유, 비펩타이드 결합 또는 비공유 결합을 의미한다. 이 회합은 콜론, 즉 (:)으로 표시될 수 있다. 또 다른 실시형태에서, 이것은 펩타이드 결합을 제외한 공유 결합을 의미한다. 예를 들어, 아미노산 시스테인은 이황화 결합을 형성할 수 있는 티올기 또는 제2 시스테인 잔기에서의 티올기와의 브릿지를 포함한다. 대부분의 천연 발생 IgG 분자에서, CH1 및 CL 영역은 이황화 결합에 의해 회합되고, 2개의 중쇄는 Kabat 넘버링 시스템(226번 또는 229번 위치, EU 넘버링 시스템)을 이용하여 239번 및 242번에 상응하는 위치에서 2개의 이황화 결합에 의해 회합된다. 공유 결합의 예는 펩타이드 결합, 금속 결합, 수소 결합, 이황화 결합, 시그마 결합, pi 결합, 델타 결합, 글라이코시드 결합, 아그노스트 결합(agnostic bond), 굽은 결합, 이극성 결합, Pi 골격, 이중 결합, 삼중 결합, 사중 결합, 오중 결합, 육중 결합, 공액, 초공액, 아로마시티, 합티시티(hapticity) 또는 반결합을 포함하지만, 이들로 제한되지는 않는다. 비공유 결합의 비제한적인 예는 이온성 결합(예를 들어, 양이온-pi 결합 또는 염 결합), 금속 결합, 수소 결합(예를 들어, 이수소 결합, 이수소 복합체, 저장벽 수소 결합, 또는 대칭 수소 결합), 반 데르 발스 힘, 런던 분산 힘, 기계적 결합, 할로겐 결합, 친금성(aurophilicity), 치윤, 스태킹, 엔트로프 힘 또는 화학 극성을 포함한다.

본 명세서에서 사용되는 용어 "단량체-이합체 하이브리드"는 이황화 결합에 의해 서로 회합된 제1 폴리펩타이드 사슬 및 제2 폴리펩타이드 사슬을 포함하는 키메라 단백질을 의미하고, 제1 사슬은 응고 인자, 예를 들어 VIII 인자 및 제1 Fc 영역을 포함하고, 제2 사슬은 응고 인자가 없는 제2 Fc 영역을 포함하거나, 본질적으로 이것으로 이루어지거나, 이것으로 이루어진다. 단량체-이합체 하이브리드 작제물은 따라서 적어도 하나의 응고 인자를 갖는 단량체 양태 및 2개의 Fc 영역을 갖는 이합체 양태를 포함하는 하이브리드이다.

본 명세서에 사용된 바와 같은, 지혈은 출혈 또는 대출혈의 중지 또는 느려짐; 또는 혈관 또는 신체 부분을 통한 혈류의 느려짐 또는 저속을 의미한다.

본 명세서에 사용된 바와 같은, 지혈 장애는 자발적으로 또는 외상의 결과로서, 피브린 혈전을 형성하는 것의 손상된 능력 또는 불능으로 인해 대출혈에 대한 경향을 특징으로 하는 유전적인 선천적 또는 후천적 병태를 의미한다. 3개의 주요 형태는 A 혈우병(VIII 인자 결핍증), B 혈우병(IX 인자 결핍증 또는 "크리스마스 질환") 및 C 혈우병(XI 인자 결핍증, 경증 출혈 경향)이다. 다른 지혈 장애는 예를 들어 폰 빌레브란트 질환, XI 인자 결핍증(PTA 결핍증), XII 인자 결핍증, 피브리노겐, 프로트롬빈, V 인자, VII 인자, X 인자 또는 XIII 인자에서의 결핍증 또는 구조적 비정상, GPIb에서의 결함 또는 결핍증인 베르나르-술리에(Bernard-Soulier) 증후군을 포함한다. vWF에 대한 수용체인 GPIb는 결함성일 수 있고, 1차 혈전 형성(1차 지혈)의 부족 및 증가한 출혈 경향, 및 글랜즈먼(Glanzman) 및 네젤리(Naegeli)의 혈소판기능저하증(글랜즈먼 혈소판기능저하증)을 발생시켰다. 간부전(급성 및 만성 형태)에서, 간에 의한 응고 인자의 불충분한 생성이 존재하고; 이는 출혈 위험을 증가시킬 수 있다.

본 개시내용의 단리된 핵산 분자, 단리된 폴리펩타이드 또는 단리된 핵산 분자를 포함하는 벡터는 예방학적으로 사용될 수 있다. 본 명세서에 사용된 바와 같은, 용어 "예방학적 치료"는 출혈 삽화 전의 분자의 투여를 의미한다. 일 실시형태에서, 일반적인 지혈제를 요하는 대상체는 수술을 겪고 있거나 막 겪을 것이다. 본 개시내용의 폴리뉴클레오타이드, 폴리펩타이드 또는 벡터는 예방학적으로 수술 전에 또는 후에 투여될 수 있다. 본 개시내용의 폴리뉴클레오타이드, 폴리펩타이드 또는 벡터는 급성 출혈 삽화를 제어하기 위해 수술 동안에 또는 후에 투여될 수 있다. 수술은 간 이식, 간 절제, 치과 시술 또는 줄기 세포 이식을 포함할 수 있지만, 이들로 제한되지는 않는다.

본 개시내용의 단리된 핵산 분자, 단리된 폴리펩타이드 또는 벡터는 요구 시 치료에 또한 사용된다. 용어 "요구 시 치료"는 출혈 삽화의 증상에 반응하거나 출혈을 야기할 수 있는 활동 전의 단리된 핵산 분자, 단리된 폴리펩타이드 또는 벡터의 투여를 의미한다. 일 양태에서, 유구 시 치료는 출혈이 시작할 때, 예컨대 손상 후 또는 출혈이 예상될 때, 예컨대 수술 전 대상체에게 주어질 수 있다. 또 다른 양태에서, 요구 시 치료는 접촉 스포츠와 같은 출혈의 위험을 증가시키는 활동 전에 주어질 수 있다.

본 명세서에 사용된 바와 같은, 용어 "급성 출혈"은 기초하는 원인과 무관하게 출혈 삽화를 의미한다. 예를 들어, 대상체는 외상, 요독증, 유전성 출혈 장애(예를 들어, VII 인자 결핍증) 혈소판 장애 또는 응고 인자에 대한 항체의 발생으로 인한 내성을 가질 수 있다.

본 명세서에 사용된 바와 같은, 치료한다, 치료, 치료하는 것은 예를 들어 질환 또는 병태의 중증도의 감소; 질환 과정의 기간의 감소; 질환 또는 병태와 연관된 하나 이상의 증상의 경감; 질환 또는 병태를 반드시 치유할 필요 없이 질환 또는 병태를 갖는 대상체에 대한 유리한 효과의 제공; 또는 질환 또는 병태와 연관된 하나 이상의 증상의 예방책을 의미한다. 일 실시형태에서, 용어 "치료하는 것" 또는 "치료"는 본 개시내용의 단리된 핵산 분자, 단리된 폴리펩타이드 또는 벡터를 투여함으로써 대상체에서 적어도 약 1IU/㎗, 2IU/㎗, 3IU/㎗, 4IU/㎗, 5IU/㎗, 6IU/㎗, 7IU/㎗, 8IU/㎗, 9IU/㎗, 10IU/㎗, 11IU/㎗, 12IU/㎗, 13IU/㎗, 14IU/㎗, 15IU/㎗, 16IU/㎗, 17IU/㎗, 18IU/㎗, 19IU/㎗, 또는 20IU/㎗의 FVIII 트로프 수준을 유지시키는 것을 의미한다. 또 다른 실시형태에서, 치료하는 것 또는 치료는 약 1 내지 약 20IU/㎗, 약 2 내지 약 20IU/㎗, 약 3 내지 약 20IU/㎗, 약 4 내지 약 20IU/㎗, 약 5 내지 약 20IU/㎗, 약 6 내지 약 20IU/㎗, 약 7 내지 약 20IU/㎗, 약 8 내지 약 20IU/㎗, 약 9 내지 약 20IU/㎗, 또는 약 10 내지 약 약 20IU/㎗의 FVIII 트로프 수준을 유지시키는 것을 의미한다. 질환 또는 병태의 치료 또는 치료하는 것은 또한 비혈우병 대상체에서 FVIII 활성의 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% 또는 20%에 필적하는 수준에서 대상체에서 FVIII 활성을 유지시키는 것을 포함할 수 있다. 치료에 필요한 최소 트로프 수준은 하나 이상의 공지된 방법에 의해 측정될 수 있고, 각각의 사람에 대해 조정(증가 또는 감소)될 수 있다.

본 명세서에 사용된 바와 같은, "투여하는"은 약제학적으로 허용 가능한 경로를 통해 대상체에게 약제학적으로 허용 가능한 VIII 인자 코딩 핵산 분자, VIII 인자 폴리펩타이드 또는 본 개시내용의 VIII 인자 코딩 핵산 분자를 포함하는 벡터를 주는 것을 의미한다. 투여 경로는 정맥내, 예를 들어 정맥내 주사 및 정맥내 점적주사일 수 있다. 추가 투여 경로는 예를 들어 피하, 근육내, 경구, 비강 및 폐 투여를 포함한다. 핵산 분자, 폴리펩타이드 및 벡터는 적어도 하나의 부형제를 포함하는 약제학적 조성물의 부분으로 투여될 수 있다.

본 명세서에 사용된 바와 같은, 구절 "이를 요하는 대상체"는, 예를 들어 지혈을 개선하도록, 본 개시내용의 핵산 분자, 폴리펩타이드 또는 벡터의 투여로부터 이익일 수 있는 대상체, 예컨대 포유류 대상체를 포함한다. 일 실시형태에서, 대상체는 혈우병을 갖는 개인을 포함하지만, 이들로 제한되지는 않는다. 또 다른 실시형태에서, 대상체는 FVIII 저해제를 발생시키지 않고 이에 따라 우회 치료를 요하는 개인을 포함하지만, 이들로 제한되지는 않는다. 대상체는 성인 또는 미성년자(예를 들어, 12세 미만)일 수 있다.

본 명세서에 사용된 바와 같은, 용어 "응고 인자"는 대상체에서의 출혈 삽화를 예방하거나 이의 기간을 감소시키는, 천연 발생 또는 재조합으로 생산된, 분자, 또는 이의 유사체를 의미한다. 즉, 이것은 응고촉진 활성을 갖는 분자를 의미하고, 즉 혈액이 응고되거나 혈전형성하도록 불용성 피브린의 메쉬로 피브리노겐의 전환을 담당한다. "활성화 가능한 응고 인자"는 활성 형태로 전환될 수 있는 불활성 형태의(예를 들어, 이의 지모겐 형태의) 응고 인자이다.

본 명세서에 사용된 바와 같은, 응고 활성은 피브린 혈전의 형성에서 절정을 이루고/이루거나, 대출혈 또는 출혈 삽화의 중증도, 기간 또는 빈도를 감소시키는 생화학적 반응의 캐스케이드에 참여하는 능력을 의미한다.

본 명세서에 사용된 바와 같은, 용어 "비상동성" 또는 "외인성"은 소정의 환경, 예를 들어 세포 또는 폴리펩타이드에서 보통 발견되지 않는 분자를 의미한다. 예를 들어, 외인성 또는 비상동성 분자는 세포로 도입될 수 있고, 예를 들어 형질주입 또는 유전자 조작의 다른 형태에 의해 세포의 조작 후 오직 존재하거나, 비상동성 아미노산 서열은 이것이 자연에서 발견되지 않는 단백질에 존재할 수 있다.

본 명세서에 사용된 바와 같은, 용어 "비상동성 뉴클레오타이드 서열"은 소정의 폴리뉴클레오타이드 서열에 의해 자연에서 발생하지 않는 뉴클레오타이드 서열을 의미한다. 일 실시형태에서, 비상동성 뉴클레오타이드 서열은 FVIII의 반감기를 연장시킬 수 있는 폴리펩타이드를 코딩한다. 또 다른 실시형태에서, 비상동성 뉴클레오타이드 서열은 FVIII의 수력학적 반경을 증가시키는 폴리펩타이드를 코딩한다. 다른 실시형태에서, 비상동성 뉴클레오타이드 서열은 이의 생물학적 활성 또는 기능(예를 들어, 이의 응혈 활성)에 유의미하게 영향을 미치지 않으면서 FVIII의 하나 이상의 약동역학 특성을 개선하는 폴리펩타이드를 코딩한다. 몇몇 실시형태에서, FVIII는 링커에 의해 비상동성 뉴클레오타이드 서열에 의해 코딩된 폴리펩타이드에 결합되거나 연결된다. 비상동성 뉴클레오타이드 서열에 의해 코딩된 폴리펩타이드 모이어티의 비제한적인 예는 면역글로불린 불변 영역 또는 이의 부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, 트랜스페린, 미국 특허 출원 제20100292130호의 PAS 폴리펩타이드, HAP 서열, 트랜스페린 또는 이의 단편, 인간 융모성 고나도트로핀의 β 아단위의 C 말단 펩타이드(CTP), 알부민 결합 소분자, XTEN 서열, FcRn 결합 모이어티(예를 들어, FcRn에 결합하는 완전한 Fc 영역 또는 이의 부분), 단쇄 Fc 영역(예를 들어, US 제2008/0260738호, WO 제2008/012543호 또는 WO 제2008/1439545호에 기재된 바와 같은 ScFc 영역), 폴리글라이신 링커, 폴리세린 링커, 펩타이드 및 무엇보다도 50% 미만 내지 50% 초과의 다양한 정도의 2차 구조를 갖는 글라이신(G), 알라닌(A), 세린(S), 트레오닌(T), 글루타메이트(E) 및 프롤린(P)으로부터 선택된 아미노산의 2개의 유형의 6개 내지 40개의 아미노산의 짧은 폴리펩타이드, 또는 2개 이상의 이들의 조합을 포함한다. 몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열에 의해 코딩된 폴리펩타이드는 비폴리펩타이드 모이어티에 연결된다. 비폴리펩타이드 모이어티의 비제한적인 예는 폴리에틸렌 글라이콜(PEG), 알부민 결합 소분자, 폴리시알산, 하이드록시에틸 전분(HES), 이의 유도체, 또는 임의의 이들의 조합을 포함한다.

본 명세서에 사용된 바와 같은, 용어 "Fc 영역"은 네이티브 Ig의 Fc 영역에 상응하는 폴리펩타이드의 부분, 즉 이의 2개의 중쇄의 각각의 Fc 도메인의 이합체 회합에 의해 형성된 것으로 정의된다. 네이티브 Fc 영역은 또 다른 Fc 영역과 동종이합체를 형성한다. 반대로, 본 명세서에 사용된 바와 같은, 용어 "유전자 융합된 Fc 영역" 또는 "단쇄 Fc 영역"(scFc 영역)은 단일 폴리펩타이드 사슬 내에 유전자 연결된(즉, 단일 인접한 유전자 서열에서 코딩된) Fc 도메인으로 이루어진 합성 이합체 Fc 영역을 의미한다.

일 실시형태에서, "Fc 영역"은 파파인 절단 부위(즉, IgG에서의 216번 잔기, 114번인 중쇄 불변 영역의 제1 잔기를 취함)의 바로 상류에 힌지 영역에서 출발하고 항체의 C 말단에서 끝나는 단일 Ig 중쇄의 부분을 의미한다. 따라서, 완전한 Fc 도메인은 적어도 힌지 도메인, CH2 도메인 및 CH3 도메인을 포함한다.

Ig 불변 영역의 Fc 영역은, Ig 아이소타입에 따라, CH2, CH3 및 CH4 도메인, 및 힌지 영역을 포함할 수 있다. Ig의 Fc 영역을 포함하는 키메라 단백질은 증가한 안정성, 증가한 혈청 반감기(문헌[Capon et al., 1989, Nature 337:525] 참조), 및 Fc 수용체, 예컨대 신생아 Fc 수용체(FcRn)에 대한 결합(미국 특허 제6,086,875호, 제6,485,726호, 제6,030,613호; WO 제03/077834호; US 제2003-0235536A1호)(본 명세서에 그 전문이 참고로 포함됨)을 포함하는 키메라 단백질에 대한 몇몇 원하는 특성을 부여한다.

"기준 뉴클레오타이드 서열"은, 본 개시내용의 뉴클레오타이드 서열에 대한 비교로서 본 명세서에서 사용될 때, FVIII 서열에 상응하는 부분이 최적화되지 않는다는 것을 제외하고 본 개시내용의 뉴클레오타이드 서열과 본질적으로 동일한 폴리뉴클레오타이드 서열이다. 예를 들어, 서열 번호 1의 코돈 최적화된 BDD FVIII로 이루어진 핵산 분자에 대한 기준 뉴클레오타이드 서열 및 3' 말단에서의 서열 번호 1에 연결된 단쇄 Fc 영역을 코딩하는 비상동성 뉴클레오타이드 서열은 서열 번호 16의 원래의(또는 "모") BDD FVIII(도 1i) 및 3' 말단에서 서열 번호 16에 연결된 단쇄 Fc 영역을 코딩하는 동일한 비상동성 뉴클레오타이드 서열로 이루어진 핵산 분자이다.

본 명세서에 사용된 바와 같은, "코돈 적응 지수"는 코돈 사용빈도 바이어스의 측정치를 의미한다. 코돈 적응 지수(CAI)는 유전자의 기준 세트와 관련하여 소정의 단백질 코딩 유전자 서열의 편차를 측정한다(Sharp PM and Li WH, Nucleic Acids Res. 15(3):1281-95 (1987). CAI는 (코돈에서 측정된) 유전자 서열의 길이에 걸쳐 각각의 코돈과 연관된 중량의 기하 평균을 결정함으로써 계산된다:

(I)

각각의 아미노산에 대해, CAI에서의 이의 코돈의 각각의 중량은 코돈(fi)의 관찰된 빈도와 그 아미노산에 대한 동의적 코돈(fj)의 빈도 사이의 비율로서 계산된다:

식 2:

(II)

본 명세서에 사용된 바와 같은, 뉴클레오타이드 서열과 관련하여, 용어 "최적화된"은 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 의미하고, 폴리뉴클레오타이드 서열은 그 폴리뉴클레오타이드 서열의 특성을 증대시키도록 돌연변이된다. 몇몇 실시형태에서, 최적화는 전사 수준을 증가시키거나, 번역 수준을 증가시키거나, 정상 상태 mRNA 수준을 증가시키거나, 조절 단백질, 예컨대 일반적인 전사 인자의 결합을 증가 또는 감소시키거나, 스플라이싱을 증가 또는 감소시키거나, 폴리뉴클레오타이드 서열에 의해 생성된 폴리펩타이드의 수율을 증가시키기 위해 수행된다. 폴리뉴클레오타이드 서열을 최적화하기 위해 이것에 이루어질 수 있는 변경의 예는 코돈 최적화, G/C 함량 최적화, 반복 서열의 제거, AT 농후 유전요소의 제거, 은성(cryptic) 슬라이스 부위의 제거, 전사 또는 번역을 억제하는 시스 작용성 유전요소의 제거, 폴리-T 또는 폴리-A 서열의 부가 또는 제거, 전사를 증대시키는 전사 시작 부위 주의의 서열, 예컨대 Kozak 공통 서열의 부가, 줄기 루프 구조를 형성하는 서열의 제거, 탈안정화 서열의 제거, 및 2개 이상의 이들의 조합을 포함한다.

FVIII 단백질을 코딩하는 폴리뉴클레오타이드 서열

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 분자에 관한 것이다. 몇몇 실시형태에서, 폴리뉴클레오타이드는 전장 FVIII 폴리펩타이드를 코딩한다. 다른 실시형태에서, 핵산 분자는 B 도메인 결실된(BDD) FVIII 폴리펩타이드를 코딩하고, FVIII의 B 도메인의 전부 또는 일부는 결실된다. 하나의 특정한 실시형태에서, 핵산 분자는 서열 번호 17(도 1j) 또는 이의 단편과 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드를 코딩한다. 일 실시형태에서, 핵산 분자는 서열 번호 17 또는 이의 단편의 아미노산 서열을 갖는 폴리펩타이드를 코딩한다.

몇몇 실시형태에서, 본 개시내용의 핵산 분자는 신호 펩타이드 또는 이의 단편을 포함하는 FVIII 폴리펩타이드를 코딩한다. 다른 실시형태에서, 핵산 분자는 신호 펩타이드가 결여된 FVIII 폴리펩타이드를 코딩한다. 몇몇 실시형태에서, 신호 펩타이드는 서열 번호 17의 1번 내지 19번 아미노산을 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 하나의 특정한 실시형태에서, 제1 핵산 서열은 서열 번호 3의 58번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 또 다른 실시형태에서, 제1 핵산 서열은 서열 번호 4의 58번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 제1 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 4의 58번 내지 1791번 뉴클레오타이드를 포함한다.

다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 일 실시형태에서, 제1 뉴클레오타이드 서열은 서열 번호 3의 1번 내지 1791번 뉴클레오타이드 또는 서열 번호 4의 1번 내지 1791번 뉴클레오타이드를 포함한다. 또 다른 실시형태에서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 하나의 특정한 실시형태에서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 또 다른 실시형태에서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 3의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 4374번 뉴클레오타이드)와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 하나의 특정한 실시형태에서, 제2 뉴클레오타이드 서열은 서열 번호 3의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 3의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 4의 1792번 내지 4374번 뉴클레오타이드)를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 소정의 실시형태에서, 제2 핵산 서열은 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 제2 핵산 서열은 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 하나의 특정한 실시형태에서, 제2 핵산 서열은 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드를 포함한다. 몇몇 실시형태에서, 상기 기재된 제2 핵산 서열에 연결된 제1 핵산 서열은 서열 번호 5의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 6의 58번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 상기 기재된 제2 핵산 서열에 연결된 제1 핵산 서열은 서열 번호 5의 1번 내지 1791번 뉴클레오타이드 또는 서열 번호 6의 1번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다.

다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드) 또는 (ⅱ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 소정의 실시형태에서, 제2 핵산 서열은 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드)와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 제2 핵산 서열은 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 하나의 특정한 실시형태에서, 제2 핵산 서열은 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드 또는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)를 포함한다. 몇몇 실시형태에서, 상기 기재된 제2 핵산 서열에 연결된 제1 핵산 서열은 서열 번호 5의 58번 내지 1791번 뉴클레오타이드 또는 서열 번호 6의 58번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 상기 기재된 제2 핵산 서열에 연결된 제1 핵산 서열은 번호 5의 1번 내지 1791번 뉴클레오타이드 서열 또는 서열 번호 6의 1번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다.

몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 1의 58번 내지 1791번 뉴클레오타이드, (ⅱ) 서열 번호 2의 58번 내지 1791번 뉴클레오타이드, (ⅲ) 서열 번호 70의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 58번 내지 1791번 뉴클레오타이드와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 다른 실시형태에서, 제1 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 1791번 뉴클레오타이드, 서열 번호 2의 58번 내지 1791번 뉴클레오타이드, (ⅲ) 서열 번호 70의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 58번 내지 1791번 뉴클레오타이드를 포함한다.

다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 1의 1번 내지 1791번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1번 내지 1791번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1번 내지 1791번 뉴클레오타이드와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 일 실시형태에서, 제1 뉴클레오타이드 서열은 서열 번호 1의 1번 내지 1791번 뉴클레오타이드, 서열 번호 2의 1번 내지 1791번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1번 내지 1791번 뉴클레오타이드를 포함한다. 또 다른 실시형태에서, 제1 뉴클레오타이드 서열에 연결된 제2 뉴클레오타이드 서열은 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 하나의 특정한 실시형태에서, 제1 뉴클레오타이드 서열에 연결된 제2 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드를 포함한다. 다른 실시형태에서, 제1 뉴클레오타이드 서열에 연결된 제2 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 일 실시형태에서, 제2 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 하나의 특정한 실시형태에서, 제2 핵산 서열은 (ⅰ) 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드를 포함한다. 몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 1의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드)와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고; N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 일 실시형태에서, 제2 핵산 서열은 (ⅰ) 서열 번호 1의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅱ) 서열 번호 2의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, (ⅲ) 서열 번호 70의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 71의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1의 1792번 내지 4374번 뉴클레오타이드, 서열 번호 2의 1792번 내지 4374번 뉴클레오타이드, 서열 번호 70의 1792번 내지 4374번 뉴클레오타이드, 또는 서열 번호 71의 1792번 내지 4374번 뉴클레오타이드)를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 4374번 뉴클레오타이드와 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1의 58번 내지 4374번 뉴클레오타이드)와 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 핵산 서열은 서열 번호 1과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 1의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 1의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 1의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 4374번 뉴클레오타이드와 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 핵산 서열은 서열 번호 2와 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 2의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 2의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 2의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 2의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 2의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 70의 58번 내지 4374번 뉴클레오타이드)와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 핵산 서열은 서열 번호 70과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 70의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 70의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 70의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 70의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 70의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 핵산 서열은 서열 번호 71과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 71의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 71의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 71의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 71의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 71의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 4374번 뉴클레오타이드와 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 3의 58번 내지 4374번 뉴클레오타이드)와 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 소정의 실시형태에서, 핵산 서열은 서열 번호 3과 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 3의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 3의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 3의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 3의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 4의 58번 내지 4374번 뉴클레오타이드와 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 4의 58번 내지 4374번 뉴클레오타이드)와 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 핵산 서열은 서열 번호 4와 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 4의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 4의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 4의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 4의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 4의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 5의 58번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 58번 내지 4374번 뉴클레오타이드)와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 소정의 실시형태에서, 핵산 서열은 서열 번호 5와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 5의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 5의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 5의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 58번 내지 4374번 뉴클레오타이드)와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함한다. 소정의 실시형태에서, 핵산 서열은 서열 번호 6과 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 58번 내지 4374번 뉴클레오타이드) 또는 서열 번호 6의 58번 내지 4374번 뉴클레오타이드를 포함한다. 더욱 다른 실시형태에서, 뉴클레오타이드 서열은 서열 번호 6의 1번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1번 내지 4374번 뉴클레오타이드) 또는 서열 번호 6의 1번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 뉴클레오타이드 서열은 신호 펩타이드를 코딩하는 핵산 서열을 포함한다. 소정의 실시형태에서, 신호 펩타이드는 FVIII 신호 펩타이드이다. 몇몇 실시형태에서, 신호 펩타이드를 코딩하는 핵산 서열은 코돈 최적화된다. 하나의 특정한 실시형태에서, 신호 펩타이드를 코딩하는 핵산 서열은 (ⅰ) 서열 번호 1의 1번 내지 57번 뉴클레오타이드; (ⅱ) 서열 번호 2의 1번 내지 57번 뉴클레오타이드; (ⅲ) 서열 번호 3의 1번 내지 57번 뉴클레오타이드; (ⅳ) 서열 번호 4의 1번 내지 57번 뉴클레오타이드; (ⅴ) 서열 번호 5의 1번 내지 57번 뉴클레오타이드; (ⅵ) 서열 번호 6의 1번 내지 57번 뉴클레오타이드; (ⅶ) 서열 번호 70의 1번 내지 57번 뉴클레오타이드; (ⅷ) 서열 번호 71의 1번 내지 57번 뉴클레오타이드; 또는 (ⅸ) 서열 번호 68의 1번 내지 57번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다.

서열 번호 1 내지 6, 70 및 71은 서열 번호 16의 최적화된 버전, 시작 또는 "모" 또는 "야생형" FVIII 뉴클레오타이드 서열이다. 서열 번호 16은 B 도메인 결실된 인간 FVIII를 코딩한다. 서열 번호 1 내지 6, 70 및 71이 FVIII의 특이적 B 도메인 결실된 형태(서열 번호 16)로부터 유래된 한편, 본 개시내용이 또한 FVIII의 다른 버전을 코딩하는 핵산의 최적화된 버전에 관한 것으로 이해되어야 한다. 예를 들어, FVIII의 다른 버전은 전장 FVIII, (하기 기재된) FVIII의 다른 B 도메인 결실, 또는 FVIII 활성을 함유하는 FVIII의 다른 단편을 포함할 수 있다.

본 명세서에 사용된 바와 같은, "FVIII 활성을 갖는 폴리펩타이드"는, 달리 기재되지 않는 한, 응고에서의 이의 정상 역할에서 기능성 FVIII 폴리펩타이드를 의미한다. 용어 FVIII 활성을 갖는 폴리펩타이드는 응고 경로에서 전장 야생형 VIII 인자의 기능을 보유하는 이의 기능적 단편, 변이체, 유사체 또는 유도체를 포함한다. "FVIII 활성을 갖는 폴리펩타이드"는 FVIII 단백질, FVIII 폴리펩타이드 또는 FVIII과 상호 교환되어 사용된다. FVIII 기능의 예는 응고를 활성화하는 능력, IX 인자에 대한 보인자로서 작용하는 능력 또는 Ca² ⁺ 및 인지질의 존재 하에 IX 인자와 tenase 복합체를 형성(이후, X 인자를 활성화된 형태 Xa로 전환시킴)하는 능력을 포함하지만, 이들로 제한되지는 않는다. 일 실시형태에서, FVIII 활성을 갖는 폴리펩타이드는 FVIII 중쇄를 갖는 제1 사슬 및 FVIII 경쇄를 갖는 제2 사슬의 2개의 폴리펩타이드 사슬을 포함한다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드는 단쇄 FVIII이다. 단쇄 FVIII는 성숙 FVIII 서열에 상응하는 1645번 및/또는 1648번 아미노산 잔기에서 하나 이상의 돌연변이 또는 치환를 함유할 수 있다. 국제 출원 제PCT/US2012/045784호(본 명세서에 그 전문이 참고로 포함됨)를 참조한다. FVIII 단백질은 인간, 돼지, 개, 랫트 또는 쥣과 FVIII 단백질일 수 있다. 또한, 인간 및 다른 종으로부터의 FVIII 사이의 비교는 기능에 필요할 것 같은 확인된 보존된 잔기를 갖는다(Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 제6,251,632호).

본 명세서에 사용된 바와 같은, FVIII의 "B 도메인"은 내부 아미노산 서열 동일성 및 트롬빈에 의한 단백질분해 절단의 부위에 의해 한정된 당해 분야에 공지된 B 도메인, 예를 들어 전장 인간 FVIII의 잔기 Ser741-Arg1648과 동일하다. 다른 인간 FVIII 도메인은 하기 아미노산 잔기에 의해 한정된다: A1, 잔기 Ala1-Arg372; A2, 잔기 Ser373-Arg740; A3, 잔기 Ser1690-Ile2032; C1, 잔기 Arg2033-Asn2172; C2, 잔기 Ser2173-Tyr2332. A3-C1-C2 서열은 잔기 Ser1690-Tyr2332를 포함한다. 잔기 Glu1649-Arg1689인 남은 서열은 보통 FVIII 경쇄 활성화 펩타이드라 불린다. 돼지, 마우스 및 개 FVIII에 대한 B 도메인을 포함하는 모든 도메인에 대한 경계의 위치는 당해 분야에 또한 공지되어 있다. BDD FVIII의 예는 REFACTO(등록상표) 재조합 BDD FVIII(Wyeth Pharmaceuticals, Inc.)이다.

"B 도메인 결실된 FVIII"는 미국 특허 제6,316,226호, 제6,346,513호, 제7,041,635호, 제5,789,203호, 제6,060,447호, 제5,595,886호, 제6,228,620호, 제5,972,885호, 제6,048,720호, 제5,543,502호, 제5,610,278호, 제5,171,844호, 제5,112,950호, 제4,868,112호 및 6,458,563호(이들의 각각은 본 명세서에 그 전문이 참고로 포함됨)에 개시된 완전 또는 부분 결실을 가질 수 있다. 몇몇 실시형태에서, 본 개시내용의 B 도메인 결실된 FVIII 서열은 미국 특허 제6,316,226호의 4열, 4줄 내지 5열, 28줄 및 실시예 1-5에(또한 US 제6,346,513호에) 개시된 결실 중 임의의 하나를 포함한다. 몇몇 실시형태에서, 본 개시내용의 B 도메인 결실된 FVIII는 미국 특허 제5,789,203호(또한 US 제6,060,447호, US 제5,595,886호 및 US 제6,228,620호)의 2열, 26줄 내지 51줄 및 실시예 5 내지 8에 개시된 결실을 갖는다. 몇몇 실시형태에서, B 도메인 결실된 FVIII는 미국 특허 제5,972,885호의 1열, 25줄 내지 2열, 40줄; 미국 특허 제6,048,720호의 6열, 1줄 내지 22줄 및 실시예 1; 미국 특허 제5,543,502호의 2열, 17줄 내지 46줄; 미국 특허 제5,171,844호의 4열, 22줄 내지 5열, 36줄; 미국 특허 제5,112,950호의 2열, 55줄 내지 68줄, 도 2 및 실시예 1; 미국 특허 제4,868,112호의 2열, 2줄 내지 9열, 21줄 및 표 2; 미국 특허 제7,041,635호의 2열, 1줄 내지 3열, 19줄, 3열, 40줄 내지 4열, 67줄, 7열, 43줄 내지 8열, 26줄 및 11열, 5줄 내지 13열, 39줄; 또는 미국 특허 제6,458,563호의 4열, 25줄 내지 53줄에 기재된 결실을 갖는다. 몇몇 실시형태에서, B 도메인 결실된 FVIII는 B 도메인의 대부분의 결실을 갖지만, WO 제91/09122호(본 명세서에 그 전문이 참고로 포함됨)에 개시된 바와 같은, 2개의 폴리펩타이드 사슬로 1차 번역 산물의 생체내 단백질분해 가공처리에 필수적인 B 도메인의 아미노 말단 서열을 여전히 함유한다. 몇몇 실시형태에서, B 도메인 결실된 FVIII는 747번 내지 1638번 아미노산의 결실, 즉 실제로 B 도메인의 완전한 결실에 의해 작제된다. Hoeben R.C., et al. J. Biol . Chem . 265 (13): 7318-7323 (1990)(본 명세서에 그 전문이 참고로 포함됨). B 도메인 결실된 FVIII는 또한 FVIII의 771번 내지 1666번 아미노산 또는 868번 내지 1562번 아미노산의 결실을 함유할 수 있다. Meulien P., et al. Protein Eng . 2(4): 301-6 (1988)(본 명세서에 그 전문이 참고로 포함됨). 본 개시내용의 부분인 추가 B 도메인 결실은 예를 들어 982번 내지 1562번 또는 760번 내지 1639번(Toole et al., Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797번 내지 1562번(Eaton, et al. Biochemistry (1986) 25:8343-8347)), 741번 내지 1646번(Kaufman(PCT 공개 출원 WO 제87/04187호)), 747번 내지 1560번(Sarver, et al., DNA (1987) 6:553-564)), 741번 내지 1648번(Pasek(PCT 출원 제88/00831호)), 816번 내지 1598번 또는 741번 내지 1689번(Lagner (Behring Inst. Mitt. (1988) No 82:16-25, EP 제295597호))(이들의 각각은 본 명세서에 그 전문이 참고로 포함됨)의 아미노산의 결실을 포함한다. 상기 결실의 각각은 임의의 FVIII 서열에서 만들어질 수 있다.

B 도메인 결실을 포함하는 다수의 기능성 FVIII 분자는 US 제6,316,226호 및 US 제6,346,513호(둘 다 Baxter에 양도); US 제7,041,635호(In2Gen에 양도); US 제5,789,203호, US 제6,060,447호, US 제5,595,886호 및 US 제6,228,620호(Chiron에 양도); US 제5,972,885호 및 US 6,048,720호(Biovitrum에 양도), US 제5,543,502호 및 US 제5,610,278호(Novo Nordisk에 양도); US 제5,171,844호(Immuno Ag에 양도); US 제5,112,950호(Transgene S.A.에 양도); US 제4,868,112호(Genetics Institute에 양도)(이들의 각각은 본 명세서에 그 전문이 참고로 포함됨)의 특허에 개시되어 있다.

코돈 최적화

일 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 핵산 서열은 코돈 최적화된다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하고 코돈 최적화로 처리되는 시작 핵산 서열은 서열 번호 16이다. 몇몇 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 서열은 인간 발현에 대해 코돈 최적화된다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 서열은 쥣과 발현에 대해 코돈 최적화된다. 서열 번호 1 내지 6, 70 및 71은 인간 발현에 최적화된 서열 번호 16의 코돈 최적화된 버전이다.

용어 "코돈 최적화된"은, 이것이 다양한 숙주의 형질전환에 대한 핵산 분자의 유전자 또는 코딩 영역을 의미하면서, DNA에 의해 코딩된 폴리펩타이드를 변경하지 않으면서 숙주 유기체의 통상적인 코돈 사용빈도를 반영하는 핵산 분자의 유전자 또는 코딩 영역에서의 코돈의 변경을 의미한다. 이러한 최적화는 그 유기체의 유전자에서 더 흔히 사용되는 하나 이상의 코돈에 의해 적어도 하나, 또는 하나 초과, 또는 유의미한 수의 코돈을 대체하는 것을 포함한다.

임의의 폴리펩타이드 사슬의 아미노산을 코딩하는 코돈을 포함하는 뉴클레오타이드 서열에서의 일탈은 유전자를 코딩하는 서열에서의 변이를 허용한다. 각각의 코돈이 3개의 뉴클레오타이드로 이루어지고, DNA를 포함하는 뉴클레오타이드가 4개의 특정한 염기로 제한되므로, 뉴클레오타이드의 64개의 가능한 조합이 있고, 이 중 61개는 아미노산을 코딩한다(남은 3개의 코돈은 번역을 종결시키는 신호를 코딩함). 어떠한 코돈이 어떠한 아미노산을 코딩하는지를 보여주는 "유전자 코드"는 본 명세서에서 표 1로서 복사된다. 그 결과, 많은 아미노산은 하나 초과의 코돈에 의해 지칭된다. 예를 들어, 아미노산 알라닌 및 프롤린은 6개에 의해 4개의 트리플렛, 세린 및 아르기닌에 대해 코딩되는 한편, 트립토판 및 메티오닌은 단지 하나의 트리플렛에 의해 코딩된다. 이 축퇴성은 DNA에 의해 코딩된 단백질의 아미노산 서열을 변경하지 않으면서 DNA 염기 조성이 넓은 범위에 걸쳐 변하게 한다.

많은 유기체는 성장하는 펩타이드 사슬에서 특정한 아미노산의 삽입을 코딩하는 특정한 코돈의 사용을 위한 바이어스를 나타낸다. 코돈 우선도 또는 코돈 바이어스, 유기체 사이의 코돈 사용빈도의 차이는 유전자 코드의 축퇴성에 의해 부여되고, 많은 유기체 중에서 잘 기록된다. 코돈 바이어스는 대개 메신저 RNA(mRNA)의 번역의 효율과 상관되고, 이것은 결국 특히 번역되는 코돈의 특성 및 특정한 운반 RNA(tRNA) 분자의 이용가능성에 따라 달라지는 것으로 믿어진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에서 가장 흔히 사용되는 코돈의 반영이다. 따라서, 유전자는 코돈 최적화에 기초한 소정의 유기체에서의 최적 유전자 발현에 대해 맞춰질 수 있다.

매우 다양한 동물, 식물 및 미생물 종에 대해 이용 가능한 유전자 서열의 많은 수를 고려하여, 코돈 사용빈도의 상대 빈도를 계산한다. 코돈 사용빈도 표는 예를 들어 www.kazusa.or.jp/codon/(2012년 6월 18일 방문)에서 이용 가능한 "코돈 사용빈도 데이터베이스(Codon Usage Database)"에서 이용 가능하다. 문헌[Nakamura, Y., et al. Nucl. Acids Res. 28:292 (2000)]을 참조한다.

소정의 폴리펩타이드 서열을 코딩하기 위한 최적화된 빈도에서 코돈을 무작위로 배정하는 것은 각각의 아미노산에 대해 코돈 빈도를 계산하고, 이후 폴리펩타이드 서열에 코돈을 무작위로 배정함으로써 수동으로 수행될 수 있다. 추가로, 다양한 알고리즘 및 컴퓨터 소프트웨어 프로그램은 최적 서열을 계산하기 위해 이용될 수 있다.

몇몇 실시형태에서, 핵산 분자는 하나 이상의 특성을 포함한다: (a) 핵산 분자 또는 이의 부분은 서열 번호 16에 대해 인간 코돈 적응 지수가 증가함; (b) 뉴클레오타이드 서열 또는 이의 부분은 서열 번호 16에 대해 최적 코돈의 빈도가 증가함; (c) 뉴클레오타이드 서열 또는 이의 부분은 서열 번호 16에서 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유함; (d) 뉴클레오타이드 서열 또는 이의 부분은 서열 번호 16에 대한 상대 동의적 코돈 사용빈도가 증가함; (e) 뉴클레오타이드 서열 또는 이의 부분은 서열 번호 16에 대해 코돈의 유효 수가 감소함; (f) 뉴클레오타이드 서열은 서열 번호 16에 대해 더 적은 MARS/ARS 서열(서열 번호 21 및 22)을 함유함; (g) 뉴클레오타이드 서열은 서열 번호 16에 대해 더 적은 탈안정화 유전요소(서열 번호 23 및 24)를 함유함; (i) 뉴클레오타이드 서열은 폴리-T 서열을 함유하지 않음, (j) 뉴클레오타이드 서열은 폴리-A 서열을 함유하지 않음; 또는 (k) 임의의 이들의 조합. 몇몇 실시형태에서, 핵산 분자는 (a) 내지 (j)의 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 10개의 특징을 함유한다.

코돈 적응 지수

일 실시형태에서, 본 개시내용은 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 인간 코돈 적응 지수는 서열 번호 16에 대해 증가한다. 예를 들어, 뉴클레오타이드 서열은 적어도 약 0.75(75%), 적어도 약 0.76(76%), 적어도 약 0.77(77%), 적어도 약 0.78(78%), 적어도 약 0.79(79%), 적어도 약 0.80(80%), 적어도 약 0.81(81%), 적어도 약 0.82(82%), 적어도 약 0.83(83%), 적어도 약 0.84(84%), 적어도 약 0.85(85%), 적어도 약 0.86(86%), 적어도 약 0.87(87%), 적어도 약 0.88(88%), 적어도 약 0.89(89%), 적어도 약 0.90(90%), 적어도 약 0.91(91%), 적어도 약 0.92(92%), 적어도 약 0.93(93%), 적어도 약 0.94(94%), 적어도 약 0.95(95%), 적어도 약 0.96(96%), 적어도 약 0.97(97%), 적어도 약 0.98(98%), 또는 적어도 약 0.99(99%)인 인간 코돈 적응 지수를 가질 수 있다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.91(91%)인 인간 코돈 적응 지수를 갖는다. 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.91(97%)인 인간 코돈 적응 지수를 갖는다.

하나의 특정한 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열의 인간 코돈 적응 지수는 서열 번호 16에 대해 증가한다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.75(75%), 적어도 약 0.76(76%), 적어도 약 0.77(77%), 적어도 약 0.78(78%), 적어도 약 0.79(79%), 적어도 약 0.80(80%), 적어도 약 0.81(81%), 적어도 약 0.82(82%), 적어도 약 0.83(83%), 적어도 약 0.84(84%), 적어도 약 0.85(85%), 적어도 약 0.86(86%), 적어도 약 0.87(87%), 적어도 약 0.88(88%), 적어도 약 0.89(89%), 적어도 약 0.90(90%) 또는 적어도 약 0.91(91%)인 인간 코돈 적응 지수를 갖는다. 하나의 특정사항에서, 뉴클레오타이드 서열은 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.91(91%)인 인간 코돈 적응 지수를 갖는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열의 인간 코돈 적응 지수는 서열 번호 16에 대해 증가한다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.75(75%), 적어도 약 0.76(76%), 적어도 약 0.77(77%), 적어도 약 0.78(78%), 적어도 약 0.79(79%), 적어도 약 0.80(80%), 적어도 약 0.81(81%), 적어도 약 0.82(82%), 적어도 약 0.83(83%), 적어도 약 0.84(84%), 적어도 약 0.85(85%), 적어도 약 0.86(86%), 적어도 약 0.87(87%) 또는 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다. 하나의 특정사항에서, 뉴클레오타이드 서열은 적어도 약 0.83(83%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열의 인간 코돈 적응 지수는 서열 번호 16에 대해 증가한다. 몇몇 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.75(75%), 적어도 약 0.76(76%), 적어도 약 0.77(77%), 적어도 약 0.78(78%), 적어도 약 0.79(79%), 적어도 약 0.80(80%), 적어도 약 0.81(81%), 적어도 약 0.82(82%), 적어도 약 0.83(83%), 적어도 약 0.84(84%), 적어도 약 0.85(85%), 적어도 약 0.86(86%), 적어도 약 0.87(87%) 또는 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다. 하나의 특정사항에서, 뉴클레오타이드 서열은 적어도 약 0.75(75%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.83(83%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.88(88%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.91(91%)인 인간 코돈 적응 지수를 갖는다. 또 다른 실시형태에서, 뉴클레오타이드 서열은 적어도 약 0.97(97%)인 인간 코돈 적응 지수를 갖는다.

몇몇 실시형태에서, 본 개시내용의 단리된 핵산 분자는 서열 번호 16에 대해 증가한 최적 코돈의 빈도(FOP)를 갖는다. 소정의 실시형태에서, 단리된 핵산 분자의 FOP는 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 64, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 79, 적어도 약 80, 적어도 약 85 또는 적어도 약 90이다.

다른 실시형태에서, 본 개시내용의 단리된 핵산 분자는 서열 번호 16에 대해 증가한 상대 동의적 코돈 사용빈도(RCSU)를 갖는다. 몇몇 실시형태에서, 단리된 핵산 분자의 RCSU는 1.5 초과이다. 다른 실시형태에서, 단리된 핵산 분자의 RCSU는 2.0 초과이다. 소정의 실시형태에서, 단리된 핵산 분자의 RCSU는 적어도 약 1.5, 적어도 약 1.6, 적어도 약 1.7, 적어도 약 1.8, 적어도 약 1.9, 적어도 약 2.0, 적어도 약 2.1, 적어도 약 2.2, 적어도 약 2.3, 적어도 약 2.4, 적어도 약 2.5, 적어도 약 2.6 또는 적어도 약 2.7이다.

더욱 다른 실시형태에서, 본 개시내용의 단리된 핵산 분자는 서열 번호 16에 대해 감소한 코돈의 유효 수를 갖는다. 몇몇 실시형태에서, 단리된 핵산 분자는 약 50 미만, 약 45 미만, 약 40 미만, 약 35 미만, 약 30 미만 또는 약 25 미만의 코돈의 유효 수를 갖는다. 하나의 특정한 실시형태에서, 단리된 핵산 분자는 약 40, 약 35, 약 30, 약 25 또는 약 20의 코돈의 유효 수를 갖는다.

G/C 함량 최적화

몇몇 실시형태에서, 본 개시내용은 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 16에서의 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 45%, 적어도 약 46%, 적어도 약 47%, 적어도 약 48%, 적어도 약 49%, 적어도 약 50%, 적어도 약 51%, 적어도 약 52%, 적어도 약 53%, 적어도 약 54%, 적어도 약 55%, 적어도 약 56%, 적어도 약 57%, 적어도 약 58%, 적어도 약 59% 또는 적어도 약 60%인 G/C 함량을 갖는다.

하나의 특정한 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에서의 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유한다. 몇몇 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 45%, 적어도 약 46%, 적어도 약 47%, 적어도 약 48%, 적어도 약 49%, 적어도 약 50%, 적어도 약 51%, 적어도 약 52%, 적어도 약 53%, 적어도 약 54%, 적어도 약 55%, 적어도 약 56%, 적어도 약 57% 또는 적어도 약 58%인 G/C 함량을 갖는다. 하나의 특정한 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 58%인 G/C 함량을 갖는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드), 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에서의 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 45%, 적어도 약 46%, 적어도 약 47%, 적어도 약 48%, 적어도 약 49%, 적어도 약 50%, 적어도 약 51%, 적어도 약 52%, 적어도 약 53%, 적어도 약 54%, 적어도 약 55%, 적어도 약 56% 또는 적어도 약 57%인 G/C 함량을 갖는다. 하나의 특정한 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 52%인 G/C 함량을 갖는다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 55%인 G/C 함량을 갖는다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 57%인 G/C 함량을 갖는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 서열 번호 16에서의 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 45%인 G/C 함량을 갖는다. 하나의 특정한 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 52%인 G/C 함량을 갖는다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 55%인 G/C 함량을 갖는다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 57%인 G/C 함량을 갖는다. 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 58%인 G/C 함량을 갖는다. 더욱 또 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 적어도 약 60%인 G/C 함량을 갖는다.

"G/C 함량"(또는 구아닌-사이토신 함량) 또는 "G/C 뉴클레오타이드의 백분율"은 구아닌 또는 사이토신인 DNA 분자에서의 질소질 염기의 백분율을 의미한다. G/C 함량은 하기 식을 이용하여 계산될 수 있다:

(III)

인간 유전자는 이의 G/C 함량에서 매우 불균일하고, 몇몇 유전자는 20%만큼 낮은 G/C 함량을 갖고, 다른 유전자는 95%만큼 높은 G/C 함량을 갖는다. 일반적으로, G/C 농후 유전자는 더 고도로 발현된다. 사실, 유전자의 G/C 함량을 증가시키는 것이, 대부분 전사의 증가 및 더 높은 정상 상태 mRNA 수준으로 인해, 유전자의 증가한 발현을 발생시킬 수 있다는 것이 입증되었다. 문헌[Kudla et al., PLoS Biol., 4(6): e180 (2006)]을 참조한다.

매트릭스 부착 영역 유사 서열

몇몇 실시형태에서, 본 개시내용은 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 6, 최대 5, 최대 4, 최대 3 또는 최대 2 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 1 MARS/ARS 서열을 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 MARS/ARS 서열을 함유하지 않는다.

하나의 특정한 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 6, 최대 5, 최대 4, 최대 3 또는 최대 2 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 1 MARS/ARS 서열을 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 MARS/ARS 서열을 함유하지 않는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드); 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 6, 최대 5, 최대 4, 최대 3 또는 최대 2 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 1 MARS/ARS 서열을 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 MARS/ARS 서열을 함유하지 않는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 6, 최대 5, 최대 4, 최대 3 또는 최대 2 MARS/ARS 서열을 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 1 MARS/ARS 서열을 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 MARS/ARS 서열을 함유하지 않는다.

사카로마이세스 세레비시아에 자율 복제 서열(ARS) 및 핵-매트릭스 부착 영역(MAR)과 서열 유사성을 갖는 인간 FVIII 뉴클레오타이드 서열에서의 AT 농후 유전요소가 확인되었다(Fallux et al., Mol . Cell. Biol . 16:4264-4272 (1996)). 이들 유전요소 중 하나는 시험관내 핵 인자를 결합시키고 클로르암페니콜 아세틸전환효소(CAT) 리포터 유전자의 발현을 억제하는 것으로 입증되었다. Id. 이 서열이 인간 FVIII 유전자의 전사 억제에 기여할 수 있다는 것이 가정된다. 따라서, 일 실시형태에서, 모든 MAR/ARS 서열은 본 개시내용의 FVIII 유전자에서 폐지된다. 모 FVIII 서열(서열 번호 16)에서 4개의 MAR/ARS ATATTT 서열(서열 번호 21) 및 3개의 MAR/ARS AAATAT 서열(서열 번호 22)이 존재한다. 이들 부위의 모두는 최적화된 FVIII 서열(서열 번호 1 내지 6)에서 MAR/ARS 서열을 파괴하도록 돌연변이된다. 이들 유전요소의 각각의 위치, 및 최적화된 서열에서의 상응하는 뉴클레오타이드의 서열은 하기 표 2에 기재되어 있다.

탈안정화 서열

몇몇 실시형태에서, 본 개시내용은 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 탈안정화 유전요소를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 탈안정화 유전요소를 함유하지 않는다.

하나의 특정한 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 탈안정화 유전요소를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 탈안정화 유전요소를 함유하지 않는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드); 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 탈안정화 유전요소를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 탈안정화 유전요소를 함유하지 않는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 탈안정화 유전요소를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 탈안정화 유전요소를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 탈안정화 유전요소를 함유하지 않는다.

모 FVIII 서열(서열 번호 16)에서의 10개의 탈안정화 유전요소: 3개의 ATTTA 서열(서열 번호 23) 및 4개의 TAAAT 서열(서열 번호 24)이 존재한다. 일 실시형태에서, 이들 부위의 서열은 최적화된 FVIII 서열 번호 1 내지 6, 70 및 71에서의 탈안정화 유전요소를 파괴하도록 돌연변이된다. 이들 유전요소의 각각의 위치, 및 최적화된 서열에서의 상응하는 뉴클레오타이드의 서열은 표 2에 기재되어 있다.

잠재적인 촉진자 결합 부위

몇몇 실시형태에서, 본 개시내용은 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 잠재적인 촉진자 결합 부위를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 잠재적인 촉진자 결합 부위를 함유하지 않는다.

하나의 특정한 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 잠재적인 촉진자 결합 부위를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 잠재적인 촉진자 결합 부위를 함유하지 않는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드); 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 잠재적인 촉진자 결합 부위를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 잠재적인 촉진자 결합 부위를 함유하지 않는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 서열 번호 16에 비해 더 적은 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 9개, 최대 8개, 최대 7개, 최대 6개 또는 최대 5개의 잠재적인 촉진자 결합 부위를 함유한다. 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 최대 4개, 최대 3개, 최대 2개 또는 최대 1개의 잠재적인 촉진자 결합 부위를 함유한다. 더욱 다른 실시형태에서, FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 잠재적인 촉진자 결합 부위를 함유하지 않는다.

TATA 박스는 진핵생물의 촉진자 영역에서 대개 발견된 조절 서열이다. 이것은 일반적인 전사 인자인 TATA 결합 단백질(TBP)의 결합 부위로서 작용한다. TATA 박스는 보통 서열 TATAA(서열 번호 28) 또는 밀접한 변이체를 포함한다. 그러나, 코딩 서열 내의 TATA 박스는 전장 단백질의 번역을 저해할 수 있다. 5개의 TATAA 서열(서열 번호 28) 및 5개의 TTATA 서열(서열 번호 29)인 야생형 BDD FVIII 서열(서열 번호 16)에서의 10개의 잠재적인 촉진자 결합 서열이 존재한다. 몇몇 실시형태에서, 촉진자 결합 부위 중 적어도 1개, 적어도 2개, 적어도 3개 또는 적어도 4개는 본 개시내용의 FVIII 유전자에서 폐지된다. 몇몇 실시형태에서, 촉진자 결합 부위 중 적어도 5개는 본 개시내용의 FVIII 유전자에서 폐지된다. 다른 실시형태에서, 촉진자 결합 부위 중 적어도 6개, 적어도 7개, 또는 적어도 8개는 본 개시내용의 FVIII 유전자에서 폐지된다. 일 실시형태에서, 촉진자 결합 부위 중 적어도 9개는 본 개시내용의 FVIII 유전자에서 폐지된다. 하나의 특정한 실시형태에서, 모든 촉진자 결합 부위는 본 개시내용의 FVIII 유전자에서 폐지된다. 각각의 잠재적인 촉진자 결합 부위의 위치 및 최적화된 서열에서의 상응하는 뉴클레오타이드의 서열은 표 2에 기재되어 있다.

다른 시스 작용성 음성 조절 유전요소

상기 기재된 MAR/ARS 서열, 탈안정화 유전요소 및 잠재적인 촉진자 부위 이외에, 몇몇 추가 잠재적인 저해 서열은 야생형 BDD FVIII 서열(서열 번호 16)에서 확인될 수 있다. 2개의 AU 농후 서열 유전요소(ARE)는 비최적화된 BDD FVIII 서열에서 폴리-A 부위(AAAAAAA; 서열 번호 26), 폴리-T 부위(TTTTTT; 서열 번호 25) 및 슬라이스 부위(GGTGAT; 서열 번호 27)와 함께 확인될 수 있다(ATTTTATT(서열 번호 30); 및 ATTTTTAA(서열 번호 31)). 이들 유전요소 중 하나 이상은 최적화된 FVIII 서열로부터 제거될 수 있다. 이들 부위의 각각의 위치 및 최적화된 서열에서의 상응하는 뉴클레오타이드의 서열은 표 2에 기재되어 있다.

소정의 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 하나 이상의 시스 작용성 음성 조절 유전요소, 예를 들어 슬라이스 부위, 폴리-T 서열, 폴리-A 서열, ARE 서열, 또는 임의의 이들의 조합을 함유하지 않는다.

또 다른 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드); 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 하나 이상의 시스 작용성 음성 조절 유전요소, 예를 들어 슬라이스 부위, 폴리-T 서열, 폴리-A 서열, ARE 서열, 또는 임의의 이들의 조합을 함유하지 않는다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 하나 이상의 시스 작용성 음성 조절 유전요소, 예를 들어 슬라이스 부위, 폴리-T 서열, 폴리-A 서열, ARE 서열, 또는 임의의 이들의 조합을 함유하지 않는다.

몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 슬라이스 부위 GGTGAT(서열 번호 27)를 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 폴리-T 서열(서열 번호 25)을 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 폴리-A 서열(서열 번호 26)을 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드; (ⅱ) 서열 번호 3의 1번 내지 1791번 뉴클레오타이드; (ⅲ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드, 또는 (ⅳ) 서열 번호 4의 1번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖고, 뉴클레오타이드 서열은 ARE 유전요소(서열 번호 30 또는 서열 번호 31)를 함유하지 않는다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고; 뉴클레오타이드 서열은 슬라이스 부위 GGTGAT(서열 번호 27)를 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 폴리-T 서열(서열 번호 25)을 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 폴리-A 서열(서열 번호 26)을 함유하지 않는다. 몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1, 2, 3, 4, 5, 6, 70 및 71로부터 선택된 아미노산 서열의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드(즉, B 도메인 또는 B 도메인 단편을 코딩하는 뉴클레오타이드가 없는 서열 번호 1, 2, 3, 4, 5, 6, 70 또는 71의 58번 내지 4374번 뉴클레오타이드)와 적어도 약 80%, 적어도 약 85%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 뉴클레오타이드 서열은 ARE 유전요소(서열 번호 30 또는 서열 번호 31)를 함유하지 않는다.

다른 실시형태에서, 본 개시내용의 최적화된 FVIII 서열은 항바이러스 모티프, 줄기-루프 구조 및 반복 서열 중 하나 이상을 포함하지 않는다.

더욱 다른 실시형태에서, 전사 시작 부위를 둘러싸는 뉴클레오타이드는 kozak 공통 서열(GCCGCCACCATGC(서열 번호 32), 여기서 밑줄 친 뉴클레오타이드는 출발 코돈임)로 변한다. 다른 실시형태에서, 제한 부위는 클로닝 과정을 수월하게 하도록 부가되거나 제거될 수 있다.

비상동성 뉴클레오타이드 서열

몇몇 실시형태에서, 본 개시내용의 단리된 핵산 분자는 비상동성 뉴클레오타이드 서열을 추가로 포함한다. 몇몇 실시형태에서, 본 개시내용의 단리된 핵산 분자는 적어도 하나의 비상동성 뉴클레오타이드 서열을 추가로 포함한다. 비상동성 뉴클레오타이드 서열은 5' 말단에서, 3' 말단에서 본 개시내용의 최적화된 BDD-FVIII 뉴클레오타이드 서열과 연결되거나, 최적화된 BDD-FVIII 뉴클레오타이드 서열의 중간으로 삽입될 수 있다. 따라서, 몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열에 의해 코딩된 비상동성 아미노산 서열은 뉴클레오타이드 서열에 의해 코딩된 FVIII 아미노산 서열의 N 말단 또는 C 말단에 연결되거나, FVIII 아미노산 서열에서의 2개의 아미노산 사이에 삽입된다. 몇몇 실시형태에서, 비상동성 아미노산 서열은 표 3으로부터 선택된 하나 이상의 삽입 부위에서 2개의 아미노산 사이로 삽입될 수 있다. 몇몇 실시형태에서, 비상동성 아미노산 서열은 국제 공보 WO 제2013/123457호 A1, WO 제2015/106052호 A1 또는 미국 공보 제2015/0158929호 A1(본 명세서에 그 전문이 참고로 포함됨)에 개시된 임의의 부위에서 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 폴리펩타이드 내에 삽입될 수 있다.

몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열에 의해 코딩된 비상동성 아미노산 서열은 B 도메인 또는 이의 단편 내에 삽입된다. 몇몇 실시형태에서, 비상동성 아미노산 서열은 성숙 인간 FVIII(서열 번호 15)의 745번 아미노산에 상응하는 아미노산의 바로 하류에 FVIII 내에 삽입된다. 하나의 특정한 실시형태에서, FVIII는 성숙 인간 FVIII(서열 번호 15)에 상응하는 746번 내지 1646번 아미노산의 결실을 포함하고, 비상동성 뉴클레오타이드 서열에 의해 코딩된 비상동성 아미노산 서열은 성숙 인간 FVIII(서열 번호 15)에 상응하는 745번 아미노산의 바로 하류에 삽입된다.

다른 실시형태에서, 본 개시내용의 단리된 핵산 분자는 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 비상동성 뉴클레오타이드 서열을 추가로 포함한다. 몇몇 실시형태에서, 모든 비상동성 뉴클레오타이드 서열은 동일하다. 몇몇 실시형태에서, 적어도 하나의 비상동성 뉴클레오타이드 서열은 다른 비상동성 뉴클레오타이드 서열과 다르다. 몇몇 실시형태에서, 본 개시내용은 2개, 3개, 4개, 5개, 6개 또는 7개 초과의 탠덤으로 된 비상동성 뉴클레오타이드 서열을 포함할 수 있다.

몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열은 아미노산 서열을 코딩한다. 몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열은 FVIII 분자의 반감기를 증가시킬 수 있는 비상동성 모이어티("반감기 연장제")이다.

몇몇 실시형태에서, 비상동성 모이어티는, 본 개시내용의 단백질에서 도입될 때, 생체내 반감기의 연장과 연관된 비구조화 또는 구조화 특징을 갖는 펩타이드 또는 폴리펩타이드이다. 비제한적인 예는 알부민, 알부민 단편, 면역글로불린의 Fc 단편, 인간 융모성 고나도트로핀의 β 아단위의 C 말단 펩타이드(CTP), HAP 서열, XTEN 서열, 트랜스페린 또는 이의 단편, PAS 폴리펩타이드, 폴리글라이신 링커, 폴리세린 링커, 알부민 결합 모이어티, 또는 임의의 단편, 유도체, 변이체, 또는 이들 폴리펩타이드의 조합을 포함한다. 하나의 특정한 실시형태에서, 비상동성 아미노산 서열은 면역글로불린 불변 영역 또는 이의 부분, 트랜스페린, 알부민 또는 PAS 서열이다. 몇몇 양태에서, 비상동성 모이어티는 폰 빌레브란트 인자 또는 이의 단편을 포함한다. 다른 관련된 양태에서, 비상동성 모이어티는 비폴리펩타이드 모이어티에 대한 부착 부위(예를 들어, 시스테인 아미노산), 예컨대 폴리에틸렌 글라이콜(PEG), 하이드록시에틸 전분(HES), 폴리시알산, 또는 임의의 유도체, 변이체, 또는 이들 유전요소의 조합을 포함할 수 있다. 몇몇 양태에서, 비상동성 모이어티는 비폴리펩타이드 모이어티에 대한 부착 부위로서 작용하는 시스테인 아미노산, 예컨대 폴리에틸렌 글라이콜(PEG), 하이드록시에틸 전분(HES), 폴리시알산, 또는 임의의 유도체, 변이체, 또는 이들 유전요소의 조합을 포함한다.

하나의 구체적인 실시형태에서, 제1 비상동성 뉴클레오타이드 서열은 당해 분야에 공지된 반감기 연장 분자인 제1 비상동성 모이어티를 코딩하고, 제2 비상동성 뉴클레오타이드 서열은 당해 분야에 공지된 또한 반감기 연장 분자일 수 있는 제2 비상동성 모이어티를 코딩한다. 소정의 실시형태에서, 제1 비상동성 모이어티(예를 들어, 제1 Fc 모이어티) 및 제2 비상동성 모이어티(예를 들어, 제2 Fc 모이어티)는 이합체를 형성하도록 서로 회합된다. 일 실시형태에서, 제2 비상동성 모이어티는 제2 Fc 모이어티이고, 제2 Fc 모이어티는 제1 비상동성 모이어티, 예를 들어 제1 Fc 모이어티에 연결되거나 이것과 회합된다. 예를 들어, 제2 비상동성 모이어티(예를 들어, 제2 Fc 모이어티)는 링커에 의해 제1 비상동성 모이어티(예를 들어, 제1 Fc 모이어티)에 연결되거나 공유 또는 비공유 결합에 의해 제1 비상동성 모이어티와 회합될 수 있다.

몇몇 실시형태에서, 비상동성 모이어티는 적어도 약 10개, 적어도 약 100개, 적어도 약 200개, 적어도 약 300개, 적어도 약 400개, 적어도 약 500개, 적어도 약 600개, 적어도 약 700개, 적어도 약 800개, 적어도 약 900개, 적어도 약 1000개, 적어도 약 1100개, 적어도 약 1200개, 적어도 약 1300개, 적어도 약 1400개, 적어도 약 1500개, 적어도 약 1600개, 적어도 약 1700개, 적어도 약 1800개, 적어도 약 1900개, 적어도 약 2000개, 적어도 약 2500개, 적어도 약 3000개 또는 적어도 약 4000개 아미노산을 포함하거나, 본질적으로 이들로 이루어지거나, 이들로 이루어진 폴리펩타이드이다. 다른 실시형태에서, 비상동성 모이어티는 약 100개 내지 약 200개의 아미노산, 약 200개 내지 약 300개의 아미노산, 약 300개 내지 약 400개의 아미노산, 약 400개 내지 약 500개의 아미노산, 약 500개 내지 약 600개의 아미노산, 약 600개 내지 약 700개의 아미노산, 약 700개 내지 약 800개의 아미노산, 약 800개 내지 약 900개의 아미노산, 또는 약 900개 내지 약 1000개의 아미노산을 포함하거나, 본질적으로 이들로 이루어지거나, 이들로 이루어진 폴리펩타이드이다.

소정의 실시형태에서, 비상동성 모이어티는 이의 생물학적 활성 또는 기능에 상당히 영향을 미치지 않으면서 FVIII 단백질의 하나 이상의 약동역학 특성을 개선한다.

소정의 실시형태에서, 비상동성 모이어티는 본 개시내용의 FVIII 단백질의 생체내 및/또는 시험관내 반감기를 증가시킨다. 다른 실시형태에서, 비상동성 모이어티는 본 개시내용의 FVIII 단백질 또는 이의 단편(예를 들어, FVIII 단백질의 단백질분해 절단 후 비상동성 모이어티를 포함하는 단편)의 가시화 또는 국재화를 수월하게 한다. 본 개시내용의 FVIII 단백질 또는 이의 단편의 가시화 및/또는 국재화는 생체내, 시험관내, 세포외, 또는 이들의 조합일 수 있다.

다른 실시형태에서, 비상동성 모이어티는 본 개시내용의 FVIII 단백질 또는 이의 단편(예를 들어, FVIII 단백질의 단백질분해 절단 후 비상동성 모이어티를 포함하는 단편)의 안정성을 증가시킨다. 본 명세서에 사용된 바와 같은, 용어 "안정성"은 환경 조건(예를 들어, 상승한 또는 하강한 온도)에 반응하여 FVIII 단백질의 하나 이상의 물성의 유지의 분야 인정된 측정치를 의미한다. 소정의 양태에서, 물성은 FVIII 단백질의 공유 구조의 유지(예를 들어, 단백질분해 절단, 원치않는 산화 또는 탈아미드화의 부재)일 수 있다. 다른 양태에서, 물성은 또한 적절히 폴딩된 상태의 FVIII 단백질의 존재(예를 들어, 가용성 또는 불용성 응집물 또는 침전물의 부재)일 수 있다. 일 양태에서, FVIII 단백질의 안정성은 FVIII 단백질의 생물물리학 특성, 예를 들어 열 안정성, pH 비폴딩된 프로필, 글라이코실화의 안정한 제거, 용해도, 생화학적 기능(예를 들어, 단백질, 수용체 또는 리간드에 결합하는 능력) 등 및/또는 이들의 조합을 평가함으로써 측정된다. 또 다른 양태에서, 생화학적 기능은 상호작용의 결합 친화도에 의해 입증된다. 일 양태에서, 단백질 안정성의 측정치는 열 안정성, 즉, 열 공격의 저항이다. 안정성은 당해 분야에 공지된 방법, 예컨대 HPLC(고성능 액체 크로마토그래피), SEC(크기 배제 크로마토그래피), DLS(동적 광 산란) 등을 이용하여 측정될 수 있다. 열 안정성을 측정하는 방법은 시차 주사 열량계(DSC), 시차 주사 형광측정법(DSF), 원편광 이색성(CD) 및 열 공격 검정을 포함하지만, 이들로 제한되지는 않는다.

소정의 양태에서, 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 단백질은 적어도 하나의 반감기 연장제, 즉 이러한 비상동성 모이어티가 결여된 상응하는 FVIII 단백질의 생체내 반감기와 관련하여 FVIII 단백질의 생체내 반감기를 증가시키는 비상동성 모이어티를 포함한다. FVIII 단백질의 생체내 반감기는 당해 분야의 숙련자에게 공지된 임의의 방법, 예를 들어 활성 검정(비색 검정 또는 1단계 응고 aPTT 검정), ELISA, ROTEM(상표명) 등에 의해 결정될 수 있다.

몇몇 실시형태에서, 하나 이상의 반감기 연장제의 존재는 이러한 하나 이상의 반감기 연장제가 결여된 상응하는 단백질의 반감기와 비교하여 증가한 FVIII 단백질의 반감기를 발생시킨다. 반감기 연장제를 포함하는 FVIII 단백질의 반감기는 이러한 반감기 연장제가 결여된 상응하는 FVIII 단백질의 생체내 반감기보다 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배 또는 적어도 약 12배 더 길다.

일 실시형태에서, 반감기 연장제를 포함하는 FVIII 단백질의 반감기는 이러한 반감기 연장제가 결여된 상응하는 단백질의 생체내 반감기보다 약 1.5배 내지 약 20배, 약 1.5배 내지 약 15배 또는 약 1.5배 내지 약 10배 더 길다. 또 다른 실시형태에서, 반감기 연장제를 포함하는 FVIII 단백질의 반감기는 이러한 반감기 연장제가 결여된 상응하는 단백질의 생체내 반감기와 비교하여 약 2배 내지 약 10배, 약 2배 내지 약 9배, 약 2배 내지 약 8배, 약 2배 내지 약 7배, 약 2배 내지 약 6배, 약 2배 내지 약 5배, 약 2배 내지 약 4배, 약 2배 내지 약 3배, 약 2.5배 내지 약 10배, 약 2.5배 내지 약 9배, 약 2.5배 내지 약 8배, 약 2.5배 내지 약 7배, 약 2.5배 내지 약 6배, 약 2.5배 내지 약 5배, 약 2.5배 내지 약 4배, 약 2.5배 내지 약 3배, 약 3배 내지 약 10배, 약 3배 내지 약 9배, 약 3배 내지 약 8배, 약 3배 내지 약 7배, 약 3배 내지 약 6배, 약 3배 내지 약 5배, 약 3배 내지 약 4배, 약 4배 내지 약 6배, 약 5배 내지 약 7배, 또는 약 6배 내지 약 8배 연장된다.

다른 실시형태에서, 반감기 연장제를 포함하는 FVIII 단백질의 반감기는 적어도 약 17시간, 적어도 약 18시간, 적어도 약 19시간, 적어도 약 20시간, 적어도 약 21시간, 적어도 약 22시간, 적어도 약 23시간, 적어도 약 24시간, 적어도 약 25시간, 적어도 약 26시간, 적어도 약 27시간, 적어도 약 28시간, 적어도 약 29시간, 적어도 약 30시간, 적어도 약 31시간, 적어도 약 32시간, 적어도 약 33시간, 적어도 약 34시간, 적어도 약 35시간, 적어도 약 36시간, 적어도 약 48시간, 적어도 약 60시간, 적어도 약 72시간, 적어도 약 84시간, 적어도 약 96시간 또는 적어도 약 108시간이다.

더욱 다른 실시형태에서, 반감기 연장제를 포함하는 FVIII 단백질의 반감기는 약 15시간 내지 약 2주, 약 16시간 내지 약 1주, 약 17시간 내지 약 1주, 약 18시간 내지 약 1주, 약 19시간 내지 약 1주, 약 20시간 내지 약 1주, 약 21시간 내지 약 1주, 약 22시간 내지 약 1주, 약 23시간 내지 약 1주, 약 24시간 내지 약 1주, 약 36시간 내지 약 1주, 약 48시간 내지 약 1주, 약 60시간 내지 약 1주, 약 24시간 내지 약 6일, 약 24시간 내지 약 5일, 약 24시간 내지 약 4일, 약 24시간 내지 약 3일 또는 약 24시간 내지 약 2일이다.

몇몇 실시형태에서, 반감기 연장제를 포함하는 FVIII 단백질의 대상체당 평균 반감기는 약 15시간, 약 16시간, 약 17시간, 약 18시간, 약 19시간, 약 20시간, 약 21시간, 약 22시간, 약 23시간, 약 24시간(1일), 약 25시간, 약 26시간, 약 27시간, 약 28시간, 약 29시간, 약 30시간, 약 31시간, 약 32시간, 약 33시간, 약 34시간, 약 35시간, 약 36시간, 약 40시간, 약 44시간, 약 48시간(2일), 약 54시간, 약 60시간, 약 72시간(3일), 약 84시간, 약 96시간(4일), 약 108시간, 약 120시간(5일), 약 6일, 약 7일(1주), 약 8일, 약 9일, 약 10일, 약 11일, 약 12일, 약 13일 또는 약 14일이다.

하나 이상의 반감기 연장제는 FVIII의 C 말단 또는 N 말단에 융합되거나 FVIII 내에 삽입될 수 있다.

1. 면역글로불린 불변 영역 또는 이의 부분

또 다른 양태에서, 비상동성 모이어티는 하나 이상의 면역글로불린 불변 영역 또는 이의 부분(예를 들어, Fc 영역)을 포함한다. 일 실시형태에서, 본 개시내용의 단리된 핵산 분자는 면역글로불린 불변 영역 또는 이의 부분을 코딩하는 비상동성 핵산 서열을 추가로 포함한다. 몇몇 실시형태에서, 면역글로불린 불변 영역 또는 이의 부분은 Fc 영역이다.

면역글로불린 불변 영역은 CH(불변 중쇄) 도메인(CH1, CH2 등)이라 칭하는 도메인으로 이루어진다. 아이소타입(즉 IgG, IgM, IgA IgD 또는 IgE)에 따라, 불변 영역은 3개 또는 4개의 CH 도메인으로 이루어질 수 있다. 몇몇 아이소타입(예를 들어, IgG) 불변 영역은 또한 힌지 영역을 함유하다. 문헌[Janeway et al. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.]을 참조한다.

본 개시내용의 FVIII 단백질을 생성하기 위한 면역글로불린 불변 영역 또는 이의 부분은 다수의 상이한 공급원으로부터 얻어질 수 있다. 일 실시형태에서, 면역글로불린 불변 영역 또는 이의 부분은 인간 면역글로불린으로부터 유래된다. 그러나, 면역글로불린 불변 영역 또는 이의 부분이 예를 들어, 설치류(예를 들어, 마우스, 랫트, 토끼, 기니아 피그) 또는 비인간 영장류(예를 들어, 침팬지, 마카크) 종을 포함하는 또 다른 포유류 종의 면역글로불린으로부터 유래될 수 있는 것으로 이해된다. 더구나, 면역글로불린 불변 영역 또는 이의 부분은 IgM, IgG, IgD, IgA 및 IgE를 포함하는 임의의 면역글로불린 종류, 및 IgG1, IgG2, IgG3 및 IgG4를 포함하는 임의의 면역글로불린 아이소타입으로부터 유래될 수 있다. 일 실시형태에서, 인간 아이소타입 IgG1을 사용한다.

다양한 면역글로불린 불변 영역 유전자 서열(예를 들어, 인간 불변 영역 유전자 서열)은 공공으로 접근 가능한 기탁의 형태로 이용 가능하다. 불변 영역 도메인 서열은 면역원성을 감소시키기 위해 특정한 효과기 기능(또는 특정한 효과기 기능이 결여) 또는 특정한 변형을 갖도록 선택될 수 있다. 항체 및 항체 코딩 유전자의 많은 서열은 공개되어 있고, 적합한 Ig 불변 영역 서열(예를 들어, 힌지, CH2, 및/또는 CH3 서열, 또는 이의 부분)은 분야 인지된 기법을 이용하여 이 서열로부터 유래될 수 있다. 이후, 임의의 상기 방법을 이용하여 얻은 유전자 재료는 본 개시내용의 폴리펩타이드를 얻도록 변경되거나 합성될 수 있다. 본 개시내용의 범위가 불변 영역 DNA 서열의 대립유전자, 변이체 및 돌연변이를 포함하는 것으로 추가로 이해될 것이다.

예를 들어, 관심 대상의 도메인을 증폭시키기 위해 선택된 중합효소 연쇄 반응 및 프라이머를 사용하여 면역글로불린 불변 영역 또는 이의 부분의 서열은 클로닝될 수 있디. 항체로부터 면역글로불린 불변 영역 또는 이의 부분의 서열을 클로닝하기 위해, mRNA는 하이브리도마, 비장 또는 림프 세포로부터 단리되고, DNA로 역전사되고, PCR에 의해 항체 유전자 증폭될 수 있다. PCR 증폭 방법은 미국 특허 제4,683,195호; 제4,683,202호; 제4,800,159호; 제4,965,188호; 및 예를 들어 문헌["PCR Protocols: A Guide to Methods and Applications" Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989. Gene 77:51; Horton et al. 1993. Methods Enzymol . 217:270)]에 자세히 기재되어 있다. PCR은 공개된 중쇄 및 경쇄 DNA 및 아미노산 서열에 기초하여 공통 불변 영역 프라이머 또는 더 특이적인 프라이머에 의해 개시될 수 있다. PCR은 또한 항체 경쇄 및 중쇄를 코딩하는 DNA 클론을 단리하기 위해 사용될 수 있다. 이 경우에, 라이브러리는 공통 프라이머 또는 더 큰 상동성 프로브, 예컨대 마우스 불변 영역 프로브에 의해 스크리닝될 수 있다. 항체 유전자의 증폭에 적합한 많은 프라이머 세트는 당해 분야에 공지되어 있다(예를 들어, 정제된 항체의 N 말단 서열에 기초한 5' 프라이머(Benhar and Pastan. 1994. Protein Engineering 7:1509); cDNA 말단의 신속한 증폭(Ruberti, F. et al. 1994. J. Immunol . Methods 173:33); 항체 리더 서열(Larrick et al. 1989 Biochem . Biophys . Res. Commun. 160:1250)). 항체 서열의 클로닝은 1995년 1월 25일자에 출원된 Newman 등의 미국 특허 제5,658,570호(본 명세서에 참고로 포함됨)에 추가로 기재되어 있다.

본 명세서에서 사용된 면역글로불린 불변 영역은 모든 도메인 및 힌지 영역 또는 이의 부분을 포함할 수 있다. 일 실시형태에서, 면역글로불린 불변 영역 또는 이의 부분은 CH2 도메인, CH3 도메인, 및 힌지 영역, 즉 Fc 영역 또는 FcRn 결합 파트너를 포함한다.

본 명세서에 사용된 바와 같은, 용어 "Fc 영역"은 네이티브 Ig의 Fc 영역에 상응하는 폴리펩타이드의 부분, 즉 이의 2개의 중쇄의 각각의 Fc 도메인의 이합체 회합에 의해 형성된 것으로 정의된다. 네이티브 Fc 영역은 또 다른 Fc 영역과 동종이합체를 형성한다. 반대로, 본 명세서에 사용된 바와 같은, 용어 "유전자 융합된 Fc 영역" 또는 "단쇄 Fc 영역"(scFc 영역)은 단일 폴리펩타이드 사슬 내에 유전자 연결된(즉, 단일 인접한 유전자 서열에서 코딩된) Fc 도메인으로 이루어진 합성 이합체 Fc 영역을 의미한다. 국제 공보 WO 제2012/006635호(본 명세서에 그 전문이 참고로 포함됨)를 참조한다.

일 실시형태에서, "Fc 영역"은 파파인 절단 부위(즉, IgG에서의 216번 잔기, 114번인 중쇄 불변 영역의 제1 잔기를 취함)의 바로 상류에 힌지 영역에서 출발하고 항체의 C 말단에서 끝나는 단일 Ig 중쇄의 부분을 의미한다. 따라서, 완전한 Fc 영역은 적어도 힌지 도메인, CH2 도메인 및 CH3 도메인을 포함한다.

면역글로불린 불변 영역 또는 이의 부분은 FcRn 결합 파트너일 수 있다. FcRn은 성인 상피 조직에서 활성이고, 장, 폐 기도, 코 표면, 질 표면, 대장 및 직장 표면(미국 특허 제6,485,726호)의 내강에서 발현된다. FcRn 결합 파트너는 FcRn에 결합하는 면역글로불린의 부분이다.

FcRn 수용체는 인간을 포함하는 몇몇 포유류 종으로부터 단리된다. 인간 FcRn, 원숭이 FcRn, 랫트 FcRn 및 마우스 FcRn의 서열은 공지되어 있다(Story et al. 1994, J. Exp. Med. 180:2377). FcRn 수용체는 비교적 낮은 pH에서 IgG(다른 면역글로불린 종류, 예컨대 IgA, IgM, IgD 및 IgE가 아님)를 결합시키고, 내강에서 장막 방향으로 세포경유로 IgG를 능동으로 수송하고, 이후 간질액에서 발견되는 비교적 높은 pH에서 IgG를 방출한다. 이것은 폐 및 장 상피(Israel et al. 1997, Immunology 92:69), 신세뇨관성 상피(Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282:F358), 및 코 상피, 질 표면 및 담관 표면을 포함하는, 성인 상피 조직(미국 특허 제6,485,726호, 제6,030,613호, 제6,086,875호; WO 제03/077834호; US 제2003-0235536A1호)에서 발현된다.

본 개시내용에서 유용한 FcRn 결합 파트너는 전체 IgG, IgG의 Fc 단편 및 FcRn 수용체의 완전한 결합 영역을 포함하는 다른 단편을 포함하는 FcRn 수용체에 의해 특이적으로 결합될 수 있는 분자를 포함한다. FcRn 수용체에 결합하는 IgG의 Fc 부분의 영역은 X선 결정학에 기초하여 기재된다(Burmeister et al. 1994, Nature 372:379). Fc와 FcRn의 주요 접촉 부위는 CH2 및 CH3 도메인의 연접부에 가깝다. Fc-FcRn 접촉은 모두 단일 Ig 중쇄 내에 있다. FcRn 결합 파트너는 전체 IgG, IgG의 Fc 단편 및 FcRn의 완전한 결합 영역을 포함하는 IgG의 다른 단편을 포함한다. 주요 접촉 부위는 CH2 도메인의 248번, 250번 내지 257번, 272번, 285번, 288번, 290번 내지 291번, 308번 내지 311번 및 314번 아미노산 잔기 및 CH3 도메인의 385번 내지 387번, 428번 및 433번 내지 436번 아미노산 잔기를 포함한다. 면역글로불린 또는 면역글로불린 단편 또는 영역의 아미노산 넘버링에 이루어진 참조는 모두 문헌[Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md]에 기초한다.

FcRn에 결합된 Fc 영역 또는 FcRn 결합 파트너는 FcRn에 의해 상피 장벽에 걸쳐 효과적으로 셔틀링될 수 있어서, 원하는 치료학적 분자를 전신으로 투여하기 위한 비침습적인 수단을 제공한다. 추가로, Fc 영역 또는 FcRn 결합 파트너를 포함하는 융합 단백질은 FcRn을 발현하는 세포에 의해 내포작용된다. 그러나 분해에 대해 표시되는 것 대신에, 이 융합 단백질은 다시 순환으로 재순환되어서, 이 단백질의 생체내 반감기를 증가시킨다. 소정의 실시형태에서, 면역글로불린 불변 영역의 부분은, 이황화 결합 및 다른 비특이적 상호작용을 통해, 이합체 및 더 높은 차수의 다합체를 형성하기 위해 또 다른 Fc 영역 또는 또 다른 FcRn 결합 파트너와 통상적으로 회합하는 Fc 영역 또는 FcRn 결합 파트너이다.

2개의 FcRn 수용체는 단일 Fc 분자를 결합시킬 수 있다. 결정학적 데이터는 각각의 FcRn 분자가 Fc 동종이합체의 단일 폴리펩타이드를 결합시킨다는 것을 제안한다. 일 실시형태에서, 생물학적 활성 분자에 FcRn 결합 파트너, 예를 들어 IgG의 Fc 단편을 연결하는 것은 경구로, 협측으로, 설하로, 직장으로, 질내로, 비강으로 투여되는 에어로졸로 또는 폐 경로를 통해, 또는 안구내 경로를 통해 생물학적 활성 분자를 전달하는 수단을 제공한다. 또 다른 실시형태에서, FVIII 단백질은 침습적으로, 예를 들어 피하로, 정맥내로 투여될 수 있다.

FcRn 결합 파트너 영역은 Fc 영역의 FcRn 수용체에 의한 결과적인 능동 수송을 갖는 FcRn 수용체에 의해 특이적으로 결합될 수 있는 분자 또는 이의 부분이다. 특이적으로 결합된은 생리학적 조건 하에 비교적 안정한 복합체를 형성하는 2개의 분자를 의미한다. 특이적 결합은 보통 내지는 높은 역량과 함께 저 친화도를 보통 갖는 비특이적 결합으로부터 구별되는 것으로 높은 친화도 및 저 내지는 보통의 역량을 특징으로 한다. 통상적으로, 결합은 친화도 상수 KA가 10⁶M^-1 초과 또는 10⁸M^-1 초과일 때 특이적인 것으로 생각된다. 필요한 경우, 비특이적 결합은 결합 조건을 변화시킴으로써 특이적 결합에 실질적으로 영향을 미치지 않으면서 감소할 수 있다. 적절한 결합 조건, 예컨대 분자의 농도, 용액의 이온 농도, 온도, 결합에 허용된 시간, 차단제(예를 들어, 혈청 알부민, 밀크 카세인)의 농도 등은 일상적인 기법을 이용하여 당해 분야의 숙련자에 의해 최적화될 수 있다.

소정의 실시형태에서, 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 단백질은 그럼에도 불구하고 Fc 수용체(FcR) 결합 특성을 Fc 영역에 부여하기에 충분한 하나 이상의 절두된 Fc 영역을 포함한다. 예를 들어, FcRn에 결합하는 Fc 영역의 부분(즉, FcRn 결합 부분)은 EU 넘버링(1차 접촉 부위는 CH2 도메인의 248번, 250번 내지 257번, 272번, 285번, 288번, 290번 내지 291번, 308번 내지 311번 및 314번 아미노산 및 CH3 도메인의 385번 내지 387번, 428번 및 433번 내지 436번 아미노산 잔기임) IgG1의 약 282번 내지 438번 아미노산을 포함한다. 따라서, 본 개시내용의 Fc 영역은 FcRn 결합 부분을 포함하거나, 이들로 이루어질 수 있다. FcRn 결합 부분은 IgG1, IgG2, IgG3 및 IgG4를 포함하는 임의의 아이소타입의 중쇄로부터 유래될 수 있다. 일 실시형태에서, 인간 아이소타입 IgG1의 항체로부터의 FcRn 결합 부분을 사용한다. 또 다른 실시형태에서, 인간 아이소타입 IgG4의 항체로부터의 FcRn 결합 부분을 사용한다.

Fc 영역은 다수의 상이한 공급원으로부터 얻어질 수 있다. 일 실시형태에서, 폴리펩타이드의 Fc 영역은 인간 면역글로불린으로부터 유래된다. 그러나, Fc 모이어티가 예를 들어 설치류(예를 들어, 마우스, 랫트, 토끼, 기니아 피그) 또는 비인간 영장류(예를 들어, 침팬지, 마카크) 종을 포함하는 또 다른 포유류 종의 면역글로불린으로부터 유래될 수 있는 것으로 이해된다. 더구나, Fc 도메인 또는 이의 부분의 폴리펩타이드는 IgM, IgG, IgD, IgA 및 IgE를 포함하는 임의의 면역글로불린 종류 및 IgG1, IgG2, IgG3 및 IgG4를 포함하는 임의의 면역글로불린 아이소타입으로부터 유래될 수 있다. 또 다른 실시형태에서, 인간 아이소타입 IgG1을 사용한다.

소정의 실시형태에서, Fc 변이체는 상기 야생형 Fc 도메인을 포함하는 Fc 모이어티에 의해 부여된 적어도 하나의 효과기 기능의 변경(예를 들어, Fc 수용체(예를 들어, FcγRI, FcγRII 또는 FcγRIII) 또는 보체 단백질(예를 들어, C1q)에 결합하거나, 항체 의존적 세포독성(ADCC), 식세포작용 또는 보체 의존적 세포독성(CDCC)을 촉발하는 Fc 영역의 능력의 개선 또는 감소)을 부여한다. 다른 실시형태에서, Fc 변이체는 조작된 시스테인 잔기를 제공한다.

본 개시내용의 Fc 영역은 효과기 기능 및/또는 FcR 또는 FcRn 결합에서 변경(예를 들어, 증대 또는 감소)을 부여하는 것으로 공지된 분야 인정된 Fc 변이체를 사용할 수 있다. 구체적으로, 본 개시내용의 Fc 영역은 국제 PCT 공보 WO 제88/07089A1호, WO 제96/14339A1호, WO 제98/05787A1호, WO 제98/23289A1호, WO 제99/51642A1호, WO 제99/58572A1호, WO 제00/09560A2호, WO 제00/32767A1호, WO 제00/42072A2호, WO 제02/44215A2호, WO 제02/060919A2호, WO 제03/074569A2호, WO 제04/016750A2호, WO 제04/029207A2호, WO 제04/035752A2호, WO 제04/063351A2호, WO 제04/074455A2호, WO 제04/099249A2호, WO 제05/040217A2호, WO 제04/044859호, WO 제05/070963A1호, WO 제05/077981A2호, WO 제05/092925A2호, WO 제05/123780A2호, WO 제06/019447A1호, WO 제06/047350A2호 및 WO 제06/085967A2호; 미국 특허 공보 US 제2007/0231329호, US 제2007/0231329호, US 제2007/0237765호, US 제2007/0237766호, US 제2007/0237767호, US 제2007/0243188호, US 제20070248603호, US 제20070286859호, US 제20080057056호; 또는 미국 특허 제5,648,260호; 제5,739,277호; 제5,834,250호; 제5,869,046호; 제6,096,871호; 제6,121,022호; 제6,194,551호; 제6,242,195호; 제6,277,375호; 제6,528,624호; 제6,538,124호; 제6,737,056호; 제6,821,505호; 제6,998,253호; 제7,083,784호; 제7,404,956호 및 제7,317,091(이들의 각각은 본 명세서에서 참고로 포함됨)에 개시된 하나 이상의 아미노산 위치에서 예를 들어 변경(예를 들어, 치환)을 포함할 수 있다. 일 실시형태에서, 특정한 변경(예를 들어, 당해 분야에 개시된 하나 이상의 아미노산의 특정한 치환)은 하나 이상의 개시된 아미노산 위치에서 이루어질 수 있다. 또 다른 실시형태에서, 하나 이상의 개시된 아미노산 위치에서의 상이한 변경(예를 들어, 당해 분야에 개시된 하나 이상의 아미노산 위치의 상이한 치환)이 이루어질 수 있다.

IgG의 Fc 영역 또는 FcRn 결합 파트너는 FcRn에 의해 결합된 변형된 IgG 또는 Fc 단편 또는 이의 부분을 생성시키도록 잘 인정된 절차, 예컨대 부위 지정 돌연변이유발 등에 따라 변형될 수 있다. 이러한 변형은 FcRn 접촉 부위로부터 먼 변형, 및 FcRn에 대한 결합을 보존하거나 심지어 증대시키는 접촉 부위 내의 변형을 포함한다. 예를 들어, 인간 IgG1 Fc에서의 하기 단일 아미노산 잔기(Fcγ1)는 FcRn에 대한 Fc 결합 친화도의 유의미한 소실 없이 치환될 수 있다: P238A, S239A, K246A, K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T289A, K290A, R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V303A, V305A, T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A, A327Q, P329A, A330Q, P331A, E333A, K334A, T335A, S337A, K338A, K340A, Q342A, R344A, E345A, Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A, S375A, D376A, A378Q, E380A, E382A, S383A, N384A, Q386A, E388A, N389A, N390A, Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A, V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A, 및 K447A(여기서, 예를 들어 P238A는 238번 위치에서 알라닌에 의해 치환된 야생형 프롤린을 나타냄). 예로서, 구체적인 실시형태는 고도로 보존된 N-글라이코실화 부위를 제거하는 N297A 돌연변이를 도입한다. 알라닌 이외에, 상기 언급된 위치에서 야생형 아미노산에 대해 다른 아미노산이 치환될 수 있다. 돌연변이는 Fc로 단독으로 도입되어서, 네이티브 Fc와 구별되는 100개 초과의 Fc 영역을 생성할 수 있다. 추가로, 이들 개별 돌연변이의 2개, 3개 또는 이것 초과의 조합은 함께 도입되어서, 수 백개가 넘는 Fc 영역을 생성할 수 있다.

소정의 상기 돌연변이는 Fc 영역 또는 FcRn 결합 파트너에 새로운 작용기를 부여할 수 있다. 예를 들어, 하나의 실시형태는 고도로 보존된 N-글라이코실화 부위를 제거하는 N297A를 도입한다. 이 돌연변이의 효과는 면역원성을 감소시켜서, Fc 영역의 순환 반감기를 증대시키고, Fc 영역이 FcRn에 대한 친화도를 손상시키지 않으면서 FcγRI, FcγRIIA, FcγRIIB 및 FcγRIIIA에 결합할 수 없게 하는 것이다(Routledge et al. 1995, Transplantation 60:847; Friend et al. 1999, Transplantation 68:1632; Shields et al. 1995, J. Biol. Chem. 276:6591). 상기 기재된 돌연변이로부터 생긴 새로운 작용기의 추가의 예로서, FcRn에 대한 친화도는 몇몇 경우에 야생형의 것을 넘어 증가할 수 있다. 이 증가한 친화도는 증가한 "결합" 상수, 감소한 "해리" 상수 또는 증가한 "결합" 상수 및 감소한 "해리" 상수 둘 다를 반영할 수 있다. FcRn에 대한 증가한 친화도를 부여하는 것으로 생각되는 돌연변이의 예는 T256A, T307A, E380A, 및 N434A를 포함하지만, 이들로 제한되지는 않는다(Shields et al. 2001, J. Biol. Chem. 276:6591).

추가로, 적어도 3개의 인간 Fc 감마 수용체는 하부 힌지 영역, 일반적으로 234번 내지 237번 아미노산 내에 IgG에서의 결합 부위를 인식하는 것으로 보인다. 따라서, 새로운 작용기 및 잠재적인 감소한 면역원성의 또 다른 예는 예를 들어 IgG2 "PVA"(1개의 아미노산 결실을 가짐)로부터 상응하는 서열에 인간 IgG1 "ELLG"의 233번 내지 236번 아미노산(서열 번호 45)을 대체함으로써, 이 영역의 돌연변이로부터 생길 수 있다. 이러한 돌연변이가 도입될 때 다양한 효과기 기능을 매개하는 FcγRI, FcγRII 및 FcγRIII가 IgG1에 결합하지 않는 것으로 밝혀졌다(Ward and Ghetie 1995, Therapeutic Immunology 2:77 and Armour et al. 1999, Eur. J. Immunol. 29:2613).

또 다른 실시형태에서, 면역글로불린 불변 영역 또는 이의 부분은 제2 면역글로불린 불변 영역 또는 이의 부분과 하나 이상의 이황화 결합을 형성하는 힌지 영역 또는 이의 부분에서의 아미노산 서열을 포함한다. 제2 면역글로불린 불변 영역 또는 이의 부분은 제2 폴리펩타이드에 연결되어서, FVIII 단백질 및 제2 폴리펩타이드가 함께 있게 할 수 있다. 몇몇 실시형태에서, 제2 폴리펩타이드는 증강자 모이어티이다. 본 명세서에 사용된 바와 같은, 용어 "증강자 모이어티"는 FVIII의 응혈 활성을 증대시킬 수 있는 폴리펩타이드의 분자, 이의 단편 또는 성분을 의미한다. 증강자 모이어티는 보인자, 예컨대 가용성 조직 인자(sTF) 또는 응혈촉진 펩타이드일 수 있다. 따라서, FVIII의 활성화 시, 증강자 모이어티는 FVIII 활성을 증대시키도록 이용 가능하다.

소정의 실시형태에서, 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 단백질은 Ig 불변 영역의 항원 독립적 효과기 기능, 특히 단백질의 순환 반감기를 변경시키는 면역글로불린 불변 영역 또는 이의 부분(예를 들어, Fc 변이체)에 대한 아미노산 치환을 포함한다.

2. scFc 영역

또 다른 양태에서, 비상동성 모이어티는 scFc(단쇄 Fc) 영역을 포함한다. 일 실시형태에서, 본 개시내용의 단리된 핵산 분자는 scFc 영역을 코딩하는 비상동성 핵산 서열을 추가로 포함한다. scFc 영역은 Fc 펩타이드 링커에 의해 연결된 하나의 기능성 scFc 영역을 형성하기 위해 폴딩(예를 들어, 분자내 또는 분자간 폴딩)할 수 있는 동일한 선형 폴리펩타이드 사슬 내에 적어도 2개의 면역글로불린 불변 영역 또는 이의 부분(예를 들어, Fc 모이어티 또는 도메인(예를 들어, 2개, 3개, 4개, 5개, 6개, 또는 이것 초과의 Fc 모이어티 또는 도메인))을 포함한다. 예를 들어, 일 실시형태에서, 본 개시내용의 폴리펩타이드는 반감기를 개선하거나 면역 효과기 기능(예를 들어, 항체 의존적 세포독성(ADCC), 식세포작용 또는 보체 의존적 세포독성(CDCC))을 촉발하고/하거나, 제조가능성을 개선하기 위해, 이의 scFc 영역을 통해, 적어도 하나의 Fc 수용체(예를 들어, FcRn, FcγR 수용체(예를 들어, FcγRIII) 또는 보체 단백질(예를 들어, C1q))에 결합할 수 있다.

3. CTP

또 다른 양태에서, 비상동성 모이어티는 인간 융모성 고나도트로핀 또는 이의 단편, 변이체 또는 유도체의 β 아단위의 1개의 C 말단 펩타이드(CTP)를 포함한다. 재조합 단백질로 삽입된 하나 이상의 CTP 펩타이드는 이 단백질의 생체내 반감기를 증가시키는 것으로 공지되어 있다. 예를 들어, 미국 특허 제5,712,122호(본 명세서에 그 전문이 참고로 포함됨)를 참조한다.

예시적인 CTP 펩타이드는 DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL(서열 번호 33) 또는 SSSSKAPPPSLPSPSRLPGPSDTPILPQ(서열 번호 34)를 포함한다. 예를 들어, 미국 특허 출원 공보 US 제2009/0087411 A1호(참고로 포함됨)를 참조한다.

4. XTEN 서열

몇몇 실시형태에서, 비상동성 모이어티는 하나 이상의 XTEN 서열, 이의 단편, 변이체 또는 유도체를 포함한다. 여기서 사용된 바와 같은, "XTEN 서열"은 주로 작은 친수성 아미노산으로 이루어진 천연 비발생, 실질적으로 비반복적인 서열을 갖는 연장된 길이 폴리펩타이드를 의미하고, 서열은 생리학적 조건 하에 적은 정도를 갖거나 2차 또는 3차 구조를 갖지 않는다. 비상동성 모이어티로서, XTEN은 반감기 연장 모이어티로서 작용할 수 있다. 또한, XTEN은 증대된 약동역학 매개변수 및 용해도 특징(이들로 제한되지는 않음)을 포함하는 원하는 특성을 제공할 수 있다.

본 개시내용의 단백질로의 XTEN 서열을 포함하는 비상동성 모이어티의 도입은 단백질에 하기 유리한 특성 중 하나 이상을 부여할 수 있다: 입체형태 가요성, 증대된 수성 용해도, 높은 정도의 프로테아제 내성, 낮은 면역원성, 포유류 수용체에 대한 낮은 결합 또는 증가한 수력학적(또는 Stokes) 반경.

소정의 양태에서, XTEN 서열은 약동역학 특성, 예컨대 더 긴 생체내 반감기 또는 증가한 곡선 하 면적(AUC)을 증가시킬 수 있어서, 본 개시내용의 단백질은 생체내 머물고, XTEN 비상동성 모이어티가 없는 것을 제외하고 이를 갖는 단백질과 비교하여 증가한 시간 기간 동안 응혈촉진 활성을 갖는다.

몇몇 실시형태에서, 본 개시내용에 유용한 XTEN 서열은 약 20개 초과, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 1000개, 1200개, 1400개, 1600개, 1800개 또는 2000개의 아미노산 잔기를 갖는 펩타이드 또는 폴리펩타이드이다. 소정의 실시형태에서, XTEN은 약 20개 초과 내지 약 3000개의 아미노산 잔기, 30개 초과 내지 약 2500개의 잔기, 40개 초과 내지 약 2000개의 잔기, 50개 초과 내지 약 1500개의 잔기, 60개 초과 내지 약 1000개의 잔기, 70개 초과 내지 약 900개의 잔기, 80개 초과 내지 약 800개의 잔기, 90개 초과 내지 약 700개의 잔기, 100개 초과 내지 약 600개의 잔기, 110개 초과 내지 약 500개의 잔기 또는 120개 초과 내지 약 400개의 잔기를 갖는 펩타이드 또는 폴리펩타이드이다. 하나의 특정한 실시형태에서, XTEN은 42개보다 긴 아미노산 및 144개보다 짧은 아미노산 길이의 아미노산 서열을 포함한다.

본 개시내용의 XTEN 서열은 서열 모티프와 적어도 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 5개 내지 14개(예를 들어, 9개 내지 14개)의 아미노산 잔기 또는 아미노산 서열의 하나 이상의 서열 모티프를 포함할 수 있고, 여기서 모티프는 글라이신(G), 알라닌(A), 세린(S), 트레오닌(T), 글루타메이트(E) 및 프롤린(P)으로 이루어진 군으로부터 선택된 4개 내지 6개 유형의 아미노산(예를 들어, 5개의 아미노산)을 포함하거나, 본질적으로 이들로 이루어지거나, 이들로 이루어진다. US 제2010-0239554호 A1을 참조한다.

몇몇 실시형태에서, XTEN은 비중첩 서열 모티프를 포함하고, 여기서 서열의 약 80% 또는 적어도 약 85% 또는 적어도 약 90% 또는 약 91% 또는 약 92% 또는 약 93% 또는 약 94% 또는 약 95% 또는 약 96% 또는 약 97% 또는 약 98% 또는 약 99% 또는 약 100%는 표 4로부터 선택된 단일 모티프 패밀리로부터 선택된 비중첩 서열의 다수의 단위로 이루어져서, 패밀리 서열을 생성시킨다. 본 명세서에 사용된 바와 같은, "패밀리"는 XTEN이 오직 표 4로부터의 단일 모티프 카테고리로부터 선택된 모티프; 즉 AD, AE, AF, AG, AM, AQ, BC, 또는 BD XTEN을 갖고, 패밀리 모티프로부터가 아닌 XTEN에서의 임의의 다른 아미노산이 필요한 특성을 달성하도록, 예컨대 코딩 뉴클레오타이드에 의한 제한 부위의 도입, 절단 서열의 도입을 허용하거나 FVIII에 대한 더 양호한 연결을 달성하도록 선택된다는 것을 의미하다. XTEN 패밀리의 몇몇 실시형태에서, XTEN 서열은 AD 모티프 패밀리 또는 AE 모티프 패밀리 또는 AF 모티프 패밀리 또는 AG 모티프 패밀리 또는 AM 모티프 패밀리 또는 AQ 모티프 패밀리 또는 BC 패밀리 또는 BD 패밀리의 비중첩 서열 모티프의 다수의 단위를 포함하고, 생성된 XTEN은 상기 기재된 상동성의 범위를 나타낸다. 다른 실시형태에서, XTEN은 표 2A의 2개 이상의 모티프 패밀리로부터의 모티프 서열의 다수의 단위를 포함한다. 이 서열은 하기 더 자세히 기재된 모티프의 아미노산 조성에 의해 부여된 순 전하, 친수화도, 2차 구조의 결여 또는 반복성의 결여와 같은 특성을 포함하는 원하는 물리적/화학적 특징을 달성하도록 선택될 수 있다. 이 문단에 기재된 상기 실시형태에서, XTEN으로 도입된 모티프는 약 36개 내지 약 3000개의 아미노산 잔기의 XTEN을 달성하도록 본 명세서에 기재된 방법을 이용하여 선택되고 조립될 수 있다.

본 개시내용의 키메라 단백질에서 비상동성 모이어티로서 사용될 수 있는 XTEN 서열의 예는 예를 들어 미국 특허 공보 제2010/0239554호 A1, 제2010/0323956호 A1, 제2011/0046060호 A1, 제2011/0046061호 A1, 제2011/0077199호 A1 또는 제2011/0172146호 A1, 또는 국제 특허 공보 WO 제2010091122호 A1, WO 제2010144502호 A2, WO 제2010144508호 A1, WO 제2011028228호 A1, WO 제2011028229호 A1 또는 WO 2011028344호 A2(이들의 각각은 본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다.

XTEN은 FVIII로의 삽입 또는 이에 대한 연결을 위해 다양한 길이를 가질 수 있다. 일 실시형태에서, XTEN 서열(들)의 길이는 융합 단백질에서 달성하고자 하는 특성 또는 기능에 기초하여 선택된다. 의도된 특성 또는 기능에 따라, XTEN은 캐리어로서 작용할 수 있는 짧은 또는 중간 길이의 서열 또는 더 긴 서열일 수 있다. 소정의 실시형태에서, XTEN은 약 6개 내지 약 99개의 아미노산 잔기의 짧은 분절, 약 100개 내지 약 399개의 아미노산 잔기의 중간 길이 및 약 400개 내지 약 1000개 및 약 3000개 이하의 아미노산 잔기의 더 긴 길이를 포함한다. 따라서, FVIII로 삽입되거나 이에 연결된 XTEN은 약 6개, 약 12개, 약 36개, 약 40개, 약 42개, 약 72개, 약 96개, 약 144개, 약 288개, 약 400개, 약 500개, 약 576개, 약 600개, 약 700개, 약 800개, 약 864개, 약 900개, 약 1000개, 약 1500개, 약 2000개, 약 2500개 또는 약 3000개 이하의 아미노산 잔기의 길이를 가질 수 있다. 다른 실시형태에서, XTEN 서열은 약 6개 내지 약 50개, 약 50개 내지 약 100개, 약 100개 내지 150개, 약 150개 내지 250개, 약 250개 내지 400개, 약 400개 내지 약 500개, 약 500개 내지 약 900개, 약 900개 내지 1500개, 약 1500개 내지 2000개 또는 약 2000개 내지 약 3000개의 아미노산 잔기의 길이이다. FVIII로 삽입되거나 이에 연결된 XTEN의 정확한 길이는 FVIII의 활성에 부정적으로 영향을 미치지 않으면서 변할 수 있다. 일 실시형태에서, 본 명세서에서 사용된 하나 이상의 XTEN은 42개의 아미노산, 72개의 아미노산, 144개의 아미노산, 288개의 아미노산, 576개의 아미노산 또는 864개의 아미노산 길이를 갖고, 하나 이상의 XTEN 패밀리 서열; 즉, AD, AE, AF, AG, AM, AQ, BC 또는 BD로부터 선택될 수 있다.

몇몇 실시형태에서, 본 개시내용에서 사용된 XTEN 서열은 AE42, AG42, AE48, AM48, AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288, AE324, AG324, AE360, AG360, AE396, AG396, AE432, AG432, AE468, AG468, AE504, AG504, AF504, AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684, AE720, AG720, AE756, AG756, AE792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875, AE912, AM923, AM1318, BC864, BD864, AE948, AE1044, AE1140, AE1236, AE1332, AE1428, AE1524, AE1620, AE1716, AE1812, AE1908, AE2004A, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908, AG2004, 및 임의의 이들의 조합으로 이루어진 군으로부터 선택된 서열과 적어도 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다. US 제2010-0239554호 A1을 참조한다. 하나의 특정한 실시형태에서, XTEN은 AE42, AE72, AE144, AE288, AE576, AE864, AG 42, AG72, AG144, AG288, AG576, AG864, 또는 임의의 이들의 조합을 포함한다.

본 개시내용의 키메라 단백질에서 비상동성 모이어티로서 사용될 수 있는 예시적인 XTEN 서열은 XTEN AE42-4(서열 번호 46, 서열 번호 47에 의해 코딩됨; 각각 도 11c 및 도 11d), XTEN 144-2A(서열 번호 48, 서열 번호 49에 의해 코딩됨; 각각 도 11e 및 도 11f), XTEN A144-3B(서열 번호 50, 서열 번호 51에 의해 코딩됨; 각각 도 11g 및 도 11h), XTEN AE144-4A(서열 번호 52, 서열 번호 53에 의해 코딩됨; 각각 도 11i 및 도 11j), XTEN AE144-5A(서열 번호 54, 서열 번호 55에 의해 코딩됨; 각각 도 11k 및 도 11l), XTEN AE144-6B(서열 번호 56, 서열 번호 57에 의해 코딩됨; 각각 도 11m 및 도 11n), XTEN AG144-1(서열 번호 58, 서열 번호 59에 의해 코딩됨; 각각 도 11o 및 도 11p), XTEN AG144-A(서열 번호 60, 서열 번호 61에 의해 코딩됨; 각각 도 11q 및 도 11r), XTEN AG144-B(서열 번호 62, 서열 번호 63에 의해 코딩됨; 각각 도 11s 및 도 11t), XTEN AG144-C(서열 번호 64, 서열 번호 65에 의해 코딩됨; 각각 도 11u 및 도 11v) 및 XTEN AG144-F(서열 번호 66, 서열 번호 67에 의해 코딩됨; 각각 도 11w 및 도 11x)를 포함한다. 하나의 특정한 실시형태에서, XTEN은 서열 번호 18에 의해 코딩된다.

몇몇 실시형태에서, XTEN의 아미노산의 100% 미만은 글라이신(G), 알라닌(A), 세린(S), 트레오닌(T), 글루타메이트(E) 및 프롤린(P)으로부터 선택되거나, 서열의 100% 미만은 표 2A 또는 본 명세서에 제공된 XTEN 서열로부터의 서열 모티프로 이루어진다. 이러한 실시형태에서, XTEN의 남은 아미노산 잔기는 임의의 다른 14개의 자연 L-아미노산으로부터 선택되지만, 친수성 아미노산으로부터 우선적으로 선택될 수 있어서, XTEN 서열은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 약 99%의 친수성 아미노산을 함유한다. 접합 작제물에서 사용된 XTEN에서의 소수성 아미노산의 함량은 5% 미만 또는 2% 미만 또는 1% 미만의 소수성 아미노산 함량일 수 있다. XTEN의 구성에 덜 양호한 소수성 잔기는 트립토판, 페닐알라닌, 타이로신, 류신, 아이소류신, 발린 및 메티오닌을 포함한다. 추가로, XTEN 서열은 하기 아미노산의 5% 미만 또는 4% 미만 또는 3% 미만 또는 2% 미만 또는 1% 미만을 함유하거나 함유하지 않을 수 있다: 메티오닌(예를 들어, 산화를 피하도록), 또는 아스파라긴 및 글루타민(데스아미데이션을 피하도록).

하나 이상의 XTEN 서열은 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열의 C 말단 또는 N 말단에서 삽입되거나 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열에서 2개의 아미노산 사이에 삽입될 수 있다. 예를 들어, XTEN은 표 3으로부터 선택된 하나 이상의 삽입 부위에서 2개의 아미노산 사이에 삽입될 수 있다. XTEN 삽입에 허용 가능한 FVIII 내의 부위의 예는 예를 들어 국제 공보 WO 제2013/123457호 A1 또는 미국 공보 제2015/0158929호 A1(본 명세서에 그 전문이 참고로 포함됨)에서 발견될 수 있다.

5. 알부민, 또는 이의 단편, 유도체 또는 변이체

몇몇 실시형태에서, 비상동성 모이어티는 알부민 또는 이의 기능성 단편을 포함한다. 전장 형태의 609개의 아미노산의 단백질인 인간 혈청 알부민(HSA, 또는 HA)은 혈청의 삼투압의 유의미한 비율을 담당하고, 또한 내인성 및 외인성 리간드의 캐리어로서 작용한다. 본 명세서에 사용된 바와 같은, 용어 "알부민"은 전장 알부민, 또는 이의 기능적 단편, 변이체, 유도체 또는 유사체를 포함한다. 알부민 또는 이의 단편 또는 변이체의 예는 미국 특허 공보 제2008/0194481호 A1, 제2008/0004206호 A1, 제2008/0161243호 A1, 제2008/0261877호 A1 또는 제2008/0153751호 A1, 또는 PCT 출원 공보 제2008/033413호 A2, 제2009/058322호 A1 또는 제2007/021494 A2호(본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다.

일 실시형태에서, 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 단백질은 면역글로불린 불변 영역 또는 이의 부분(예를 들어, Fc 영역), PAS 서열, HES 및 PEG로 이루어진 군으로부터 선택된 제2 비상동성 모이어티에 추가로 연결된 알부민, 이의 단편 또는 변이체를 포함한다.

6. 알부민 결합 모이어티

소정의 실시형태에서, 비상동성 모이어티는 알부민 결합 펩타이드, 박테리아 알부민 결합 도메인, 알부민 결합 항체 단편, 또는 임의의 이들의 조합을 포함하는 알부민 결합 모이어티이다.

예를 들어, 알부민 결합 단백질은 도메인 항체(미국 특허 제6,696,245호 참조)를 포함하는 박테리아 알부민 결합 단백질, 항체 또는 항체 단편일 수 있다. 알부민 결합 단백질은 예를 들어 박테리아 알부민 결합 도메인, 예컨대 스트렙토코커스 단백질 G 중 하나일 수 있다(Konig, T. and Skerra, A. (1998)　J. Immunol. Methods　218, 73-83). 접합 파트너로서 사용될 수 있는 알부민 결합 펩타이드의 다른 예는 예를 들어 미국 특허 출원 제2003/0069395호 또는 Dennis et al.(Dennis et al. (2002)　J. Biol . Chem .　277, 35035-35043)에 기재된 바와 같은 Cys-Xaa₁-Xaa₂-Xaa₃-Xaa₄-Cys 공통 서열(여기서, Xaa₁은 Asp, Asn, Ser, Thr 또는 Trp이고; Xaa₂는 Asn, Gln, His, Ile, Leu 또는 Lys이고; Xaa₃은 Ala, Asp, Phe, Trp 또는 Tyr이고; Xaa₄는 Asp, Gly, Leu, Phe, Ser 또는 Thr임)을 갖는 것이다.

Kraulis 등의 FEBS Lett. 378:190-194 (1996) 및 Linhult 등의 Protein Sci. 11:206-213 (2002)에 의해 기재된 것과 같은 스트렙토코커스 단백질 G로부터의 도메인 3은 박테리아 알부민 결합 도메인의 예이다. 알부민 결합 펩타이드의 예는 코어 서열 DICLPRWGCLW(서열 번호 35)를 갖는 일련의 펩타이드를 포함한다. 예를 들어, 문헌[Dennis et al., J. Biol. Chem. 2002, 277: 35035-35043 (2002)]을 참조한다. 알부민 결합 항체 단편의 예는 문헌[Muller and Kontermann, Curr. Opin. Mol. Ther. 9:319-326 (2007); Roovers et al., Cancer Immunol. Immunother. 56:303-317 (2007), 및 Holt et al., Prot. Eng. Design Sci., 21:283-288 (2008)](본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다. 이러한 알부민 결합 모이어티의 예는 Trussel 등의 Bioconjugate Chem. 20:2286-2292 (2009)에 의해 개시된 바와 같은 2-(3-말레이미도프로판아미도)-6-(4-(4-요오도페닐)뷰탄아미도) 헥사노에이트("Albu" 태그)이다.

지방산, 특히 장쇄 지방산(LCFA) 및 장쇄 지방산 유사 알부민 결합 화합물은 본 개시내용의 FVIII 단백질의 생체내 반감기를 연장시키기 위해 사용될 수 있다. LCFA 유사 알부민 결합 화합물의 예는 16-(1-(3-(9-(((2,5-다이옥소피롤리딘-l-일옥시)카보닐옥시)-메틸)-7-설포-9H-플루오렌-2-일아미노)-3-옥소프로필)-2,5-다이옥소피롤리딘-3-일티오) 헥사데칸산(예를 들어, WO 제2010/140148호 참조)이다.

7. PAS 서열

다른 실시형태에서, 비상동성 모이어티는 PAS 서열이다. 본 명세서에 사용된 바와 같은, PAS 서열은 알라닌 및 세린 잔기를 주로 포함하거나 알라닌, 세린 및 프롤린 잔기를 주로 포함하는 아미노산 서열을 의미하고, 아미노산 서열은 생리학적 조건 하에 랜덤 코일 입체구조를 형성한다. 따라서, PAS 서열은 키메라 단백질에서 비상동성 모이어티의 부분으로 사용될 수 있는 알라닌, 세린 및 프롤린을 포함하거나, 본질적으로 이들로 이루어지거나, 이들로 이루어진 빌딩 블록, 아미노산 중합체 또는 서열 카세트이다. 거기에, 숙련자는 알라닌, 세린 및 프롤린 이외의 잔기가 PAS 서열에서 마이너 구성성분으로서 첨가될 때 아미노산 중합체가 또한 랜덤 코일 입체구조를 형성할 수 있다는 것을 알 것이다. 본 명세서에 사용된 바와 같은, 용어 "마이너 구성성분"은 알라닌, 세린 및 프롤린 이외의 아미노산이 소정의 정도로, 예를 들어 약 12% 이하, 즉 PAS 서열의 100개 중 약 12개의 아미노산, 약 10% 이하, 즉 PAS 서열의 100개 중 약 10개의 아미노산, 약 9% 이하, 즉 100개 중 약 9개의 아미노산, 약 8% 이하, 즉 100개 중 약 8개의 아미노산, 약 6%, 즉 100개 중 약 6개의 아미노산, 약 5%, 즉 100개 중 약 5개의 아미노산, 약 4%, 즉 100개 중 약 4개의 아미노산, 약 3%, 즉 100개 중 약 3개의 아미노산, 약 2%, 즉 100개 중 약 2개의 아미노산, 약 1%, 즉 100개 중 약 1개의 아미노산으로 PAS 서열에서 첨가될 수 있다는 것을 의미한다. 알라닌, 세린 및 프롤린과 다른 아미노산은 Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr 및 Val로 이루어진 군으로부터 선택될 수 있다.

생리학적 조건 하에, PAS 서열 스트레치는 랜덤 코일 입체구조를 형성하고 이로써 FVIII 단백질에 대한 증가한 생체내 및/또는 시험관내 안정성을 매개할 수 있다. 랜덤 코일 도메인이 스스로 안정한 구조 또는 기능을 채택하지 않으므로, FVIII 단백질에 의해 매개된 생물학적 활성은 본질적으로 보존된다. 다른 실시형태에서, 랜덤 코일 도메인을 형성하는 PAS 서열은 특히 혈액 혈장에서의 단백질분해, 면역원성, 등전점/정전기 거동, 세포 표면 수용체에 대한 결합 또는 내재화와 관련하여 생물학적으로 불활성이지만, 여전히 생분해성이고, 이것은 합성 중합체, 예컨대 PEG에 비해 명확한 이점을 제공한다.

랜덤 코일 입체구조를 형성하는 PAS 서열의 비제한적인 예는 ASPAAPAPASPAAPAPSAPA(서열 번호 36), AAPASPAPAAPSAPAPAAPS(서열 번호 37), APSSPSPSAPSSPSPASPSS(서열 번호 38), APSSPSPSAPSSPSPASPS(서열 번호 39), SSPSAPSPSSPASPSPSSPA(서열 번호 40), AASPAAPSAPPAAASPAAPSAPPA(서열 번호 41) 및 ASAAAPAAASAAASAPSAAA(서열 번호 42) 또는 임의의 이들의 조합으로 이루어진 군으로부터 선택된 아미노산 서열을 포함한다. PAS 서열의 추가 예는 예를 들어 미국 특허 공보 제2010/0292130호 A1 및 PCT 출원 공보 WO 제2008/155134호 A1로부터 공지되어 있다.

8. HAP 서열

소정의 실시형태에서, 비상동성 모이어티는 글라이신 농후 호모-아미노산 중합체(HAP)이다. HAP 서열은 적어도 50개의 아미노산, 적어도 100개의 아미노산, 120개의 아미노산, 140개의 아미노산, 160개의 아미노산, 180개의 아미노산, 200개의 아미노산, 250개의 아미노산, 300개의 아미노산, 350개의 아미노산, 400개의 아미노산, 450개의 아미노산 또는 500개의 아미노산 길이를 갖는 글라이신의 반복 서열을 포함할 수 있다. 일 실시형태에서, HAP 서열은 HAP 서열에 융합되거나 연결된 모이어티의 반감기를 연장시킬 수 있다. HAP 서열의 비제한적인 예는 (Gly)_n, (Gly₄Ser)_n 또는 S(Gly₄Ser)_n(여기서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20임)을 포함하지만, 이들로 제한되지는 않는다. 일 실시형태에서, n은 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40이다. 또 다른 실시형태에서, n은 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 또는 200이다.

9. 트랜스페린 또는 이의 단편

소정의 실시형태에서, 비상동성 모이어티는 트랜스페린 또는 이의 단편이다. 임의의 트랜스페린은 본 개시내용의 FVIII 단백질을 만들도록 사용될 수 있다. 예로서, 야생형 인간 TF(TF)는, 유전자 중복으로부터 기원하는 것으로 보이는, N(약 330개의 아미노산) 및 C(약 340개의 아미노산)인 2개의 주요 도메인을 갖는 대략 75kDa(글라이코실화를 설명하지 않음)의 679개의 아미노산 단백질이다. 유전자은행 수탁 번호 NM001063, XM002793, M12530, XM039845, XM 039847 및 S95936(www.ncbi.nlm.nih.gov/)(이들은 모두 본 명세서에 그 전문이 참고로 포함됨)을 참조한다. 트랜스페린은 N 도메인 및 C 도메인인 2개의 도메인을 포함한다. N 도메인은 N1 도메인 및 N2 도메인인 2개의 하위도메인을 포함하고, C 도메인은 C1 도메인 및 C2 도메인인 2개의 하위도메인을 포함한다.

일 실시형태에서, 트랜스페린 비상동성 모이어티는 트랜스페린 슬라이스 변이체를 포함한다. 일 예에서, 트랜스페린 슬라이스 변이체는 인간 트랜스페린의 슬라이스 변이체, 예를 들어 유전자은행 수탁번호 AAA61140일 수 있다. 또 다른 실시형태에서, 키메라 단백질의 트랜스페린 부분은 트랜스페린 서열의 하나 이상의 도메인, 예를 들어 N 도메인, C 도메인, N1 도메인, N2 도메인, C1 도메인, C2 도메인 또는 임의의 이들의 조합을 포함한다.

10. 간극 수용체

소정의 실시형태에서, 비상동성 모이어티는 간극 수용체(clearance receptor), 이의 단편, 변이체 또는 유도체이다. LRP1은 X 인자와 같은 다양한 단백질의 수용체 매개된 청소에 관여된 600kDa 내부 막 단백질이다. 예를 들어, 문헌[Narita et al., Blood 91:555-560 (1998)]을 참조한다.

11. 폰 빌레브란트 인자 또는 이의 단편

소정의 실시형태에서, 비상동성 모이어티는 폰 빌레브란트 인자(VWF) 또는 하나 이상의 이의 단편이다.

VWF(F8VWF로도 공지됨)는 혈액 혈장에 존재하고 내피(바이벨펠라드소체에서), 거핵구(혈소판의 α-과립) 및 내피하 연결 조직에서 구성적으로 제조된 큰 다합체 당단백질이다. 염기성 VWF 단량체는 2813개의 아미노산 단백질이다. 모든 단량체는 특이적 기능을 갖는 다수의 특이적 도메인, D' 및 D3 도메인(함께 VIII 인자에 결합), A1 도메인(혈소판 GPIb-수용체, 헤파린, 및/또는 가능하게는 콜라겐에 결합), A3 도메인(콜라겐에 결합), C1 도메인(여기서, RGD 도메인은 이것이 활성화될 때 혈소판 인테그린 αIIbβ3에 결합) 및 단백질의 C 말단 말단에서의 "시스테인 노트(knot)" 도메인(VWF는 혈소판 유래 성장 인자(PDGF), 형질전환 성장 인자-β(TGFβ) 및 β-인간 융모성 고나도트로핀(βHCG)과 공유함)을 함유한다.

인간 VWF에 대한 2813개의 단량체 아미노산 서열은 유전자은행에서 수탁 번호 NP000543.2로 보고된다. 인간 VWF를 코딩하는 뉴클레오타이드 서열은 유전자은행에서 수탁 번호 NM000552.3으로 보고된다. 서열 번호 44(도 11b)는 서열 번호 43에 의해 코딩된 아미노산 서열이다. D' 도메인은 서열 번호 44의 764번 내지 866번 아미노산을 포함한다. D3 도메인은 서열 번호 44의 867 내지 1240번 아미노산을 포함한다.

혈장에서, FVIII의 95% 내지 98%는 전장 VWF와 단단한 비공유 복합체로서 순환한다. 이 복합체의 형성은 생체내 FVIIII의 적절한 혈장 수준의 유지에 중요하다. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). FVIII가 중쇄에서의 372번 및 740번 위치 및 경쇄에서의 1689번 위치에서 단백질분해로 인해 활성화될 때, FVIII에 결합된 VWF는 활성화된 FVIII으로부터 제거된다.

소정의 실시형태에서, 비상동성 모이어티는 전장 폰 빌레브란트 인자이다. 다른 실시형태에서, 비상동성 모이어티는 폰 빌레브란트 인자 단편이다. 본 명세서에 사용된 바와 같은, 본 명세서에서 사용된 용어 "VWF 단편" 또는 "VWF 단편"은 FVIII와 상호작용하고, 전장 VWF에 의해 FVIII에 보통 제공되는 적어도 하나 이상의 특성, 예를 들어 FVIIIa로의 조기 활성화의 방지, 조기 단백질분해의 방지, 조기 청소를 발생시킬 수 있는 인지질 막과의 회합의 방지, VWF 결합된 FVIII가 아니라 네이키드 FVIII를 결합시킬 수 있는 FVIII 간극 수용체에 대한 결합의 방지, 및/또는 FVIII 중쇄 및 경쇄 상호작용의 안정화를 보유하는 임의의 VWF 단편을 의미한다. 구체적인 실시형태에서, 비상동성 모이어티는 D' 도메인 및 VWF의 D3 도메인을 포함하는 (VWF) 단편이다. D' 도메인 및 D3 도메인을 포함하는 VWF 단편은 A1 도메인, A2 도메인, A3 도메인, D1 도메인, D2 도메인, D4 도메인, B1 도메인, B2 도메인, B3 도메인, C1 도메인, C2 도메인, CK 도메인, 하나 이상의 이의 단편, 및 임의의 이들의 조합으로 이루어진 군으로부터 선택된 VWF 도메인을 추가로 포함할 수 있다. VWF 단편에 융합된 FVIII 활성을 갖는 폴리펩타이드의 추가 예는 미국 가특허 출원 제61/667,901호(2012년 7월 3일 출원) 및 미국 공보 제2015/0023959호 A1(둘 다 본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다.

12. 링커 모이어티

소정의 실시형태에서, 비상동성 모이어티는 펩타이드 링커이다.

본 명세서에 사용된 바와 같은, 용어 "펩타이드 링커" 또는 "링커 모이어티"는 폴리펩타이드 사슬의 선형 아미노산 서열에서 2개의 도메인을 연결하는 펩타이드 또는 폴리펩타이드 서열(예를 들어, 합성 펩타이드 또는 폴리펩타이드 서열)을 의미한다.

몇몇 실시형태에서, 펩타이드 링커를 코딩하는 비상동성 뉴클레오타이드 서열은 본 개시내용의 최적화된 FVIII 폴리뉴클레오타이드 서열과 예를 들어 상기 기재된 비상동성 모이어티 중 하나를 코딩하는 비상동성 뉴클레오타이드 서열, 예컨대 알부민 사이에 삽입될 수 있다. 펩타이드 링커는 키메라 폴리펩타이드 분자에 가요성을 제공할 수 있다. 링커는 통상적으로 절단되지 않고, 이러한 절단이 바람직할 수 있다. 일 실시형태에서, 이 링커는 가공 동안 제거되지 않는다.

본 개시내용의 키메라 단백질에 존재할 수 있는 링커의 유형은 절단 가능한 부위(즉, 프로테아제 절단 부위 기질, 예를 들어 XIa 인자, Xa 인자 또는 트롬빈 절단 부위)를 포함하고, N 말단 또는 C 말단 또는 절단 부위의 양측에서 추가 링커를 포함할 수 있는 프로테아제 절단 가능한 링커이다. 이 절단 가능한 링커는 본 개시내용의 작제물로 도입될 때 비상동성 절단 부위를 갖는 키메라 분자를 생성시킨다.

일 실시형태에서, 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 폴리펩타이드는 단일 폴리펩타이드 사슬에 포함된 Fc 영역을 형성하도록 cscFc 링커를 통해 연결된 2개 이상의 Fc 도메인 또는 모이어티를 포함한다. cscFc 링커는 적어도 하나의 세포내 가공 부위, 즉 세포내 효소에 의해 절단된 부위에 의해 플랭킹된다. 적어도 하나의 세포내 가공 부위에서의 폴리펩타이드의 절단은 적어도 2개의 폴리펩타이드 사슬을 포함하는 폴리펩타이드를 발생시킨다.

다른 펩타이드 링커는 예를 들어 FVIII 단백질을 Fc 영역에 연결하기 위해 본 개시내용의 작제물에서 임의로 사용될 수 있다. 본 개시내용과 연결되어 사용될 수 있는 몇몇 예시적인 링커는 예를 들어 하기 더 자세히 기재된 GlySer 아미노산을 포함하는 폴리펩타이드를 포함한다.

일 실시형태에서, 펩타이드 링커는 합성, 즉 천연 비발생이다. 일 실시형태에서, 펩타이드 링커는 아미노산의 제1 선형 서열을 자연에서 연결되지 않거나 자연히 유전자 융합된 아미노산의 제2 선형 서열에 연결시키거나 유전적으로 융합시키는 아미노산 서열을 포함하는 펩타이드(또는 폴리펩타이드)(천연 발생일 수 있거나 아닐 수 있음)를 포함한다. 예를 들어, 일 실시형태에서 펩타이드 링커는 천연 발생 폴리펩타이드의 변형태 형태(예를 들어, 돌연변이, 예컨대 부가, 치환 또는 결실을 포함)인 천연 비발생 폴리펩타이드를 포함할 수 있다. 또 다른 실시형태에서, 펩타이드 링커는 천연 비발생 아미노산을 포함할 수 있다. 또 다른 실시형태에서, 펩타이드 링커는 자연에서 발생하지 않는 선형 서열에서 발생하는 천연 발생 아미노산을 포함할 수 있다. 더욱 또 다른 실시형태에서, 펩타이드 링커는 천연 발생 폴리펩타이드 서열을 포함할 수 있다.

예를 들어, 소정의 실시형태에서, 펩타이드 링커는 동일한 Fc 모이어티를 융합시켜서, 동종이합체 scFc 영역을 형성하도록 사용될 수 있다. 다른 실시형태에서, 펩타이드 링커는 상이한 Fc 모이어티(예를 들어, 야생형 Fc 모이어티 및 Fc 모이어티 변이체)를 융합시켜서, 이종이합체 scFc 영역을 형성하도록 사용될 수 있다.

또 다른 실시형태에서, 펩타이드 링커는 gly-ser 링커를 포함하거나 이것으로 이루어진다. 일 실시형태에서, scFc 또는 cscFc 링커는 면역글로불린 힌지 및 gly-ser 링커의 적어도 일부를 포함한다. 본 명세서에 사용된 바와 같은, 용어 "gly-ser 링커"는 글라이신 및 세린 잔기로 이루어진 펩타이드를 의미한다. 소정의 실시형태에서, 상기 gly-ser 링커는 펩타이드 링커의 2개의 다른 서열 사이에 삽입될 수 있다. 다른 실시형태에서, gly-ser 링커는 펩타이드 링커의 또 다른 서열의 일 말단 또는 양 말단에 부착된다. 더욱 다른 실시형태에서, 2개 이상의 gly-ser 링커는 펩타이드 링커에서 시리즈로 도입된다. 일 실시형태에서, 본 개시내용의 펩타이드 링커는 상부 힌지 영역의 적어도 일부(예를 들어, IgG1, IgG2, IgG3 또는 IgG4 분자로부터 유래), 중간 힌지 영역의 적어도 일부(예를 들어, IgG1, IgG2, IgG3 또는 IgG4 분자로부터 유래) 및 gly/ser 아미노산 잔기의 시리즈를 포함한다.

본 개시내용의 펩타이드 링커는 적어도 하나의 아미노산 길이이고, 다양한 길이일 수 있다. 일 실시형태에서, 본 개시내용의 펩타이드 링커는 약 1개 내지 약 50개의 아미노산 길이이다. 이 문맥에서 사용된 바대로, 용어 "약" ±2개의 아미노산 잔기를 나타낸다. 링커 길이가 양의 정수이어야 하므로, 약 1개 내지 약 50개의 아미노산 길이의 길이는 1개 내지 3개 내지 48개 내지 52개의 아미노산 길이를 의미한다. 또 다른 실시형태에서, 본 개시내용의 펩타이드 링커는 약 10개 내지 약 20개의 아미노산 길이이다. 또 다른 실시형태에서, 본 개시내용의 펩타이드 링커는 약 15개 내지 약 50개의 아미노산 길이이다. 또 다른 실시형태에서, 본 개시내용의 펩타이드 링커는 약 20개 내지 약 45개의 아미노산 길이이다. 또 다른 실시형태에서, 본 개시내용의 펩타이드 링커는 약 15개 내지 약 35개 또는 약 20개 내지 약 30개의 아미노산 길이이다. 또 다른 실시형태에서, 본 개시내용의 펩타이드 링커는 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 500개, 1000개 또는 2000개의 아미노산 길이이다. 일 실시형태에서, 본 개시내용의 펩타이드 링커는 20개 또는 30개의 아미노산 길이이다.

몇몇 실시형태에서, 펩타이드 링커는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개 또는 적어도 100개의 아미노산을 포함할 수 있다. 다른 실시형태에서, 펩타이드 링커는 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 600개, 적어도 700개, 적어도 800개, 적어도 900개 또는 적어도 1,000개의 아미노산을 포함할 수 있다. 몇몇 실시형태에서, 펩타이드 링커는 적어도 약 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 300개, 400개, 500개, 600개, 700개, 800개, 900개, 1000개, 1100개, 1200개, 1300개, 1400개, 1500개, 1600개, 1700개, 1800개, 1900개 또는 2000개의 아미노산을 포함할 수 있다. 펩타이드 링커는 1개 내지 5개의 아미노산, 1개 내지 10개의 아미노산, 1개 내지 20개의 아미노산, 10개 내지 50개의 아미노산, 50개 내지 100개의 아미노산, 100개 내지 200개의 아미노산, 200개 내지 300개의 아미노산, 300개 내지 400개의 아미노산, 400개 내지 500개의 아미노산, 500개 내지 600개의 아미노산, 600개 내지 700개의 아미노산, 700개 내지 800개의 아미노산, 800개 내지 900개의 아미노산 또는 900개 내지 1000개의 아미노산을 포함할 수 있다.

펩타이드 링커는 당해 분야에 공지된 기법을 이용하여 폴리펩타이드 서열로 도입될 수 있다. 변형은 DNA 서열 분석에 의해 확인될 수 있다. 플라스미드 DNA는 제조된 폴리펩타이드의 안정한 제조를 위해 형질전환된 숙주 세포에 사용될 수 있다.

단량체-이합체 하이브리드

몇몇 실시형태에서, 비상동성 뉴클레오타이드 서열을 추가로 포함하는 본 개시내용의 단리된 핵산 분자는 FVIII를 포함하는 단량체-이합체 하이브리드 분자를 코딩한다.

본 명세서에서 사용된 용어 "단량체-이합체 하이브리드"는 이황화 결합에 의해 서로와 회합된 제1 폴리펩타이드 사슬 및 제2 폴리펩타이드 사슬을 포함하는 키메라 단백질을 의미하고, 여기서 제1 사슬은 VIII 인자 및 제1 Fc 영역을 포함하고, 제2 사슬은 FVIII이 없는 제2 Fc 영역을 포함하거나, 본질적으로 이것으로 이루어지거나, 이것으로 이루어진다. 따라서, 단량체-이합체 하이브리드 작제물은 적어도 하나의 응고 인자를 갖는 단량체 양태 및 2개의 Fc 영역을 갖는 이합체 양태를 포함하는 하이브리드이다.

발현 제어 유전요소

몇몇 실시형태에서, 본 개시내용의 핵산 분자 또는 벡터는 추가로 적어도 하나의 발현 제어 서열을 포함한다. 본 명세서에 사용된 바와 같은 발현 제어 서열은 이것이 작동적으로 연결된 코딩 핵산의 효율적인 전사 및 번역을 촉진하는 임의의 조절 뉴클레오타이드 서열, 예컨대 촉진자 서열 또는 촉진자-증강자 조합이다. 예를 들어, 본 개시내용의 단리된 핵산 분자는 적어도 하나의 전사 제어 서열에 작동적으로 연결될 수 있다. 유전자 발현 제어 서열은 예를 들어 포유류 또는 바이러스 촉진자, 예컨대 구성적 또는 유도성 촉진자일 수 있다. 구성적 포유류 촉진자는 하기 유전자에 대한 촉진자: 하이폭산틴 포스포리보실 전환효소(HPRT), 아데노신 탈아미노효소, 피류베이트 키나제, 베타-액틴 촉진자, 및 다른 구성적 촉진자를 포함하지만, 이들로 제한되지는 않는다. 진핵생물 세포에서 구성적으로 작용하는 예시적인 바이러스 촉진자는 예를 들어 사이토메갈로바이러스(CMV), 유인원 바이러스(예를 들어, SV40), 파필로마 바이러스, 아데노바이러스, 인간 면역결핍 바이러스(HIV), 라우스 육종 바이러스, 사이토메갈로바이러스, 몰로니 백혈병 바이러스의 긴 말단 반복(LTR) 및 다른 레트로바이러스로부터의 촉진자, 및 단순 포진 바이러스의 타이미딘 키나제 촉진자를 포함한다. 다른 구성적 촉진자는 당해 분야의 숙련자에게 공지되어 있다. 본 개시내용의 유전자 발현 서열로서 유용한 촉진자는 또한 유도성 촉진자를 포함한다. 유도성 촉진자는 유도제의 존재 하에 발현된다. 예를 들어, 메탈로티오네인 촉진자는 소정의 금속 이온의 존재 하에 전사 및 번역을 촉진하도록 유도된다. 다른 유도성 촉진자는 당해 분야의 숙련자에게 공지되어 있다.

일 실시형태에서, 본 개시내용은 조직 특이적 촉진자 및/또는 증강자의 제어 하에 전이유전자의 발현을 포함한다. 또 다른 실시형태에서, 촉진자 또는 다른 발현 제어 서열은 선택적으로 간 세포에서 전이유전자의 발현을 증대시킨다. 간 특이적 촉진자의 예는 마우스 타이레틴 촉진자(mTTR), 내인성 인간 VIII 인자 촉진자(F8), 인간 알파-1-안티트립신 촉진자(hAAT), 인간 알부민 최소 촉진자 및 마우스 알부민 촉진자를 포함하지만, 이들로 제한되지는 않는다. 특정한 실시형태에서, 촉진자는 mTTR 촉진자를 포함한다. mTTR 촉진자는 문헌[R. H. Costa et al., 1986, Mol. Cell. Biol. 6:4697]에 기재되어 있다. F8 촉진자는 문헌[Figueiredo and Brownlee, 1995, J. Biol. Chem. 270:11828-11838]에 기재되어 있다.

발현 수준은 하나 이상의 증강자를 사용하여 치료학적 효능을 달성하도록 추가로 증대될 수 있다. 하나 이상의 증강자는 단독으로 또는 하나 이상의 촉진자 유전요소와 함께 제공될 수 있다. 통상적으로, 발현 제어 서열은 복수의 증강자 유전요소 및 조직 특이적 촉진자를 포함한다. 일 실시형태에서, 증강자는 α-1-마이크로글로불린/비쿠닌 증강자의 하나 이상의 카피를 포함한다(Rouet et al., 1992, J. Biol. Chem. 267:20765-20773; Rouet et al., 1995, Nucleic Acids Res. 23:395-404; Rouet et al., 1998, Biochem. J. 334:577-584; Ill et al., 1997, Blood Coagulation Fibrinolysis 8:S23-S30). 또 다른 실시형태에서, 증강자는 HNF1, (센스)-HNF3, (센스)-HNF4, (안티센스)-HNF1, (안티센스)-HNF6, (센스)-EBP, (안티센스)-HNF4(안티센스)를 포함하는 간 특이적 전사 인자 결합 부위, 예컨대 EBP, DBP, HNF1, HNF3, HNF4, HNF6과 Enh1로부터 유래된다.

특정한 예에서, 본 개시내용에 유용한 촉진자는 유전자은행 AY661265호로도 공지된 서열 번호 69(즉, ET 촉진자; 도 11y)를 포함한다. 또한, 문헌[Vigna et al., Molecular Therapy 11(5):763 (2005)]을 참조한다. 다른 적합한 벡터 및 유전자 조절 유전요소의 예는 WO 제02/092134호, 제EP1395293호, 또는 미국 특허 제6,808,905호, 제7,745,179호 또는 제7,179,903호(본 명세서에 그 전문이 참고로 포함됨)에 기재되어 있다.

일반적으로, 발현 제어 서열은, 필요한 바대로, 각각 전사 및 번역의 개시에 관여된 5' 비전사 및 5' 비번역 서열, 예컨대 TATA 박스, 캡핑 서열, CAAT 서열 등을 포함해야 한다. 특히, 이러한 5' 비전사 서열은 작동적으로 연결된 코딩 핵산의 전사 제어를 위한 촉진자 서열을 포함하는 촉진자 영역을 포함할 것이다. 유전자 발현 서열은 임의로 원하는 바대로 증강자 서열 또는 상류 활성자 서열을 포함한다.

벡터 시스템

본 개시내용의 몇몇 실시형태는 본 명세서에 기재된 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 하나 이상의 코돈 최적화된 핵산 분자를 포함하는 벡터, 벡터를 포함하는 숙주 세포 및 벡터를 사용하여 출혈 장애를 치료하는 방법에 관한 것이다. 본 개시내용은 대상체에서 증가한 발현을 입증하고 잠재적으로 유전자 치료 방법에서 사용될 때 더 큰 치료학적 효능을 생성시킨 최적화된 FVIII 서열을 포함하는 벡터를 제공함으로써 당해 분야에서 중요한 수요를 충족시킨다.

몇몇 실시형태에서, 본 개시내용은 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 제1 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 1791번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 1791번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다. 다른 실시형태에서, 핵산 분자는 FVIII 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하고, 제2 핵산 서열은 (ⅰ) 서열 번호 5의 1792번 내지 4374번 뉴클레오타이드; (ⅱ) 서열 번호 6의 1792번 내지 4374번 뉴클레오타이드; (ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드; 또는 (ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖고, N 말단 부분 및 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 1의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 1의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 2의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 2의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 70의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 70의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 71의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 71의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 3의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 3의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 3의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 4의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 4의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 5의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 5의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

몇몇 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자를 포함하는 벡터를 제공하고, 뉴클레오타이드 서열은 (ⅰ) 서열 번호 6의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하고, 촉진자, 표적 서열, 또는 둘 다에 작동적으로 연결된다. 다른 실시형태에서, 핵산 서열은 (ⅰ) 서열 번호 6의 58번 내지 4374번 뉴클레오타이드 또는 (ⅱ) 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드를 포함한다.

본 개시내용에 적합한 벡터는 발현 벡터, 바이러스 벡터 및 플라스미드 벡터를 포함한다. 일 실시형태에서, 벡터는 바이러스 벡터이다.

본 명세서에 사용된 바대로, 발현 벡터는 삽입된 코딩 서열의 전사 및 번역에 필요한 유전요소, 또는 RNA 바이러스 벡터의 경우에, 적절한 숙주 세포로 도입될 때 복제 및 번역에 필요한 유전요소를 포함하는 임의의 핵산 작제물을 의미한다. 발현 벡터는 플라스미드, 파지미드, 바이러스, 및 이의 유도체를 포함할 수 있다.

본 개시내용의 발현 벡터는 본 명세서에 기재된 BDD FVIII 단백질을 코딩하는 최적화된 폴리뉴클레오타이드를 포함할 것이다. 일 실시형태에서, BDD FVIII 단백질에 대한 최적화된 코딩 서열은 발현 제어 서열에 작동적으로 연결된다. 본 명세서에 사용된 바대로, 2개의 핵산 서열은 각각의 성분 핵산 서열이 이의 기능성을 허용하는 방식으로 이들이 공유로 연결될 때 작동적으로 연결된다. 코딩 서열 및 유전자 발현 제어 서열은 코딩 서열의 발현 또는 전사 및/또는 번역이 유전자 발현 제어 서열의 영향 또는 제어 하에 있게 하는 방식으로 이들이 공유로 연결될 때 작동적으로 연결된다고 말해진다. 2개의 DNA 서열은 5' 유전자 발현 서열에서의 촉진자의 유도가 코딩 서열의 전사를 발생시키는 경우 및 2개의 DNA 서열 사이의 연결의 성질이 (1) 프레임-시프트 돌연변이의 도입을 발생시키지 않거나, (2) 코딩 서열의 전사를 지시하는 촉진자 영역의 능력을 방해하지 않거나, (3) 단백질로 번역되는 상응하는 RNA 전사체의 능력을 방해하지 않는 경우 작동적으로 연결된다고 말해진다. 따라서, 유전자 발현 서열은 생성된 전사체가 원하는 단백질 또는 폴리펩타이드로 번역되도록 유전자 발현 서열이 그 코딩 핵산 서열의 전사를 실행시킬 수 있는 경우 코딩 핵산 서열에 작동적으로 연결될 것이다.

바이러스 벡터는 하기 바이러스로부터의 핵산 서열을 포함하지만, 이들로 제한되지는 않는다: 레트로바이러스, 예컨대 몰로니 쥣과 백혈병 바이러스, 하비(Harvey) 쥣과 육종 바이러스, 쥣과 유방 종양 바이러스 및 라우스 육종 바이러스; 렌티바이러스; 아데노바이러스; 아데노 연관된 바이러스; SV40 타입 바이러스; 폴리오마바이러스; 엡스타인-바 바이러스; 파필로마 바이러스; 헤르페스 바이러스; 백시니아 바이러스; 폴리오 바이러스; 및 RNA 바이러스, 예컨대 레트로바이러스. 당해 분야에 널리 공지된 다른 벡터를 용이하게 사용할 수 있다. 소정의 바이러스 벡터는 비필수 유전자가 관심 대상의 유전자에 의해 대체된 비세포변성 진핵생물 바이러스에 기초한다. 비세포변성 바이러스는 레트로바이러스(이의 생활 주기는 숙주 세포 DNA로의 후속하는 프로바이러스 통합과 함께 DNA로의 게놈 바이러스 RNA의 역전사를 수반)를 포함한다. 레트로바이러스는 인간 유전자 치료 실험에 승인되었다. 복제 결핍성인(즉, 원하는 단백질의 합성을 지시할 수 있지만, 감염성 입자를 제조할 수 없는) 레트로바이러스가 가장 유용하다. 이러한 유전자 변경된 레트로바이러스 발현 벡터는 생체내 유전자의 고효율 형질도입에 일반적인 유용성을 갖는다. (플라스미드로의 외인성 유전자 재료의 도입, 플라스미드에 의한 패키징 세포주의 형질주입, 패키징 세포주에 의한 재조합 레트로바이러스의 제조, 조직 배양 배지로부터의 바이러스 입자의 수집 및 바이러스 입자에 의한 표적 세포의 감염의 단계를 포함하는) 복제 결핍성 레트로바이러스를 제조하기 위한 표준 프로토콜은 문헌[Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) 및 Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Cliffton, N.J. (1991)]에서 제공된다.

일 실시형태에서, 바이러스는 아데노 연관된 바이러스, 이중 가닥 DNA 바이러스이다. 아데노 연관된 바이러스는 복제 결핍되도록 조작될 수 있고, 넓은 범위의 세포 유형 및 종을 감염시킬 수 있다. 이것은 추가로 열 및 지질 용매 안정성; 조혈 세포를 포함하는 다양한 계통의 세포에서의 높은 형질도입 빈도; 및 슈퍼감염 저해의 결여(이로써 다수의 일련의 형질도입을 허용함)와 갖은 이점을 가진다. 보고에 의하면, 아데노 연관된 바이러스는 부위 특이적 방식으로 인간 세포 DNA로 통합할 수 있어서, 삽입 돌연변이유발의 가능성 및 레트로바이러스 감염의 삽입된 유전자 발현 특징의 가변성을 최소화한다. 또한, 야생형 아데노 연관된 바이러스 감염은 선택적 압력의 부재 하에 100회 초과의 계대배양에 대해 조직 배양에서 후행하여서, 아데노 연관된 바이러스 게놈 통합이 비교적 안정한 사건이라는 것을 암시한다. 아데노 연관된 바이러스는 또한 염색체외 방식으로 작용할 수 있다.

또 다른 실시형태에서, 바이러스 벡터는 본 명세서에 개시된 바와 같은 FVIII 단백질을 코딩하는 폴리뉴클레오타이드를 운반하도록 조작된 아데노 연관된 바이러스(AAV)이다. 재조합 AAV(rAAV)를 수득하기 위한 일반적인 방법은 개시되어 있다. 예를 들어, USP 제8,734,809호, 제2013/0195801호, 및 여기에 인용된 참고문헌을 참조한다. 몇몇 실시형태에서, rAAV 벡터는 하나 이상의 AAV 인버티드 말단 반복(ITR) 및 관심 대상의 전이유전자(예를 들어, 최적화된 FVIII 폴리뉴클레오타이드 서열)를 포함한다. 소정의 실시형태에서, rAAV를 제조하는 방법은 AAV 캡시드 단백질을 코딩하는 핵산 서열 또는 이의 단편; 기능성 rep 유전자; AAV 인버티드 말단 반복(ITR) 및 관심 대상의 전이유전자로 이루어진 rAAV 벡터; 및 AAV 캡시드 단백질로 재조합 AAV 벡터의 패키징을 허용하기에 충분한 헬퍼 기능을 함유하는 원하는 숙주 세포를 배양하는 것을 수반한다. 이들 및 관련 절차를 수행하기 위한 재료 및 방법은 예를 들어 USP 제8,734,809호, 제2013/0195801호, 제PCT/US1997/015692호, 제PCT/US2002/033692호, 제PCT/US2002/033630호, WO 제2007/148971호, WO 제00/20561호, WO 제03/042361호 및 WO 제2007/04670호에 개시되어 있다.

거의 임의의 혈청형으로부터 유래된 하나 이상의 상이한 AAV 벡터 서열은 본 개시내용에 따라 사용될 수 있다. 특정한 AAV 벡터 서열의 선택은 공지된 매개변수, 예컨대 관심 대상의 굴성, 필요한 벡터 수율 등에 의해 지도될 것이다. 일반적으로, AAV 혈청형은 아미노산 및 핵산 수준에서 유의미한 상동성의 게놈 서열을 갖고, 관련된 세트의 유전자 기능을 제공하고, 관련된 비리온을 생성하고, 유사하게 복제하고 조립한다. 다양한 AAV 혈청형의 게놈 서열 및 게놈 유사성의 리뷰에 대해 예를 들어 유전자은행 수탁 번호 U89790호; 유전자은행 수탁 번호 J01901호; 유전자은행 수탁 번호 AF043303호; 유전자은행 수탁 번호 AF085716호; [Chlorini et al. (1997, J. Vir. 71: 6823-33); Srivastava et al. (1983, J. Vir. 45:555-64); Chlorini et al. (1999, J. Vir. 73:1309-1319); Rutledge et al. (1998, J. Vir. 72:309-319); 및 Wu et al. (2000, J. Vir. 74: 8635-47)]을 참조한다. AAV 혈청형 1, 2, 3, 4 및 5는 본 개시내용의 맥락에서 사용하기 위한 AAV 뉴클레오타이드 서열의 예시적인 공급원이다. 예를 들어, 캡시드 셔플링 기법 및 AAV 캡시드 라이브러리에 의해 또는 새로 설계되거나 개발되거나 전개된 ITR로부터 얻은 AAV6, AAV7, AAV8 또는 AAV9 또는 새로 개발된 AAV 유사 입자는 소정의 개시내용 출원에 또한 적합하다. 문헌[Dalkara, D et al. (2013), Sci. Transl. Med. 5(189): 189ra76; Kotterman, MA Nat. Rev. Genet. (2014) 15(7):455]을 참조한다.

그러나, 소정의 실시형태에서 간 및 관련된 조직에 유의미한 굴성을 갖는 AAV 벡터는 본 명세서에 개시된 FVIII 단백질을 발현하는 데 관심이 있을 것이다. 비제한적인 예는 AAV 혈청형 1, 2, 6 및 8을 포함한다. 예를 들어, 문헌[Torres-Torranteras et al. (2014) 22: 901] 및 여기에 인용된 문헌을 참조한다.

다른 실시형태에서, 벡터는 렌티바이러스로부터 유래된다. 소정의 실시형태에서, 벡터는 비분열 세포를 감염시킬 수 있는 재조합 렌티바이러스의 벡터이다.

렌티바이러스 게놈 및 프로바이러스 DNA는 통상적으로 2개의 긴 말단 말단(LTR) 서열에 의해 플랭킹된 gag, pol 및 env인 레트로바이러스에서 발견된 3개의 유전자를 갖는다. gag 유전자는 내부 구조(매트릭스, 캡시드 및 뉴클레오캡시드) 단백질을 코딩하고; pol 유전자는 RNA 지시된 DNA 중합효소(역전사효소), 프로테아제 및 인테그라아제를 코딩하고; env 유전자는 바이러스 외피 당단백질을 코딩한다. 5' 및 3' LTR은 비리온 RNA의 전사 및 폴리아데닐화를 촉진하도록 작용한다. LTR은 바이러스 복제에 필요한 모든 다른 시스 작용성 서열을 함유한다. 렌티바이러스는 (HIV-1, HIV-2 및/또는 SIV에서) vif, vpr, tat, rev, vpu, nef 및 vpx를 포함하는 추가 유전자를 갖는다.

게놈의 역전사(tRNA 프라이머 결합 부위) 및 입자로의 바이러스 RNA의 효율적인 이입(Psi 부위)에 필요한 서열은 5' LTR에 인접하다. 이입에 필요한 서열(또는 감염성 비리온으로의 레트로바이러스 RNA의 패키징)이 바이러스 게놈으로부터 미싱되는 경우, 시스 결함은 게놈 RNA의 이입을 방지한다.

그러나, 생성된 돌연변이체는 모든 비리온 단백질의 합성을 지시할 수 있게 있는다. 본 개시내용은 패키징 기능을 보유하는 2개 이상의 벡터, 즉 gag, pol 및 env, 및 rev 및 tat에 의해 적합한 숙주 세포를 형질주입시키는 것을 포함하는 비분열 세포를 감염시킬 수 있는 재조합 렌티바이러스를 제조하는 방법을 제공한다. 본 명세서에서 하기 개시되는 것처럼, 기능성 tat 유전자가 결여된 벡터는 소정의 분야에 바람직하다. 따라서, 예를 들어 제1 벡터는 바이러스 gag 및 바이러스 pol을 코딩하는 핵산을 제공할 수 있고, 또 다른 벡터는 패키징 세포를 생성하는 바이러스 env를 코딩하는 핵산을 제공할 수 있다. 운반 벡터로서 본 명세서에서 확인된 비상동성 유전자를 제공하는 벡터를 그 패키징 세포로 도입하는 것은 관심 대상의 외래 유전자를 보유하는 감염성 바이러스 입자를 방출시키는 생산자 세포를 생성시킨다.

벡터 및 외래 유전자의 상기 표시된 구성에 따라, 제2 벡터는 바이러스 외피(env) 유전자를 코딩하는 핵산을 제공할 수 있다. env 유전자는 레트로바이러스를 포함하는 거의 임의의 적합한 바이러스로부터 유래될 수 있다. 몇몇 실시형태에서, env 단백질은 인간 및 다른 종의 세포의 형질도입을 허용하는 암포트로픽(amphotropic) 외피 단백질이다.

레트로바이러스 유래 env 유전자의 예는 몰로니 쥣과 백혈병 바이러스(MoMuLV 또는 MMLV), 하비 쥣과 육종 바이러스(HaMuSV 또는 HSV), 쥣과 유방 종양 바이러스(MuMTV 또는 MMTV), 긴팔원숭이 유인원 백혈병 바이러스(GaLV 또는 GALV), 인간 면역결핍 바이러스(HIV) 및 라우스 육종 바이러스(RSV)를 포함하지만, 이들로 제한되지는 않는다. 다른 env 유전자, 예컨대 수포성 구내염 바이러스(VSV) 단백질 G(VSV G), 간염 바이러스 및 인플루엔자의 것을 또한 사용할 수 있다.

바이러스 env 핵산 서열을 제공하는 벡터는 본 명세서에서 그 외 기재된 조절 서열과 작동적으로 회합된다.

소정의 실시형태에서, 벡터는 비분열 세포를 형질도입하는 벡터의 능력을 손상시키지 않으면서 HIV 독력 유전자 env, vif, vpr, vpu 및 nef가 결실된 렌티바이러스 벡터를 포함한다.

몇몇 실시형태에서, 벡터는 3' LTR의 U3 영역의 결실을 포함하는 렌티바이러스 벡터를 포함한다. U3 영역의 결실은 완전 결실 또는 부분 결실일 수 있다.

몇몇 실시형태에서, 본 명세서에 기재된 FVIII 뉴클레오타이드 서열을 포함하는 본 개시내용의 렌티바이러스 벡터는 세포에서 (a) gag, pol, 또는 gag 및 pol 유전자를 포함하는 제1 뉴클레오타이드 서열 및 (b) 비상동성 env 유전자를 포함하는 제2 뉴클레오타이드 서열에 의해 형질주입될 수 있고; 렌티바이러스 벡터는 기능성 tat 유전자가 결여된다. 다른 실시형태에서, 세포는 추가로 rev 유전자를 포함하는 제4 뉴클레오타이드 서열에 의해 형질주입된다. 소정의 실시형태에서, 렌티바이러스 벡터는 vif, vpr, vpu, vpx 및 nef로부터 선택된 기능성 유전자, 또는 이들의 조합이 결여된다.

소정의 실시형태에서, 렌티바이러스 벡터는 gag 단백질을 코딩하는 하나 이상의 뉴클레오타이드 서열, Rev-반응 유전요소, 중앙 폴리퓨린 트랙(cPPT), 또는 임의의 이들의 조합을 포함한다.

렌티바이러스 벡터의 예는 WO 제9931251호, W0 제9712622호, W0 제9817815호, W0 제9817816호 및 WO 제9818934호(본 명세서에 그 전문이 참고로 포함됨)에 개시되어 있다.

다른 벡터는 플라스미드 벡터를 포함한다. 플라스미드 벡터는 당해 분야에서 광범위하게 기재되어 있고, 당해 분야의 숙련자에게 널리 공지되어 있다. 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989]을 참조한다. 최근 몇 년에, 플라스미드 벡터는 숙주 게놈 내에 복제하고 이것으로 통합하는 불능 때문에 생체내 세포로 유전자를 전달하기에 특히 유리한 것으로 밝혀졌다. 그러나, 숙주 세포와 사용성인 촉진자를 갖는 이 플라스미드는 플라스미드 내에 작동적으로 코딩된 유전자로부터 펩타이드를 발현할 수 있다. 상업용 공급자로부터 이용 가능한 몇몇 흔히 사용되는 플라스미드는 pBR322, pUC18, pUC19, 다양한 pcDNA 플라스미드, pRC/CMV, 다양한 pCMV 플라스미드, pSV40 및 pBlueScript를 포함한다. 구체적인 플라스미드의 추가 예는 pcDNA3.1, 카탈로그 V79020호; pcDNA3.1/hygro, 카탈로그 V87020호; pcDNA4/myc-His, 카탈로그 V86320호; 및 pBudCE4.1, 카탈로그 V53220호(모두 Invitrogen(캘리포니아주 칼즈배드)으로부터 입수)를 포함한다. 다른 플라스미드는 당해 분야의 숙련자에게 널리 공지되어 있다. 추가로, 플라스미드는 DNA의 특이적 단편을 제거하고/하거나 추가하도록 표준 분자 생물학 기법을 이용하여 커스텀 설계될 수 있다.

조직 특이적 발현

소정의 실시형태에서, 예를 들어 최적화된 FVIII 전이유전자에 작동적으로 연결된 하나 이상의 miRNA 표적 서열을 벡터 내에 포함하는 것이 유용할 것이다. 따라서, 본 개시내용은 또한 최적화된 FVIII 뉴클레오타이드 서열에 작동적으로 연결되거나 그렇지 않으면 벡터 내에 삽입된 적어도 하나의 miRNA 서열 표적을 제공한다. 벡터에 포함된 miRNA 표적 서열의 하나 초과의 카피는 시스템의 유효성을 증가시킬 수 있다. 상이한 miRNA 표적 서열은 또한 포함된다. 예를 들어, 하나 초과의 전이유전자를 발현하는 벡터는 동일하거나 상이할 수 있는 하나 초과의 miRNA 표적 서열의 제어 하에 전이유전자를 가질 수 있다. miRNA 표적 서열은 탠덤일 수 있지만, 다른 배열이 또한 포함된다. miRNA 표적 서열을 함유하는 전이유전자 발현 카세트는 또한 안티센스 배향으로 벡터 내에 삽입될 수 있다. 안티센스 배향은 생산자 세포에 달리 독성일 수 있는 유전자 산물의 발현을 피하도록 바이러스 입자의 제조에 유용할 수 있다. 다른 실시형태에서, 벡터는 동일하거나 상이한 miRNA 표적 서열의 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 카피를 포함한다. 그러나 소정의 다른 실시형태에서, 벡터는 임의의 miRNA 표적 서열을 포함하지 않을 것이다. MiRNA 표적 서열을 포함하는지 또는 아닌지(그리고 얼마나 많이)의 선택은 공지된 매개변수, 예컨대 의도된 조직 표적, 필요한 발현의 수준에 의해 안내될 것이다.

일 실시형태에서, 표적 서열은 골수성 전용의 전구세포 및 적어도 부분적으로 더 원시적 HSPC에서 가장 효과적으로 발현을 차단하는 것으로 보고된 miR-223 표적이다. miR-223 표적은 과립구, 단핵구, 대식세포, 골수성 수지상 세포를 포함하는 분화된 골수성 세포에서 발현을 차단할 수 있다. miR-223 표적은 림프구 또는 적혈구 계통에서 튼튼한 전이유전자 발현에 의존하는 유전자 치료 분야에 또한 적합할 수 있다. miR-223 표적은 인간 HSC에서 매우 효과적으로 발현을 또한 차단할 수 있다.

또 다른 실시형태에서, 표적 서열은 miR142 표적(tccataaagt aggaaacact aca(서열 번호 43))이다. 일 실시형태에서, 벡터는 miR-142 표적 서열의 4개의 카피를 포함한다. 소정의 실시형태에서, miR-142(142T)와 같은 조혈 특이적 마이크로RNA의 상보성 서열은 렌티바이러스 벡터(LV)와 같은 벡터의 3' 비번역된 영역으로 도입되어서, 전이유전자 코딩 전사체가 miRNA 매개된 하향조절에 감수성이게 만든다. 이 방법에 의해, 전이유전자 발현은 비조혈 세포에서 유지되면서 조혈 계통 항원 제시 세포(APC)에서 방지될 수 있다(Brown et al., Nat Med 2006). 이 전략은 전이유전자 발현에 엄격한 전사 후 제어를 이용할 수 있고, 따라서 전이유전자의 안정한 전달 및 장기간 발현이 가능하게 한다. 몇몇 실시형태에서, miR-142 조절은 형질도입된 세포의 면역 매개된 청소를 방지하고/하거나, 항원 특이적 조절 T 세포(T reg)를 유도하고, 전이유전자 코딩 항원에 대한 튼튼한 면역학적 관용성을 매개한다.

몇몇 실시형태에서, 표적 서열은 miR181 표적이다. 문헌[Chen C-Z and Lodish H, Seminars in Immunology (2005) 17(2):155-165]은 마우스 골수 내에 B 세포에서 특이적으로 발현된 miRNA인 miR-181을 개시한다(Chen and Lodish, 2005). 이것은 또한 몇몇 인간 miRNA가 백혈병에 연결된다는 것을 개시한다.

표적 서열은 miRNA에 완전히 또는 부분적으로 상보성일 수 있다. 용어 "완전히 상보성"은 표적 서열이 이것을 인식하는 miRNA의 서열에 100% 상보성인 핵산 서열을 갖는다는 것을 의미한다. 용어 "부분적으로 상보성은"은 표적 서열이 이것을 인식하는 miRNA의 서열에 오직 부분적으로 상보성(이로써, 부분적으로 상보성인 서열은 여전히 miRNA에 의해 인식됨)이라는 것을 의미한다. 즉, 본 개시내용의 맥락에서 부분적으로 상보성인 표적 서열은 상응하는 miRNA를 인식하고 그 miRNA를 발현하는 세포에서 전이유전자 발현의 방지 또는 감소를 실행하는 데 있어서 효과적이다. miRNA 표적 서열의 예는 WO 제2007/000668호, WO 제2004/094642호, WO 제2010/055413호 또는 WO 제2010/125471호(본 명세서에 그 전문이 참고로 포함됨)에 기재되어 있다.

숙주 세포

본 개시내용은 또한 본 개시내용의 핵산 분자 또는 벡터를 포함하는 숙주 세포를 제공한다. 본 명세서에 사용된 바와 같은, 용어 "형질전환"은 넓은 의미에서 유전자형을 변경하고 결과적으로 수혜자 세포에서의 변경을 발생시키는 수혜자 숙주 세포로의 DNA의 도입을 의미하도록 사용되어야 한다.

"숙주 세포"는 재조합 DNA 기법을 이용하여 작제되고 적어도 하나의 비상동성 유전자를 코딩하는 벡터에 의해 형질전환된 세포를 의미한다. 본 개시내용의 숙주 세포는 바람직하게는 포유류 기원이고; 가장 바람직하게는 인간 또는 마우스 기원이다. 이 목적에 가장 적합한 특정한 숙주 세포주를 우선적으로 결정하는 능력은 당해 분야의 숙련자의 공이다. 예시적인 숙주 세포주는 CHO, DG44 및 DUXB11(중국 햄스터 난소 계통, DHFR 마이너스), HELA(인간 자궁경부암종), CVI(원숭이 신장 계통), COS(SV40 T 항원을 갖는 CVI의 유도체), R1610(중국 햄스터 섬유아세포) BALBC/3T3(마우스 섬유아세포), HAK(햄스터 신장 계통), SP2/O(마우스 골수종), P3.times.63-Ag3.653(마우스 골수종), BFA-1c1BPT(소 내피 세포), RAJI(인간 림프구), PER.C6(등록상표), NS0, CAP, BHK21 및 HEK 293(인간 신장)을 포함하지만, 이들로 제한되지는 않는다. 하나의 특정한 실시형태에서, 숙주 세포는 CHO 세포, HEK293 세포, BHK21 세포, PER.C6(등록상표) 세포, NS0 세포 및 CAP 세포로 이루어진 군으로부터 선택된다. 숙주 세포주는 통상적으로 상업적 서비스, 미국 미생물보존센터(American Tissue Culture Collection), 또는 공개 문헌으로부터 이용 가능하다.

숙주 세포로의 본 개시내용의 단리된 핵산 분자 또는 벡터의 도입은 당해 분야의 숙련자에게 널리 공지된 다양한 기법에 의해 달성될 수 있다. 이것은 형질주입(전기천공 및 전기천공 포함), 원형질체 융합, 인산칼슘 침전, 외피 DNA와의 세포 융합, 미량주사 및 온전한 바이러스에 의한 감염을 포함하지만, 이들로 제한되지는 않는다. 문헌[Ridgway, A. A. G. "Mammalian Expression Vectors" Chapter 24.2, pp. 470-472 Vectors, Rodriguez and Denhardt, Eds. (Butterworths, Boston, Mass. 1988)]을 참조한다. 가장 바람직하게는, 숙주로의 플라스미드 도입은 전기천공을 통한다. 형질전환된 세포는 경쇄 및 중쇄의 제조에 적절한 조건 하에 성장하고, 중쇄 및/또는 경쇄 단백질 합성에 대해 평가된다. 예시적인 검정 기법은 효소 연결 면역흡착 검정(ELISA), 방사면역검정(RIA) 또는 형광 활성화 세포 분류 분석(FACS), 면역조직화학 등을 포함한다.

본 개시내용의 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포는 적절한 성장 배지 중에 성장한다. 본 명세서에 사용된 바와 같은, 용어 "적절한 성장 배지"는 세포의 성장에 필요한 영양소를 함유하는 배지를 의미한다. 세포 성장에 필요한 영양소는 탄소원, 질소원, 필수 아미노산, 비타민, 미네랄 및 성장 인자를 포함할 수 있다. 임의로, 배지는 하나 이상의 선택 인자를 함유할 수 있다. 임의로, 배지는 소 송아지 혈청 또는 태아 송아지 혈청(FCS)을 함유할 수 있다. 일 실시형태에서, 배지는 실질적으로 IgG를 함유하지 않는다. 성장 배지는 예를 들어 DNA 작제물에서의 선택 가능한 마커에 의해 보완되거나 DNA 작제물에 의해 동시형질주입된 필수 영양소에서의 결핍 또는 약물 선택에 의해 일반적으로 DNA 작제물을 함유하는 세포를 선택할 것이다. 배양된 포유류 세포는 일반적으로 상업적으로 입수 가능 혈청 함유 또는 혈청 비함유 배지(예를 들어, MEM, DMEM, DMEM/F12)에서 성장한다. 일 실시형태에서, 배지는 CDoptiCHO(Invitrogen(캘리포니아주 칼즈배드))이다. 또 다른 실시형태에서, 배지는 CD17(Invitrogen(캘리포니아주 칼즈배드))이다. 사용된 특정한 세포주에 적절한 배지의 선택은 당해 분야의 숙련자의 수준 내에 있다.

폴리펩타이드의 제조

본 개시내용은 또한 본 개시내용의 핵산 분자에 의해 코딩된 폴리펩타이드를 제공한다. 다른 실시형태에서, 본 개시내용의 폴리펩타이드는 본 개시내용의 단리된 핵산 분자를 포함하는 벡터에 의해 코딩된다. 더욱 다른 실시형태에서, 본 개시내용의 폴리펩타이드는 본 개시내용의 단리된 핵산 분자를 포함하는 숙주 세포에 의해 생산된다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드가 생산되는 조건 하에 본 개시내용의 숙주 세포를 배양하는 단계 및 FVIII 활성을 갖는 폴리펩타이드를 회수하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드를 제조하는 방법을 또한 제공한다. 몇몇 실시형태에서, FVIII 활성을 갖는 폴리펩타이드의 발현은 모 FVIII 유전자 서열인 서열 번호 16을 포함하는 기준 뉴클레오타이드 서열을 포함한다는 것을 제외하고는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드가 핵산 분자에 의해 발현되는 조건 하에 본 개시내용의 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법을 제공하고, 여기서 FVIII 활성을 갖는 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다.

다른 실시형태에서, 본 개시내용은 FVIII 활성을 갖는 폴리펩타이드가 핵산 분자에 의해 생산되는 조건 하에 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법을 제공하고, 여기서 FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다.

다른 실시형태에서, 본 개시내용은 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법을 제공하고, 여기서 뉴클레오타이드 서열의 3' 부분의 코돈 적응 지수는 뉴클레오타이드 서열의 5' 부분에 비해 증가하고; FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다. 몇몇 실시형태에서, 뉴클레오타이드 서열의 5' 부분의 코돈 적응 지수는 서열 번호 16의 코돈 최적화 지수에 비해 증가하거나 감소하거나 변하지 않는다.

다른 실시형태에서, 본 개시내용은 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법을 제공하고, 여기서 뉴클레오타이드 서열의 5' 부분의 코돈 적응 지수는 뉴클레오타이드 서열의 3' 부분에 비해 증가하고; FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다. 몇몇 실시형태에서, 뉴클레오타이드 서열의 3' 부분의 코돈 적응 지수는 서열 번호 16의 코돈 최적화 지수에 비해 증가하거나 감소하거나 변하지 않는다.

다른 실시형태에서, 본 개시내용은 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법을 제공하고, 여기서 폴리펩타이드의 C 말단 부분을 코딩하는 뉴클레오타이드의 부분의 코돈 적응 지수는 폴리펩타이드의 N 말단 부분을 코딩하는 뉴클레오타이드의 부분에 비해 증가하고; FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다. 몇몇 실시형태에서, 폴리펩타이드의 N 말단 부분을 코딩하는 뉴클레오타이드의 부분의 코돈 적응 지수는 서열 번호 16의 코돈 최적화 지수에 비해 증가하거나 감소하거나 변하지 않는다.

다른 실시형태에서, 본 개시내용은 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 세포를 배양하는 단계를 포함하는 FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 방법을 제공하고, 여기서 폴리펩타이드의 N 말단 부분을 코딩하는 뉴클레오타이드의 부분의 코돈 적응 지수는 폴리펩타이드의 C 말단 부분을 코딩하는 뉴클레오타이드의 부분에 비해 증가하고; FVIII 활성을 갖는 폴리펩타이드의 수율은 서열 번호 16을 포함하는 기준 핵산 분자를 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 증가한다. 몇몇 실시형태에서, 폴리펩타이드의 C 말단 부분을 코딩하는 뉴클레오타이드의 부분의 코돈 적응 지수는 서열 번호 16의 코돈 최적화 지수에 비해 증가하거나 감소하거나 변하지 않는다.

FVIII 활성을 갖는 폴리펩타이드의 수율을 개선하는 것의 소정의 실시형태에서, 뉴클레오타이드 서열의 5' 부분은, 적절히 정렬될 때, 서열 번호 1의 약 1번 내지 1791번 뉴클레오타이드, 서열 번호 1의 58번 내지 1791번 뉴클레오타이드, 또는 이의 단편과 상응한다. 다른 실시형태에서, 뉴클레오타이드의 5' 부분에 의해 코딩된 폴리펩타이드는, 적절히 정렬될 때, 서열 번호 17의 약 1번 내지 497번 아미노산, 서열 번호 17의 20번 내지 497번번 아미노산, 또는 이의 단편과 상응한다. 소정의 실시형태에서, 폴리펩타이드의 N 말단 부분을 코딩하는 뉴클레오타이드 서열의 부분은, 적절히 정렬될 때, 서열 번호 1의 약 1번 내지 1791번 뉴클레오타이드, 서열 번호 1의 58번 내지 1791번 뉴클레오타이드, 또는 이의 단편과 상응한다. 몇몇 실시형태에서, 뉴클레오타이드 서열의 3' 부분은, 적절히 정렬될 때, 서열 번호 1의 약 1792번 내지 4374번 뉴클레오타이드 또는 이의 단편과 상응한다. 다른 실시형태에서, 뉴클레오타이드의 3' 부분에 의해 코딩된 폴리펩타이드는, 적절히 정렬될 때, 서열 번호 17의 약 498번 내지 1458번 아미노산, 또는 이의 단편과 상응한다. 소정의 실시형태에서, 폴리펩타이드의 C 말단 부분을 코딩하는 뉴클레오타이드 서열의 부분은, 적절히 정렬될 때, 서열 번호 1의 약 1792번 내지 4374번 뉴클레오타이드 또는 이의 단편과 상응한다.

몇몇 실시형태에서, FVIII 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 서열을 포함하는 동일한 조건 하에 배양된 숙주 세포에 비해 적어도 약 1.5배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배, 적어도 약 100배, 적어도 약 150배, 또는 적어도 약 200배 증가한다.

다양한 방법은 본 개시내용의 최적화된 핵산 분자로부터 FVIII 단백질을 재조합으로 생산하기 위해 이용 가능하다. 원하는 서열의 폴리뉴클레오타이드는 신생 고상 DNA 합성에 의해 또는 이전에 제조된 폴리뉴클레오타이드의 PCR 돌연변이유발에 의해 제조될 수 있다. 올리고뉴클레오타이드 매개된 돌연변이유발은 뉴클레오타이드 서열에서 치환, 삽입, 결실 또는 변경(예를 들어, 변경된 코돈)을 준비하기 위한 하나의 방법이다. 예를 들어, 출발 DNA는 원하는 돌연변이를 코딩하는 올리고뉴클레오타이드를 단일 가닥 DNA 주형에 혼성화함으로써 변경된다. 혼성화 후, DNA 중합효소는 올리고뉴클레오타이드 프라이머를 도입하는 주형의 전체 제2 상보성 가닥을 합성하도록 사용된다. 일 실시형태에서, 유전자 조작, 예를 들어 프라이머 기반 PCR 돌연변이유발은 본 개시내용의 폴리뉴클레오타이드를 제조하기 위해, 본 명세서에 정의된 바대로, 변경을 도입하기에 충분하다.

재조합 단백질 제조를 위해, FVIII 단백질을 코딩하는 본 개시내용의 최적화된 폴리뉴클레오타이드 서열은 적절한 발현 비히클, 즉 삽입된 코딩 서열의 전사 및 번역에 필요한 유전요소, 또는 RNA 바이러스 벡터의 경우에, 복제 및 번역에 필요한 유전요소를 함유하는 벡터로 삽입된다.

본 개시내용의 폴리뉴클레오타이드 서열은 적절한 리딩 프레임에서 벡터로 삽입된다. 이후, 발현 벡터는 폴리펩타이드를 발현하는 적합한 표적 세포로 형질주입된다. 당해 분야에 공지된 형질주입 기법은 인산칼슘 침전(Wigler et al. 1978, Cell 14: 725) 및 전기천공(Neumann et al. 1982, EMBO , J. 1: 841)을 포함하지만, 이들로 제한되지는 않는다. 다양한 숙주-발현 벡터 시스템은 진핵생물 세포에서 본 명세서에 기재된 FVIII 단백질을 발현하도록 사용될 수 있다. 일 실시형태에서, 진핵생물 세포는 포유류 세포(예를 들어, HEK293 세포, PER.C6(등록상표), CHO, BHK, Cos, HeLa 세포)를 포함하는 동물 세포이다. 본 개시내용의 폴리뉴클레오타이드 서열은 FVIII 단백질이 분비되게 허용하는 신호 서열을 또한 코딩할 수 있다. 당해 분야의 숙련자는 FVIII 단백질이 번역되면서 신호 서열이 세포에 의해 절단되어서 성숙 단백질을 형성한다는 것을 이해할 것이다. 다양한 신호 서열, 예를 들어 네이티브 Vll 인자 신호 서열, 네이티브 인자 IX 신호 서열 및 마우스 IgK 경쇄 신호 서열은 당해 분야에 공지되어 있다. 대안적으로, 신호 서열이 포함되지 않는 경우, FVIII 단백질은 세포를 용해함으로써 회수될 수 있다.

본 개시내용의 FVIII 단백질은 형질전환 동물, 예컨대 설치류, 염소, 양, 돼지 또는 소에서 합성될 수 있다. 용어 "형질전환 동물"은 이의 게놈으로 외래 유전자를 도입시킨 비인간 동물을 의미한다. 이 유전자가 생식선 조직에 존재하므로, 이것은 부모로부터 자손으로 넘겨진다. 외인성 유전자는 단일 세포 배아로 도입된다(Brinster et al. 1985, Proc. Natl. Acad.Sci. USA 82:4438). 면역글로불린 분자를 제조하는 형질전환을 포함하는, 형질전환 동물을 제조하는 방법은 당해 분야에 공지되어 있다(Wagner et al. 1981, Proc. Natl. Acad. Sci. USA 78: 6376; McKnight et al. 1983, Cell 34: 335; Brinster et al. 1983, Nature 306: 332; Ritchie et al. 1984, Nature 312: 517; Baldassarre et al. 2003, Theriogenology 59: 831; Robl et al. 2003, Theriogenology 59: 107; Malassagne et al. 2003, Xenotransplantation 10 (3): 267).

발현 벡터는 재조합으로 제조된 단백질의 용이한 정제 또는 확인을 허용하는 태그를 코딩할 수 있다. 예는 벡터 pUR278(Ruther et al. 1983, EMBO J. 2: 1791)(여기서, 본 명세서에 기재된 FVIII 단백질을 코딩하는 서열이 lac Z 코딩 영역과 프레임으로 벡터로 결찰될 수 있어서, 하이브리드 단백질이 제조됨)을 포함하지만, 이들로 제한되지는 않고; pGEX 벡터는 글루타티온 S-전환효소(GST) 태그를 갖는 단백질을 발현하도록 사용될 수 있다. 이 단백질은 보통 가용성이고, 글루타티온-아가로스 비드에 대한 흡착, 이어서 유리 글루타티온의 존재 하의 용리로부터 세포로부터 용이하게 정제될 수 있다. 벡터는 정제 후 태그의 용이한 제거를 위해 절단 부위(예를 들어, PreCission Protease(Pharmacia(뉴저지주 피백)))를 포함한다.

본 개시내용의 목적을 위해, 많은 발현 벡터 시스템을 사용할 수 있다. 이 발현 벡터는 통상적으로 에피솜 또는 숙주 염색체 DNA의 통합 부분으로서 숙주 유기체에서 복제 가능하다. 발현 벡터는 발현 제어 서열, 예를 들어 촉진자(예를 들어, 자연에서 연관된 또는 비상동성 촉진자), 증강자, 신호 서열, 슬라이스 신호, 증강자 유전요소 및 전사 종결 서열(이들로 제한되지는 않음)을 포함할 수 있다. 바람직하게는, 발현 제어 서열은 진핵생물 숙주 세포를 형질전환 또는 형질주입시킬 수 있는 벡터에서 진핵생물 촉진자 시스템이다. 발현 벡터는 동물 바이러스, 예컨대 소 파필로마 바이러스, 폴리오마 바이러스, 아데노바이러스, 백시니아 바이러스, 바큘로바이러스, 레트로바이러스(RSV, MMTV 또는 MOMLV), 사이토메갈로바이러스(CMV) 또는 SV40 바이러스로부터 유래된 DNA 유전요소를 또한 이용할 수 있다. 기타는 내부 리보솜 결합 부위를 갖는 폴리시스트론성 시스템의 사용을 수반한다.

흔히, 발현 벡터는 원하는 DNA 서열에 의해 형질전환된 세포의 검출을 허용하도록 선택 마커(예를 들어, 암피실린 내성, 하이그로마이신 내성, 테트라사이클린 내성 또는 네오마이신 내성)를 함유한다(예를 들어, Itakura et al., 미국 특허 제4,704,362호 참조). 염색체로 DNA를 통합시킨 세포는 형질주입된 숙주 세포의 선택을 허용하는 하나 이상의 마커를 도입함으로써 선택될 수 있다. 마커는 영양요구성 숙주에 기본유기영양(prototrophy), 살생물제(예를 들어, 항생제) 내성 또는 중금속, 예컨대 구리에 대한 내성을 제공할 수 있다. 선택 가능한 마커 유전자는 발현시키고자 하는 DNA 서열에 직접적으로 연결되거나, 동시형질전환에 의해 동일한 세포로 도입될 수 있다.

최적화된 FVIII 서열을 발현시키기에 유용한 벡터의 예는 NEOSPLA(미국 특허 제6,159,730호)이다. 이 벡터는 사이토메갈로바이러스 촉진자/증강자, 마우스 베타 글로빈 주요 촉진자, SV40 복제 기원, 소 성장 호르몬 폴리아데닐화 서열, 네오마이신 포스포전환효소 엑손 1 및 엑손 2, 다이하이드로폴레이트 환원효소 유전자 및 리더 서열을 함유한다. 이 벡터는 가변 및 불변 영역 유전자의 도입 시 항체의 매우 높은 수준 발현, 세포에서의 형질주입, 이어서 G418 함유 배지에서의 선택 및 메토트렉세이트 증폭을 발생시키는 것으로 발견되었다. 벡터 시스템은 또한 미국 특허 제5,736,137호 및 제5,658,570호(이들은 각각 본 명세서에 그 전문이 참고로 포함됨)에 교시되어 있다. 이 시스템은 예를 들어 30pg/세포/일 초과의 높은 발현 수준을 제공한다. 다른 예시적인 벡터 시스템은 예를 들어 미국 특허 제6,413,777호에 개시되어 있다.

다른 실시형태에서, 본 개시내용의 폴리펩타이드는 폴리시스트론성 작제물을 사용하여 발현될 수 있다. 이 발현 시스템에서, 관심 대상의 다수의 유전자 산물, 예컨대 다합체 결합 단백질의 다수의 폴리펩타이드는 단일 폴리시스트론성 작제물로부터 제조될 수 있다. 이 시스템은 유리하게는 진핵생물 숙주 세포에서 비교적 높은 수준의 폴리펩타이드를 제공하도록 내부 리보솜 진입 부위(IRES)를 사용한다. 상용성 IRES 서열은 미국 특허 제6,193,980호(또한 본 명세서에 포함됨)에 개시되어 있다.

더 일반적으로, 폴리펩타이드를 코딩하는 벡터 또는 DNA 서열이 제조되면, 발현 벡터는 적절한 숙주 세포로 도입될 수 있다. 즉, 숙주 세포는 형질전환될 수 있다. 숙주 세포로의 플라스미드의 도입은, 상기 기재된 바대로, 당해 분야의 숙련자에게 널리 공지된 다양한 기법에 의해 달성될 수 있다. 형질전환된 세포는 FVIII 폴리펩타이드의 제조에 적절한 조건 하에 성장되고, FVIII 폴리펩타이드 합성에 대해 평가된다. 예시적인 검정 기법은 효소 연결 면역흡착 검정(ELISA), 방사면역검정(RIA) 또는 형광 활성화 세포 분리기 분석(FACS), 면역조직화학 등을 포함한다.

재조합 숙주로부터의 폴리펩타이드의 단리를 위한 공정의 설명에서, 용어 "세포" 및 "세포 배양"은, 명확히 달리 기재되지 않는 한, 폴리펩타이드의 공급원을 나타내도록 상호 교환되어 사용한다. 즉, "세포"로부터의 폴리펩타이드의 회수는 스핀 다운된 전체 세포로부터 또는 배지 및 현탁된 세포 둘 다를 함유하는 세포 배양으로부터의 것을 의미할 수 있다.

본 개시내용의 단리된 핵산이 인간 세포에서의 발현에 최적화되면서, 단백질 발현에 사용된 숙주 세포주는 바람직하게는 포유류 기원이고; 가장 바람직하게는 인간 또는 마우스 기원이다. 예시적인 숙주 세포주는 상기 기재되어 있다. FVIII 활성을 갖는 폴리펩타이드를 제조하는 방법의 일 실시형태에서, 숙주 세포는 HEK293 세포이다. FVIII 활성을 갖는 폴리펩타이드를 제조하는 방법의 또 다른 실시형태에서, 숙주 세포는 CHO 세포이다.

본 개시내용의 폴리펩타이드를 코딩하는 유전자는 비포유류 세포, 예컨대 박테리아 또는 효모 또는 식물 세포에서 또한 발현될 수 있다. 이와 관련하여, 다양한 단세포 비포유류 미생물, 예컨대 박테리아가 또한 형질전환될 수 있는 것(즉, 배양 또는 발효에서 성장될 수 있는 것)으로 이해될 것이다. 형질전환에 감수성인 박테리아는 엔테로박테리아세아에(enterobacteriaceae)의 구성원, 예컨대 에스체리치아 콜라이(Escherichia coli) 또는 살모넬라(Salmonella)의 균주; 바실라세아에(Bacillaceae), 예컨대 바실러스 서브틸리스(Bacillus subtilis); 뉴모코커스(Pneumococcus); 스트렙토코커스(Streptococcus) 및 헤모필루스 인플루엔자에(Haemophilus influenzae)를 포함한다. 박테리아에서 발현될 때, 폴리펩타이드가 통상적으로 봉입체의 일부가 되는 것으로 추가로 이해될 것이다. 폴리펩타이드는 단리되고 정제되고 이후 기능성 분자로 조립되어야 한다.

대안적으로, 본 개시내용의 최적화된 뉴클레오타이드 서열은 형질전환 동물의 게놈으로의 도입 및 형질전환 동물의 젖에서 후속하는 발현을 위해 전이유전자에서 도입될 수 있다(예를 들어, Deboer 등의 US 제5,741,957호, Rosen의 US 5,304,489 및 Meade 등의 US 제5,849,992호 참조). 적합한 전이유전자는 카제인 또는 베타 락토글로불린과 같은 유선 특이적 유전자로부터의 촉진자 및 증강자와 조작 가능한 연결의 폴리펩타이드에 대한 코딩 서열을 포함한다.

시험관내 제조는 다량의 원하는 폴리펩타이드를 제공하도록 규모확대를 허용한다. 조직 배양 조건 하에 포유류 세포 배양에 대한 기법은 당해 분야에 공지되어 있고, 예를 들어 에어리프트 반응기 또는 연속 교반기 반응기, 또는 부동화된 또는 포획된 세포 배양에서, 예를 들어 중공 섬유, 마이크로캡슐에서, 아가로스 마이크로비드 또는 세라믹 카트리지에서 균일한 현탁 배양을 포함한다. 필요한 및/또는 원하는 경우, 폴리펩타이드의 용액은, 예를 들어 합성 힌지 영역 폴리펩타이드의 우선적 생합성 후에 또는 본 명세서에 기재된 HIC 크로마토그래피 단계 전에 또는 후속하여 종래의 크로마토그래피 방법, 예를 들어 겔 여과, 이온 교환 크로마토그래피, DEAE-셀룰로스 위로 크로마토그래피 또는 (면역-)친화도 크로마토그래피에 의해 정제될 수 있다. 친화도 태그 서열(예를 들어, His (6) 태그)은 하류 정제를 수월하게 하도록 선택적으로 부착되거나 폴리펩타이드 서열 내에 포함될 수 있다.

발현되면, FVIII 단백질은 황산암모늄 침전, 친화도 열 크로마토그래피, HPLC 정제, 겔 전기천공 등을 포함하는 당해 분야의 표준 절차에 따라 정제될 수 있다(일반적으로 문헌[Scopes, Protein Purification (Springer-Verlag, N.Y., (1982)] 참조). 약제학적 용도에, 적어도 약 90 내지 95% 동종성의 실질적으로 순수한 단백질이 바람직하고, 98 내지 99% 또는 이것 초과의 동종성이 가장 바람직하다.

약제학적 조성물

단리된 핵산 분자, 본 개시내용의 핵산 분자, 벡터 또는 숙주 세포에 의해 코딩된 FVIII 활성을 갖는 폴리펩타이드를 함유하는 조성물은 적합한 약제학적으로 허용 가능한 담체를 함유할 수 있다. 예를 들어, 이것은 작용 부위로의 전달에 설계된 제제로 활성 화합물의 가공을 수월하게 하는 부형제 및/또는 보조제를 함유할 수 있다.

약제학적 조성물은 볼루스 주사에 의해 비경구 투여(즉, 정맥내, 피하 또는 근육내)를 위해 제제화될 수 있다. 주사용 제제는 단위 제형에서, 예를 들어 첨가된 보존제를 갖는 앰플 또는 다용량 용기에서 제시될 수 있다. 조성물은 유성 또는 수성 비히클 중에 현탁액, 용액 또는 에멀션과 같은 형태를 위할 수 있고, 제제화제, 예컨대 현탁제, 안정화제 및/또는 분산제를 함유한다. 대안적으로, 활성 성분은 적합한 비히클, 예를 들어 발열원 비함유 물에 의한 구성을 위한 분말 형태일 수 있다.

비경구 투여에 적합한 제제는 또한 수용성 형태, 예를 들어 수용성 염 중의 활성 화합물의 수용액을 포함한다. 또한, 적절한 오일 주사 현탁액으로서 활성 화합물의 현탁액은 투여될 수 있다. 적합한 친유성 용매 또는 비히클은 지방 오일, 예를 들어 참깨유, 또는 합성 지방산 에스터, 예를 들어 에틸 올레에이트 또는 트라이글라이세라이드를 포함한다. 수성 주사 현탁액은 예를 들어 나트륨 카복시메틸 셀룰로스, 소르비톨 및 덱스트란을 포함하는 현탁액의 점도를 증가시키는 물질을 함유할 수 있다. 임의로, 현탁액은 또한 안정화제를 함유할 수 있다. 리포솜은 세포 또는 간질성 공간으로의 전달을 위해 본 개시내용의 분자를 캡슐화하기 위해 또한 사용될 수 있다. 예시적인 약제학적으로 허용 가능한 담체는 생리학적으로 상용성인 용매, 분산 매질, 코팅, 항박테리아제 및 진균제. 등장화제 및 흡수 지연제, 물, 식염수, 인산염 완충 식염수, 덱스트로스, 글라이세롤, 에탄올 등이다. 몇몇 실시형태에서, 조성물은 등장화제, 예를 들어 당, 폴리알코올, 예컨대 만니톨, 소르비톨 또는 염화나트륨을 포함한다. 다른 실시형태에서, 조성물은 활성 성분의 저장수명 또는 유효성을 증대시키는 약제학적으로 허용 가능한 물질, 예컨대 습윤제 또는 소량의 보조 물질, 예컨대 습윤제 또는 유화제, 보존제 또는 완충제를 포함한다.

본 개시내용의 조성물은 예를 들어 액체(예를 들어, 주사용 및 점적주사용 용액), 분산액, 현탁액, 반고체 및 고체 제형을 포함하는 다양한 형태일 수 있다. 바람직한 형태는 투여 방식 및 치료학적 분야에 따라 달라진다.

조성물은 용액, 마이크로 에멀션, 분산액, 리포솜 또는 높은 약물 농도에 적합한 다른 정돈된 구조로 제제화될 수 있다. 무균 주사용 용액은 상기 열거된 성분 중 하나 또는 이의 조합과 적절한 용매 중에 필요한 양의 활성 성분을 도입한 후 여과 무균화시킴으로써 제조될 수 있다. 일반적으로, 분산액은 상기 열거된 것으로부터 기본 분산 매질 및 필요한 다른 성분을 함유하는 무균 비히클로 활성 성분을 도입함으로써 제조된다. 무균 주사용 용액의 제조를 위한 무균 분말의 경우에, 바람직한 제조 방법은 이전에 무균 여과된 용액으로부터 활성 성분과 임의의 추가 원하는 성분의 분말을 생성시키는 진공 건조 및 동결 건조이다. 용액의 적절한 유동성은 예를 들어 코팅, 예컨대 레시틴의 사용에 의해, 분산액의 경우에 필요한 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다. 주사용 조성물의 연장된 흡수는 흡수를 지연시키는 물질, 예를 들어 모노스테아레이트 염 및 젤라틴을 조성물 중에 포함함으로써 발생할 수 있다.

활성 성분은 제어 방출 제제 또는 장치에 의해 제제화될 수 있다. 이러한 제제 및 장치의 예는 임플란트, 경피 패치 및 마이크로캡슐화된 전달 시스템을 포함한다. 생분해성, 생체적합성 중합체, 예를 들어 에틸렌 비닐 아세테이트, 폴리언하이드라이드, 폴리글라이콜산, 콜라겐, 폴리오쏘에스터 및 폴리락트산을 사용할 수 있다. 이러한 제제 및 장치의 제조 방법은 당해 분야에 공지되어 있다. 예를 들어, 문헌[Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978]을 참조한다.

주사용 데포 제제는 생분해성 중합체, 예컨대 폴리락타이드-폴리글라이콜라이드 중의 약물의 마이크로캡슐화된 매트릭스를 형성함으로써 제조될 수 있다. 약물 대 중합체의 비율 및 사용된 중합체의 성질에 따라, 약물 방출의 속도는 제어될 수 있다. 다른 예시적인 생분해성 중합체는 폴리오쏘에스터 및 폴리언하이드라이드이다. 데포 주사용 제제는 리포솜 또는 마이크로에멀션 중에 약물을 포획함으로써 또한 제조될 수 있다.

보충적 활성 화합물은 조성물로 도입될 수 있다. 일 실시형태에서, 본 개시내용의 키메라 단백질은 또 다른 응고 인자, 또는 이의 변이체, 단편, 유사체 또는 유도체와 제제화된다. 예를 들어, 응고 인자는 V 인자, VII 인자, VIII 인자, IX 인자, X 인자, XI 인자, XII 인자, XIII 인자, 프로트롬빈, 피브리노겐, 폰 빌레브란트 인자 또는 재조합 가용성 조직 인자(rsTF) 또는 임의의 상기의 활성화 형태를 포함하지만, 이들로 제한되지는 않는다. 지혈제의 응고 인자는 항섬유소용해 약물, 예를 들어 엡실론-아미노-카프로산, 트라넥삼산을 또한 포함할 수 있다.

투약량 섭생은 최적 원하는 반응을 제공하도록 조정될 수 있다. 예를 들어, 단일 볼루스가 투여될 수 있거나, 몇몇 분할 용량이 시간에 걸쳐 투여될 수 있거나, 용량은 치료학적 상황의 응급성에 의해 표시된 바대로 비례하여 감소하거나 증가할 수 있다. 투여의 용이성 및 투약량의 균일성을 위해 투약량 단위 형태의 비경구 조성물을 제제화하는 것이 유리하다. 예를 들어, 문헌[Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980)]을 참조한다.

활성 화합물 이외에, 액체 제형은 불활성 성분, 예컨대 물, 에틸 알코올, 에틸 카보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글라이콜, 1,3-부틸렌 글라이콜, 다이메틸포름아미드, 오일, 글라이세롤, 테트라하이드로푸르푸릴 알코올, 폴리에틸렌 글라이콜 및 소르비탄의 지방산 에스터를 함유할 수 있다.

적합한 약제학적 담체의 비제한적인 예는 문헌[Remington's Pharmaceutical Sciences by E. W. Martin]에 또한 기재되어 있다. 부형제의 몇몇 예는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카 겔, 나트륨 스테아레이트, 글라이세롤 모노스테아레이트, 탈크, 염화나트륨, 탈지분유, 글라이세롤, 프로필렌, 글라이콜, 물, 에탄올 등을 포함한다. 조성물은 pH 완충 시약, 및 습윤제 또는 유화제를 또한 함유할 수 있다.

경구 투여를 위해, 약제학적 조성물은 종래의 수단에 의해 제조된 정제 또는 캡슐의 형태를 취할 수 있다. 조성물은 액체, 예를 들어 시럽 또는 현탁액으로서 또한 제조될 수 있다. 액체는 현탁제(예를 들어, 소르비톨 시럽, 셀룰로스 유도체 또는 수소화된 식용 지방), 유화제(레시틴 또는 아카시아), 비수성 비히클(예를 들어, 아몬드유, 오일 에스터, 에틸 알코올 또는 분별화된 식물성 오일) 및 보존제(예를 들어, 메틸 또는 프로필-p-하이드록시벤조에이트 또는 소르브산)를 포함할 수 있다. 제제는 항료, 착삭제 및 감미료를 또한 포함할 수 있다. 대안적으로, 조성물은 물 또는 또 다른 적합한 비히클과의 구성을 위한 건조 생성물로서 제시될 수 있다.

협측 투여를 위해, 조성물은 종래의 프로토콜에 따라 정제 또는 로젠지의 형태를 취할 수 있다.

흡입에 의한 투여를 위해, 본 개시내용에 따라 사용하기 위한 화합물은 편리하게는 부형제를 갖거나 갖지 않는 분무된 에어로졸의 형태로 또는 임의로 추진제, 예를 들어 다이클로로다이플루오로메탄, 트라이클로로플루오로메탄, 다이클로로테트라플루오로메탄, 이산화탄소 또는 다른 적합한 가스를 갖는 가압 팩 또는 분무기로부터의 에어로졸 스프레이의 형태로 전달된다. 가압 에어로졸의 경우에, 투약량 단위는 계량된 양을 전달하도록 밸브를 제공함으로써 결정될 수 있다. 흡입제 또는 취입기에서 사용하기 위한 예를 들어 젤라틴의 캡슐 및 카트리지는 화합물 및 적합한 분말 기제, 예컨대 락토스 또는 전분의 분말 혼합물을 함유하여 제제화될 수 있다.

약제학적 조성물은 예를 들어 종래의 좌제 기제, 예컨대 코코아 버터 또는 다른 글라이세라이드를 함유하는 좌제 또는 정체 관장으로서 직장 투여를 통해 또한 제제화될 수 있다.

일 실시형태에서, 약제학적 조성물은 VIII 인자 활성을 갖는 폴리펩타이드, VIII 인자 활성을 갖는 폴리펩타이드를 코딩하는 최적화된 핵산 분자, 핵산 분자를 포함하는 벡터 또는 벡터를 포함하는 숙주 세포, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에서, 조성물은 국소 투여, 안구내 투여, 비경구 투여, 척추강내 투여, 경막하 투여 및 경구 투여로 이루어진 군으로부터 선택된 경로에 의해 투여된다. 비경구 투여는 정맥내 또는 피하 투여일 수 있다.

다른 실시형태에서, 조성물은 이를 요하는 대상체에서 출혈 질환 또는 병태를 치료하기 위해 사용된다. 출혈 질환 또는 병태는 출혈 응고 장애, 혈관절증, 근육 블리드, 경구 블리드, 대출혈, 근육으로의 대출혈, 경구 대출혈, 외상, 두부 외상, 위장 출혈, 두개내 대출혈, 복부내 대출혈, 흉곽내 대출혈, 골절, 중추 신경계 출혈, 후인두 공간에서의 출혈, 후복막 공간에서의 출혈, 장요근초에서의 출혈 및 임의의 이들의 조합으로 이루어진 군으로부터 선택된다. 더욱 다른 실시형태에서, 대상체는 치료를 받을 예정이다. 더욱 다른 실시형태에서, 치료는 예방학적 또는 요구 시이다.

치료 방법

본 개시내용은 본 개시내용의 핵산 분자, 벡터 또는 폴리펩타이드를 이를 요하는 대상체에게 투여하는 단계를 포함하는 출혈 장애를 치료하는 방법을 제공한다. 몇몇 실시형태에서, 출혈 장애는 FVIII에서의 방법을 특징으로 한다. 몇몇 실시형태에서, 출혈 장애는 혈우병이다. 몇몇 실시형태에서, 출혈 장애는 A 혈우병이다. 출혈 장애를 치료하는 방법의 몇몇 실시형태에, 투여 후 24시간에 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 증가한다.

몇몇 실시형태에서, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 바이러스 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 투여 후 약 6시간에, 약 12시간에, 약 18시간에, 약 24시간에, 약 36시간에, 약 48시간에, 약 3일에, 약 4일에, 약 5일에, 약 6일에, 약 7일에, 약 8일에, 약 9일에, 약 10일에, 약 11일에, 약 12일에, 약 13일에, 약 14일에, 약 15일에, 약 16일에, 약 17일에, 약 18일에, 약 19일에, 약 20일에, 약 21일에, 약 22일에, 약 23일에, 약 24일에, 약 25일에, 약 26일에, 약 27일, 또는 약 28일에 증가한다. 소정의 실시형태에서, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 바이러스 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 투여 후 약 24시간에 증가한다. 또 다른 실시형태에서, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 바이러스 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 투여 후 약 21일에 증가한다.

몇몇 실시형태에서, 투여 후 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 바이러스 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 1.5배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배, 적어도 약 100배, 적어도 약 150배, 적어도 약 200배, 적어도 약 250배, 적어도 약 300배, 적어도 약 350배, 적어도 약 400배, 적어도 약 450배, 또는 적어도 약 500배 증가한다. 몇몇 실시형태에서, 투여 후 혈장 FVIII 활성은 생리학적으로 정상인 순환하는 FVIII 수준에 비해 적어도 약 150%, 적어도 약 200%, 적어도 약 250%, 적어도 약 300%, 적어도 약 350%, 적어도 약 400%, 적어도 약 450%, 적어도 약 500%, 적어도 약 550%, 적어도 약 600%, 적어도 약 650%, 적어도 약 700%, 적어도 약 750%, 적어도 약 800%, 적어도 약 850%, 적어도 약 900%, 적어도 약 950%, 적어도 약 1000%, 적어도 약 1500%, 적어도 약 2000%, 적어도 약 2500%, 적어도 약 3000%, 적어도 약 3500%, 적어도 약 4000%, 적어도 약 4500%, 적어도 약 5000%, 적어도 약 5500%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000%, 적어도 약 10,000% 증가한다. 일 실시형태에서, 투여 후 혈장 FVIII 활성은 생리학적으로 정상인 순환하는 FVIII 수준에 비해 적어도 약 3000 내지 약 5000% 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 6배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 10배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 23배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 18배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 30배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 50배 증가한다. 몇몇 실시형태에서, 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드의 투여 후 24시간에 또는 본 명세서에 기재된 VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터 또는 렌티바이러스의 투여 후 21시간에, 혈장 FVIII 활성은 서열 번호 16을 포함하는 기준 핵산 분자, 기준 핵산 분자를 포함하는 벡터 또는 기준 핵산 분자에 의해 코딩된 폴리펩타이드가 투여된 대상체에 비해 적어도 약 100배 증가한다.

본 개시내용은 또한 치료학적 유효량의 본 개시내용의 단리된 핵산 분자 또는 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 활성을 갖는 폴리펩타이드를 투여하는 단계를 포함하는 대상체에서 지혈 장애를 치료하거나 경감시키거나 예방하는 방법에 관한 것이다. 단리된 핵산 분자 또는 코딩된 폴리펩타이드에 의한 치료, 경감 및 예방은 바이패스 치료일 수 있다. 바이패스 치료를 받은 대상체는 이미 응고 인자, 예를 들어 FVIII에 대해 발생된 저해제를 갖거나, 발생하는 응고 인자 저해제로 처리된다.

본 개시내용의 핵산 분자, 벡터 또는 폴리펩타이드는 피브린 혈전의 형성을 촉진함으로써 지혈 장애를 치료하거나 예방한다. 본 개시내용의 핵산 분자에 의해 코딩된 FVIII 활성을 갖는 폴리펩타이드는 응고 캐스케이드의 구성원을 활성화할 수 있다. 응고 인자는 외인성 경로, 내인성 경로 또는 둘 다에 참여할 수 있다.

본 개시내용의 핵산 분자, 벡터 또는 폴리펩타이드는 FVIII에 의해 치료 가능한 것으로 공지된 지혈 장애를 치료하도록 사용될 수 있다. 본 개시내용의 방법을 이용하여 치료될 수 있는 지혈 장애는 A 혈우병, B 혈우병, 폰 빌레브란트 질환, XI 인자 결핍증(PTA 결핍증), XII 인자 결핍증, 및 피브리노겐, 프로트롬빈, V 인자, VII 인자, X 인자 또는 XIII 인자에서의 결핍증 또는 구조적 비정상, 혈관절증, 근육 블리드, 경구 블리드, 대출혈, 근육으로의 대출혈, 경구 대출혈, 외상, 두부 외상, 위장 출혈, 두개내 대출혈, 복부내 대출혈, 흉곽내 대출혈, 골절, 중추 신경계 출혈, 후인두 공간에서의 출혈, 후복막 공간에서의 출혈, 장요근초에서의 출혈을 포함하지만, 이들로 제한되지는 않는다. 대상체에 대한 투여를 위한 조성물은 FVIII 응고 인자를 코딩하는 본 개시내용의 최적화된 뉴클레오타이드 서열을 포함하는 (유전자 치료 분야에 대한) 핵산 분자, 및 FVIII 폴리펩타이드 분자를 포함한다.

몇몇 실시형태에서, 지혈 장애는 유전성 장애이다. 일 실시형태에서, 대상체는 A 혈우병을 갖는다. 다른 실시형태에서, 지혈 장애는 FVIII에서의 결핍증의 결과이다. 다른 실시형태에서, 지혈 장애는 결함성 FVIII 응고 인자의 결과일 수 있다.

또 다른 실시형태에서, 지혈 장애는 후천성 장애일 수 있다. 후천성 장애는 기초하는 2차 질환 또는 병태로부터 생길 수 있다. 비관련된 병태는 제한으로서가 아니라, 예로서, 암, 자가면역 질환 또는 임신일 수 있다. 후천성 장애는 노령 또는 기초하는 2차 장애를 치료하기 위한 약제(예를 들어, 암 화학치료)로부터 생길 수 있다.

본 개시내용은 또한 지혈 장애 또는 지혈 장애의 획득으로부터 생긴 2차 질환 또는 병태를 갖지 않는 대상체를 치료하는 방법에 관한 것이다. 본 개시내용은 따라서 치료학적 유효량의 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드를 투여하는 단계를 포함하는 일반적인 지혈제를 요하는 대상체를 치료하는 방법에 관한 것이다. 예를 들어, 일 실시형태에서, 일반적인 지혈제를 요하는 대상체는 수술을 겪고 있거나 막 겪을 것이다. 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 예방학적으로 수술 전에 또는 후에 투여될 수 있다. 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 급성 출혈 삽화를 제어하기 위해 수술 동안에 또는 후에 투여될 수 있다. 수술은 간 이식, 간 절제 또는 줄기 세포 이식을 포함할 수 있지만, 이들로 제한되지는 않는다.

또 다른 실시형태에서, 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 지혈 장애를 갖지 않는 급성 출혈 삽화를 갖는 대상체를 치료하기 위해 사용될 수 있다. 급성 출혈 삽화는 중증 외상, 예를 들어 수술, 자동차 사고, 상처, 열상 발포 또는 비제어된 출혈을 발생시키는 임의의 다른 외상성 사건으로부터 생길 수 있다.

단리된 핵산 분자, 벡터 또는 FVIII 단백질은 지혈 장애를 갖는 대상체를 예방학적으로 치료하기 위해 사용될 수 있다. 단리된 핵산 분자, 벡터 또는 FVIII 단백질은 지혈 장애를 갖는 대상체에서 급성 출혈 삽화를 치료하기 위해 사용될 수 있다.

또 다른 실시형태에서, 본 개시내용의 단리된 핵산 분자 또는 벡터를 투여함으로써 FVIII 단백질의 발현은 대상체에서 면역 반응을 유도하지 않는다. 몇몇 실시형태에서, 면역 반응은 FVIII에 대한 항체의 발생을 포함한다. 몇몇 실시형태에서, 면역 반응은 사이토카인 분비를 포함한다. 몇몇 실시형태에서, 면역 반응은 B 세포, T 세포, 또는 B 세포 및 T 세포 둘 다의 활성화를 포함한다. 몇몇 실시형태에서, 면역 반응은 저해 면역 반응이고, 대상체에서의 면역 반응은 발생된 면역 반응을 갖지 않는 대상체에서 FVIII의 활성에 비해 FVIII 단백질의 활성을 감소시킨다. 소정의 실시형태에서, 본 개시내용의 단리된 핵산 분자 또는 벡터를 투여함으로써 FVIII 단백질의 발현은 FVIII 단백질 또는 단리된 핵산 분자 또는 벡터로부터 발현된 FVIII 단백질에 대해 저해 면역 반응을 방지한다.

몇몇 실시형태에서, 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 단백질 조성물은 지혈을 촉진하는 적어도 하나의 다른 물질과 조합되어 투여된다. 상기 다른 물질은 입증된 응고 활성을 갖는 치료제에서 지혈을 촉진한다. 제한으로서가 아니라, 예로서, 지혈제는 V 인자, VII 인자, IX 인자, X 인자, XI 인자, XII 인자, XIII 인자, 프로트롬빈 또는 피브리노겐, 또는 임의의 상기의 활성화된 형태를 포함할 수 있다. 응고 인자 또는 지혈제는 항섬유소용해 약물, 예를 들어 엡실론-아미노-카프로산, 트라넥삼산을 또한 포함할 수 있다.

본 개시내용의 일 실시형태에서, 조성물(예를 들어, 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드)은 FVIII가 대상체에게 투여될 때 활성화 가능한 형태로 존재하는 것이다. 이러한 활성화 가능한 분자는 대상체에게 투여 후 응고의 부위에서 생체내 활성화될 수 있다.

단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 정맥내로, 피하로, 근육내로 또는 임의의 점막 표면을 통해, 예를 들어 경구로, 설하로, 협측으로, 설하로, 비강으로, 직장으로, 질내로 또는 폐 경로를 통해 투여될 수 있다. FVIII 단백질은 원하는 부위로의 키메라 단백질의 느린 방출을 허용하는 바이오중합체 고체 지지체 내에 이식되거나 이것에 연결될 수 있다.

협측 및 설하 투여를 위해, 조성물은 종래의 프로토콜에 따라 정제, 로젠지 또는 신속 용해 필름의 형태를 취할 수 있다.

흡입에 의한 투여를 위해, 본 개시내용에 따라 사용하기 위한 FVIII 활성을 갖는 폴리펩타이드는 편리하게는 적합한 추진제, 예를 들어 다이클로로다이플루오로메탄, 트라이클로로플루오로메탄, 다이클로로테트라플루오로메탄, 이산화탄소 또는 다른 적합한 가스를 갖는 가압 팩 또는 분무기(예를 들어, PBS 중의)로부터의 에어로졸 스프레이의 형태로 전달된다. 가압 에어로졸의 경우에, 투약량 단위는 계량된 양을 전달하도록 밸브를 제공함으로써 결정될 수 있다. 흡입제 또는 취입기에서 사용하기 위한 예를 들어 젤라틴의 캡슐 및 카트리지는 화합물 및 적합한 분말 기제, 예컨대 락토스 또는 전분의 분말 혼합물을 함유하여 제제화될 수 있다.

일 실시형태에서, 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드의 투여 경로는 비경구이다. 본 명세서에 사용된 바와 같은, 용어 비경구는 정맥내, 관절내, 복강내, 근육내, 피하, 직장 또는 질내 투여를 포함한다. 비경구 투여의 정맥내 형태가 바람직하다. 모든 이들 투여 형태는 분명히 본 개시내용의 범위 내에 있는 것으로 고려되지만, 투여를 위한 형태는 특히 정맥내 또는 관절내 주사 또는 드립을 위한 주사용수일 것이다. 보통, 주사에 적합한 약제학적 조성물은 완충제(예를 들어, 아세트산염, 인산염 또는 시트르산염 완충제), 계면활성제(예를 들어, 폴리소르베이트), 임의로 안정화제(예를 들어, 인간 알부민) 등을 포함할 수 있다. 그러나, 본 명세서에서의 교시내용과 상용성인 다른 방법에서, 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 불리한 세포 집단의 부위로 직접적으로 전달될 수 있어서, 치료제에 대한 이환된 조직의 노출을 증가시킨다.

비경구 투여를 위한 제제는 무균 수성 또는 비수성 용액, 현탁액 및 에멀션을 포함한다. 비수성 용매의 예는 프로필렌 글라이콜, 폴리에틸렌 글라이콜, 식물성 오일, 예컨대 올리브유, 및 주사용 유기, 에스터, 예컨대 에틸 올레에이트이다. 수성 담체는 물, 알코올성/수성 용액, 에멀션 또는 현탁액, 예를 들어 식염수 및 완충 매질을 포함한다. 본 개시내용에서, 약제학적으로 허용 가능한 담체는 0.01 내지 0.1M 및 바람직하게는 0.05M 인산염 완충제 또는 0.8% 식염수를 포함하지만, 이들로 제한되지는 않는다. 다른 흔한 비경구 비히클은 인산나트륨 용액, 링거 덱스트로스, 덱스트로스 및 염화나트륨, 락테이트화 링거 또는 고정유를 포함한다. 정맥내 비히클은 유체 및 영양소 보충제, 전해질 보충제, 예컨대 링거 덱스트로스에 기초한 것 등을 포함한다. 보존제 및 다른 첨가제, 예를 들어 항균제, 항산화제, 킬레이트화제 및 불활성 기체 등이 또한 제시될 수 있다.

더 특히, 주사용 사용에 적합한 약제학적 조성물은 무균 주사용 용액 또는 분산액의 임시 제조를 위한 무균 수성 용액(여기서 수용성) 또는 분산액 및 무균 분말을 포함한다. 이러한 경우에, 조성물은 무균이어야 하고, 용이한 주사 가능성이 존재하는 정도로 유체이어야 한다. 이것은 제조 및 저장의 조건 하에 안정해야 하고, 바람직하게는 미생물, 예컨대 박테리아 및 진균의 오염 작용에 대해 보존될 것이다. 담체는 예를 들어 물, 에탄올, 폴리올(예를 들어, 글라이세롤, 프로필렌 글라이콜 및 액체 폴리에틸렌 글라이콜 등), 및 적합한 이들의 혼합물을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어 코팅, 예컨대 레시틴의 사용에 의해, 분산액의 경우에 필요한 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다.

미생물의 작용의 예방은 다양한 항박테리아제 및 진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 아스코르브산, 티메로살 등에 의해 달성될 수 있다. 많은 경우에, 조성물 중에 등장화제, 예를 들어 당, 폴리알코올, 예컨대 만니톨, 소르비톨 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사용 조성물의 연장된 흡수는 조성물에 흡수를 지연시키는 물질, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴을 포함시킴으로써 발생할 수 있다.

임의의 경우에, 무균 주사용 용액은 본 명세서에 열거된 성분 중 하나 또는 이의 조합과 적절한 용매 중에 필요한 양의 활성 화합물(예를 들어, 홀로 또는 다른 활성제와 조합된 폴리펩타이드)을 도입한 후 여과 무균화시킴으로써 제조될 수 있다. 일반적으로, 분산액은 상기 열거된 것으로부터 기본 분산 매질 및 필요한 다른 성분을 함유하는 무균 비히클로 활성 화합물을 도입함으로써 제조된다. 무균 주사용 용액의 제조를 위한 무균 분말의 경우에, 바람직한 제조 방법은 이전에 무균 여과된 용액으로부터 활성 성분과 임의의 추가 원하는 성분의 분말을 생성시키는 진공 건조 및 동결 건조이다. 주사를 위한 제제는 가공처리되고, 용기, 예컨대 앰플, 백, 병, 주사기 또는 바이알로 충전되고, 당해 분야에 공지된 방법에 따라 무균성 조건 하에 밀봉된다. 추가로, 제제는 키트의 형태로 포장되고 판매될 수 있다. 이러한 제조 물품은 바람직하게는 연관된 조성물이 응고 장애를 겪거나 이의 소인이 있는 대상체를 치료하는 데 유용하다는 것을 나타내는 라벨 또는 패키지 인서트를 가질 것이다.

병태의 치료를 위한 본 개시내용의 조성물의 유효 용량은 많은 상이한 인자, 예를 들어 투여 수단, 표적 부위, 환자의 생리학적 상태, 환자가 인간 또는 동물인지, 투여되는 다른 약제 및 치료가 예방학적 또는 치료학적인지에 따라 변한다. 보통, 환자는 인간이지만, 형질전환 포유류를 포함하는 비인간 포유류는 또한 치료될 수 있다. 치료 투약량은 안전성 및 효능을 최적화하기 위해 당해 분야의 숙련자에게 공지된 일상적인 방법을 위해 적정될 수 있다.

본 명세서에 기재된 바와 같은, VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 플라스미드 또는 코돈 최적화된 유전자에 의해 코딩된 폴리펩타이드를 투여하기 위한 투약량은 1000㎍/㎏ 내지 0.1ng/체중(㎏)의 범위일 수 있다. 일 실시형태에서, 투약 범위는 1㎍/㎏ 내지 100㎍/㎏이다. 본 명세서에 기재된 바와 같은, VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 렌티바이러스 벡터를 투여하기 위한 투약량은 10³ 내지 10¹⁵TU/㎏의 범위일 수 있다. 본 명세서에 기재된 바와 같은, VIII 인자(FVIII) 활성을 갖는 폴리펩타이드를 코딩하는 코돈 최적화된 유전자를 포함하는 AAV 벡터를 투여하기 위한 투약량은 10⁵ 내지 10¹⁸ VG/㎏의 범위일 수 있다.

단리된 핵산 분자, 플라스미드, 벡터 또는 FVIII 폴리펩타이드는 단일 용량으로서 또는 다수의 용량으로서 투여될 수 있고, 다수의 용량은 연속하여 또는 특정한 시간 간격으로 투여될 수 있다. 시험관내 검정은 최적 용량 범위 및/또는 투여 스케줄을 결정하기 위해 이용될 수 있다. 응고 인자 활성을 측정하는 시험관내 검정은 당해 분야에 공지되어 있다. 추가로, 유효 용량은 동물 모델, 예를 들어 혈우병 개로부터 얻은 용량-반응 곡선으로부터 외삽될 수 있다(Mount et al. 2002, Blood 99 (8): 2670).

상기 범위에서 용량 중간은 본 개시내용의 범위 내에 있는 것으로 또한 의도된다. 대상체는 매일, 다른 날에, 주마다 또는 경험 분석에 의해 결정된 임의의 다른 스케줄에 따라 이러한 용량이 투여될 수 있다. 예시적인 치료는 예를 들어 적어도 6개월의 연장된 기간에 걸쳐 다수의 투약량의 투여를 수반한다. 몇몇 방법에서, 2개 이상의 폴리펩타이드는 동시에 투여될 수 있고, 이 경우에 투여되는 각각의 폴리펩타이드의 투약량은 표시된 범위 내에 있다.

본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 다수의 때에 투여될 수 있다. 단일 투약량 사이의 간격은 매일, 매주, 매월 또는 매년일 수 있다. 간격은 또한 환자에서의 변형된 폴리펩타이드 또는 항원의 혈액 수준을 측정함으로써 표시된 바대로 불규칙일 수 있다. 대안적으로, 폴리펩타이드는 지속 방출 제제로서 투여될 수 있고, 이 경우에 덜 빈번한 투여가 필요하다. 투약량 및 빈도는 환자에서의 폴리펩타이드 또는 폴리뉴클레오타이드의 반감기에 따라 변한다.

투여의 투약량 및 빈도는 치료가 예방학적 또는 치료학적인지에 따라 변할 수 있다. 예방학적 분야에서, 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드 또는 이의 칵테일을 함유하는 조성물은 환자의 내성을 증대시키거나 질환의 효과를 최소화하기 위해 이미 질환 상태에 없는 환자에게 투여된다. 이러한 양은 "예방학적 유효 용량"인 것으로 정의된다. 비교적 적은 투약량은 긴 시간 기간에 걸쳐 비교적 덜 빈번한 간격으로 투여된다. 몇몇 환자는 이의 생의 나머지 동안 치료를 계속해서 받는다.

본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드는 임의로 치료를 요하는 장애 또는 병태를 치료하는 데 효과적인(예를 들어, 예방학적 또는 치료학적) 다른 물질과 조합되어 투여될 수 있다.

본 명세서에 사용된 바대로, 부가 치료와 함께 또는 이것과 조합되어 본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드의 투여는 치료제 및 개시된 폴리펩타이드의 순차적인, 동시, 동시간, 동시발생, 공존 또는 동시발생 투여 또는 적용을 의미한다. 당해 분야의 숙련자는 조합된 치료학적 섭생의 다양한 성분의 투여 또는 적용이 치료의 전체 유효성을 증대시키기 위해 타이밍화될 수 있다는 것을 이해할 것이다. 숙련자(예를 들어, 의사)는 선택된 부가 치료 및 본 명세서의 교시내용에 기초하여 부당한 실험 없이 효과적인 조합된 치료학적 섭생을 용이하게 구분할 것이다.

본 개시내용의 단리된 핵산 분자, 벡터 또는 FVIII 폴리펩타이드가 물질 또는 물질들(예를 들어, 조합된 치료학적 섭생을 제공하기 위해)과 함께 또는 조합하여 사용될 수 있는 것으로 추가로 이해될 것이다. 본 개시내용의 폴리펩타이드 또는 폴리뉴클레오타이드가 조합될 수 있는 예시적인 물질은 치료되는 특정한 장애에 대한 현재의 표준 관리를 나타내는 물질을 포함한다. 이러한 물질은 자연히 화학적 또는 생물학적일 수 있다. 용어 "생물학적" 또는 "생물학적 물질"은 살아 있는 유기체 및/또는 치료제로서 사용하도록 의도되는 이의 산물로부터 제조된 임의의 약제학 활성제를 의미한다.

본 개시내용의 폴리뉴클레오타이드 또는 폴리펩타이드와 조합되어 사용되는 물질의 양은 대상체마다 변할 수 있거나, 당해 분야에 공지된 것에 따라 투여될 수 있다. 예를 들어, 문헌[Bruce A Chabner et al., Antineoplastic Agents, in Goodman & Gilman's The Pharmacological Basis of Therapeutics 1233-1287 ((Joel G. Hardman et al., eds., 9^th ed. 1996)]을 참조한다. 또 다른 실시형태에서, 표준 관리와 일치하는 이러한 물질의 양이 투여된다.

이전에 기재된 바대로, 본 개시내용의 폴리뉴클레오타이드 및 폴리펩타이드는 응고 장애의 생체내 치료를 위한 약제학적 유효량으로 투여될 수 있다. 이와 관련하여, 본 개시내용의 폴리펩타이드 또는 폴리뉴클레오타이드가 투여를 수월하게 하고 활성제의 안정성을 촉진하기 위해 제제화될 수 있는 것으로 이해될 것이다. 바람직하게는, 본 개시내용에 따른 약제학적 조성물은 약제학적으로 허용 가능한, 비독성, 무균 담체, 예컨대 생리학적 식염수, 비독성 완충제, 보존제 등을 포함한다. 물론, 본 개시내용의 약제학적 조성물은 약제학적 유효량의 폴리펩타이드를 제공하기 위해 단일 또는 다수의 용량으로 투여될 수 있다.

응고 시스템의 기능을 평가하기 위한 다수의 시험: 활성화된 부분 트롬보플라스틴 시간(aPTT) 시험, 비색 검정, ROTEM(등록상표) 검정, 프로트롬빈 시간(PT) 시험(또한 INR을 결정하도록 사용됨), 피브리노겐 시험(대개 Clauss 방법에 의함), 혈소판 수, 혈소판 기능 시험(대개 PFA-100에 의함), TCT, 출혈 시간, 혼합 시험(환자의 혈장이 정상 혈장과 혼합되는 경우 비정상이 보정되는지), 응고 인자 검정, 항인지질 항체, D-이합체, 유전자 시험(예를 들어, V 인자 라이덴(Leiden), 프로트롬빈 돌연변이 G20210A), 희석 러셀(Russell) 독사 독액 시간(dRVVT), 기타 혈소판 기능 시험, 혈전탄성그래피(TEG 또는 Sonoclot), 혈전탄성측정법(TEM(등록상표), 예를 들어 ROTEM(등록상표)), 또는 유글로불린 용해 시간(ELT)이 이용 가능하다.

aPTT 시험은 "내인성"(또한 접촉 활성화 경로라 칭함) 및 흔한 응고 경로 둘 다의 효능을 측정하는 성능 표시자이다. 이 시험은 상업적으로 입수 가능 재조합 응고 인자, 예를 들어 FVIII 또는 FIX의 응고 활성을 측정하기 위해 흔히 사용된다. 이것은 외인성 경로를 측정하는 프로트롬빈 시간(PT)과 함께 사용된다.

ROTEM(등록상표) 분석은 지혈의 전체 동역학: 응고 시간, 혈전 형성, 혈전 안정성 및 용해에 대한 정보를 제공한다. 혈전탄성측정법에서의 상이한 매개변수는 혈장 응고 시스템의 활성, 혈소판 기능, 섬유소분해 또는 이 상호작용에 영향을 미치는 많은 인자에 따라 달라진다. 이 검정은 2차 지혈의 완전한 관점을 제공할 수 있다.

유전자 치료

본 개시내용은 본 개시내용의 단리된 핵산 분자를 이를 요하는 대상체에게 투여하는 단계를 포함하는 대상체에서 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법을 제공하고, 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 분자에 비해 증가한다. 본 개시내용은 또한 본 개시내용의 벡터를 이를 요하는 대상체에게 투여하는 단계를 포함하는 대상체에서 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법을 제공하고, 폴리펩타이드의 발현은 기준 핵산 분자를 포함하는 벡터에 비해 증가한다.

체세포 유전자 치료는 A 혈우병에 대한 가능한 치료로서 조사되었다. 유전자 치료는 벡터의 단일 투여 후 FVIII의 연속 내인성 제조를 통해 질환을 치유하는 이의 가능성 때문에 혈우병의 특히 매력적인 치료이다. A 혈우병은 이의 임상 표출이 전적으로 혈장에서 적은 양(200ng/㎖)으로 순환하는 단일 유전자 산물(FVIII)의 기여로 인하므로 유전자 대체 접근법에 매우 적합하다.

본 개시내용의 FVIII 단백질은 출혈 응고 장애, 혈관절증, 근육 블리드, 경구 블리드, 대출혈, 근육으로의 대출혈, 경구 대출혈, 외상, 두부 외상, 위장 출혈, 두개내 대출혈, 복부내 대출혈, 흉곽내 대출혈, 골절, 중추 신경계 출혈, 후인두 공간에서의 출혈, 후복막 공간에서의 출혈, 장요근초에서의 출혈로 이루어진 군으로부터 선택된 출혈 질환 또는 장애의 치료에 대한 유전자 치료 접근법을 이용하여 포유류, 예를 들어 인간 환자에서 생체내 제조될 수 있고, 치료학적으로 유리할 것이다. 일 실시형태에서, 출혈 질환 또는 장애는 혈우병이다. 또 다른 실시형태에서, 출혈 질환 또는 장애는 A 혈우병이다. 이것은 적합한 발현 제어 서열에 작동적으로 연결된 핵산을 코딩하는 최적화된 FVIII의 투여를 수반한다. 소정의 실시형태에서, 이 서열은 바이러스 벡터로 도입된다. 이러한 유전자 치료에 적합한 바이러스 벡터는 아데노바이러스 벡터, 렌티바이러스 벡터, 바큘로바이러스 벡터, 엡스타인 바 바이러스 벡터, 파포바바이러스 벡터, 백시니아 바이러스 벡터, 단순 포진 바이러스 벡터 및 아데노 연관된 바이러스(AAV) 벡터를 포함한다. 바이러스 벡터는 복제 결함 바이러스 벡터일 수 있다. 다른 실시형태에서, 아데노바이러스 벡터는 이의 E1 유전자 또는 E3 유전자에서 결실을 갖는다. 다른 실시형태에서, 서열은 당해 분야의 숙련자에게 공지된 비바이러스 벡터로 도입된다.

본 명세서에 기재된 모든 다양한 양태, 실시형태 및 옵션은 임의의 및 모든 변형으로 조합될 수 있다.

본 명세서에 언급된 모든 공보, 특허 및 특허 출원은 각각의 개별 공보, 특허 또는 특허 출원이 구체적으로 및 개별적으로 참조로 포함된 것으로 표시된 것과 동일한 정도로 본 명세서에 참고로 포함된다.

본 개시내용이 일반적으로 기재되어 있지만, 추가의 이해가 본 명세서에 제공된 실시예를 참조하여 얻어질 수 있다. 이 실시예는 오직 예시의 목적을 위한 것이고 제한인 것으로 의도되지 않는다.

실시예

실시예 1. 코돈 최적화 전략

coFVIII-3(서열 번호 1; 도 1a), coFVIII-4(서열 번호 2; 도 1b), coFVIII-5(서열 번호 70; 도 1c), coFVIII-6(서열 번호 71; 도 1d), coFVIII-52(서열 번호 3; 도 1e), coFVIII-62(서열 번호 4; 도 1f), coFVIII-25(서열 번호 5; 도 1g) 및 coFVIII-26(서열 번호 6; 도 1h)을 포함하는 코돈 사용빈도 바이어스를 제어함으로써 8개의 코돈 최적화된 BDD FVIII 변이체를 생성하였다. 온라인 도구 Eugene을 이용하여 상기 기재된 바대로 코돈 최적화를 수월하게 하고(문헌[Gaspar et al., "EuGene: maximizing synthetic gene design for heterologous expression," Bioinformatics 28:2683-84 (2012)] 참조), 몇몇 코돈 사용빈도 매개변수, 예컨대 코돈 적응 지수(CAI) 및 상대 동의적 코돈 사용빈도(RSCU)를 모니터링하였다(표 5). 모든 변이체를 83% 이상의 CAI 및 1.63의 RSCU로 조정하는 한편, 모 B 도메인 결실된 FVIII 서열은, 최적화 전에, 74%의 CAI 및 1.12의 RSCU를 가졌다(표 5).

CAI의 전체 증가 이외에, 8개의 변이체를, 비최적화된 BDD FVIII 서열(도 2a)에 비해, 도 2에 예시된 바대로 코딩 영역에 걸친 CAI의 분포에 기초하여 3개의 종류로 설계하였다. 제1 종류는 전체 코딩 영역에 걸쳐 높은 CAI의 평평한 분포를 갖는 BDD FVIII 변이체를 포함한다(도 2c 내지 도 2f 참조). 제1 종류는 coFVIII-3(도 2c), coFVIII-4(도 2d), coFVIII-5(도 2e), coFVIII-6(도 2f), 및 이전에 기재된 coFVIII-1(국제 공보 WO 제2014/127215호(서열 번호 1) 참조)(도 2b)을 포함한다. 제2 종류는 코딩 서열의 N 말단에서 더 낮은 CAI 및 코딩 서열의 C 말단에서 더 높은 CAI를 갖는 BDD-FVIII 변이체를 포함한다(도 2g 및 도 2h 참조). 제2 종류는 coFVIII-52(도 2g) 및 coFVIII-62(도 2h)를 포함한다. 제3 종류는 코딩 서열의 N 말단에서 더 높은 CAI 및 코딩 서열의 C 말단에서 더 낮은 CAI를 갖는 BDD-FVIII 변이체를 포함한다(도 2i 및 도 2j 참조). 제3 종류는 coFVIII-25(도 2i) 및 coFVIII-26(도 2j)을 포함한다.

임의의 이론에 의해 구속되지 않으면서, 더 높은 CAI가 더 빠른 단백질 번역과 상관되고, 이 3개의 종류가 시작으로부터 종료까지 단백질 합성의 상이한 속도를 나타낸다는 것이 추측된다. 예를 들어, 더 낮은 CAI를 갖는 영역의 번역은 더 높은 CAI를 갖는 영역의 번역에 비해 천천히 진행한다. 그렇다면, 예를 들어 더 낮은 CAI를 갖는 coFVIII-62의 coFVIII-52의 N 말단 반의 번역은 초기에 천천히 진행한 후 더 높은 CAI를 갖는 C 말단 반의 더 신속한 번역이 후행한다. 이것은 전체 단백질 합성을 느리게 하지 않으면서 번역 동안 단백질 폴딩 및 번역 후 변형에 바람직할 수 있다. 반대의 효과는 N 말단 반에서의 더 높은 CAI 및 C 말단 반에서의 더 낮은 CAI를 갖는 coFVIII-25 및 coFVIII-26 변이체에 대해 보인다.

mRNA의 안정성을 보장하기 위해, 은성 스플라이싱 부위, 조숙 폴리A 부위, RNA 불안정성 모티프(ARE) 및 반복 서열을 포함하는 다수의 부위를 피하기 위해 그리고 GC 함량을 조정하기 위해 모든 FVIII 코돈 최적화된 변이체를 조정하였다(표 2 참조).

실시예 2. pcDNA3 플라스미드로부터의 coFVIII 변이체의 클로닝 및 발현

생체내 발현에 대해 다양한 FVIII 변이체를 함유하는 발현 플라스미드를 설계하였다. 비최적화된 BDD FVIII(도 1i; 서열 번호 16) 및 coFVIII-1(도 11z; 서열 번호 68) 폴리뉴클레오타이드를 pcDNA3 골격(Invitrogen)으로 클로닝하였고, 여기서 CMV 촉진자를 ET 촉진자에 의해 대체하였다(도 3 참조). FVIII-311(BDD FVIII) 및 FVIII-303(coFVIII-1)인 생성된 플라스미드는 각각 비최적화된 BDD FVIII 및 coFVIII-1의 발현을 추진시켰다.

FVIII-303 또는 FVIII-311의 5㎍의 DNA/마우스의 수력 주사에 의해 Hem A 마우스에서 FVIII-311 및 FVIII-303의 생체내 발현을 평가하였다. 주사 후 24시간, 48시간 및 72시간에 혈장 샘플을 수집하고, FVIII 특이적 비색 검정에 의해 FVIII 활성을 결정하였다.

도 4에 도시된 바대로, FVIII-311(BDD FVIII; 정사각형)에 의해 치료된 마우스의 혈장 FVIII 활성은 주사 후 72시간에 74±43mU/㎖인 한편, FVIII-303(coFVIII-1; 원)에 의해 치료된 마우스의 혈장 FVIII 활성은 주사 후 72시간에 452±170mU/㎖이었다(도 4). 이것은 비최적화된 BDD FVIII에 비해 coFVIII-1의 발현의 대략 6배 증가를 나타낸다.

실시예 3. 렌티바이러스 벡터 시스템을 사용한 coFVIII 변이체의 클로닝 및 발현

코돈 최적화된 BDD FVIII 변이체의 발현 수준을 추가로 평가하기 위해, 코딩 서열을 ET 촉진자의 제어 하에 렌티바이러스 플라스미드로 클로닝하였다(문헌[Amendola et al., "Coordinate dual-gene transgenesis by lentiviral vectors carrying synthetic bidirectional promoters," Nature Biol . 23:108-16 (2005)]; 국제 공보 WO 제2000/066759호 A1 참조). pLV-coFVIII-52의 플라스미드 지도가 도 5에 도시되어 있고; 비최적화된 BDD FVIII(LV-2116), coFVIII-1(LV-coFVIII-1), coFVIII-3(LV-coFVIII-3), coFVIII-4(LV-coFVIII-4), coFVIII-5(LV-coFVIII-5) 및 coFVIII-6(LV-coFVIII-6), coFVIII-62(LV-coFVIII-62), coFVIII-25(LV-coFVIII-25) 및 coFVIII-26(LV-coFVIII-26)을 함유하는 플라스미드를, coFVIII-52 단편을 NheI 및 SalI 부위를 사용하여 각각의 표시된 코딩 서열에 의해 대체한다는 것을 제외하고는, 동일한 방식으로 작제하였다. (표 6).

5㎍의 DNA/마우스(도 6a, 도 6b) 또는 20㎍의 DNA/마우스(도 6c)의 용량에서의 수력 주사에 의해 HemA 마우스에서 렌티바이러스 코돈 최적화된 FVIII 변이체를 평가하였다. 도 6에 도시된 바대로, 각각의 coFVIII-3(도 6a; 삼각형), coFVIII-4(도 6a; 역삼각형), coFVIII-5(도 6a; 다이아몬드), coFVIII-6(도 6a; 빈 원), coFVIII-25(도 6b; 삼각형), coFVIII-26(도 6b; 역삼각형), coFVIII-52(도 6c; 정사각형) 및 coFVIII-62(도 6c; 채워지니 원)는 coFVIII-1보다 더 높은 FVIII 활성을 나타냈다(도 6a, 원; 도 6b, 원; 및 도 6c, 삼각형). 특히, coFVIII-25 및 coFVIII-26은 주사 후 72시간에 유사한 발현 수준을 나타내어서, coFVIII-1의 것보다 3배 더 높은 활성에 도달하였고(도 6b), 이것은 비최적화된 모 BDD FVIII과 비교하여 24배 더 높은 FVIII 활성으로 번역된다(도 4 참조). coFVIII-52(정사각형) 및 coFVIII-62(채워진 원) 둘 다는 주사 후 72시간에 훨씬 더 높은 발현을 달성하여서, coFVIII-1(삼각형)보다 각각 6배 및 4배 더 높은 발현 및 비최적화된 모 BDD FVIII(빈 원)(도 6c)보다 각각 50배 및 30배 더 높은 발현을 나타낸다. 이 데이터는 코딩 서열의 N 말단 반에서의 더 낮은 CAI 및 코딩 서열의 C 말단 반에서의 더 높은 CAI의 조합이 CAI의 역분포와 비교하여 FVIII 발현에 대해 더 유리하다는 것을 나타낸다.

실시예 4: HemA 마우스에서의 코돈 최적화된 FVIII 변이체의 장기간 렌티바이러스 발현

렌티바이러스 벡터 매개된 유전자 운반에 의해 수력 주사 후 72시간에서 HemA 마우스에서 FVIII의 높은 발현을 추진시키는 것으로 확인된 변이체를 장기간 FVIII 발현에 대해 평가하였다. 렌티바이러스 벡터는 293T 세포에서 일시적인 형질주입에 의해 제조하고, 초원심분리에 의해 약 5E9TU/㎖로 농축시켰다. 이후, 렌티바이러스 벡터를 1E8TU/마우스의 용량에서 후안와 주사에 의해 12 내지 14일령 HemA 마우스로 투여하였다. 렌티바이러스 주사 후 21일에, 평균 혈장 FVIII 활성은 LV-2116에 의해 치료된 마우스에 대해 약 0.04IU/㎖이었다(BDD FVIII; 도 7). 각각의 coFVIII-1, coFVIII-5, coFVIII-52, coFVIII-6 및 coFVIII-62는 LV-2116(비최적화된 B 도메인 결실된 FVIII) 대조군에 대해 주사 후 21일에 더 높은 순환 FVIII 수준을 발생시켰다. 특히, 주사 후 21일에 coFVIII-1 및 coFVIII-5 주사는 약 1.8IU/㎖의 FVIII 혈장 활성 수준을 생성시키고, coFVIII-52는 약 4.9IU/㎖의 FVIII 혈장 활성 수준을 생성시키고, coFVIII-6은 약 4.6IU/㎖의 FVIII 혈장 활성 수준을 생성시키고, coFVIII-62는 약 2.5IU/㎖의 FVIII 혈장 활성 수준을 생성시켰다(도 7). 각각 LV-coFVIII-6 및 LV-coFVIII-52, 4.6IU/㎖ 및 4.9IU/㎖에 의해 주사된 마우스에서 관찰된 FVIII 혈장 수준은 LV-2116(비최적화된 BDD-FVIII) 대조군이 주사된 마우스에서 관찰된 혈장 수준보다 100배 더 높았다.

실시예 5. coFVIII-XTEN 융합 작제물

정상 상태 FVIII 발현을 개선하는 XTEN의 능력을 시험하였다. 처음에, 144개의 아미노산의 XTEN에 대한 코딩 서열("XTEN₁₄₄"; 서열 번호 18)을 coFVIII-52 및 coFVIII-1의 1193번 뉴클레오타이드(또는 코딩된 폴리펩타이드의 처음의 764개의 아미노산 후)에서 삽입하여서 각각 coFVIII-52-XTEN(도 8a; 서열 번호 19) 및 coFVIII-1-XTEN(도 8b; 서열 번호 20)을 생성하였다. 이후, coFVIII-1-XTEN 서열을 상기 기재된 바와 같이 ET 촉진자의 제어 하에 pcDNA3 골격(Invitrogen)으로 클로닝하여, FVIII-306 발현 플라스미드를 생성하고; coFVIII-52-XTEN 서열을 상기 개시된 바와 같이 ET 촉진자의 제어 하에 렌티바이러스 플라스미드로 클로닝하여, pLV-coFVIII-52-XTEN(도 9)을 생성하였다. FVIII-306(coFVIII-1-XTEN)을 수력 주사에 의해 5㎍의 DNA/마우스에서 HemA 마우스에 투여하였다. FVIII-303(coFVIII-1; 도 10a, 작은 원) 및 FVIII-311(BDD FVIII; 도 10a, 정사각형)과 비교하여, coFVIII-1에 대한 XTEN₁₄₄의 융합(FVIII-306; 도 10a, 큰 원)은 주사 후 72시간에 HemA 마우스에서 각각 약 5배 및 33배 더 높은 FVIII 발현을 발생시켰다. HemA 마우스에서 렌티바이러스 벡터를 사용하여 FVIII 발현에 대한 XTEN 삽입의 효과를 또한 평가하였다(도 10b). LV-coFVIII-52-XTEN을 후안와 주사에 의해 1E8TU/마우스에서 12 내지 14일령 HemA 마우스에게 투여하였다. LV-coFVIII52 및 LV-2116(BDD-FVIII)과 비교하여, coFVIII-52에 대한 XTEN₁₄₄의 융합(도 10b)은 주사 후 21일에 HemA 마우스에서 각각 약 4배 및 450배 더 높은 FVIII 발현을 발생시켰다.

XTEN₁₄₄에 융합되고 ET 촉진자에 융합된 각각의 coFVIII-3, co-FVIII-4, coFVIII-5, coFVIII-6, coFVIII-62, coFVIII-25 및 coFVIII-26을 포함하는 렌티바이러스 벡터는 상기 기재된 바와 같이 제조될 것이다. 벡터는 FVIII 단백질의 발현에 대해 시험될 것이다.

실시예 6. coFVIII 작제물의 발현

코돈 최적화된 FVIII 변이체를 표준 분자 클로닝 기법에 의해 도 9에 예시된 바대로 렌티바이러스 플라스미드로 클로닝하였다. 이후, 렌티바이러스 벡터를 일시적인 형질주입을 통해 HEK293 세포에서 제조하고, 초원심분리에 의해 단리하였다.

FVIII 렌티바이러스 벡터를 1.5E10TU/㎏의 LV-FVIII 변이체의 용량에서 정맥내 주사에 의해 14일령 HemA 마우스 새끼에게 투여하였다. FVIII 혈장 활성을 LV-FVIII 치료 후 21일에 측정하고, 세포마다 벡터 카피수(VCN)를 LV-FVIII 치료 후 150일에 LV-FVIII 치료된 동물로부터 수집된 간 괴사 샘플에서 측정하였다. VCN 값은 투여된 LV-FVIII 변이체와 무관하게 모든 동물에서 유사한 한편(도 12b), coFVIII 변이체에 의해 치료된 동물에서의 FVIII 활성 수준은 wtBDD-FVIII에 의해 치료된 동물에서보다 30 내지 100배 높았다(도 12a 및 도 12c; 표 7). 이 데이터는 FVIII 코돈 최적화가 렌티바이러스 벡터 환경에서 FVIII 발현을 개선한다는 것을 나타낸다.

실시예 7. 렌티바이러스 치료 후 HemA 마우스에서 FVIII 전이유전자 발현 매개된 면역 반응

실시예 6의 LV-FVIII 치료된 마우스를 장기간 FVIII 발현 및 항-FVIII 항체 형성에 대해 평가하였다. FVIII 발현은, FVIII 혈장 활성에 의해 입증된 바대로, 동일한 치료군 내에 동물 중에 변했다(도 13a). 예를 들어, coFVIII-5 변이체를 발현하는 렌티바이러스 벡터에 의해 치료된 3마리의 마우스(1, 2 및 3 지칭)는 대략 16주에 걸쳐 한결같은 FVIII 발현을 보여주는 한편, 동일한 렌티바이러스 벡터에 의해 치료된 3마리의 한배 새끼(4, 5 및 6 지칭)는 치료 후 약 10주에 FVIII 혈장 활성 수준의 급격한 감소를 보여주었다(도 13a). 마우스 1, 2 및 3에서 관찰된 한결같은 FVIII 혈장 활성은 검출 불가능하거나 매우 낮은 수준의 항-FVIII 항체와 상관되었다(도 13b; 마우스 1, 2 및 3). 반대로, FVIII 혈장 활성의 급격한 감소를 나타낸 마우스는 또한 항-FVIII 항체의 증가한 수준을 나타냈다(도 13b; 마우스 4, 5 및 6). 이 데이터는 FVIII 전이유전자 발현이 동물의 하위집단에서 항-FVIII 항체 형성을 유도하고, 생성된 항-FVIII 항체가 순환으로부터 형질전환 FVIII 단백질을 제거한다는 것을 제안한다.

FVIII 발현과 항-FVIII 항체 형성 사이의 관계를 평가하였다. 실시예 6의 LV-FVIII 치료된 마우스를 항-FVIII 항체 음성인 마우스 및 항-FVIII 항체 양성인 마우스의 2개의 군으로 나눴다. 도 14에 도시된 바대로, 생리학적 수준에서의 형질전환 FVIII의 발현은 형질전환 FVIII에 면역 반응을 유도하지 않았지만(도 14, 원), 초 생리학적 수준의 FVIII 발현은 항-FVIII 항체 형성을 유도하는 것으로 보여서, FVIII 발현 수준이 더 높을수록, 항-FVIII 항체 유도의 기회가 더 높았다. 이 데이터는 FVIII 유전자 치료 치료로 치료된 환자에서 FVIII 발현의 생리학적 수준을 유지시키는 것이 유리할 수 있다는 것을 제안한다.

FVIII 발현 유도된 면역 반응이 간 세포를 발현하는 전이유전자의 소실을 발생시키는지를 결정하기 위해, 벡터 카피수(도 15) 및 FVIII RNA 전사 수준(도 16)을 항-FVIII 항체 양성 및 음성 마우스로부터의 간 괴사 샘플에서 평가하였다. 도 15에 도시된 바대로, 벡터 카피수의 분포는 항-FVIII 항체 양성 및 음성 마우스에서 동일하여서, LV-FVIII 통합을 갖는 세포가 항-FVIII 항체의 발생에도 불구하고 유지된다는 것을 나타낸다. 이것은 LV-FVIII 매개된 FVIII 전이유전자 발현 용량이 간 세포를 발현하는 FVIII에 대해 세포독성 T 림프구(CTL) 반응을 유도하지 않는다는 것을 제시한다. 이 결과를 추가로 확인하기 위해, FVIII RNA 전사를 RNA 인시츄 혼성화에 의해 평가하였다(도 16c 및 도 16d). 간 수확의 시간에, 마우스 coFVIII-52-B는 검출 불가능한 순환 FVIII 및 높은 수준의 항-FVIII 항체를 가졌다(도 16a 및 도 16b). 그러나, coFVIII-52-B 마우스로부터의 간 조직에서의 FVIII-RNA 양성 세포의 수 및 RNA 전사 신호는 괴사의 시간에 약 4IU/㎖의 순환 FVIII를 갖는 FVIII-52-A 마우스에 필적하였다. 이를 위해 FVIII 발현은 실험 HemA 마우스에서 CTL 반응을 유도하지 않았다.

실시예 8. LV-FVIII 치료된 HemA 마우스 신생아에서의 FVIII 장기간 발현

간의 표적화를 통한 소아 HemA 환자의 치료를 위한 렌티바이러스 시스템을 사용하는 것의 효능을 평가하기 위해, 2일령 HemA 마우스에 LV-coFVIII-52XTEN, LV-coFVIII6-XTEN 또는 wtBDD-FVIII를 발현하는 렌티바이러스 벡터의 약 1.5E10TU/㎏의 템플 정맥 주사에 의해 투여하였다. 한결같은 장기간 FVIII 발현이 변이체 및 대조군 둘 다에 관찰되어서, 통합된 FVIII 발현 캐스케이드가 치료된 마우스의 분할 간 세포에서 유지된다는 것을 입증한다(도 17). 이 데이터는 LV-FVIII가 소아 및 성인 HemA 환자 둘 다를 치료하기 위해 잠재적으로 사용될 수 있다는 것을 제안한다.

실시예 9. HemA 개 신생아에서의 LV-FVIII의 평가

더 큰 동물 모델에서 LV-FVIII의 효능을 추가로 평가하기 위해, 2개의 1주령 HemA 개 신생아(S3 및 K4라 지칭)에 1.3 x 10⁹TU/㎏의 LV-coFVIII-6-XTEN을 정맥내 주사에 의해 투여하였다. 이 용량은 HemA 마우스 모델에서 이전에 사용된 용량보다 10배 초과로 낮았다. 렌티바이러스 벡터의 투여 후, 혈장 FVIII 활성을 1단계 응고 검정(aPTT)(도 18)에 의해 모니터링하고, 전혈 지혈을 회전 혈전탄성측정법(ROTEM) 검정에 의해 모니터링하였다(도 19a 내지 도 19d). LV-FVIII 치료 전에, S3에 대한 FVIII 수준은 정상의 0.7%이었다(도 18). 렌티바이러스 벡터 치료 후, S3의 FVIII 수준은 각각 7일 및 14일에 정상의 79% 및 103%로 증가하였다(도 18). K4에 대해, 전투여 FVIII 수준은 정상의 1.4%이었다(도 18). 렌티바이러스 벡터 치료 후, FVIII 수준은 각각 6일 및 14일에 정상의 22% 및 25%로 증가하였다(도 18).

FVIII 수준과 상관된, 정규화된 ROTEM은 치료 후 2주에 동물 둘 다에 대해 관찰되어서(도 19a 내지 도 19c), LV-FVIII에 의해 매개된 치료학적 이익을 입증한다. HemA 게에서 LV-FVIII에 의해 달성된 치료학적으로 유리한 FVIII 발현 수준은 A 혈우병의 치료에 대한 LV-FVIII의 잠재적인 사용을 확인시켜준다.

실시예 10. HemA 마우스 신생아에서의 LV-FVIII의 평가

유전자 대체에 대한 렌티바이러스 벡터(LV)에 의한 세포외 유전자 치료는 다수의 적응증에 대해 및 치료된 환자에서의 수년간 추적관찰에 의해 임상 효능을 입증하여서, 종양발생의 증거를 나타내지 않는다. LV-FIX의 전신 전달은 지속적인 FIX 발현을 매개하고, 혈우병 동물 모델에서 매우 관용성이었다. 큰 패키징 역량, 유전자 통합을 통해 장기간 전이유전자 발현을 지속시키는 능력, 인간 집단에서의 기존의 항-LV 항체(ab)의 결여 및 전임상 및 임상 환경에서 입증된 독려하는 생체내 프로필은 특히 큰 cDNA 크기, 예컨대 FVIII에 의한 유전자 후보에 대해 생체내 유전자 전달에 대한 LV 유망한 비히클을 만든다.

A 혈우병(HemA)의 치료를 위한 LV-FVIII의 잠재적인 사용을 평가하기 위해, 간세포 특이적 촉진자 하에 놓인 코돈 최적화된 인간 FVIII(hFVIII) 변이체는 항원 제시 세포에서의 FVIII 발현을 최소화하고 항-FVIII 항체를 유도할 가능성을 감소시키기 위해 마이크로RNA-142 표적 서열의 다수의 카피를 함유하는 LV 시스템에 구축되었다. LV-hFVIII 벡터를 293T 세포의 일시적인 형질주입, 이어서 초원심분리에 의한 1000배 농축에 의해 제조하고, HemA 마우스 모델에서 평가하였다. LV-hFVIII의 정맥내 투여 후, 순환 hFVIII 수준은 FVIII 활성 및 항원 검정에 의해 모니터링되고, 간에서의 LV 형질도입 효율은 정량적 PCR을 통해 LV DNA 카피를 측정하고 인시츄 혼성화를 통해 전이유전자 RNA를 측정함으로써 평가되고, 항-hFVIII 항체는 전체 항-hFVIII 항체 ELISA에 의해 측정되었다.

신생아 단계에서 치료된 HemA 마우스에서 모든 LV-hFVIII 변이체에서 대해 지속적인 FVIII 발현이 관찰되었다. 1.5E10 형질도입 단위/㎏ 용량에서, 코돈 최적화된 hFVIII를 코딩하는 LV(LV-cohFVIII)는 야생형 hFVIII를 코딩하는 LV보다 30 내지 100배 더 높은 순환 FVIII를 발생시키는 한편(도 12c), 간 세포에서의 벡터 카피수 및 FVIII RNA 양성 세포의 %는 모든 치료된 그룹에서 필적하였다(도 12b). 페이로드의 수력학적 크기를 증가시킴으로써 순환 반감기를 아마도 개선하는 비구조화된 친수성 폴리펩타이드인 XTEN에 의한 코돈 최적화의 조합(LV-cohFVIII-XTEN)은 혈장에서 30 내지 50IU/㎖의 FVIII의 활성을 발생시켜서, 정상 순환 FVIII 수준의 3,000 내지 5,000%를 나타낸다(도 12a, 도 17). 더구나, 항-hFVIII ab가 초 생리학적 수준의 hFVIII에 의해 마우스에서 오직 검출되었지만(도 14), LV 형질도입된 세포에 대한 세포독성 T 림프구 반응은 항-hFVIII 항체 양성 마우스에서 관찰되지 않았다(도 15 및 도 16a 내지 도 16d). 본 발명자들의 결과는 A 혈우병의 생체내 유전자 치료에 대한 LV-FVIII의 추가의 개발을 지원한다.

구체적인 실시형태의 상기 설명은 본 개시내용의 일반적인 성질을 완전히 밝힐 수 있어서, 본 개시내용의 일반적인 개념으로부터 벗어나지 않으면서, 부당한 실험 없이 다양한 분야에 대해 다른 사람은, 당해 분야의 기술 내의 지식을 적용함으로써, 이러한 구체적인 실시형태를 용이하게 변형하고/하거나 적응할 수 있다. 따라서, 이러한 적응 및 변형은 본 명세서에 제시된 교시내용 및 가이드에 따라 개시된 실시형태의 균등물의 의미 및 범위 내에 있는 것으로 의도된다. 본 명세서에서 어법 또는 전문용어가 제한이 아니라 설명의 목적을 위한 것이어서, 본 명세서의 어법 또는 전문용어가 교시내용 및 가이드의 견지에서 당해 분야의 숙련자에 의해 해석되어야 하는 것으로 이해된다.

본 개시내용의 다른 실시형태는 본 명세서에 개시된 본 개시내용의 명세서 및 실행의 고려로부터 당해 분야의 숙련자에게 명확할 것이다. 명세서 및 실시예가 오직 예시적인 것으로 생각되는 것을 의도되고, 본 개시내용의 진정한 범위 및 사상은 하기 청구항에 의해 표시된다.

본 명세서에 인용된 모든 특허 및 공보는 본 명세서에 그 전문이 참고로 포함된다.

본 출원은 2016년 2월 1일자에 출원된 미국 가출원 제62/289,696호 및 2016년 10월 18일자에 출원된 62/409,739호(본 명세서에 그 전문이 참고로 포함됨)의 이익을 주장한다.

SEQUENCE LISTING <110> BIOVERATIV THERAPEUTICS INC. <120> OPTIMIZED FACTOR VIII GENES <130> WO2017/138986 <140> PCT/US2016/052346 <141> 2017-03-08 <150> 62/409,739 <151> 2016-10-18 <150> 62/289,696 <151> 2016-02-01 <160> 103 <170> PatentIn version 3.5 <210> 1 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-5 <400> 1 atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60 acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120 ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180 acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240 gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300 gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360 ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420 gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480 aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540 gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600 ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660 ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720 gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780 ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840 accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900 cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960 gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020 gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080 gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140 gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200 tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260 cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320 aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380 atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440 ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500 gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560 ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620 actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680 gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740 cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800 aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860 cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920 ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980 attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040 atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100 atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160 atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220 tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280 ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340 cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400 gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460 cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520 cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580 caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640 ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700 cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760 cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820 ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880 gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940 ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000 ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060 gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120 taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180 caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240 attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300 tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360 tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420 gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480 cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540 tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600 ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660 ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720 agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780 aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840 tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900 atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960 tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020 tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080 aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140 tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200 caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260 tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320 cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374 <210> 2 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-4 <400> 2 atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60 accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120 ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180 acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240 gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300 gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360 ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420 gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480 aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540 gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600 ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660 ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720 gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780 ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840 accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900 aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960 gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020 gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080 gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140 gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200 tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260 cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320 aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380 atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440 ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500 gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560 cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620 acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680 gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740 aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800 aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860 cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920 ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980 atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040 atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100 atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160 atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220 agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280 ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340 cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400 gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460 aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520 cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580 caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640 ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700 aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760 cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820 ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880 gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940 ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000 ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060 gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120 tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180 caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240 atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300 tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360 tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420 gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480 cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540 tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600 ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660 ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720 aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780 aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840 tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900 atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960 ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020 tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080 aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140 tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200 cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260 agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320 cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374 <210> 3 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-52 <400> 3 atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60 acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120 ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180 acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240 gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300 gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360 ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420 gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480 aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540 gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600 ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660 ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720 gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780 ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840 accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900 cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960 gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020 gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080 gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140 gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200 tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260 cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320 aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380 atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440 ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500 gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560 ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620 actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680 gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740 cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800 aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860 cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920 ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980 atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040 atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100 atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160 atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220 agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280 ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340 cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400 gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460 aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520 catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580 caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640 ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700 aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760 cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820 ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880 gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940 ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000 ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060 gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120 tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180 caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240 atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300 tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360 tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420 gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480 cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540 tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600 ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660 ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720 aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780 aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840 tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900 atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960 ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020 agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080 aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140 tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200 cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260 agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320 cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374 <210> 4 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-62 <400> 4 atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60 actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120 ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180 acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240 gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300 gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360 ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420 gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480 aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540 gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600 ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660 ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720 gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780 ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840 actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900 cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960 gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020 gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080 gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140 gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200 tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260 cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320 aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380 attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440 ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500 gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560 cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620 accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680 gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740 cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800 aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860 cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920 ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980 atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040 atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100 atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160 atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220 agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280 ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340 cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400 gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460 aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520 catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580 caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640 ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700 aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760 cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820 ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880 gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940 ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000 ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060 gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120 tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180 caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240 atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300 tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360 tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420 gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480 cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540 tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600 ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660 ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720 aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780 aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840 tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900 atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960 ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020 agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080 aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140 tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200 cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260 agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320 cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374 <210> 5 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-25 <400> 5 atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60 accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120 ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180 accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240 gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300 gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360 ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420 gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480 aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540 gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600 ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660 ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720 gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780 ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840 accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900 aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960 gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020 gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080 gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140 gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200 tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260 cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320 aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380 atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440 ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500 gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560 cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620 accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680 gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740 aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800 aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860 cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920 ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980 attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040 atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100 atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160 atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220 tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280 ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340 cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400 gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460 cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520 cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580 caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640 ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700 cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760 cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820 ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880 gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940 ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000 ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060 gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120 taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180 caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240 attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300 tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360 tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420 gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480 cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540 tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600 ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660 ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720 agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780 aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840 tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900 atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960 tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020 tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080 aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140 tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200 caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260 tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320 cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374 <210> 6 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-26 <400> 6 atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60 accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120 ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180 accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240 gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300 gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360 ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420 gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480 aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540 gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600 ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660 ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720 gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780 ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840 accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900 aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960 gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020 gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080 gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140 gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200 tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260 cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320 aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380 atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440 ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500 gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560 cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620 accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680 gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740 aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800 aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860 caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920 ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980 atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040 atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100 atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160 atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220 tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280 ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340 caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400 gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460 agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520 cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580 caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640 ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700 cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760 cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820 ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880 gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940 ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000 tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060 gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120 tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180 caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240 attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300 tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360 tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420 gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480 cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540 tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600 ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660 ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720 aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780 aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840 tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900 atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960 ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020 tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080 aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140 tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200 caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260 tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320 cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374 <210> 7 <211> 1734 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-52-NT58 <400> 7 gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60 cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120 aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180 atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240 tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300 gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360 agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420 ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480 cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540 gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600 gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660 gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720 tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780 gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840 caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900 atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960 gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020 gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080 gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140 acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200 gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260 agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320 gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380 cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440 actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500 tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560 ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620 cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680 caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734 <210> 8 <211> 2583 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-52-CT <400> 8 tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60 gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120 ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180 atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240 aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300 ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360 aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420 tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480 cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540 accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600 aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660 aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720 agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780 gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840 aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900 gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960 gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020 aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080 aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140 ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200 gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260 gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320 aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380 gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440 atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500 atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560 gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620 ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680 agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740 ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800 gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860 ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920 cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980 agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040 cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100 agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160 tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220 cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280 gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340 accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400 ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460 gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520 tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580 tga 2583 <210> 9 <211> 1734 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-62-NT58 <400> 9 gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60 ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120 aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180 atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240 tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300 gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360 cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420 ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480 catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540 gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600 gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660 gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720 tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780 ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840 caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900 atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960 gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020 gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080 gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140 acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200 gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260 agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320 gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380 ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440 accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500 ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560 cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620 cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680 caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734 <210> 10 <211> 2583 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-62-CT <400> 10 tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60 gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120 ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180 atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240 aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300 ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360 aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420 tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480 cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540 accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600 aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660 aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720 agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780 gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840 aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900 gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960 gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020 aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080 aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140 ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200 gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260 gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320 aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380 gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440 atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500 atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560 gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620 ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680 agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740 ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800 gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860 ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920 cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980 agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040 cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100 agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160 tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220 cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280 gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340 accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400 ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460 gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520 tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580 tga 2583 <210> 11 <211> 1734 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-25-NT58 <400> 11 gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60 ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120 aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180 atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240 tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300 gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360 agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420 ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480 cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540 gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600 gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660 gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720 agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780 ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840 cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900 atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960 gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020 gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080 gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140 acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200 gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260 aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320 gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380 ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440 accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500 ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560 cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620 agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680 cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734 <210> 12 <211> 2583 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-25-CT <400> 12 ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60 gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120 ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180 atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240 aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300 tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360 aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420 tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480 cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540 accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600 aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660 aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720 tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780 gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840 aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900 gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960 gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020 aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080 aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140 ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200 gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260 gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320 aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380 gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440 atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500 atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560 gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620 ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680 agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740 ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800 gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860 ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920 caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980 tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040 cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100 tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160 tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220 cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280 gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340 acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400 ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460 gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520 tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580 tga 2583 <210> 13 <211> 1734 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-26-NT58 <400> 13 gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60 ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120 aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180 atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240 tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300 gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360 agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420 ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480 cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540 gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600 gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660 gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720 agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780 ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840 cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900 atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960 gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020 gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080 gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140 acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200 gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260 aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320 gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380 ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440 accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500 ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560 cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620 agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680 cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734 <210> 14 <211> 2583 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-26-CT <400> 14 ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60 gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120 ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180 attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240 aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300 ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360 aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420 tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480 ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540 accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600 aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660 aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720 tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780 gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840 aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900 gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960 gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020 aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080 aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140 gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200 gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260 gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320 aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380 gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440 attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500 atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560 gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620 ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680 agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740 ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800 gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860 ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920 cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980 tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040 cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100 tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160 agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220 cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280 gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340 acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400 ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460 gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520 tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580 tga 2583 <210> 15 <211> 2332 <212> PRT <213> Homo sapiens <400> 15 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys 965 970 975 Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys 980 985 990 Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala 995 1000 1005 Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu 1010 1015 1020 Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu 1025 1030 1035 Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp 1040 1045 1050 Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr 1055 1060 1065 Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly 1070 1075 1080 Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys 1085 1090 1095 Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His 1100 1105 1110 Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln 1115 1120 1125 Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe 1130 1135 1140 Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr 1145 1150 1155 Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn 1160 1165 1170 Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His 1175 1180 1185 Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr 1190 1195 1200 Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr 1205 1210 1215 Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg 1220 1225 1230 Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu 1235 1240 1245 Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys 1250 1255 1260 His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu 1265 1270 1275 Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys 1280 1285 1290 Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr 1295 1300 1305 Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu 1310 1315 1320 Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr 1325 1330 1335 Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr 1340 1345 1350 Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser 1355 1360 1365 Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala 1370 1375 1380 Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser 1385 1390 1395 Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser 1400 1405 1410 Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val 1415 1420 1425 Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu 1430 1435 1440 Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu 1445 1450 1455 Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys 1460 1465 1470 Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr 1475 1480 1485 Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys 1490 1495 1500 Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu 1505 1510 1515 Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile 1520 1525 1530 Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg 1535 1540 1545 Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp 1550 1555 1560 Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu 1565 1570 1575 Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys 1580 1585 1590 Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His 1595 1600 1605 Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu 1610 1615 1620 Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln 1625 1630 1635 Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr 1640 1645 1650 Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile 1655 1660 1665 Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp 1670 1675 1680 Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr 1685 1690 1695 Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser 1700 1705 1710 Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1715 1720 1725 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe 1730 1735 1740 Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 1745 1750 1755 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val 1760 1765 1770 Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser 1775 1780 1785 Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg 1790 1795 1800 Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys 1805 1810 1815 Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys 1820 1825 1830 Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His 1835 1840 1845 Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu 1850 1855 1860 Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu 1865 1870 1875 Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu 1880 1885 1890 Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu 1895 1900 1905 Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly 1910 1915 1920 Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln 1925 1930 1935 Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile 1940 1945 1950 His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1955 1960 1965 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe 1970 1975 1980 Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val 1985 1990 1995 Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu 2000 2005 2010 Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala 2015 2020 2025 Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr 2030 2035 2040 Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser 2045 2050 2055 Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val 2060 2065 2070 Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly 2075 2080 2085 Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile 2090 2095 2100 Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn 2105 2110 2115 Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser 2120 2125 2130 Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr 2135 2140 2145 Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg 2150 2155 2160 Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu 2165 2170 2175 Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser 2180 2185 2190 Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 2195 2200 2205 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val 2210 2215 2220 Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met 2225 2230 2235 Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr 2240 2245 2250 Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly 2255 2260 2265 His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe 2270 2275 2280 Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp 2285 2290 2295 Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp 2300 2305 2310 Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala 2315 2320 2325 Gln Asp Leu Tyr 2330 <210> 16 <211> 4371 <212> DNA <213> Artificial Sequence <220> <223> BDD-FVIII (non-optimized; "parental"), Nucleotide Sequence <400> 16 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60 accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120 ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180 acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240 gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300 gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360 ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420 gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480 aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540 gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600 gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660 tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720 gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780 ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840 accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900 cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960 gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020 gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080 gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140 gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200 tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260 cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320 aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380 attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440 ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500 gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560 ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620 actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680 gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740 agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800 aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860 cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920 tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980 attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040 atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100 atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160 atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220 agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280 ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340 cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400 gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460 cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520 catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580 caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640 ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700 agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760 cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820 ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880 gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940 ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000 tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060 gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120 tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180 caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240 attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300 tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360 tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420 gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480 cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540 tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600 ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660 ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720 cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780 aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840 tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900 atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960 tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020 agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080 aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140 tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200 cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260 tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320 cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371 <210> 17 <211> 1438 <212> PRT <213> Artificial Sequence <220> <223> BDD-FVIII (non-optimized; "parental"), Amino Acid Sequence <400> 17 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His 740 745 750 Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile 755 760 765 Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp 770 775 780 Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 785 790 795 800 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly 805 810 815 Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser 820 825 830 Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser 835 840 845 Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 850 855 860 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr 865 870 875 880 Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile 885 890 895 Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe 900 905 910 Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His 915 920 925 Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe 930 935 940 Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro 945 950 955 960 Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln 965 970 975 Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr 980 985 990 Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro 995 1000 1005 Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg 1010 1015 1020 Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu 1025 1030 1035 Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met 1040 1045 1050 Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val 1055 1060 1065 Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn 1070 1075 1080 Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys 1085 1090 1095 Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His 1100 1105 1110 Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln 1115 1120 1125 Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile 1130 1135 1140 Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg 1145 1150 1155 Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro 1160 1165 1170 Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His 1175 1180 1185 Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr 1190 1195 1200 Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 1205 1210 1215 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe 1220 1225 1230 Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro 1235 1240 1245 Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser 1250 1255 1260 Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn 1265 1270 1275 Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp 1280 1285 1290 Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr 1295 1300 1305 Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn 1310 1315 1320 Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val 1325 1330 1335 Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly 1340 1345 1350 Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile 1355 1360 1365 Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn 1370 1375 1380 Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro 1385 1390 1395 Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg 1400 1405 1410 Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu 1415 1420 1425 Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1430 1435 <210> 18 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN nucleotide sequence <400> 18 ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60 tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120 gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180 ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240 cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300 gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360 gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420 cccaccagca ctgaagaagg tgcctcgagc 450 <210> 19 <211> 4824 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-52-XTEN <400> 19 atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60 acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120 ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180 acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240 gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300 gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360 ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420 gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480 aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540 gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600 ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660 ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720 gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780 ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840 accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900 cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960 gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020 gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080 gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140 gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200 tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260 cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320 aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380 atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440 ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500 gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560 ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620 actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680 gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740 cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800 aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860 cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920 ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980 atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040 atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100 atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160 atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220 agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280 ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340 gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400 ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460 acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520 ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580 gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640 acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700 ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760 caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820 gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880 cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940 ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000 agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060 cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120 gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180 tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240 tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300 accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360 gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420 gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480 accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540 cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600 atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660 agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720 aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780 gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840 ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900 ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960 tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020 gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080 acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140 agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200 ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260 gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320 ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380 tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440 agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500 cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560 cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620 caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680 aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740 ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800 tgtgaggccc aggacctgta ctga 4824 <210> 20 <211> 4824 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-1-XTEN <400> 20 atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60 acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120 ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180 actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240 gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300 gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360 ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420 gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480 aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540 gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600 ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660 tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720 gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780 ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840 accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900 cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960 gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020 gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080 gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140 gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200 tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260 ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320 aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380 atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440 ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500 gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560 ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620 actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680 gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740 agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800 aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860 cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920 ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980 attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040 atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100 atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160 atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220 tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280 tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340 gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400 ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460 acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520 ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580 gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640 acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700 ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760 caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820 gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880 cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940 ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000 agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060 ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120 gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180 tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240 ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300 acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360 gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420 gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480 acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540 cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600 atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660 agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720 aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780 gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840 ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900 ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960 tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020 gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080 actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140 agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200 ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260 gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320 ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380 tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440 tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500 cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560 cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620 caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680 aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740 ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800 tgcgaggccc aggatctgta ctga 4824 <210> 21 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> MAR/ARS <400> 21 atattt 6 <210> 22 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> MAR/ARS <400> 22 aaatat 6 <210> 23 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> destabilizing element <400> 23 attta 5 <210> 24 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> destabilizing element <400> 24 taaat 5 <210> 25 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> poly-T site <400> 25 tttttt 6 <210> 26 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> poly-A site <400> 26 aaaaaaa 7 <210> 27 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> splice site <400> 27 ggtgat 6 <210> 28 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> TATA box <400> 28 tataa 5 <210> 29 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> TATA box <400> 29 ttata 5 <210> 30 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> AU rich sequence element <400> 30 attttatt 8 <210> 31 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> AU rich sequence element <400> 31 atttttaa 8 <210> 32 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> kozak consensus sequence <400> 32 gccgccacca tgc 13 <210> 33 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> CTP peptide <400> 33 Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser 1 5 10 15 Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu 20 25 30 <210> 34 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> CTP peptide <400> 34 Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg 1 5 10 15 Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln 20 25 <210> 35 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> albumin-binding peptide core sequence <400> 35 Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp 1 5 10 <210> 36 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 36 Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro 1 5 10 15 Ser Ala Pro Ala 20 <210> 37 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 37 Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro 1 5 10 15 Ala Ala Pro Ser 20 <210> 38 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 38 Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala 1 5 10 15 Ser Pro Ser Ser 20 <210> 39 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 39 Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala 1 5 10 15 Ser Pro Ser <210> 40 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 40 Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro 1 5 10 15 Ser Ser Pro Ala 20 <210> 41 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 41 Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro 1 5 10 15 Ala Ala Pro Ser Ala Pro Pro Ala 20 <210> 42 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 42 Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro 1 5 10 15 Ser Ala Ala Ala 20 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> miR142 target <400> 43 tccataaagt aggaaacact aca 23 <210> 44 <211> 2332 <212> PRT <213> Homo sapiens <400> 44 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys 965 970 975 Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys 980 985 990 Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala 995 1000 1005 Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu 1010 1015 1020 Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu 1025 1030 1035 Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp 1040 1045 1050 Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr 1055 1060 1065 Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly 1070 1075 1080 Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys 1085 1090 1095 Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His 1100 1105 1110 Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln 1115 1120 1125 Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe 1130 1135 1140 Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr 1145 1150 1155 Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn 1160 1165 1170 Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His 1175 1180 1185 Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr 1190 1195 1200 Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr 1205 1210 1215 Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg 1220 1225 1230 Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu 1235 1240 1245 Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys 1250 1255 1260 His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu 1265 1270 1275 Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys 1280 1285 1290 Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr 1295 1300 1305 Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu 1310 1315 1320 Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr 1325 1330 1335 Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr 1340 1345 1350 Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser 1355 1360 1365 Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala 1370 1375 1380 Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser 1385 1390 1395 Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser 1400 1405 1410 Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val 1415 1420 1425 Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu 1430 1435 1440 Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu 1445 1450 1455 Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys 1460 1465 1470 Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr 1475 1480 1485 Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys 1490 1495 1500 Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu 1505 1510 1515 Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile 1520 1525 1530 Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg 1535 1540 1545 Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp 1550 1555 1560 Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu 1565 1570 1575 Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys 1580 1585 1590 Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His 1595 1600 1605 Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu 1610 1615 1620 Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln 1625 1630 1635 Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr 1640 1645 1650 Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile 1655 1660 1665 Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp 1670 1675 1680 Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr 1685 1690 1695 Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser 1700 1705 1710 Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1715 1720 1725 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe 1730 1735 1740 Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 1745 1750 1755 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val 1760 1765 1770 Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser 1775 1780 1785 Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg 1790 1795 1800 Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys 1805 1810 1815 Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys 1820 1825 1830 Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His 1835 1840 1845 Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu 1850 1855 1860 Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu 1865 1870 1875 Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu 1880 1885 1890 Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu 1895 1900 1905 Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly 1910 1915 1920 Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln 1925 1930 1935 Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile 1940 1945 1950 His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1955 1960 1965 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe 1970 1975 1980 Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val 1985 1990 1995 Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu 2000 2005 2010 Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala 2015 2020 2025 Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr 2030 2035 2040 Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser 2045 2050 2055 Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val 2060 2065 2070 Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly 2075 2080 2085 Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile 2090 2095 2100 Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn 2105 2110 2115 Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser 2120 2125 2130 Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr 2135 2140 2145 Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg 2150 2155 2160 Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu 2165 2170 2175 Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser 2180 2185 2190 Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 2195 2200 2205 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val 2210 2215 2220 Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met 2225 2230 2235 Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr 2240 2245 2250 Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly 2255 2260 2265 His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe 2270 2275 2280 Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp 2285 2290 2295 Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp 2300 2305 2310 Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala 2315 2320 2325 Gln Asp Leu Tyr 2330 <210> 45 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> amino acids 233-236 of human IgG1 <400> 45 Glu Leu Leu Gly 1 <210> 46 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE42-4, protein sequence <400> 46 Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly 1 5 10 15 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala 20 25 30 Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser 35 40 <210> 47 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE42-4, DNA sequence <400> 47 ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60 gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120 tcgagc 126 <210> 48 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE144-2A, protein sequence <400> 48 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly 1 5 10 15 Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly 20 25 30 Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 35 40 45 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu 50 55 60 Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 65 70 75 80 Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly 85 90 95 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu 100 105 110 Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 115 120 125 Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 130 135 140 <210> 49 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE144-2A, DNA sequence <400> 49 ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60 ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120 tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180 gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240 accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300 tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360 gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420 accccggaga gcgggccagg tgcctcgagc 450 <210> 50 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE144-3B, protein sequence <400> 50 Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser 1 5 10 15 Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser 20 25 30 Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 35 40 45 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu 50 55 60 Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly 65 70 75 80 Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 85 90 95 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu 100 105 110 Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 115 120 125 Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 130 135 140 <210> 51 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE144-3B, DNA sequence <400> 51 ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60 acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120 tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180 gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240 agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300 tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360 gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420 agtgaaggct ctgcaccagg tgcctcgagc 450 <210> 52 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE144-4A, protein sequence <400> 52 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala 1 5 10 15 Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 20 25 30 Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly 35 40 45 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu 50 55 60 Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 65 70 75 80 Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly 85 90 95 Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly 100 105 110 Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu 115 120 125 Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 130 135 140 <210> 53 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE144-4A, DNA sequence <400> 53 ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60 agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120 gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180 gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240 acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300 cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360 gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420 agcgagggga gtgcaccagg tgcctcgagc 450 <210> 54 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE144-5A, protein sequence <400> 54 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala 1 5 10 15 Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 20 25 30 Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly 35 40 45 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu 50 55 60 Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 65 70 75 80 Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 85 90 95 Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 100 105 110 Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 115 120 125 Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly 130 135 140 <210> 55 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE144-5A, DNA sequence <400> 55 ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60 tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120 gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180 ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240 cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300 gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360 gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420 cccaccagca ctgaagaagg tgcctcgagc 450 <210> 56 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AE144-6B, protein sequence <400> 56 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser 1 5 10 15 Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 20 25 30 Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 35 40 45 Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala 50 55 60 Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 65 70 75 80 Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 85 90 95 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala 100 105 110 Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu 115 120 125 Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 130 135 140 <210> 57 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AE144-6B, DNA sequence <400> 57 ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60 acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120 agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180 actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240 cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300 agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360 actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420 tccgaaggat cagcaccagg tgcctcgagc 450 <210> 58 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AG144-1, protein sequence <400> 58 Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser 1 5 10 15 Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr 20 25 30 Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser 35 40 45 Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser 50 55 60 Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr 65 70 75 80 Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser 85 90 95 Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser 100 105 110 Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser 115 120 125 Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser 130 135 140 <210> 59 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AG144-1, DNA sequence <400> 59 ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60 tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120 ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180 ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240 tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300 ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360 acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420 tcgggaaccg cgtcgtcaag cgcctcgagc 450 <210> 60 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AG144-A, protein sequence <400> 60 Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro 1 5 10 15 Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr 20 25 30 Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro 35 40 45 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro 50 55 60 Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser 65 70 75 80 Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro 85 90 95 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly 100 105 110 Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser 115 120 125 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 130 135 140 <210> 61 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AG144-A, DNA sequence <400> 61 ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60 gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120 actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180 ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240 acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300 tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360 tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420 acctcctcga caggtagccc ggcctcgagc 450 <210> 62 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AG144-B, protein sequence <400> 62 Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr 1 5 10 15 Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser 20 25 30 Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro 35 40 45 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro 50 55 60 Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr 65 70 75 80 Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro 85 90 95 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro 100 105 110 Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser 115 120 125 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 130 135 140 <210> 63 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AG144-B, DNA sequence <400> 63 ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60 tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120 acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180 gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240 gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300 tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360 ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420 acttcaagca cagggagccc tgcctcgagc 450 <210> 64 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AG144-C, protein sequence <400> 64 Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro 1 5 10 15 Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser 20 25 30 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 35 40 45 Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly 50 55 60 Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser 65 70 75 80 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 85 90 95 Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr 100 105 110 Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala 115 120 125 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 130 135 140 <210> 65 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AG144-C, DNA sequence <400> 65 ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60 acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120 gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180 accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240 acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300 gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360 ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420 acgtcaagca ctggctcccc tgcctcgagc 450 <210> 66 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> XTEN AG144-F, protein sequence <400> 66 Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro 1 5 10 15 Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser 20 25 30 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 35 40 45 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro 50 55 60 Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser 65 70 75 80 Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro 85 90 95 Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr 100 105 110 Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala 115 120 125 Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 130 135 140 <210> 67 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> XTEN AG144-F, DNA sequence <400> 67 ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60 gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120 gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180 ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240 acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300 acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360 ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420 acttcgagca cggggtcgcc cgcctcgagc 450 <210> 68 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-1 DNA Sequence <400> 68 atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60 acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120 ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180 actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240 gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300 gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360 ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420 gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480 aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540 gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600 ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660 tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720 gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780 ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840 accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900 cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960 gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020 gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080 gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140 gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200 tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260 ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320 aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380 atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440 ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500 gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560 ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620 actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680 gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740 agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800 aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860 cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920 ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980 attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040 atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100 atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160 atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220 tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280 tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340 cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400 gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460 aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520 cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580 caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640 ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700 agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760 cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820 ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880 gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940 ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000 ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060 gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120 taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180 caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240 attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300 tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360 tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420 gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480 cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540 tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600 ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660 ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720 cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780 aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840 tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900 atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960 ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020 agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080 aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140 tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200 cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260 agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320 cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374 <210> 69 <211> 577 <212> DNA <213> Artificial Sequence <220> <223> ET Promoter, DNA sequence <400> 69 ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60 ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120 gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180 cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240 atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300 ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360 tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420 tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480 tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540 agccgtcaca cagatccaca agctcctgcc accatgg 577 <210> 70 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-5 <400> 70 atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60 acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120 ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180 acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240 gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300 gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360 ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420 gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480 aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540 gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600 ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660 ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720 gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780 ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840 accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900 cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960 gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020 gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080 gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140 gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200 tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260 cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320 aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380 atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440 ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500 gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560 ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620 actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680 gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740 cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800 aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860 cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920 ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980 attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040 atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100 atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160 atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220 tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280 ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340 cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400 gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460 cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520 cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580 caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640 ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700 cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760 cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820 ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880 gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940 ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000 ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060 gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120 taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180 caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240 attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300 tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360 tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420 gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480 cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540 tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600 ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660 ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720 agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780 aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840 tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900 atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960 tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020 tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080 aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140 tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200 caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260 tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320 cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374 <210> 71 <211> 4374 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-6 <400> 71 atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60 actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120 ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180 acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240 gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300 gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360 ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420 gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480 aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540 gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600 ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660 ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720 gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780 ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840 actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900 cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960 gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020 gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080 gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140 gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200 tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260 cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320 aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380 attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440 ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500 gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560 cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620 accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680 gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740 cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800 aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860 caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920 ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980 atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040 atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100 atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160 atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220 tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280 ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340 caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400 gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460 agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520 cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580 caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640 ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700 cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760 cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820 ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880 gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940 ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000 tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060 gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120 tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180 caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240 attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300 tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360 tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420 gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480 cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540 tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600 ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660 ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720 aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780 aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840 tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900 atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960 ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020 tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080 aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140 tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200 caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260 tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320 cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374 <210> 72 <211> 4824 <212> DNA <213> Artificial Sequence <220> <223> coFVIII-6-XTEN <400> 72 atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60 actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120 ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180 acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240 gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300 gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360 ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420 gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480 aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540 gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600 ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660 ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720 gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780 ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840 actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900 cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960 gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020 gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080 gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140 gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200 tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260 cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320 aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380 attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440 ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500 gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560 cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620 accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680 gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740 cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800 aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860 caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920 ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980 atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040 atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100 atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160 atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220 tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280 ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340 gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400 ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460 acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520 ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580 gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640 acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700 ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760 caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820 gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880 cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940 ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000 tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060 ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120 gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180 tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240 ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300 accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360 gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420 gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480 actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540 cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600 atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660 tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720 cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780 gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840 ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900 ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960 tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020 gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080 acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140 agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200 tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260 gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320 ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380 agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440 tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500 ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560 cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620 caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680 aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740 ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800 tgcgaggccc aggacctgta ctga 4824 <210> 73 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AD motif <400> 73 Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser 1 5 10 <210> 74 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AD motif <400> 74 Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser 1 5 10 <210> 75 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AD motif <400> 75 Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro 1 5 10 <210> 76 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AD motif <400> 76 Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser 1 5 10 <210> 77 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AE, AM motif <400> 77 Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu 1 5 10 <210> 78 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AE, AM, AQ motif <400> 78 Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro 1 5 10 <210> 79 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AE, AM, AQ motif <400> 79 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro 1 5 10 <210> 80 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AE, AM, AQ motif <400> 80 Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro 1 5 10 <210> 81 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AF, AM motif <400> 81 Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro 1 5 10 <210> 82 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AF, AM motif <400> 82 Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro 1 5 10 <210> 83 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AF, AM motif <400> 83 Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro 1 5 10 <210> 84 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AF, AM motif <400> 84 Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro 1 5 10 <210> 85 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AG, AM motif <400> 85 Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro 1 5 10 <210> 86 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AG, AM motif <400> 86 Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro 1 5 10 <210> 87 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AG, AM motif <400> 87 Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro 1 5 10 <210> 88 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AG, AM motif <400> 88 Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro 1 5 10 <210> 89 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 89 Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu 1 5 10 <210> 90 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 90 Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu 1 5 10 <210> 91 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 91 Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu 1 5 10 <210> 92 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 92 Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala 1 5 10 <210> 93 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 93 Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala 1 5 10 <210> 94 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> AQ motif <400> 94 Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala 1 5 10 <210> 95 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BC motif <400> 95 Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro 1 5 10 <210> 96 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BC motif <400> 96 Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser 1 5 10 <210> 97 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BC motif <400> 97 Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala 1 5 10 <210> 98 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BC motif <400> 98 Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala 1 5 10 <210> 99 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BD motif <400> 99 Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala 1 5 10 <210> 100 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BD motif <400> 100 Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala 1 5 10 <210> 101 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BD motif <400> 101 Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala 1 5 10 <210> 102 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> BD motif <400> 102 Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser 1 5 10 <210> 103 <211> 1607 <212> PRT <213> Artificial Sequence <220> <223> coFVIII-6-XTEN Protein Sequence <400> 103 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr 755 760 765 Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr 770 775 780 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 785 790 795 800 Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr 805 810 815 Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro 820 825 830 Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr 835 840 845 Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser 850 855 860 Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala 865 870 875 880 Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr 885 890 895 Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala 900 905 910 Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr 915 920 925 Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser 930 935 940 Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn 945 950 955 960 Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala 965 970 975 Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val 980 985 990 Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val 995 1000 1005 Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr 1010 1015 1020 Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile 1025 1030 1035 Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln 1040 1045 1050 Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu 1055 1060 1065 Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys 1070 1075 1080 Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met 1085 1090 1095 Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe 1100 1105 1110 Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly 1115 1120 1125 Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly 1130 1135 1140 Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe 1145 1150 1155 Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn 1160 1165 1170 Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys 1175 1180 1185 Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr 1190 1195 1200 Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr 1205 1210 1215 Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe 1220 1225 1230 Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met 1235 1240 1245 Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met 1250 1255 1260 Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly 1265 1270 1275 Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser 1280 1285 1290 Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg 1295 1300 1305 Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro 1310 1315 1320 Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser 1325 1330 1335 Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro 1340 1345 1350 Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe 1355 1360 1365 Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp 1370 1375 1380 Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu 1385 1390 1395 Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn 1400 1405 1410 Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro 1415 1420 1425 Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly 1430 1435 1440 Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys 1445 1450 1455 Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn 1460 1465 1470 Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln 1475 1480 1485 Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu 1490 1495 1500 Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val 1505 1510 1515 Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys 1520 1525 1530 Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu 1535 1540 1545 Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp 1550 1555 1560 Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr 1565 1570 1575 Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala 1580 1585 1590 Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1595 1600 1605

Claims

VIII 인자(FVIII) 폴리펩타이드의 N 말단 부분을 코딩하는 제1 핵산 서열 및 FVIII 폴리펩타이드의 C 말단 부분을 코딩하는 제2 핵산 서열을 포함하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서,
(a) 상기 제1 핵산 서열은
(ⅰ) 서열 번호 3의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅱ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 1791번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅲ) 서열 번호 5의 58번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성; 또는
(ⅳ) 서열 번호 6의 58번 내지 1791번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖고;
(b) 상기 제2 뉴클레오타이드 서열은
(ⅰ) 서열 번호 3의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅱ) 서열 번호 4의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅲ) 서열 번호 5의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성; 또는
(ⅳ) 서열 번호 6의 1792번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성; 또는
(c) (a) 및 (b)의 임의의 조합을 갖되;
상기 N 말단 부분 및 상기 C 말단 부분은 함께 FVIII 폴리펩타이드 활성을 갖는, 단리된 핵산 분자.
FVIII 활성을 갖는 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산 분자로서, 상기 뉴클레오타이드 서열은
(ⅰ) 서열 번호 1의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅱ) 서열 번호 2의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅲ) 서열 번호 70의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅳ) 서열 번호 71의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅴ) 서열 번호 3의 58번 내지 2277 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅵ) 서열 번호 4의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅶ) 서열 번호 5의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성;
(ⅷ) 서열 번호 6의 58번 내지 2277번 및 2320번 내지 4374번 뉴클레오타이드와 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성; 또는
(ⅸ) 또는 (ⅰ) 내지 (ⅷ)의 임의의 조합을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자.
제1항 또는 제2항에 있어서, 상기 뉴클레오타이드 서열은 신호 펩타이드를 코딩하는 핵산 서열을 추가로 포함하고, 상기 신호 펩타이드를 코딩하는 핵산 서열은
(ⅰ) 서열 번호 1의 1번 내지 57번 뉴클레오타이드;
(ⅱ) 서열 번호 2의 1번 내지 57번 뉴클레오타이드;
(ⅲ) 서열 번호 3의 1번 내지 57번 뉴클레오타이드;
(ⅳ) 서열 번호 4의 1번 내지 57번 뉴클레오타이드;
(ⅴ) 서열 번호 5의 1번 내지 57번 뉴클레오타이드;
(ⅵ) 서열 번호 6의 1번 내지 57번 뉴클레오타이드;
(ⅶ) 서열 번호 70의 1번 내지 57번 뉴클레오타이드;
(ⅷ) 서열 번호 71의 1번 내지 57번 뉴클레오타이드; 또는
(ⅸ) 서열 번호 68의 1번 내지 57번 뉴클레오타이드와 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는, 단리된 핵산 분자.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 핵산 분자는,
(a) 상기 핵산 분자 또는 이의 부분의 인간 코돈 적응 지수가 서열 번호 16에 대해 증가함;
(b) 상기 뉴클레오타이드 서열 또는 이의 부분의 최적 코돈의 빈도가 서열 번호 16에 대해 증가함;
(c) 상기 뉴클레오타이드 서열 또는 이의 부분이 서열 번호 16에서 G/C 뉴클레오타이드의 백분율과 비교하여 G/C 뉴클레오타이드의 더 높은 백분율을 함유함;
(d) 상기 뉴클레오타이드 서열 또는 이의 부분의 상대 동의적 코돈 사용빈도가 서열 번호 16에 대해 증가함;
(e) 상기 뉴클레오타이드 서열 또는 이의 부분의 코돈의 유효 수가 서열 번호 16에 대해 감소함;
(f) 상기 뉴클레오타이드 서열이 서열 번호 16에 대해 더 적은 MARS/ARS 서열(서열 번호 21 및 22)을 함유함;
(g) 상기 뉴클레오타이드 서열이 서열 번호 16에 대해 더 적은 탈안정화 유전요소(서열 번호 23 및 24)를 함유함; 및
(h) 임의의 이들의 조합으로 이루어진 군으로부터 선택된 하나 이상의 특성을 포함하는, 단리된 핵산 분자.
제1항 내지 제4항 중 어느 한 항에 있어서, 비상동성 아미노산 서열을 코딩하는 비상동성 뉴클레오타이드 서열을 추가로 포함하는, 단리된 핵산 분자.
제5항에 있어서, 상기 비상동성 아미노산 서열은 면역글로불린 불변 영역 또는 이의 부분, XTEN, 트랜스페린, 알부민 또는 PAS 서열인, 단리된 핵산 분자.
제5항 또는 제6항에 있어서, 상기 비상동성 아미노산 서열은 상기 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열의 N 말단 또는 C 말단에 연결되거나, 표 3으로부터 선택된 하나 이상의 삽입 부위에서 뉴클레오타이드 서열에 의해 코딩된 아미노산 서열에서 2개의 아미노산 사이에 삽입된, 단리된 핵산 분자.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 FVIII 폴리펩타이드는 전장 FVIII 또는 B 도메인 결실된 FVIII인, 단리된 핵산 분자.
제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터.
제9항에 있어서, 상기 벡터는 렌티바이러스 벡터인, 벡터.
제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자 또는 제9항 또는 제10항의 벡터를 포함하는 숙주 세포.
제11항의 숙주 세포에 의해 생산된 폴리펩타이드.
FVIII 활성을 갖는 폴리펩타이드를 제조하는 방법으로서, FVIII 활성을 갖는 폴리펩타이드가 생산되는 조건 하에 제11항의 숙주 세포를 배양하는 단계 및 상기 FVIII 활성을 갖는 폴리펩타이드를 회수하는 단계를 포함하는, 방법.
대상체에서 FVIII 활성을 갖는 폴리펩타이드의 발현을 증가시키는 방법으로서, 제1항 내지 제8항 중 어느 한 항의 단리된 핵산 분자 또는 제9항 또는 제10항의 벡터를 이를 요하는 대상체에게 투여하는 단계를 포함하되, 상기 폴리펩타이드의 발현은 서열 번호 16을 포함하는 기준 핵산 분자 또는 상기 기준 핵산 분자를 포함하는 벡터에 대해 증가되는, 방법.
출혈 장애를 치료하는 방법으로서, 제1항 내지 제8항 중 어느 한 항의 핵산 분자, 제9항 또는 제10항의 벡터 또는 제12항의 폴리펩타이드를 출혈 장애의 치료를 요하는 대상체에게 투여하는 단계를 포함하는, 방법.