KR20140115347A

KR20140115347A - 키메라 인자 viii 폴리펩티드들과 이의 용도

Info

Publication number: KR20140115347A
Application number: KR1020147022369A
Authority: KR
Inventors: 엑타 세스 치하브라; 통야오 류; 로버트 피터스; 하이얀 장
Original assignee: 바이오겐 아이덱 엠에이 인코포레이티드
Priority date: 2012-01-12
Filing date: 2013-01-12
Publication date: 2014-09-30
Also published as: IL233463A0; CA2863328A1; SG10201610193RA; HK1202799A1; US20150023959A1; IL261632A; CN104271150A; CO7010788A2; TWI826778B; AU2016202875B2; US20230011438A1; PH12014501602A1; JP7475613B2; BR112014017165A8; TW201348253A; CN111499760A; JP2018057388A; WO2013106787A1; DK2804623T3; AU2018201163A1

Abstract

본 발명은 VWF의 상기 D' 도메인과 D3 도메인이 포함된 VWF 단편, 상기 VWF 단편과 이형모이어티가 포함된 키메라 단백질, 또는 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질 및 이를 이용하는 방법들을 제공한다. 본 발명의 VWF 단편이 포함된 폴리펩티드 쇄는 FVIII 단백질이 포함된 폴리펩티드 쇄에 결합되거나 또는 연합되고, 그리고 VWF 단편이 포함된 상기 폴리펩티드 쇄는 내생성 VWF가 상기 FVIII 단백질에 결합하는 것을 방지 또는 저해시킬 수 있다. FVIII에 대한 반감기 제한 인자인 내생성 VWF가 상기 FVIII 단백질에 결합하는 것을 방지 또는 저해함으로써, 상기 VWF 단편은 상기 FVIII 단백질의 반감기의 연장을 유도할 수 있다. 본 발명은 뉴클레오티드, 벡터, 숙주 세포들, 상기 VWF 단편, 또는 상기 키메라 단백질들을 이용하는 방법들을 또한 포함한다.

Description

키메라 인자 VIII 폴리펩티드들과 이의 용도{CHIMERIC FACTOR VIII POLYPEPTIDES AND USES THEREOF}

응고는 혈액이 덩어리를 형성하는 복잡한 과정이다. 응고는 손상된 혈관으로부터 혈액 손실을 중단시키는 지혈의 중요한 일부분이며, 이때 손상된 혈관 벽은 혈소판과 피브린-포함된 덩어리로 덮혀 출혈이 중단되고, 그리고 손상된 혈관의 복구가 시작된다. 응혈 장애는 출혈 (대량출혈) 또는 방해성 응고(혈전생성)의 위험 증가로 이어질 수 있다.

혈관의 손상으로 혈관의 내피 라이닝이 손상된 후 거의 즉각적으로 응고는 대부분 시작된다. 혈액이 가령, 조직 인자와 같은 단백질들에 노출되면 혈액 혈소판과 응고 인자인 혈장 단백질 피브리노겐으로의 변화가 시작된다. 혈소판들은 손상 부위에서 즉각적으로 플러그를 형성하고; 이것은 1차 지혈이라고 한다. 2차 지혈도 동시에 일어나며: 응혈 인자 또는 응고인자라고 불리는 혈액 혈장내 단백질들은 피브린 스트랜드의 형성을 위한 복합 캐스캐이드에 반응하게 되며, 이로써 혈소판 플러그는 강화된다. 비-제한적 응고 인자는 다음을 포함하나 이에 한정되지 않는다: 인자 I (피브리노겐), 인자 II (프로트롬빈), 조직 인자, 인자 V (프로아세레린, 불안정한 인자), 인자 VII (안정한 인자, 프로컨베르틴), 인자 VIII (항혈우병 인자 A), 인자 IX (항혈우병 인자 B 또는 Christmas 인자), 인자 X (Stuart-Prower 인자), 인자 XI (혈장 트롭보플라스틴 선조), 인자 XII (Hageman 인자), 인자 XIII (피브린-안정화 인자), VWF, 프레칼리크레인 (Fletcher 인자), 고분자량 키니노겐 (HMWK) (Fitzgerald 인자), 피브로넥틴, 항트롭빈 III, 헤파린 공인자 II, 단백질 C, 단백질 S, 단백질 Z, 플라스미노겐, 알파 2-항플라스민, 조직 플라스미노겐 활성화물 (tPA), 우로키나제, 플라스미노겐 활성화물 저해제-1 (PAI1), 그리고 플라스미노겐 활성화물 저해제-2 (PAI2).

혈우병 A는 응혈 인자 VIII (FVIII)를 인코드하는 유전자에 결함에 의해 야기되는 출혈 장애로써, 남아 출생아 10,000당 1-2명꼴로 영향을 준다. Graw 및 다른 사람들,Nat. Rev. Genet. 6(6): 488-501 (2005). 혈우병 A에 걸린 환자는 정제된 또는 재조합에 의해 생산된 FVIII의 주입에 의해 치료될 수 있다. 그러나, 시판되는 이용가능한 모든 FVIII 제품들은 약 8-12 시간의 반감기를 가진 것으로 알려져 있어, 환자의 정맥으로 빈번한 투여가 요구된다. Weiner M.A. 및 Cairo, M.S., Pediatric Hematology Secrets, Lee, M.T., 12. Disorders of Coagulation, Elsevier Health Sciences, 2001; Lillicrap, D. Thromb. Res. 122 Suppl 4:S2-8 (2008) 참고. 또한, FVIII 반감기를 연장시키기 위한 수많은 시도들이 있었다. 예를 들면, 응고인자의 반감기를 연장시키기 위한 개발 시도에는 페길화, 글리코페길화, 그리고 알부민과의 접합이 포함된다. Dumont 및 다른 사람들, Blood. 119(13): 3024-3030 (2012년 1월 13일 온라인 상에서 공개됨) 참고. 그러나, 이용된 단백질 공학과 무관하게, 현재 개발중에 있는 장기 작용 FVIII 산물은 개선된 반감기를 가지지만, 이 반감기는 전임상 동물 모델에서 ? 단지 약 1.5 내지 2 배의 개선으로 제한적이다. Id 참고. 인간에서도 일관된 결과들이 설명되고 있는데, 예를 들면, rFVIIIFc는 혈우병 A 환자에서 ADVATE®와 비교하였을 때 최대 ~1.7배 반감기가 개선된 것으로 보고되었다. Id 참고. 따라서, 미약한 개선에도 불구하고, 이러한 반감기 증가는 T1/2 제한하는 다른 인자의 존재를 존재는 암시하는 것일 수 있다. Liu, T. 및 다른 사람들, 2007 ISTH meeting, abstract #P-M-035; Henrik, A. 및 다른 사람들, 2011 ISTH 미팅, 요약서 #P=MO-181; Liu, T. 및 다른 사람들, 2011 ISTH 미팅 요약서 #P-WE-131 참고.

혈장 폰 빌레브란트 인자 (VWF)는 대략 12 시간 (9 내지 15 시간 범위)의 반감기를 가진다. http://www.nhlbi.nih.gov/guidelines/vwd/2_scientificoverview.htm (2011년 10월 22일 최종 방문함). 이러한 VWF 반감기는 다수의 요인에 의해 영향을 받을 수 있다: 당화 패턴, ADAMTS-13 (디스인테그린 그리고 트롬보스폰딘 모티프-13를 가진 메탈로프로테아제), 그리고 VWF에서 다양한 돌연변이들.

혈장에서, FVIII의 95-98%는 전장의 VWF와 단단한 비-공유 복합체로 순환한다. 이러한 복합체 형성은 생체내 FVIII의 적절한 혈장 수준 유지에 중요하다. Lenting 및 다른 사람들, Blood. 92(11): 3983-96 (1998); Lenting 및 다른 사람들,J. Thromb. Haemost. 5(7): 1353-60 (2007). 전장의 야생형 FVIII는 중쇄 (MW 200kd)와 경쇄 (MW 73kd)를 보유하는 이형이량체로 대부분 존재한다. FVIII가 중쇄의 위치 372와 740 그리고 경쇄의 위치 1689에서 단백질가수분해로 인하여 활성화될 때, FVIII에 결합된 상기 VWF는 활성화된 FVIII로부터 제거된다. 활성화된 인자 IX, 칼슘, 그리고 인지질 ("테나제 복합체")과 함께 활성화된 FVIII는 인자 X의 활성화에 관련되어, 다량의 트롬빈을 만든다. 그 다음 트롬빈은 피브리노겐을 절단하여 가용성 피브린 단량체들을 만들고, 그 다음 이 단량체들은 자발적으로 중합되어 가용성 피브린 중합체가 형성된다. 트롬빈은 또한 인자 XIII를 활성화시키는데, 이 인자는 칼슘과 함께, 가용성 피브린 중합체를 교차연계시키고, 안정화시키는 역할을 하며, 교차-연결된 (불용성) 피브린이 형성된다. 상기 활성화된 FVIII는 단백질가수분해에 의해 순환계로부터 신속하게 제거된다.

빈번한 투약(dosing)과 이러한 투약 일정으로 인한 불편함 때문에, 덜 빈번한 투여가 요구되는 FVIII 산물, 예컨대, 1.5 내지 2 배 반감기 제약보다 더 긴 반감기를 보유하는 FVIII 산물의 개발은 여전히 필요하다.

발명의 간단한 요약

본 발명은 인자 VIII ("FVIII") 단백질과 부속 모이어티 ("adjunct moiety": "AM")를 포함하는 키메라 단백질에 의해 만들어졌으며, 이때 상기 부속 모이어티는 내생성 VWF가 상기 FVIII 단백질에 결합하는 것을 저해 또는 방지한다. 상기 FVIII 단백질과 부속 모이어티는 공유 결합에 의해 서로 연결되어, 내생성 VWF 존재하에서 상기 부속 모이어티의 분리를 방지한다. 한 구체예에서, 상기 공유 결합은 내생성 VWF 존재하에서 상기 FVIII 단백질로부터 상기 부속 모이어티의 분리를 충분히 막을 수 있는 강한 펩티드 결합, 이황화결합, 또는 링커(linker)이다. 또 다른 구체예에서, 상기 부속 모이어티는 VWF 제거 경로를 통하여 상기 FVIII 단백질이 제거되는 것을 방지한다. 또 다른 구체예들에 있어서, 상기 부속 모이어티는 상기 FVIII 단백질 상의 VWF 결합 부위를 차폐 또는 차단시켜 상기 FVIII 단백질에 내생성 VWF가 결합되는 것을 저해하거나 또는 방지한다. 예를 들면, VWF 결합 부위는 상기 FVIII 단백질의 A3 도메인 또는 C2 도메인 또는 A3 도메인과 C2 도메인 모두에 위치한다.

일부 구체예들에 있어서, 상기 키메라 단백질은 FVIII 단백질과 부속 모이어티가 서로 공유결합에 의해 서로 연계된 구조체를 포함하고, 이때 상기 키메라 단백질은 상기 FVIII 단백질의 반감기 제한을 유도하는 FVIII 반감기 제한 인자, 예컨대 전장 VWF 단백질 또는 성숙 VWF 단백질을 포함하지 않는다. 따라서, 일부 구체예들에 있어서, 상기 키메라 단백질의 FVIII 단백질 반감기는 내생성 VWF 존재하에서 상기 FVIII 단백질의 반감기 제한을 넘어서 연장될 수 있다.

특정 구체예들에 있어서, 상기 부속 모이어티는 최소한 하나의 VWF-유사 FVIII 보호 특성을 가진다. VWF-유사 FVIII 보호 특성의 예로써 하나 또는 그 이상의 프로테아제 절단으로부터 상기 FVIII 단백질을 보호하고, 활성화로부터 상기 FVIII 단백질을 보호하고, 상기 FVIII 단백질의 중쇄 및/또는 경쇄를 안정화시키고, 또는 하나 또는 그 이상의 소거 수용체들에 의해 상기 FVIII 단백질이 제거되는 것을 방지하는 것이 포함되나 이에 국한되지 않는다. 한 구체예에서, 상기 부속 모이어티는 폴리펩티드, 비-폴리펩티드모이어티, 또는 이 둘 모두를 포함한다. 또 다른 구체예에서, 상기 부속 모이어티는 길이가 최소한 약 40개, 최소한 약 50개, 최소한 약 60개, 최소한 약 70개, 최소한 약 80개, 최소한 약 90개, 최소한 약 100개, 최소한 약 110개, 최소한 약 120개, 최소한 약 130개, 최소한 약 140개, 최소한 약 150개, 최소한 약 200개, 최소한 약 250개, 최소한 약 300개, 최소한 약 350개, 최소한 약 400개, 최소한 약 450개, 최소한 약 500개, 최소한 약 550개, 최소한 약 600개, 최소한 약 650개, 최소한 약 700개, 최소한 약 750개, 최소한 약 800개, 최소한 약 850개, 최소한 약 900개, 최소한 약 950개, 또는 최소한 약 1000개의 아미노산 서열을 포함하는 폴리펩티드일 수 있다. 특정 구체예들에 있어서, 상기 부속 모이어티는 VWF 단편(fragment), 면역글로불린 불변 영역(region) 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들을 포함한다. 또 다른 구체예들에 있에서, 상기 부속 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는 비-폴리펩티드 모이어티다.

특정 구체예들에 있어서, 상기 부속 모이어티는 VWF의 D' 도메인과 D3 도메인을 포함하는 VWF 단편을 포함하는데, 이때 상기 VWF 단편은 상기 FVIII 단백질과 상기 부속 모이어티 (VWF 단편) 사이의 공유 결합에 추가하여, 비-공유 결합에 의해 상기 FVIII 단백질에 연합된다. 한 실시예에서, 상기 VWF단편은 단량체다. 또 다른 실시예에서, 상기 VWF 단편은 하나 또는 그 이상에서 연계된 2개, 3개, 4개, 5개 또는 6개의 VWF 단편을 포함한다.

한 측면에서, 상기 키메라 단백질은 부속 모이어티, 예컨대 VWF 단편, 최소한 하나의 이종기원(heterologous)의 모이어티 (H1) 그리고 상기 부속 모이어티, 예컨대 VWF 단편과 이종기원의 모이어티 (H1) 사이에 임의선택적 링커를 포함한다. 한 구체예에서, 상기 이종기원의 모이어티 (H1)는 상기 FVIII 단백질의 모이어티를 연장시키는 모이어티, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 폴리펩티드 또는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 비-폴리펩티드 모이어티를 포함할 수 있다. 한 구체예에서, 상기 이종기원의 모이어티 (H1)는 제 1 Fc 영역을 포함한다. 또 다른 구체예에서, 상기 이종기원의 모이어티 (H1)는 최소한 약 50개 아미노산, 최소한 약 100개 아미노산, 최소한 약 150개 아미노산, 최소한 약 200개 아미노산, 최소한 약 250개 아미노산, 최소한 약 300개 아미노산, 최소한 약 350개 아미노산, 최소한 약 400개 아미노산, 최소한 약 450개 아미노산, 최소한 약 500개 아미노산, 최소한 약 550개 아미노산, 최소한 약 600개 아미노산, 최소한 약 650개 아미노산, 최소한 약 700개 아미노산, 최소한 약 750개 아미노산, 최소한 약 800개 아미노산, 최소한 약 850개 아미노산, 최소한 약 900개 아미노산, 최소한 약 950개 아미노산, 또는 최소한 약 1000개의 아미노산이 포함된 아미노산 서열을 포함한다. 또 다른 구체예들에 있에서, 상기 키메라 단백질은 상기 부속 모이어티, 예컨대 VWF 단편과 상기 이종기원의 모이어티 (H1) 사이에 링커를 포함하는데, 이 링커는 절단가능한 링커다.

또 다른 측면에서, 상기 키메라 단백질 내 FVIII 단백질은 FVIII와 최소한 하나의 이종기원의 모이어티 (H2)를 포함한다. 한 구체예에서, 상기 이종기원의 모이어티 (H2)는 상기 FVIII 단백질의 반감기를 연장시킬 수 있는데, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편 그리고 이의 임의의 조합들로 구성된 군에서 선택된 폴리펩티드, 또는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들을 포함하는 비-폴리펩티드 모이어티다. 한 특정 구체예에 있어서, 상기 이종기원의 모이어티 (H2)는 제 2 Fc 영역을 포함한다.

일부 구체예들에 있어서, 상기 키메라 단백질은 상기 VWF 단편, 제 1 이종기원의 모이어티, 그리고 링커를 포함하는 제 1 폴리펩티드 쇄와 상기 FVIII 단백질과 제 2 이종기원의 모이어티를 포함하는 제 2 폴리펩티드 쇄를 포함하고, 이때 상기 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄는 공유 결합에 의해 서로 연계된다. 한 실시예에서, 상기 제 1 이종기원의 모이어티와 제 2 이종기원의 모이어티는 공유 결합, 예컨대 이황화결합, 펩티드 결합, 또는 링커에 의해 서로 연계되고, 이때 상기 공유 결합은 생체내에서 상기 제 1 폴리펩티드 쇄에서 상기 VWF 단편이 내생성 VWF로 대체되는 것을 방지한다. 일부 구체예들에 있어서, 상기 FVIII 단백질과 상기 제 2 이종기원의 모이어티 사이의 링커는 절단가능한 링커다.

특정 구체예들에 있어서, 상기 VWF 단편에 연계된 제 1 이종기원의 모이어티 (H1)와 상기 FVIII 단백질에 연계된 제 2 이종기원의 모이어티 (H2)는 링커, 예컨대 가공가능한(processable) scFc 링커에 의해 연계된다.

여전히 다른 구체예들에 있어서, 상기 키메라 단백질내 FVIII 단백질은 제 3의 이종기원의 모이어티 (H3), 제 4의 이종기원의 모이어티 (H4), 제 5의 이종기원의 모이어티 (H5), 제 6의 이종기원의 모이어티 (H6), 또는 이의 임의의 조합들을 더 포함한다. 한 구체예에서, 제 3의 이종기원의 모이어티 (H3), 제 4의 이종기원의 모이어티 (H4), 제 5의 이종기원의 모이어티 (H5), 제 6의 이종기원의 모이어티 (H6)중 하나 또는 그 이상은 상기 FVIII 단백질의 반감기의 반감기를 연장시킬 수 있다. 또 다른 구체예들에 있어서, 제 3의 이종기원의 모이어티 (H3), 제 4의 이종기원의 모이어티 (H4), 제 5의 이종기원의 모이어티 (H5), 그리고 제 6의 이종기원의 모이어티 (H6)는 FVIII의 C 말단 또는 N 말단에 연계되거나 또는 FVIII의 2개 아미노산 사이에 삽입된다. 또 다른 구체예들에 있에서, 제 3의 이종기원의 모이어티 (H3), 제 4의 이종기원의 모이어티 (H4), 제 5의 이종기원의 모이어티 (H5), 또는 제 6의 이종기원의 모이어티 (H6)중 하나 또는 그 이상은 최소한 약 50개 아미노산, 최소한 약 100개 아미노산, 최소한 약 150개 아미노산, 최소한 약 200개 아미노산, 최소한 약 250개 아미노산, 최소한 약 300개 아미노산, 최소한 약 350개 아미노산, 최소한 약 400개 아미노산, 최소한 약 450개 아미노산, 최소한 약 500개 아미노산, 최소한 약 550개 아미노산, 최소한 약 600개 아미노산, 최소한 약 650개 아미노산, 최소한 약 700개 아미노산, 최소한 약 750개 아미노산, 최소한 약 800개 아미노산, 최소한 약 850개 아미노산, 최소한 약 900개 아미노산, 최소한 약 950개 아미노산, 또는 최소한 약 1000 개의 아미노산이 포함된 아미노산 서열을 포함한다.

일부 구체예들에 있어서, 상기 FVIII 단백질과 상기 제 2 이종기원의 모이어티 사이의 링커 또는 상기 VWF 단편과 상기 제 1 이종기원의 모이어티 사이의 링커는 링커의 N-말단 영역내 제 1 절단 부위(P1), 링커의 C-말단 영역내 제 2 절단 부위(P2), 또는 이 둘 모두를 더 포함한다. 또 다른 구체예들에 있에서, 상기 FVIII 단백질과 상기 부속 모이어티 사이의 링커, 상기 FVIII 단백질과 상기 제 2 이종기원의 모이어티 사이의 링커, 그리고 상기 VWF 단편과 상기 제 1 이종기원의 모이어티 사이의 링커중 하나 또는 그 이상은 약 1 내지 약 2000개의 아미노산 길이를 가진다.

또 다른 구체예들에 있에서, 상기 키메라 단백질은 상기 FVIII 단백질과 상기 부속 모이어티 사이의 링커에 의해 연계된 FVIII 단백질과 부속 모이어티를 포함하고, 이때 상기 링커는 소르타제(sortase) 인지 모티프, 예컨대 서열 LPXTG (서열 번호: 106)를 더 포함한다.

본 발명은 VWF의 D' 도메인과 D3 도메인이 포함된 폰 빌레브란트 인자 (VWF) 단편에 관계되며, 이때 상기 VWF 단편은 인자 VIII (FVIII)에 결합되고, 그리고 내생성 VWF가 FVIII 단백질에 결합하는 것을 저해한다. 한 구체예에서, 본 발명의 상기 VWF 단편은 서열 번호: 2의 아미노산 764 내지 1274는 아니다. 한 구체예에서, 상기 VWF 단편없는, 상기 FVIII 단백질은 야생형 FVIII에 상응하는 반감기를 갖는다. 또 다른 구체예에서, 상기 FVIII 단백질은 FVIII와 FVIII의 반감기를 연장시킬 수 있는 이종기원의 모이어티가 포함된 융합 단백질이다. 상기 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드모이어티, 또는 이 둘 모두일 수 있다. 상기 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합으로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예들에 있에서, 상기 이종기원의 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 예컨대 Fc 영역이다. 여전히 다른 구체예들에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 특정 구체예들에 있어서, 상기 FVIII 단백질 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄를 포함하고, 이때 상기 제 1 폴리펩티드 쇄는 FVIII와 제 1 Fc 영역을 포함하고, 그리고 상기 제 2 폴리펩티드 쇄는 FVIII 없이 제 2 Fc 영역을 포함한다.

또 다른 구체예에서, 상기 VWF 단편은 FVIII의 반감기를 연장시킨다. 상기 D' 도메인의 아미노산 서열은 서열 번호: 2의 아미노산 764 내지 866에 대해 최소한 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하다. 또한, 상기 D3 도메인의 아미노산 서열은 서열 번호: 2의 아미노산 867 내지 1240에 대해 최소한 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하다. 특정 구체예들에 있어서, 상기 VWF 단편은 서열 번호: 2의 잔기 1099, 잔기 1142, 또는 이 둘 잔기 모두에 대응하는 잔기에서 최소한 하나의 아미노산 치환을 가진다. 한 특정 구체예에 있어서, VWF 단편은 서열 번호: 2의 아미노산 764 내지 1240을 포함하는, 필수적으로 구성된 또는 구성된다. 상기 VWF 단편은 VWF의 상기 D1 도메인, D2 도메인, 또는 D1과 D2 도메인을 더 포함할 수 있다. 일부 구체예들에 있어서, 상기 VWF 단편은 상기 A1 도메인, A2 도메인, A3 도메인, D4 도메인, B1 도메인, B2 도메인, B3 도메인, C1 도메인, C2 도메인, CK 도메인, 이의 하나 또는 그 이상의 단편들 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 VWF 도메인을 더 포함한다. 또 다른 구체예들에 있에서, 상기 VWF 단편은 페길화되고(pegylated), 글리코실화되고, 헤실화되고(hesylated), 또는 폴리시알릴화(polysialylated)된다.

본 발명은 본 명세서에서 설명된 VWF 단편, 이종기원의 모이어티, 그리고 상기 VWF 단편과 이종기원의 모이어티 사이에 임의선택적 링커가 포함된 키메라 단백질에 또한 관계된다. 상기 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드모이어티, 또는 이 둘 모두일 수 있다. 한 구체예에서, 상기 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합으로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 이종기원의 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 한 특정 구체예에 있어서, 상기 이종기원의 모이어티는 제 1 Fc 영역이다. 상기 키메라 단백질은 제 2 Fc 영역을 더 포함할 수 있고, 이때 상기 제 2 Fc 영역은 상기 제 1Fc 영역에 연계되거나 또는 연합되고 또는 상기 VWF 단편에 연계되거나 또는 연합된다.

한 측면에서, 본 발명의 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬러(formula)를 포함한다:

(aa) V-L1-H1-L2-H2

(bb) H2-L2-H1-L1-V,

(cc) H1-L1-V-L2-H2, 그리고

(dd) H2-L2-V-L1-H1,

이때 상기 V는 본 명세서에서 설명된 하나 또는 그 이상의 VWF 단편들이며,

각 L1과 L2는 임의선택적 링커이며;

H1은 제 1 이종기원의 모이어티이며;

(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이고; 그리고

H2는 임의선택적 제 2 이종기원의 모이어티이다.

한 구체예에서, H1은 제 1 이종기원의 모이어티, 예컨대 당분야에 공지된 반감기 연장 분자다. 한 구체예에서, 상기 제 1 이종기원의 모이어티는 폴리펩티드다. 상기 제 1 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합으로 구성된 군으로부터 선택된다. 또 다른 구체예에서, H1은 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 비-폴리펩티드 모이어티다. H2는 임의선택적 제 2 이종기원의 모이어티, 예컨대 당분야에 공지된 반감기 연장 분자다. 한 구체예에서, 상기 제 2 이종기원의 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합으로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예에서, H2는 비-폴리펩티드 모이어티로써, 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 특정 구체예들에 있어서, H1은 제 1 Fc 영역이고, H2는 제 2 Fc 영역이다. 상기 제 1Fc 영역과 제 2 Fc 영역은 동일하거나 또는 상이할 수 있으며, 그리고 링커 또는 공유 결합, 예컨대 이황화결합에 의해 서로 연계될 수 있다. 또 다른 구체예에서, 상기 제 2 Fc 영역은 인자 VIII 단백질에 연계되거나 또는 연합된다. 임의선택적으로, 반감기 증량제인 제 3의 이종기원의 모이어티, H3이 존재할 수 있으며, 이것은 상기 VWF단편, 상기 제 1 이종기원의 모이어티, 또는 상기 제 2 이종기원의 모이어티에 연계된다. 상기 제 3 이종기원의 모이어티의 비-제한적 예로써 폴리펩티드 또는 비-폴리펩티드 모이어티 또는 이 둘 모두가 포함될 수 있다. 한 구체예에서, 상기 제 3 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예에서, H2는 비-폴리펩티드 모이어티로써, 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 일부 구체예들에 있어서, H3은 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커에 의해 상기 VWF 단편 또는 제 1 또는 제 2 이종기원의 모이어티에 연계된다. 링커들의 비-제한적 예들은 본 명세서 도처에서 공개된다.

또 다른 측면에서, 본 발명은 본 명세서에서 설명된 VWF 단편, FVIII 단백질, 그리고 상기 VWF 단편과 상기 FVIII 단백질 사이에 있는 임의선택적 링커가 포함된 키메라 단백질을 제시한다. 상기 VWF 단편은 상기 FVIII 단백질에 결합되어 있을 수 있다. 한 구체예에서, 키메라 단백질은 이종기원의 모이어티에 연계된 본 명세서에서 설명된 VWF 단편을 포함한다. 상기 이종기원의 모이어티는 상기 단백질의 반감기를 연장시키는 모이어티일 수 있으며, 상기 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함할 수 있다. 이러한 이종기원의 폴리펩티드 모이어티의 예로써 예컨대, 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 이의 임의의 유도체들 또는 이의 임의의 변이체들, 또는 이의 임의의 조합들이 포함된다. 비-폴리펩티드 모이어티의 예로서 예컨대, 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들이 포함된다. 또 다른 구체예에서, 상기 이종기원의 모이어티는 상기 VWF단편에 연계된 제 1 Fc 영역이다. 또 다른 구체예들에 있에서, 상기 키메라 단백질은 상기 FVIII 단백질에 연계된 제 2 Fc 영역을 더 포함한다. 상기 VWF 단편 또는 FVIII 단백질은 각각 링커에 의해 상기 제 1 Fc 영역 또는 제 2 Fc 영역에 연계될 수 있다. 여전히 다른 구체예들에 있어서, 키메라 단백질은 제 1 이종기원의 모이어티, 예컨대 제 1 Fc 영역에 연계된 본 명세서에서 설명된 VWF 단편과 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역에 연계된 FVIII 단백질을 포함하고, 이때 상기 VWF 단편은 링커 또는 공유 결합에 의해 상기 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역) 또는 상기 FVIII 단백질에 더 연계되거나 또는 상기 제 1 이종기원의 모이어티 (예컨대 Fc 영역)는 링커 또는 공유 결합에 의해 상기 FVIII 단백질 또는 상기 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)에 더 연계된다. 일부 구체예들에 있어서, 상기 키메라 단백질의 FVIII는 부분적인 B-도메인을 가진다. 일부 구체예들에 있어서, 부분적인 B-도메인을 가진 상기 FVIII 단백질은 FVIII198 (서열 번호: 105)이다. 또 다른 구체예들에 있에서, 상기 키메라 단백질은 소르타제 인지 모티프를 더 포함한다.

일부 구체예들에 있어서, 본 발명의 결과로써 상기 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 FVIII 단백질 또는 야생형 FVIII과 비교하여 연장된다. 상기 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 FVIII 단백질 반감기보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 또는 최소한 약 12 배 더 길다. 한 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII의 반감기 보다 약 1.5-배 내지 약 20-배, 약 1.5 배 내지 약 15 배, 또는 약 1.5 배 내지 약 10 배 더 길다. 또 다른 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII 또는 상기 VWF 단편이 없는 FVIII 단백질 과 비교하였을 때, 약 2-배 내지 약 10-배, 약 2-배 내지 약 9-배, 약 2-배 내지 약 8-배, 약 2-배 내지 약 7-배, 약 2-배 내지 약 6-배, 약 2-배 내지 약 5-배, 약 2-배 내지 약 4-배, 약 2-배 내지 약 3-배, 약 2.5-배 내지 약 10-배, 약 2.5-배 내지 약 9-배, 약 2.5-배 내지 약 8-배, 약 2.5-배 내지 약 7-배, 약 2.5-배 내지 약 6-배, 약 2.5-배 내지 약 5-배, 약 2.5-배 내지 약 4-배, 약 2.5-배 내지 약 3-배, 약 3-배 내지 약 10-배, 약 3-배 내지 약 9-배, 약 3-배 내지 약 8-배, 약 3-배 내지 약 7-배, 약 3-배 내지 약 6-배, 약 3-배 내지 약 5-배, 약 3-배 내지 약 4-배, 약 4-배 내지 약 6 배, 약 5-배 내지 약 7-배, 또는 약 6-배 내지 약 8 배 연장된다. 또 다른 구체예들에 있어서, 상기 FVIII의 반감기는 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 25 시간, 최소한 약 26 시간, 최소한 약 27 시간, 최소한 약 28 시간, 최소한 약 29 시간, 최소한 약 30 시간, 최소한 약 31 시간, 최소한 약 32 시간, 최소한 약 33 시간, 최소한 약 34 시간, 최소한 약 35 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간이다. 여전히 다른 구체예들에 있어서, 상기 FVIII의 반감기는 약 15 시간 내지 약 2 주, 약 16 시간 내지 약 1 주, 약 17 시간 내지 약 1 주, 약 18 시간 내지 약 1 주, 약 19 시간 내지 약 1 주, 약 20 시간 내지 약 1 주, 약 21 시간 내지 약 1 주, 약 22 시간 내지 약 1 주, 약 23 시간 내지 약 1 주, 약 24 시간 내지 약 1 주, 약 36 시간 내지 약 1 주, 약 48 시간 내지 약 1 주, 약 60 시간 내지 약 1 주, 약 24 시간 내지 약 6일, 약 24 시간 내지 약 5 일, 약 24 시간 내지 약 4 일, 약 24 시간 내지 약 3 일, 또는 약 24 시간 내지 약 2 일이다.

일부 구체예들에 있어서, 한 대상 당 상기 FVIII 단백질의 평균 반감기는 약 15 시간, 약 16 시간, 약 17 시간, 약 18 시간, 약 19 시간, 약 20 시간, 약 21 시간, 약 22 시간, 약 23 시간, 약 24 시간 (1 일), 약 25 시간, 약 26 시간, 약 27 시간, 약 28 시간, 약 29 시간, 약 30 시간, 약 31 시간, 약 32 시간, 약 33 시간, 약 34 시간, 약 35 시간, 약 36 시간, 약 40 시간, 약 44 시간, 약 48 시간 (2 일), 약 54 시간, 약 60 시간, 약 72 시간 (3 일), 약 84 시간, 약 96 시간 (4 일), 약 108 시간, 약 120 시간 (5 일), 약 6일, 약 7 일(1 주), 약 8 일, 약 9 일, 약 10 일, 약 11 일, 약 12 일, 약 13 일, 또는 약 14 일이다.

또 다른 측면에서, 본 발명의 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬러를 포함한다:

(a) V-L1-H1- L3- C-L2-H2,

(b) H2-L2-C- L3- H1-L1-V,

(c) C-L2-H2- L3- V-L1-H1,

(d) H1-L1-V- L3-H2-L2-C,

(e) H1-L1-V-L3-C-L2-H2,

(f) H2-L2-C- L3- V-L1-H1,

(g) V-L1-H1-L3- H2-L2-C,

(h) C-L2-H2- L3- H1-L1-V,

(i) H2-L3-H1-L1-V-L2-C,

(j) C-L2-V-L1-H1-L3-H2,

(k) V-L2-C-L1-H1-L3-H2, 및

(l) H2-L3-H1-L1-C-L2-V,

이때 V는 본 명세서에서 설명된 VWF 단편이며;

각 L1 또는 L2는 임의선택적 링커, 예컨대 트롬빈 절단가능한 링커이며;

L3은 임의선택적 링커, 예컨대 scFc 링커, 예컨대 가공가능한 링커이며;

각 H1 또는 H2는 임의선택적 이종기원의 모이어티이며;

C는 FVIII 단백질이며;

(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이다.

다른 측면들에 있어서, 본 발명의 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬러를 포함한다:

(m) V-L1-H1: H2-L2-C,

(n) V-L1-H1:C-L2-H2,

(o) H1-L1-V:H2-L2-C,

(p) H1-L1-V:C-L2-H2,

(q) V:C-L1-H1:H2,

(r) V:H1-L1-C:H2,

(s) H2:H1-L1-C:V,

(t) C:V-L1-H1:H2, 및

(u) C:H1-L1-V:H2,

이때 V는 본 명세서에서 설명된 VWF 단편이며;

각 H1 또는 H2는 임의선택적 이종기원의 모이어티이며;

C는 FVIII 단백질이며;

(:) 는 H1과 H2 사이, V와 C 사이, 그리고 V와 H1과 C와 H2 사이의 화학적 또는 물리적 연합이다. (:)는 화학적 연합, 예컨대 최소한 하나의 비-펩티드 결합을 나타낸다. 특정 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 공유 결합이다. 일부 구체예들에 있어서, 상기 H1과 H2 사이의 연합은 공유 결합, 예컨대 이황화결합이다. 또 다른 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 비-공유 상호작용, 예컨대 이온 상호작용, 소수성 상호작용, 친수성 상호작용, 반 데르 발스 상호작용, 수소 결합이다. 특정 구체예들에 있어서, 상기 FVIII 단백질과 VWF 단편 사이의 연합은 비-공유 결합이다. 또 다른 구체예들에 있어서, (:)는 비-펩티드 공유 결합이다. 여전히 다른 구체예들에 있어서, (:)는 펩티드 결합이다. 한 구체예에서, H1은 제 1 이종기원의 모이어티다. 한 구체예에서, 상기 제 1 이종기원의 모이어티는 상기 FVIII 활성의 반감기를 연장시킬 수 있다. 또 다른 구체예에서, 상기 제 1 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두다. 한 구체예에서, 상기 제 1 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예에서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 일부 구체예들에 있어서, H2는 제 2 이종기원의 모이어티다. 상기 제 2 이종기원의 모이어티는 당분야에 공지된 반감기 증량제일 수 있고, 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이둘 모두의 조합일 수 있다. 한 구체예에서, 상기 제 2 이종기원의 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다. 특정 구체예들에 있어서, 상기 비-폴리펩티드는 모이어티 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된다 한 특정 구체예에 있어서, H1은 제 1 Fc 영역이다. 일부 구체예들에 있어서, H2는 제 2 Fc 영역이다. 임의선택적으로, 반감기 증량제인 제 3의 이종기원의 모이어티, H3가 있을 수 있다. H3은 임의선택적 링커, 예컨대 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커에 의해 하나 또는 그 이상의 V, C, H1, 또는 H2에 연계될 수 있다. 상기 제 3 이종기원의 모이어티의 비-제한적 예로써 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 폴리에틸렌 글리콜 (PEG), PAS 서열, 그리고 히드록시에틸 전분 (HES) 또는 이의 유도체가 포함될 수 있다.

특정 구체예들에 있어서, 포뮬러 (a) 내지 (u)의 상기 VWF 단편, FVIII 단백질, 제 1 이종기원의 모이어티, 및/또는 상기 제 2 이종기원의 모이어티를 서로 연결시키는데 이용되는 하나 또는 그 이상의 링커는 절단가능한 링커다. 상기 키메라 단백질에 이용된 하나 또는 그 이상의 절단 부위는 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, 그랜자임-B, TEV, 엔테로키나제, 프로테아제 3C, 소르타제 A, MMP-12, MMP-13, MMP-17, 그리고 MMP-20으로 구성된 군에서 선택된 프로테아제에 의해 절단될 수 있다. 또 다른 구체예들에 있어서, 포뮬라 (a) 내지 (l)에서 이용된 하나 또는 그 이상의 링커 (예컨대 L3)는 가공가능한 링커를 포함한다. 상기 가공가능한 링커들은 분비될 때 세포내 효소에 의해 절단될 수 있다. 상기 가공가능한 링커는 링커의 N-말단 영역내 제 1 절단 부위(P1), 링커의 C-말단 영역내 제 2 절단 부위(P2), 또는 이 둘 모두를 포함할 수 있다.

일부 구체예들에 있어서, 본 발명에 이용된 하나 또는 그 이상의 링커들은 최소한 약 1 내지 2000개의 아미노산 길이를 갖는다. 특정 구체예에 있어서, 본 발명에 이용된 하나 또는 그 이상의 링커들은 최소한 약 20, 35, 42, 48, 73, 98, 144, 288, 324, 576, 또는 864개의 아미노산 길이를 갖는다. 한 특정 구체예에 있어서, 하나 또는 그 이상의 링커들은 gly/ser 펩티드를 포함한다. 상기 gly/ser 펩티드는 (Gly₄ Ser)₃ 또는 (Gly₄ Ser)₄일 수 있다.

다른 측면들에 있어서, 키메라 단백질내 FVIII 단백질은 기능성 인자 VIII 단백질이다. 상기 FVIII 단백질은 상기 A1 도메인, A2 도메인, B 도메인, A3 도메인, C1 도메인, C2 도메인, 하나 또는 그 이상의 이의 단편, 그리고 이의 임의의 조합들로 구성된 군에서 선택된 FVIII의 하나 또는 그 이상의 도메인을 포함할 수 있다. 한 구체예에서, 상기 FVIII 단백질은 상기 B 도메인 또는 이의 일부분을 포함한다. 또 다른 구체예에서, 상기 FVIII 단백질은 SQ B 도메인 결실된 FVIII이다. 또 다른 구체예들에 있어서, 상기 FVIII 단백질은 단일 쇄 FVIII를 포함한다. 여전히 다른 구체예들에 있어서, 상기 FVIII 단백질은 FVIII의 중쇄와 인자 VIII의 경쇄를 포함하며, 이때 상기 중쇄와 경쇄는 금속 결합에 의해 서로 연합된다. 특정 구체예들에 있어서, 상기 FVIII 단백질은 저-밀도 지단백질 수용체-관련된 단백질 (LRP)에 대해 낮은 친화력을 보유하거나, 또는 이에 결합되지 않는다. 예를 들면, 본 발명에 유용한 FVIII 단백질은 상기 LRP에 대한 친화력을 낮추는 또는 상기 LRP에 대한 결합을 없애버리는 최소한 하나의 아미노산 치환을 보유할 수 있다. 최소한 하나의 아미노산 치환의 비-제한적 예는 전장의 성숙 FVIII에서 잔기 471, 잔기 484, 잔기 487, 잔기 490, 잔기 497, 잔기 2092, 잔기 2093 또는 2개 또는 그 이상의 조합에 상응하는 잔기에 존재한다. 일부 구체예들에 있어서, 본 발명의 상기 키메라 단백질내 FVIII 단백질은 치환이 없는 FVIII 단백질보다 FVIII 단백질이 더 안정화되도록 유도하는 최소한 하나의 아미노산 치환을 보유한다. 또 다른 구체예들에 있어서, 상기 FVIII 단백질은 A2 도메인에 최소한 하나의 아미노산 치환과 A3 도메인에 최소한 하나의 아미노산 치환을 보유하는데, 이때 상기 A2 도메인과 A3 도메인은 공유 결합에 의해 서로 연합된다. 상기 A2 도메인 안에 아미노산 치환의 비-제한적 예는 전장의 성숙 FVIII의 잔기 662 또는 664에 대응하는 잔기에 존재한다. 또한, A3 도메인 안에 아미노산 치환의 비-제한적인 예는 전장 성숙한 FVIII의 잔기 1826 또는 1828에 존재한다 폴리시알릴화된다.

추가 측면에 있어서, 본 발명은 본 명세서에서 설명된 VWF 단편 또는 키메라 단백질을 인코드하는 폴리뉴클레오티드, 또는 제 1 뉴클레오티드 쇄와 제 2 뉴클레오티드 쇄를 포함하는 폴리뉴클레오티드 세트를 제시하는데, 이때 상기 제 1뉴클레오티드 쇄는 상기 VWF 단편을 인코드하고, 상기 제 2 뉴클레오티드 쇄는 상기 키메라 단백질의 제 2 Fc 영역 또는 응고인자 또는 이의 단편을 인코드한다. 한 구체예에서, 상기 폴리뉴클레오티드 세트는 제 3의 폴리뉴클레오티드 쇄를 더 포함하는데, 상기 쇄는 서브틸리신-유사 프로프로테인 전환효소 패밀리에 속하는 프로프로테인 전환효소(convertase)를 인코드한다. 프로프로테인 전환효소의 비-제한적인 예에는 프로프로테인 전환효소 서브틸리신/케신 유형 3 (PACE 또는 PCSK3), 프로프로테인 전환효소 서브틸리신/케신 유형 5 (PCSK5 또는 PC5), 프로프로테인 전환효소 서브틸리신/케신 유형 7 (PCSK7 또는 PC7), 또는 효모 Kex 2가 포함된다. 여전히 다른 측면들에 있어서, 본 발명은 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드 세트와 상기 폴리뉴클레오티드 또는 폴리뉴클레오티드 세트에 작용가능하도록 연계된 하나 또는 그 이상의 프로모터가 포함된 벡터를 포함하거나 또는 제 1 벡터와 제 2 벡터가 포함된 벡터 세트를 포함하며, 이때 상기 제 1벡터는 상기 폴리뉴클레오티드 세트의 제 1 폴리뉴클레오티드 쇄를 인코드하고, 상기 제 2 벡터는 상기 폴리뉴클레오티드 세트의 제 2 폴리뉴클레오티드 쇄를 인코드한다. 상기 벡터 세트는 PC5 또는 PC7를 인코드하는 제 3 폴리뉴클레오티드가 포함된 제 3 벡터를 더 포함한다. 일부 구체예들에 있어서, 상기 벡터는 PACE를 더 포함한다. 일부 구체예들에 있어서, PACE는 상기 VWF 단편의 D1D2 도메인을 절단한다.

일부 측면들에 있어서, 본 발명은 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 폴리뉴클레오티드 세트, 벡터, 또는 벡터 세트, 그리고 약학적으로 수용가능한 운반체가 포함된 약제학적 조성물에 관계한다. 본 발명의 상기 조성물은 상기 인자 VIII의 반감기를 연장시킬 수 있다. 다른 측면들에 있어서, 본 발명은 상기 폴리뉴클레오티드, 폴리뉴클레오티드 세트, 벡터, 또는 벡터 세트가 포함된 숙주 세포를 포함한다.

다른 측면들에 있어서, 본 발명은 FVIII 단백질, 부속 모이어티 그리고 임의선택적 링커가 포함된 키메라 단백질로부터 얻는데, 이때 상기 부속 모이어티는 내생성 VWF가 상기 FVIII 단백질에 결합하는 것을 저해하거나 또는 결합을 막고, 그리고 최소한 하나의 VWF-유사 FVIII 보호 특성을 갖는다. 상기 VWF-유사 FVIII 보호 특성은 프로테아제 절단으로부터 상기 FVIII 단백질을 보호하고, 활성화로부터 상기 FVIII 단백질을 보호하고, 상기 FVIII 단백질의 중쇄 및/또는 경쇄를 안정화시키고, 또는 하나 또는 그 이상의 소거 수용체들에 의한 상기 FVIII 단백질의 제거를 방지하는 것 중에서 하나 또는 그 이상을 포함한다.

상기 키메라 단백질 안에 부속 모이어티는 상기 FVIII 단백질 상의 VWF 결합 부위를 차폐 또는 차단시킴으로써, 내생성 VWF가 상기 FVIII 단백질에 결합되는 것을 저해시키거나 또는 막을 수 있다. 일부 구체예들에 있어서, 상기 VWF결합 부위는 상기 FVIII 단백질의 A3 도메인 또는 C2 도메인 또는 상기 FVIII 단백질의 A3 도메인과 C2 도메인 모두에 위치된다. 또 다른 구체예에서, 상기 VWF결합 부위는 서열 번호: 16의 아미노산 1669 내지 1689 그리고 2303 내지 2332에 상응하는 아미노산 서열이다. 일부 구체예들에 있어서, 상기 부속 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두이다. 상기 부속 모이어티로 유용한 폴리펩티드는 최소한 40개, 50개, 60개, 70개, 80개, 90개, 100개, 110개, 120개, 130개, 140개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 550개, 600개, 650개, 700개, 750개, 800개, 850개, 900개, 950개, 또는 1000개의 아미노산 길이의 아미노산 서열을 포함할 수 있다. 예를 들면, 상기 부속 모이어티로 유용한 폴리펩티드는 VWF 단편, 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 다른 반감기 연장 기술, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택될 수 있다. 상기 부속 모이어티로 유용한 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES) 또는 이의 유도체, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택될 수 있다. 한 구체예에서, 상기 부속 모이어티는 상기 본 명세서에서 설명된 VWF 단편이다. 상기 부속 모이어티와 FVIII 단백질은 예컨대 링커에 의해 연계될 수 있고, 또는 서로 연합될 수 있다. 상기 링커는 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커를 포함할 수 있다.

한 측면에서, 본 발명은 FVIII 단백질에 내생성 VWF의 결합을 방지 또는 저해하는 방법을 제시하는데, 이 방법은 유효량의 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트를 FVIII 단백질 또는 상기 FVIII 단백질을 인코드하는 폴리뉴클레오티드가 포함된 세포에 추가하는 것으로 포함하며, 이때 상기 VWF 단편은 상기 FVIII 단백질에 결합된다. 또 다른 측면에서, 본 발명은 FVIII 단백질에 내생성 VWF의 결합을 방지 또는 저해하는 방법을 포함하는데, 이 방법은 상기 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트의 유효량을 이를 필요로 하는 대상에게 추가하는 것을 포함하며, 이때 상기 VWF 단편은 상기 FVIII 단백질에 결합되고, 따라서 상기 FVIII 단백질의 결합이 방지 또는 저해된다. 일부 측면들에 있어서, 본 발명은 FVIII 단백질의 반감기를 연장 또는 증가시키는 방법을 포함하는데, 이때 상기 방법은 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트의 유효량을 FVIII 단백질 또는 상기 FVIII 단백질을 인코드하는 폴리뉴클레오티드가 포함된 세포로 또는 이를 필요로 하는 대상에게 추가하는 것을 포함하고, 이때 상기 VWF 단편은 상기 FVIII 단백질에 결합된다. 다른 측면들에 있어서, 본 발명은 세포로부터 FVIII 단백질의 제거를 막거나 또는 저해시키는 방법으로써, 이때 상기 방법은 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트의 유효량을 FVIII 단백질 또는 상기 FVIII 단백질을 인코드하는 폴리뉴클레오티드가 포함된 세포 또는 이를 필요로 하는 대상에게 추가하는 것을 포함하며, 이때 상기 VWF 단편은 상기 FVIII 단백질에 결합된다.

또 다른 측면에서, 본 발명은 출혈 질환 또는 장애의 치료를 필요로 하는 대상에서 출혈 질환 또는 장애의 치료 방법에 관계되는데, 상기 방법은 유효량의 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트의 투여를 포함하며, 이때 상기 출혈 질환 또는 장애는 출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 그리고 장요근에서의 출혈로 구성된 군으로부터 선택된다. 또 다른 구체예들에 있어서, 상기 치료는 예방적 또는 요청(on-demand)에 의한 치료다. 여전히 다른 구체예들에 있어서, 본 발명은 유형 2N 폰 빌레브란트의 질환과 관련된 질환 또는 장애의 치료 방법으로써, 이를 필요로 하는 대상에게 상기 VWF 단편, 키메라 단백질, 폴리뉴클레오티드, 또는 폴리뉴클레오티드 세트의 유효량을 투여하는 것을 포함하며, 이때 상기 질환 또는 장애는 치료된다.

도 1a-f. VWF 단백질들의 계략적 도해. 도 1a는 서열 번호: 73의 아미노산 1 내지 276 (서열 번호: 2의 아미노산 764 내지 1039)이 포함된 2가지 VWF 단편을 나타낸다. VWF-001은 VWF의 프레/프로펩티드 서열없이 합성되며, VWF-009는 프레/프로펩티드 서열 (D1 및 D2 도메인)을 가지도록 합성된다. 상기 VWF-009의 프레펩티드는 합성하는 동안 절단되고, VWF-009는 상기 D' 와 D3 도메인 서열이 있는 프로펩티드를 포함한다. 도 1b는 서열 번호: 73의 아미노산 1 내지 477 (서열 번호: 2의 아미노산 764 내지 1240)이 포함된 3가지 VWF 단편들을 나타낸다. VWF-002는 프레/프로펩티드 서열 없이 합성된다. VWF-010은 상기 D'D3 도메인에 추가하여 상기 D1D2 도메인을 포함한다. VWF-013은 서열 번호: 72의 잔기 336과 379에서 시스테인이 알라닌 잔기로 치환에 추가하여, 상기 D1D2D'D3 도메인을 포함한다. 도 1c는 상기 D'D3 도메인과 상기 A1 도메인의 일부가 포함된 2가지 VWF 단편을 나타낸다. VWF-003은 서열 번호: 2)의 아미노산 764 내지 1274를 가진다. VWF-011은 상기 D'D3 도메인에 추가하여 상기 D1D2 도메인을 포함한다. 도 1d는 두 가지 구조체, VWF-004와 VWF-012를 나타낸다. VWF-004는 상기 D'D3 도메인과 A1 도메인의 온전한 서열을 포함한다. VWF-012는 상기 D1D2D'D3 도메인과 A1 도메인의 온전한 서열을 포함한다. 도 1e는 3가지 구조체를 나타낸다. VWF-006은 상기 D1D2D'D3 도메인과 VWF의 CK 도메인(시스테인 매듭 도메인)을 포함한다. VWF-008은 전장의 VWF다. VWF-031 (VWF-Fc)은 절단가능한 링커에 의해 단일 Fc 영역에 연계된 상기 D1D2D'D3 도메인이 포함된 구조체를 나타낸다. VWF-053은 상기 D1D2 도메인이다. 도 1F는 프로펩티드 (상기 D1과 D2 도메인) 그리고 성숙한 아단위들 (상기 D', D3, A1, A2, A3, D4, B1-3, C1-2 도메인들)이 포함된 전장의 VWF 단백질을 나타낸다. 상기 VWF 단백질은 약 250 kDa의 단백질이며, 그리고 이황화결합에 의해 다량체(> 20 MDa)가 형성된다. 상기 VWF 단백질은 비-공유 복합체에서 FVIII (95-98%)와 연합되고, 프로테아제 절단/활성화로부터 FVIII를 보호하고, 중쇄와 경쇄를 안정화시키고, 그리고 소거 수용체들에 의한 FVIII의 제거를 막음으로써, FVIII의 반감기를 연장시킨다. 상기 VWF 단백질은 또한 VWF 수용체를 통하여 FVIII-VWF 복합체를 제거하고, 음세포작용(pinocytosis)을 막고, 그리고 rFVIIIFc를 재순환시킴으로써, FVIII의 반감기를 제한시킬 수 있다.
도 2. VWF:FVIII 이형이량체 구조체의 실시예들의 계략적 도해. 좌측 구조체는 상기 전장 VWF의 D'D3 도메인 (서열 번호: 73의 아미노산 1-477)을 보유하고, 그리고 서열 번호: 72의 잔기 336과 379에서 알라닌 치환이 포함된 VWF 단편을 나타낸다. 상기 키메라 단백질 구조체 (FVIII 064/065)는 링커에 의해 제 1 Fc 영역에 연계된 VWF 단편의 C-말단을 포함하고, 그리고 FVIII는 제 2 Fc 영역에 연계되며, 이때 상기 제 2 Fc 영역은 링커(예컨대 포뮬라 C-H1-L1-V-L2-H2, 이때 V는 VWF 단편이며, C는 FVIII이며, H1과 H2는 Fc 영역이며, 그리고 L1과 L2는 절단가능한 링커들이다)에 의해 VWF 단편의 N-말단에 더 연계된다. 도 2b에서 상기 구조체는 세포안에서 가공된 VWF:FVIII 이형이량체 구조체이며, 이때 상기 제 2 Fc와 VWF 단편의 N-말단 사이의 링커는 절단되었다. FVIII-064는 상기 VWF의 D'D3 도메인 (C336A 및 C379 치환과 함께, 서열 번호: 73의 아미노산 1 내지 477)을 포함한다. FVIII-065는 상기 VWF의 D'D3 도메인 (서열 번호: 73의 아미노산 1 내지 276)을 포함한다. FVIII-136은 세포내 프로테아제 효소에 의해 가공될 수 있는 링커에 의해 상기 D'D3 단편-Fc에 연계된 FVIIIFc 를 포함한다. FVIII-136이 발현될 때, 상기 효소는 상기 제 2 Fc (FVIII-LC에 융합된)와 VWF D'D3 단편 (상기 제 1Fc에 융합된) 사이의 링커를 절단하고, 한편 FVIII-LC에 융합된(또는 이에 연계된) Fc 영역은 상기 VWF 단편에 융합된 (또는 이에 연계된) 제 1 Fc와 공유 결합(예컨대 이황화결합)을 형성한다. FVIII-148은 D'D3 단편을 가진 단일 쇄 FVIIIFc(단일 쇄 FVIII, R1645A/R1648A 돌연변이가 FVIII 유전자로 도입된)이다.
도 3. VWF와 Fc 사이에 가변적 링커의 실시예들이 포함된 VWF:FVIII 이형이량체 구조체들의 실시예들의 계락적 도해. 상기 구조체들 (FVIII-064, FVIII-159, FVIII-160, FVIII-178, 그리고 FVIII-179)은 포뮬라 C-H1-L1-V-L2-H2로 표현된 공통적인 구조를 보유하지만, 상이한 링커들 또는 아미노산 치환들의 실시예들이 포함된다. 나타낸 상기 구조체들은 동일한 VWF 단편을 보유하는데, 이 단편은 상기 VWF의 D'와 D3 도메인(예컨대, 아미노산 치환 C336A 및 C379A를 가진 서열 번호: 73의 아미노산 1 내지 477)이다. 구조체 FVIII 64는 상기 VWF 단편과 Fc (예컨대, H2) 사이에 트롬빈 절단가능한 링커 (예컨대, L2)를 보유하고, 이 링커는 20개의 아미노산을 갖는다. 구조체 FVIII 159는 상기 VWF 단편과 Fc (예컨대, H2) 사이에 트롬빈 절단가능한 링커 (예컨대, L2)를 보유하고, 이 링커는 35개의 아미노산을 갖는다. 구조체 FVIII 160은 상기 VWF 단편과 Fc (예컨대, H2) 사이에 트롬빈 절단가능한 링커 (예컨대, L2)를 보유하고, 이 링커는 48개의 아미노산을 갖는다. 구조체 FVIII-180, FVIII-181, 그리고 FVIII-182는 FVIII C1 도메인 안에 K2092A 돌연변이, FVIII C1 도메인 안에 K2093A 돌연변이, 그리고 FVIII C1 도메인 안에 K2092A/K2093A 돌연변이들이 각각 포함된 FVIII-160 유도체들이다. 구조체 FVIII-178은 상기 VWF 단편과 Fc (예컨대, H2) 사이에 트롬빈 절단가능한 링커 (예컨대, L2)를 보유하고, 이 링커는 73개의 아미노산을 갖는다. 구조체 FVIII-179는 상기 VWF 단편과 Fc (예컨대, H2) 사이에 트롬빈 절단가능한 링커 (예컨대, L2)를 보유하고, 이 링커는 98개의 아미노산을 갖는다.
도 4: FVIII-VWF 구조체들의 실시예들의 계략적 도해, 이때 VWF는 VWF의 D1D2D'D3 단편이고, 상기 링커는 절단 부위, 예컨대 트롬빈 절단 부위가 포함된 가변 길이의 링커이며, SC FVIII는 R1645A/R1648A 치환이 포함된 단일 쇄 FVIII이며, H는 이종기원의 모이어티, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 폴리에틸렌 글리콜 (PEG) 및/또는 PEG 접합용 모이어티, 알부민 또는 알부민 단편, 알부민 결합 모이어티, HAP 서열, 폴리시알릴화 및/또는 폴리시알산용 모이어티, 히드록시에틸 전분 (HES) 및/또는 HES용 모이어티, 또는 PAS 서열, 등등이며, HC FVIII는 FVIII의 중쇄이고, LC FVIII는 FVIII의 경쇄이며, 그리고 Fc는 면역글로불린 불변 영역의 Fc 영역이다. 도 4a는 VWF-링커-SC FVIII의 포뮬라를 가진다. 도 4b는 VWF-링커-H-링커-SC FVIII의 포뮬라를 가진다. 상기 링커들 (VWF와 H 사이의 제 1 링커 그리고 H와 SC FVIII 사이의 제 2 링커)은 동일하거나또는 상이할 수 있다. 도 4C는 VWF-링커-SC FVIII-링커-H의 포뮬라를 가진다. 상기 링커들 (VWF와 SC FVIII 사이의 제 1 링커 그리고 SC FVIII와 H 사이의 제 2 링커)은 동일하거나 또는 상이할 수 있다. 도 4D는 VWF-링커-HC FVIII-H-링커-LC FVIII의 포뮬라를 가진다. 상기 링커들 (VWF와 HC FVIII 사이의 제 1 링커 그리고 H와 LC FVIII 사이의 제 2 링커)은 동일하거나 또는 상이할 수 있다. 도 4e는 HC FVIII-H-LC FVIII-링커-제 1 Fc-링커-VWF-링커-제 2 Fc의 포뮬라를 가진다. 상기 링커들 (LC FVIII와 제 1 Fc 사이의 제 1 링커, 제 1 Fc와 VWF 사이의 제 2 링커 그리고 VWF와 제 2 Fc사이의 제 3 링커)은 동일하거나 또는 상이할 수 있다. 상기 링커들은 절단가능한 링커일 수 있다. 예를 들면, 제 1 Fc와 VWF 사이의 링커는 이 링커의 N-말단 및/또는 상기 C-말단에 절단 부위가 포함된 절단가능한 링커일 수 있다. 상기 제 1Fc와 제 2 Fc 동일하거나 또는 상이할 수 있다. 도 4f는 HC FVIII-H-LC FVIII-링커-제 1 Fc-링커-VWF-링커-제 2 Fc의 포율라를 가진다. 상기 링커들 (LC FVIII와 제 1 Fc 사이의 제 1 링커, 제 1 Fc와 VWF 사이의 제 2 링커 그리고 VWF와 제 2 Fc사이의 제 3 링커)은 동일하거나 또는 상이할 수 있다. 하나 또는 그 이상의 링커들은 절단가능한 링커일 수 있다. 예를 들면, 제 1 Fc와 VWF 사이의 링커는 이 링커의 N-말단 및/또는 상기 C-말단에 절단 부위가 포함된 절단가능한 링커일 수 있다. 상기 제 1Fc와 제 2 Fc 동일하거나 또는 상이할 수 있다. 도 4g는 SC FVIII-링커-Fc-링커-VWF-H-링커-Fc의 포뮬러를 가진다. 도 4h는 페길화된 또는 헤실화된 SC FVIII-링커-Fc-링커-VWF-H-링커-Fc의 포뮬러를 가진다. 상기 링커들 (SC FVIII와 제 1 Fc 사이의 제 1 링커, 제 1 Fc와 VWF 사이의 제 2 링커 그리고 H와 제 2 Fc사이의 제 3 링커)은 동일하거나 또는 상이할 수 있다. 하나 또는 그 이상의 링커들은 절단가능한 링커일 수 있다. 예를 들면, 제 1 Fc와 VWF 사이의 링커는 이 링커의 N-말단 및/또는 상기 C-말단에 절단 부위가 포함된 절단가능한 링커일 수 있다. 상기 제 1Fc와 제 2 Fc 동일하거나 또는 상이할 수 있다.
도 5. FVIII-VWF 이형이량체 공동-형질감염 시스템의 계략적 도해. 구조체 FVIII-155는 Fc 영역에 연계된 전장 FVIII 서열(1645 및 1648에서 상기 아르기닌 잔기를 대체하는 알라닌 잔기를 가진)을 포함한다. VWF-031은 48 트롬빈 절단가능한 링커에 의해 또 다른 Fc 영역에 연계된 상기 D1D2D'D3 단편 (336과 379에서 상기 시스테인 잔기를 대체하는 알라닌 잔기와 함께)을 포함한다 세포내 가공(processing)이후, 구조체 FVIII-155는 하나의 Fc 단편에 융합된 전장의 단일 쇄 FVIII (SCFVIII)를 만들고, 구조체 VWF-031은 또 다른 Fc 단편에 융합된 477개의 아미노산 D'D3 단편을 만든다. 상기 SC FVIII 또는 D'D3 단편에 연계된 Fc 단편 사이에 2개의 공유 결합이 형성될 수 있고, 이 공유결합으로 다시 FVIII와 D'D3의 공유 연합이 허용되며, 이것은 상기 원하는 최종 산물의 주요 특징이 된다.
도 6은 상기 VWF-009의 비-환원 및 환원 SDS PAGE (D1D2D'D3 1-276 aa x 6 HIS)이며, VWF-009는 단량체로 존재한다는 것을 보여준다. 가공되지 않았다는 것은 프로펩티드 (상기 D1D2 도메인)를 가진 VVF-009를 의미한다.
도 7은 VWF-002 (D'D3 1-477 aa x 6 his) 또는 VWF-010 (D1D2D'D3 1-477 aa x 6 his)의 비-환원 및 환원 SDS PAGE이며, VWF-002는 단량체로 존재하며, VWF-010는 이량체로 존재한다는 것을 보여준다.
도 8은 도 2(b)에 나타낸 FVIII-VWF 이형이량체의 트롬빈 절단을 보여준다. 라인 1은 표식(marker)을 나타낸다. 라인 2는 트롬빈없는 rFVIII-Fc를 나타낸다. 라인 3은 트롬빈을 가진 rFVIII-Fc를 나타낸다. 라인 5는 FVIIIFc-VWF를 나타낸다. 라인 6은 FVIIIFc-VWF와 트롬빈을 나타낸다. A1은 FVIII의 A1 도메인을 나타내고, A2는 FVIII의 A2 도메인을 나타내고, 그리고 Δa3 LC는 FVIII의 경쇄를 나타낸다.
도 9a-b는 FVIII 색원체 분석에 의해 측정된 상기 FVIII 활성을 보여준다. 도 9a는 HemA 마우스에서 rFVIII과 rFVIIIFc의 약동학 프로파일을 보여준다. 도 9b는 FVIII/VWF 이중 녹아웃 (DKO) 마우스에서 rFVIII과 rFVIIIFc의 PK 프로파일을 보여준다. Y축은 FVIII 활성, mIU/mL을 나타내고, X 축은 시간을 나타낸다.
도 10a-b는 플라스미드 주사 후 48시간에 측정된 mFVIII 혈장 수준 (mIU/mL) 그리고 VWF 발현 수준 (nM/mL)에 의해 나타난 것과 같이, 상기 D'D3 단편들에 의한 FVIII 보호를 보여준다. FVIII 보호를 보여주는데 이용된 상기 VWF 단편들은 VWF-001 (276aa, 단량체), VWF-009 (276aa, 단량체), VWF-002 (477aa, 단량체), VWF-010 (477aa, 이량체), VWF-003 (511aa, 단량체), VWF-011 (511aa, 이량체), VWF-004 (716aa, 단량체), VWF-012 (716aa, 이량체), VWF-006, 그리고 VWF-008이다.
도 11은 D'D3 단편과 공동-투여될 때, FVIII-VWF DKO 마우스에서 rBDD-FVIII의 약동학 프로파일을 보여준다. 도 11a는 rBDD-FVIII 와 VWF-002의 공동-투여 또는 rBDD-FVIII와 VWF-010의 공동-투여 또는 rBDD-FVIII 단독 투여 후 FVIII/VWF DKO 마우스에서 FVIII 색원체 분석으로 측정된 FVIII 활성 (mIU/mL)을 보여준다. 도 11b는 투여 후 VWF-002와 VWF-010 혈장 수준 (ng/mL)을 보여준다. X축은 시간(hour)을 나타낸다.
도 12는 VWF D'D3 발현 마우스에서 rFVIIIFc의 약동학 프로파일을 나타낸다. 도 12a는 상기 D'D3 도메인 인코딩 플라스미드 DNA의 수력학적(hydrodynamic) 주사 (-5일 차), rFVIIIFc의 정맥내 투여 분량 (0일 차), 그리고 PK 시료 수집 (0 - 3일차)의 일정을 나타낸다. 도 12b는 rFVIIIFc 주입 후 FVIII/VWF DKO 마우스에서 FVIII 색원체 분석에 의해 측정된 혈장 FVIII 활성 (mIU/mL), 상기 D1D2D'D3 도메인 (477aa)의 HDI (원) 그리고 시스테인 치환을 가진 상기 D1D2D'D3 도메인 (477aa)의 HDI (직사각)를 나타낸다. 상기 D'D3 도메인의 HDI 없는 대조군 마우스에서 상기 FVIII 활성은 삼각형으로 나타낸다. 도 10c는 상기 D1D2D'D3 이량체 또는 상기 D1D2D'D3 단량체 DNA 구조체의 HDI 투여 후 D'D3 혈장 수준 (ng/mL)을 나타낸다. X축은 시간(hour)을 나타낸다.
도 13은 FVIII/VWF DKO 마우스에서 HDI에 의한 D'D3-Fc 링커 선택을 보여준다. 상이한 길이의 링커들 (20aa (FVIII-064), 35aa (FVIII-159), 또는 48aa (FVIII-160))이 상기 D'D3 도메인과 Fc 영역 사이에 삽입되었다. 상기 FVIII 활성 (mIU/ml)은 FVIII/VWF DKO 마우스에서 HDI 이후, FVIII 색원체 분석에 의해 측정되었다.
도 14는 FVIII/VWF DKO 마우스에서 단일 쇄 FVIIIFc/D'D3 이형이량체의 HDI를 보여준다. 가공된 (이중 쇄) rFVIIIFc-D'D3 (pSYN-FVIII-136)과 단일 쇄 rFVIIIFc-D'D3 (pSYN-FVIII-148)의 FVIII 활성은 HDI 후 24시간과 48시간에 측정되었다.
도 15는 Octet 분석을 통하여 고정된 hVWF에 대한 FVIII-155/VWF-031 이형이량체의 결합 친화력을 나타낸다. FVIIIFc, FVIII, 및 IgG은 또한 대조군으로 이용되었다. x-축은 시간(초)을 나타내고, y-축은 결합(nm)을 나타낸다.
도 16은 FVIII/VWF 결함있는 (FVIII/VWF DKO) 마우스에서 FVIII-155/VWF-031 약동학을 나타낸다. x-축은 시간(hour)을 나타내고, y-축은 유입량에 대하여 FVIII 회수 백분율을 나타낸다.
도 17: VWF 단편 구조체들의 실시예의 계락적 도해, 이때 VWF는 VWF의 D1D2D'D3 단편이며; 상기 링커는 절단 부위, 예컨대 트롬빈 절단 부위가 포함된 가변성 길이를 가진 링커이며; H는 이종기원의 모이어티, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 폴리에틸렌 글리콜 (PEG) 및/또는 PEG 접합용 모이어티 접합용 모이어티, 알부민 또는 알부민 단편, 알부민 결합 모이어티, HAP 서열, 폴리시알화 및/또는 폴리시알산용 모이어티, 히드록시에틸 전분 (HES) 및/또는 HES용 모이어티, 또는 PAS 서열, 등등이며; Fc는 면역글로불린의 Fc 영역이다. 도 17a는 D1D2-D'일부 D3-H-일부 D3-링커-Fc의 포뮬라를 가진다. 도 17b는 D1D2-일부 D'-H-일부 D'D3-링커-Fc의 포뮬라를 가진다. 도 17c는 D1D2-페길화된 또는 헤실화된 D'D3- 링커-Fc의 포뮬라를 가진다. 상기 링커는 임의선택적으로 절단될 수 있다.
도 18: A)에서 시간 경과에 따라 HemA (다이아몬드)과 DKO (사각) 혈장 모두에서 FVIIIFc는 FVIII 활성을 상실한다는 것을 나타낸다. FVIII 활성은 색원체 분석에 의해 측정된다. X-축은 시간(hour)을 나타내고, y-축은 상대적 활성을 나타낸다. B)에서 FVIII 활성의 상실은 상기 중쇄(HC)의 분리(dissociation) 또는 분해(degradation) 때문이라는 것을 보여준다. 좌측 패널은 Bio-rad 4-15% 겔에서 양(sheep)의 항-FVIII 다클론성 항체를 이용한 면역-침전 분석을 보여준다. 상기 겔은 환원되었고, Bio-rad 시스템에 의해 영상화되었다. 라인 1은 Bio-rad 착색안된 표식을 보여주고; 라인 2는 FVIIIFc와 PBS를 보여주고; 라인 3은 FVIIIFc와 DKO 혈장을 보여주고; 그리고 라인 5는 양의 항-FVIII 다클론성 항체 만을 보여준다. 우측 패널은 FVIII 항-중쇄 항체 (GMA012)를 이용하여 겔의 웨스턴 분석을 나타낸다. 라인 1은 Bio-rad 착색안된 표식을 보여주고; 라인 2는 FVIIIFc와 PBS를 보여주고; 라인 3은 FVIIIFc와 DKO 혈장을 보여주고; 그리고 라인 4는 양의 항-FVIII 다클론성 항체 만을 보여준다.
도 19: 시간에 대한 함수로써 DKO 마우스 혈장 (좌측 패널)과 HemA 마우스 혈장 (우측 패널)에서 색원체 분석에 따른 야생형 FVIIIFc (원), scFVIIIFc (단일 쇄 FVIII) (채워진 삼각형), 또는 FVIII:VWF 이형이량체 (예컨대 FVIII155/VWF31) (빈 삼각형)의 FVIII 활성을 나타낸다. Y 축은 상대적 FVIII 활성을 나타낸다. 야생형 FVIIIFc는 FVIII의 이중 쇄 (예컨대, FVIII 중쇄와 FVIII 경쇄는 비-공유적으로 서로 연결됨)를 포함하고, 따라서 3개 쇄를 갖는다: FVIII 중쇄, Fc에 융합된 FVIII 경쇄, 그리고 Fc 단독. ScFVIIIFc는 FVIII 단일 쇄를 포함하고, 따라서, 2개의 쇄를 갖는다: Fc에 융합된 단일 쇄 FVIII와 Fc 단독. 상기 FVIII:VWF 이형이량체 (예컨대 FVIII155/VWF031)는 Fc에 융합된 단일 쇄 FVIII와 Fc에 융합된 VWF 단편 (D'D3)을 포함한다.
도 20은 상이한 농도의 PC5 또는 PACE (Furin)에 의해 VWF 단편 (예컨대 VWF-031(D1D2D'D3Fc))로부터 D1D2 도메인의 가공을 보여준다. 환원된 상태의 Bio-rad 4-15% 겔 상에서 Bio-rad 화상촬영기에 의한 상기 D1D2 가공을 보여준다. 라인 1은 VWF031 만을 보여주고; 라인 2는 PC5 만을 보여주고; 라인 3은 PACE 만을 보여주고; 라인 4는 2.5%에서 VWF031과 PC5를 보여주고; 라인 5는 5%에서 VWF031과 PC5를 보여주고; 라인 6은 7.5%에서 VWF031과 PC5를 보여주고; 라인 7은 10%에서 VWF031과 PC5를 보여주고; 라인 8은 2.5%에서 VWF031과 PACE를 보여주고; 라인 9는 5%에서 VWF031과 PACE를 보여주고; 라인 10은 7.5%에서 VWF031을 보여주고; 그리고 라인 11은 10%에서 VWF031과 PACE 를 보여준다.
도 21: A)에서 ForteBio octet 기구에 의한 FVIII:VWF 이형이량체 (예컨대 FVIII-155/VWF-031)의 결합 분석을 보여준다. 상기 분석을 위하여, APS 센서를 이용하여 전장의 VWF가 포획되었다. 전장 VWF에 대한 FVIIIFc와 FVIII의 결합은 하부 좌측 패널에 나타낸다. FVIIIY1680 (VWF에 대한 친화력이 없는 돌연변이)과 FVIII:VWF 이형이량체 (FVIII155/VWF031)의 결합 부재는 하부 우측 패널에 나타낸다. B)는 FVIII:VWF 이형이량체 (예컨대 FVIII-155/VWF-031)의 또 다른 결합 분석을 보여준다. 상기 분석에서, 구조체들 (VWF031 구조체, FVIII-155/VWF031, 또는 FVIII)은 단백질 G 센서 상에 고정되었다. FVIII에 상기 구조체들의 결합이 측정되었다.
도 22는 표면 혈장 공명 실험에 의해 측정된 VWF D'D3 도메인의 FVIII 분자에 대한 결합 친화력을 나타낸다. 상기 VWF031 구조체 (100RU)는 1000RU의 항-인간 IgG를 이용하여 포획되었다. B-도메인 결실된 FVIII는 1:1 맞춤으로 단일 주기 동태학 방식으로 적용되었다. 총 수는 4이다.
도 23은 FVIII/VWF DKO 마우스에 투여되었을 때, 약동학에서 FVIIIFc/VWF 이형이량체 구조체내 상이한 길이의 링커 효과를 나타낸다. 3가지 상이한 링커들 (48 aa, 73aa, 또는 98aa)은 예컨대, VWF031, VWF035, 그리고 VWF036의 상기 D'D3와 Fc 사이에 삽입되었다. Y 축은 5분 값(%)으로 표준화된 상기 FVIII 활성을 나타낸다.
도 24는 VWF 단편을 FVIII에 소르타제 결찰시킨 예를 나타낸다. A)는 2개의 결찰(ligation) 구조체, (1) 상기 C-말단에서 소르타제 인지 모티프 (예컨대 LPXTG)에 융합된 VWF 단편, 그리고 (2) N-말단에서 글리신(n)을 보유하는 FVIII을 나타낸다. 소르타제와 반응 후, 상기 VWF 단편과 소르타제 인지 모티프는 FVIII의 N-말단에서 결찰된다. B)는 2가지 결찰 구조체, (1) 이의 C 말단 소르타제 인지 모티프에 융합된 FVIII, 그리고 (2) 이의 N-말단에서 글리신(n)을 갖는 VWF를 나타낸다. 소르타제와 반응 후, FVIII와 소르타제 인지 모티프는 VWF 단편의 N-말단에서 상기 VWF 단편에결찰된다. C)는 2가지 결찰 구조체, (1) 가변 길이 링커에 의해 소르타제 인지 모티프에 융합된 VWF 단편 그리고 (2) 이의 N-말단에서 글리신(n)에 융합된 FVIII를 나타낸다. 소르타제와 반응 후, 링커에 의해 소르타제 인지 모티프에 융합된 상기 VWF는 FVIII의 N-말단에 결찰된다. D)는 2가지 결찰 구조체, (1) 가변 길이 링커에 의해 소르타제 인지 모티프에 융합된 FVIII 그리고 (2) 이의 N-말단에서 글리신(n)에 융합된 VWF 단편을 나타낸다. 소르타제와 반응 후, 링커에 의해 소르타제 인지 모티프에 융합된 FVIII는 VWF의 N-말단에 결찰된다. E)는 가변 길이 링커에 의해 소르타제 인지 모티프에 융합되고, 다시 Fc에 연계된 가변 길이 링커에 의해 융합된 프로테아제 절단 부위(예컨대 트롬빈 절단 부위)에 또 융합된, VWF 단편을 나타낸다.
도 25는 FVIII155와 FVIII198의 계략적 비교를 나타낸다. FVIII155는 단일 쇄 FVIIIFc 단백질을 인코드한다. FVIII198은 쇄 FVIIIFc 분자-226N6을 포함하는 부분적인 B-도메인이다. 226은 상기 FVIII B-도메인의 N-말단 226개 아미노산을 나타내고, N6는 상기 B-도메인에서 6개 N-당화 부위를 나타낸다.
도 26 A)는 시간에 대한 함수로써 DKO 혈장에서 FVIII155와 FVIII198의 상대적 활성을 측정하는 안정성 분석을 보여준다. 상기 도면에서 볼 수 있는 것과 같이, FVIII155와 비교하였을 때, FVIII198 안에 부분적인 B-도메인의 존재는 단일 쇄 FVIIIFc 안정성을 증가시켰다; B)는 DKO 마우스에서 FVIII198, FVIII155, 그리고 이중 쇄 (dcFVIIIFc)의 반감기를 비교한 것이다. 상기 도면에서 볼 수 있는 것과 같이, 단일 쇄 FVIII (FVIII155)는 이중 쇄 FVIII와 비교하여 1.5배 증가된 반감기를 갖는다. 266N6 B-도메인 (FVIII198)를 가진 단일 쇄 FVIII는 1.5배 더 증가된 반감기를 갖는다. 상기 그래프는 시간에 대한 함수로써 5분 값(%)에 대한 상기 FVIII 회수를 나타낸다.
발명의 상세한 설명
정의
용어 단수용 부정관사("a" 또는 "an")는 하나 또는 그 이상의 실체를 의미하는 것으로써; 예를 들면, "뉴클레오티드 서열"는 하나 또는 그 이상의 뉴클레오티드 서열을 나타내는 것을 의미한다. 이와 같이, 용어 단수용 부정관사( "a" (또는 "an")), "하나 또는 그 이상" 그리고 "최소한 하나"는 본 명세서에서 호환 이용될 수 있다.
용어 "폴리뉴클레오티드" 또는 "뉴클레오티드"는 단수 핵산 뿐만 아니라 복수개의 핵산을 포괄하며, 그리고 단리된 핵산 분자 또는 구조체, 예컨대, 메신져 RNA (mRNA) 또는 플라스미드 DNA (pDNA)를 지칭한다. 특정 구체예들에 있어서, 폴리뉴클레오티드는 통상적 포스포디에스테르 결합 또는 비-통상적 결합 (예컨대, 펩티드 핵산 (PNA))에서 볼 수 있는 아미드 결합을 포함한다. 용어 "핵산"는 임의의 하나 또는 그 이상의 핵산 분절(segments), 예컨대, 폴리뉴클레오티드에 존재하는 DNA 또는 RNA 단편들을 지칭한다. "단리된" 핵산 또는 폴리뉴클레오티드는 이의 고유 환경으로부터 격리된 핵산 분자, DNA 또는 RNA를 의미한다. 예를 들면, 벡터 안에 포함된 인자 VIII 폴리펩티드를 인코드하는 재조합 폴리뉴클레오티드는 본 발명의 목적을 위하여 단리된 것으로 간주된다. 단리된 폴리뉴클레오티드의 추가적인 예로써 이종기원의 숙주 세포 안에 유지된 재조합 폴리뉴클레오티드 또는 용액내 다른 폴리뉴클레오티드로부터 정제된 (부분적으로 또는 실질적으로) 것들이 포함된다. 단리된 RNA 분자들은 생체내 또는 시험관내 본 발명에 따른 폴리뉴클레오티드의 RNA 전사체를 포함한다. 본 발명에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성에 의해 생산된 이러한 분자들을 포함한다. 또한, 폴리뉴클레오티드 또는 핵산은 조절 요소들 가령, 프로모터, 인헨서, 리보솜 결합 부위, 또는 전사 종료 신호를 포함할 수 있다.
본 명세서에서 이용된 것과 같이, "코딩 영역" 또는 "코딩 서열"는 아미노산으로 해독가능한 코돈으로 구성된 폴리뉴클레오티드의 일부분이다. "정지 코돈" (TAG, TGA, 또는 TAA)은 일반적으로 아미노산으로 해독되지 않지만, 코딩 영역의 일부분으로 간주될 수 있고, 그러나 임의의 측면 서열들, 예를 들면 프로모터, 리보솜 결합 부위, 전사 종료자, 인트론, 그리고 이와 유사한 것들은 코딩 영역의 일부가 아니다. 코딩 영역의 경계는 결과로 생성되는 폴리펩티드의 아미노 말단을 인코드하는 5'말단에 있는 시작 코돈과 결과로 생성되는 폴리펩티드의 카르복실 말단을 인코드하는 3' 말단의 해독 정지 코돈에 의해 일반적으로 결정된다. 본 발명의 2 또는 그 이상의 코딩 영역은 단일 폴리뉴클레오티드 구조체 내, 예컨대, 단일 벡터, 또는 별도의 폴리뉴클레오티드 구조체 내 단일 백터, 예컨대, 별도의 (상이한) 벡터 상에 존재할 수 있다. 단일 벡터는 단지 한 개의 코딩 영역을 포함할 수 있고, 또는 2개 또는 그 이상코딩 영역을 포함할 수 있는데, 예컨대, 하기에서 논의되는 것과 같이 단일 벡터는 결합 도메인-A와 결합 도메인-B를 별도로 인코드할 수 있다. 추가적으로, 본 발명의 벡터, 폴리뉴클레오티드, 또는 핵산은 본 발명의 결합 도메인을 인코드하는 핵산에 융합된 또는 융합되지 않은 이종기원의 코딩 영역을 인코드할 수 있다. 이종기원의 코딩 영역은 특화된 요소들 또는 모티프, 가령, 분비 신호 펩티드 또는 이종기원의 기능적 도메인을 포함하나 이에 한정되지 않는다.
포유동물 세포들에 의해 분비되는 특정 단백질들은 분비신호 펩티드에 연합되고, 거친 세포질 망상구조를 통하여 일단 성장하는 단백질 쇄의 방출이 개시되면 이 분비신호 펩티드는 성숙한 단백질으로부터 잘려나가게 된다. 신호 펩티드들은 상기 폴리펩티드의 N-말단에 일반적으로 융합되며, 그리고 온전한 또는 "전장의" 폴리펩티드로부터 절단됨으로써, 상기 폴리펩티드의 분비된 형태 또는 "성숙한" 형태가 만들어진다는 것을 당분야 숙련자는 인식하고 있다. 특정 구체예들에 있어서, 고유한 신호 펩티드, 예컨대, 면역글로불린 중쇄 또는 경쇄 신호 펩티드가 이용되거나, 또는 상기 폴리펩티드에 작용가능하도록 연합되어, 상기 폴리펩티드의 분비를 지시하는 능력이 유지된 이 서열의 기능성 유도체가 이용된다. 대안으로, 이종기원의 포유동물 신호 펩티드, 예컨대, 인간 조직 플라스미노겐 활성화물 (TPA) 또는 마우스 ß-글루쿠로니다제 신호 펩티드, 또는 이의 기능성 유도체가 이용될 수 있다.
용어 "하류(downstream)"는 기준 뉴클레오티드 서열에 대해 3'에 위치하는 뉴클레오티드 서열을 지칭한다. 특정 구체예들에 있어서, 하류 뉴클레오티드 서열은 전사 시작 지점 이후에 따라나오는 서열과 관련된다. 예를 들면, 한 유전자의 해독 개시 코돈은 전사 시작 부위의 하류에 위치한다.
용어 "상류(upstream)"는 기준 뉴클레오티드 서열에 대해 5'에 위치하는 뉴클레오티드 서열을 지칭한다. 특정 구체예들에 있어서, 상류 뉴클레오티드 서열은 코딩 영역의 5' 측면 또는 전사의 시작점에 위치한 서열에 관련된다. 예를 들면, 대부분 프로모터는 전사 시작 부위의 상류에 위치한다.
본 명세서에서 이용된 것과 같이, 용어 "조절 영역"는 코딩영역의 상류 (5' 비-코딩 서열), 코딩 영역내, 또는 코딩 영역의 하류 (3' 비-코딩 서열)에 위치하고, 상기 연합된 코딩 영역의 전사, RNA 가공, 안정성, 또는 해독에 영향을 주는 뉴클레오티드 서열을 지칭한다. 조절 영역은 프로모터, 해독 리더 서열, 인트론, 폴리아데닐화 인지 서열, RNA 가공 부위, 효과물질 결합 부위 그리고 스템-루프 구조들을 포함할 수 있다. 코딩 영역이 진핵 세포 안에서 발현되는 경우라면, 폴리아데닐화 신호와 전사 종료 서열은 코딩 서열의 3'에 보통 위치할 것이다.
유전자 산물, 예컨대, 폴리펩티드를 인코드하는 폴리뉴클레오티드는 하나 또는 그 이상의 코딩 영역에 작용가능하도록 연합된 프로모터 및/또는 다른 전사 또는 해독 조절 요소들을 포함할 수 있다. 작용가능하도록 연합에 있어서 유전자 산물, 예컨대, 폴리펩티드의 코딩 영역은 상기 조절 영역(들)의 영향 또는 조절하에 유전자 산물의 발현이 일어나는 방식으로 하나 또는 그 이상의 조절 영역에 연합된다. 예를 들면, 프로모터 기능의 유도로 mRNA의 코딩 영역에 유전자 산물이 인코딩된 mRNA의 전사를 초래하고, 그리고 상기 프로모터와 코딩 영역 사이의 연계 특성이 상기 유전자 산물의 발현을 지시하는 프로모터의 능력을 간섭하지 않거나 또는 전사되는 상기 DNA 주형의 능력을 간섭하지 않는 경우에 코딩 영역과 프로모터는 "작용가능하도록 연합되어" 있다라고 한다. 프로모터를 제외한 다른 전사 조절 요소들, 예를 들면 인헨서, 오퍼레이터(operators), 리프레서(repressors), 그리고 전사 종료 신호는 유전자 산물 발현의 발현을 지시하는 코딩 영역에 또한 작용가능하도록 연합될 수 있다.
당분야 숙련자들에게 다양한 전사 조절 영역들이 공지되어 있다. 이러한 조절 영역은 척추동물 세포들에서 기능을 하는 전사 조절 영역들, 가령, 사이토메갈로바이러스의 프로모터와 인헨서 분절 (인트론-A와 결합되어 있는 즉각적인 초기(immediate early) 프로모터), 유인원 바이러스 40 (초기(early) 프로모터), 그리고 레트로바이러스(가령, 라우스 육종 바이러스)가 포함되나 이에 한정되지 않는다. 다른 전사 조절 영역은 척추동물로부터 유도된 유전자들 가령, 액틴, 열 쇼크 단백질, 소 성장 호르몬 그리고 토끼 ß-글로빈, 뿐만 아니라 진핵 세포들에서 유전자 발현을 조절할 수 있는 다른 서열을 포함한다. 추가적인 적합한 전사 조절 영역은 조직-특이적 프로모터와 인헨서 뿐만 아니라 림포카인-유도성 프로모터 (예컨대, 인터페론 또는 인터루킨에 의해 유도되는 프로모터)를 포함한다.
유사하게, 당업계 숙련자들에게는 다양한 해독 조절 요소들이 공지되어 있다. 이러한 요소들에는 리보솜 결합 부위, 해독 개시와 종료 코돈, 그리고 피코르나바이러스로부터 유도된 요소들 (구체적으로 내부 리보솜 진입 부위, 또는 IRES, 또한 CITE 서열로도 불림)이 포함되나 이에 국한되지 않는다.
본 명세서에서 이용된 것과 같이, 용어 "발현"란 폴리뉴클레오티드가 유전자 산물, 예를 들면, RNA 또는 폴리펩티드를 만드는 공정을 지칭한다. 발현은 폴리뉴클레오티드가 메신져 RNA (mRNA), 전달 RNA (tRNA), 작은 헤어핀 RNA (shRNA), 작은 간섭 RNA (siRNA) 또는 임의의 다른 RNA 산물로의 전사, 그리고 mRNA가 폴리펩티드로 해독되는 것을 포함하나 이에 한정되지 않는다. 발현은 "유전자 산물"를 만든다. 본 명세서에서 이용된 것과 같이, 유전자 산물은 핵산, 예컨대, 유전자의 전사에 의해 생산된 메신져 RNA, 또는 전사체로부터 해독된 폴리펩티드일 수 있다. 본 명세서에서 설명된 유전자 산물은 전사 후 변형(modification), 예컨대, 폴리아데닐화 또는 스플라이싱(splicing)된 핵산, 또는 해독후 변형된 폴리펩티드들, 예컨대, 메틸화, 당화, 지질의 추가, 다른 단백질 아단위들과의 연합, 또는 단백질분해성 절단된 폴리펩티드들 더 포함한다.
"벡터"는 핵산의 클로닝 및/또는 핵산을 숙주 세포로 이동시키기 위한 임의의 운반체(vehicle)를 지칭한다. 벡터는 부착된 분획의 복제를 야기할 수 있도록 또 다른 핵산 분획이 부착된 레플리콘일 수 있다. "레플리콘"는 생체내에서, 즉, 자체 조절하에 복제를 할 수 있는 자가 복제 단위로 기능을 하는 임의의 유전적 요소 (예컨대, 플라스미드, 파아지, 코스미드, 염색체, 바이러스)를 지칭한다. 용어 "벡터"에는 시험관내, 생체외 또는 생체내에서 핵산을 세포 안으로 도입시키는 바이러스 및 비-바이러스 운반체가 포함된다. 당분야에는 예를 들면, 플라스미드, 변형된 진핵 바이러스, 또는 변형된 세균성 바이러스가 포함된, 다수의 벡터가 공지되어 있으며, 이용되고 있다. 적절한 폴리뉴클레오티드 단편들을 상보성 점착성(cohesive) 말단을 보유한 선택된 벡터 안에 결찰시킴으로써, 폴리뉴클레오티드를 적합한 벡터 안으로 삽입시킬 수 있다.
상기 벡터가 혼입되어 있는 세포를 선택 또는 식별할 수 있는 선택성 표식 또는 리포터가 인코드되도록 벡터를 작제할 수 있다. 선택성 표식 또는 리포터의 발현으로 상기 벡터에 포함된 다른 코딩 영역을 혼입 또는 발현시키는 숙주 세포의 식별 또는 선택이 가능하다. 당분야에 공지된 그리고 이용되는 선택성 표식 유전자들의 예로는 다음이 포함된다: 암피실린, 스트렙토마이신, 젠타마이신, 카나마이신, 하이그로마이신, 비아라포스 제초제, 술폰아미드, 그리고 이와 유사한 것들에 저항성을 제공하는 유전자들; 그리고 표현형 표식으로 이용되는 유전자들, 즉., 안토시아닌 조절 유전자들, 이소펜타닐 전이효소 유전자, 그리고 이와 유사한 것들. 당분야에 공지되고, 이용되는 리포터의 실시예로는 다음이 포함된다: 루시퍼라제 (Luc), 녹색 형광 단백질 (GFP), 클로람페니콜 아세틸전이효소 (CAT), -갈락코시다제 (LacZ), -글루쿠로니다제 (Gus), 그리고 이와 유사한 것들. 선택성 표식들은 또한 리포터로도 간주될 수 있다.
용어 "플라스미드"는 세포의 중심 대사의 일부분이 아닌 유전자를 운반하는 염섹체-외 요소를 지칭하며, 보통 원형의 이중-가닥으로 된 DNA 분자 형태를 가진다. 이러한 요소들은 임의의 원천으로부터 유도된 자가 복제 서열, 게놈 통합 서열, 파아지 또는 뉴클레오티드 서열, 선형, 원형, 또는 슈퍼코일된(supercoiled), 단일- 또는 이중-가닥으로 된 DNA 또는 RNA일 수 있으며, 이때 다수의 뉴클레오티드 서열은 독창적인 구조로 결합 또는 재조합되는데, 이 구조는 프로모터 단편, 선택된 유전자 산물의 DNA 서열, 그리고 적절한 3'해독안된 서열을 을 세포 안으로 도입시킬 수 있다
이용될 수 있는 진핵 바이러스 벡터에는 아데노바이러스 벡터, 레트로바이러스 벡터, 아데노-연합된 바이러스 벡터, 자연두바이러스, 예컨대, 우두 바이러스 벡터, 바큘로바이러스 벡터, 또는 포진바이러스 벡터가 포함되나 이에 한정되지 않는다. 비-바이러스 벡터는 플라스미드, 리포좀, 전하를 띈 지질(사이토펙틴), DNA-단백질 복합체, 그리고생물중합체를 포함한다.
"클로닝 벡터"는 연속적으로 복제되고, 그리고 플라스미드, 파아지 또는 코스미드와 같은 복제 원점이 포함된 핵산의 단위 길이인, "레플리콘"를 지칭하는데, 또 다른 핵산 분절이 부착되어, 부착된 분절의 복제를 야기한다. 특정 클로닝 벡터는 한 가지 세포 유형, 예컨대, 박테리아 안에서 복제를 할 수 있으며, 그리고 예컨대, 또 다른 진핵 세포들 안에서 발현할 수 있다. 클로닝 벡터는 전형적으로 상기 벡터가 포함된 세포의 선별에 이용될 수 있는 하나 또는 그 이상의 서열 및/또는 관심 핵산 서열의 삽입을 위한 하나 또는 그 이상의 다중 클로닝 부위를 포함한다.
용어 "발현 벡터"는 숙주 세포 안으로 삽입된 후, 삽입된 핵산 서열이 발현될 수 있도록 기획된 운반체를 지칭한다. 상기 삽입된 핵산 서열은 앞서 논의된 바와 같이 조절 영역들과 작용가능하도록 연합되어 있다.
벡터는 당분야에 공지된 방법들, 예컨대, 형질감염, 전기천공, 현미주사, 형질유도, 세포 융합, DEAE 덱스트란, 인산칼슘염 침전, 리포펙션 (리소좀 융합), 유전자 총 이용, 또는 DNA 벡터 운송체(transporter)에 의해 숙주 세포 안으로 도입된다.
"배양물", "배양하다" 그리고 "배양하는"란 본 명세서에서 이용된 것과 같이, 세포의 성장 또는 분화를 허용하는, 또는 세포가 살아있는 상태로 유지되도록 하는 시험관내 조건하에서 세포들을 항온처리한다는 것을 의미한다. "배양된 세포들"란 본 명세서에서 이용된 것과 같이, 시험관내에서 증식된 세포들을 의미한다.
본 명세서에서 이용된 것과 같이, 용어 "폴리펩티드"는 단수 "폴리펩티드" 뿐만 아니라 복수개 "폴리펩티드들"를 포괄하며, 아미드 결합 (또한 펩티드 결합으로도 알려짐)에 의해 선형으로 연계된 단량체(아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩티드"는 2개 또는 그 이상의 아미노산 쇄 또는 쇄들을 지칭하며, 특정 길이의 산물을 지칭하지는 않는다. 따라서, 상기 "폴리펩티드" 정의에는 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질", "아미노산 쇄" 또는 2개 또는 그 이상의 아미노산의 쇄 또는 쇄들을 지칭하는데 이용된 임의의 다른 용어들이 포함되며, 용어 "폴리펩티드"는 이들 용어중 임의의 것과 호환되거나 대용될 수 있다. 용어 "폴리펩티드"는 상기 폴리펩티드의 발현 후 변형, 이를 테면, 당화, 아세틸화, 포스포릴화, 아미드화, 공지의 보호/차단기들에 의한 유도, 단백질분해성 절단, 또는 비-자연적으로 발생되는 아미노산에 의한 변형을 포함하나 이에 한정되지 않는 발현 후 변형된 산물을 또한 의도한다. 폴리펩티드는 자연 생물학적 원천으로부터 또는 생산된 재조합 기술로부터 유도될 수 있지만, 지정된 핵산 서열로부터 필연적으로 해독되지는 않는다. 화학적 합성을 포함하는 임의의 방식으로 만들어질 수 있다.
"단리된" 폴리펩티드 또는 이의 단편, 변이체, 또는 유도체는 이들 자연 환경에 존재하지 않는 폴리펩티드를 지칭한다. 특정 수준의 정제가 요구되지 않는다. 예를 들면, 단리된 폴리펩티드는 이의 고유 또는 자연 환경으로부터 간단히 제거될 수 있다. 고유한 또는 재조합 폴리펩티드들은 임의의 적합한 기술에 의해 분리된, 분별된(fractionated), 또는 부분적으로 또는 실질적으로 정제되었기 때문에, 재조합에 의해 생산된 폴리펩티드들과 숙주 세포 안에서 발현된 단백질들은 본 발명의 목적을 위하여 단리된 것으로 간주된다.
본 발명에는 폴리펩티드의 단편들 또는 변이체들, 그리고 이의 임의의 조합이 또한 포함된다. 본 발명의 폴리펩티드 결합 도메인 또는 결합 분자를 지칭할 때, 용어 "단편" 또는 "변이체"에는 성질(예컨대, FcRn 결합 도메인 또는 Fc 변이체에 대한 FcRn 결합 친화력, FVIII 변이체에 대한 응고 활성, 또는 기준 폴리펩티드의 상기 VWF 단편에 대한 FVIII 결합 활성)의 최소한 일부가 유지된 임의의 폴리펩티드가 포함된다. 폴리펩티드들의 단편들에는 본 명세서 도처에서 논의된 특이적 항체 단편들에 추가하여 단백질분해성 단편들, 뿐만 아니라 결손 단편들이 포함되지만, 그러나 자연적으로 발생되는 전장의 폴리펩티드 (또는 성숙한 폴리펩티드)가 포함되지는 않는다. 본 발명의 폴리펩티드 결합 도메인들 또는 결합 분자들의 변이체들은 앞서 논의된 단편들, 그리고 아미노산 치환들, 결손들, 또는 삽입들로 인하여 변경된 아미노산 서열을 가진 폴리펩티드들을 또한 포함한다. 변이체들은 자연적으로 또는 비-자연적으로 발생되는 것일 수 있다. 비-자연적으로 발생되는 변이체들은 당분야에 공지된 돌연변이생성 기술을 이용하여 만들어질 수 있다. 변이체 폴리펩티드들은 보존적 또는 비-보존적 아미노산 치환들, 결손들 또는 추가들을 포함할 수 있다.
본 명세서에서 이용된 용어 "VWF 단편" 또는 "VWF 단편들"는 FVIII와 상호작용하고, 그리고 전장 VWF에 의해 FVIII에 정상적으로 제공되는 최소한 하나의 또는 그 이상의 성질들, 예컨대 FVIIIa에 대한 미숙한 활성화를 방지하고, 미성숙 단백질가수분해를 방지하고, 미성숙 제거로 이어질 수 있는 인지질 막과의 연합을 방지하고, 네이키드(naked) FVIII에는 결합할 수 있지만, VWF-결합된 FVIII에는 결합하지 못하는 FVIII 제거 수용체들에 결합을 방지하고, 및/또는 상기 FVIII 중쇄와 경쇄 상호작용을 안정화시키는, 임의의 VWF 단편들을 의미한다. 용어 "VWF 단편"는 본 명세서에서 이용된 것과 같이, 전장의 또는 성숙한 VWF 단백질을 포함하지 않는다. 특정 구체예에 있어서, 상기 "VWF 단편"는 본 명세서에서 이용된 것과 같이 상기 VWF 단백질의 D' 도메인과 D3 도메인을 포함하지만, 상기 VWF 단백질의 A1 도메인, A2 도메인, A3 도메인, D4 도메인, B1 도메인, B2 도메인, B3 도메인, C1 도메인, C2 도메인, 그리고 CK 도메인을 포함하지 않는다.
용어 "반감기 제한 인자" 또는 "FVIII 반감기 제한 인자"는 본 명세서에서 이용된 것과 같이 야생형 FVIII과 비교하여, 상기 FVIII의 단백질의 반감기가 1.5배 또는 2배 이상 더 연장되는 것을 방지하는 인자를 나타난다(예컨대 ADVATE® 또는 REFACTO®). 예를 들면, 전장의 또는 성숙한 VWF는 하나 또는 그 이상의 VWF 제거 경로들을 통하여 상기 FVIII와 VWF 복합체가 시스템으로부터 제거되는 것을 유도하는 FVIII 반감기 제한 인자로 작용할 수 있다. 한 실시예에서, 내생성 VWF는 FVIII 반감기 제한 인자다. 또 다른 실시예에서, FVIII 단백질에 비-공유적으로 결합된 전장의 재조합 VWF 분자는 FVIII-반감기 제한 인자다.
용어 "내생성 VWF"는 본 명세서에서 이용된 것과 같이 혈장 안에 자연적으로 존재하는 VWF를 지칭한다. 상기 내생성 VWF 분자는 다량체일 수 있지만, 단량체 또는 이량체일 수 있다. 혈장 안의 내생성 VWF는 FVIII에 결합되어, FVIII와 함께 비-공유 복합체를 형성한다.
"보존적 아미노산 치환"는 한 아미노산 잔기가 유사한 측쇄를 보유하는 아미노산 잔기로 대체된 것이다. 유사한 측쇄들을 갖는 아미노산 잔기 패밀리는 염기성 측쇄들 (예컨대, 리신, 아르기닌, 히스티딘), 산성 측쇄들 (예컨대, 아스파르트산, 글루타민산), 하전을 띄지 않는 극성 측쇄들 (예컨대, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄들 (예컨대, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지화된 측쇄들 (예컨대, 트레오닌, 발린, 이소류신) 그리고 방향족 측쇄들 (예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함하여, 이는 당분야에서 정의되어 있다. 따라서, 폴리펩티드 안의 한 아미노산이 동일한 측쇄 패밀리에 속하는 또 다른 아미노산으로 대체되는 경우, 상기 치환은 보존적 치환으로 간주된다. 또 다른 구체예에서, 아미노산들의 띠(string)는 구조적으로 유사하지만 배열 순서가 상이한 및/또는 측쇄 패밀리 구성원들의 조성이 상이한 구조적으로 유사한 띠로 보존적으로 대체될 수 있다.
당분야에 공지된 것과 같이, 두 폴리펩티드 간에 "서열 동일성(identity)"는 제 1 폴리펩티드의 아미노산 서열을 제2 폴리펩티드의 서열에 비교함으로써 결정된다. 본 명세서에서 논의된 바와 같이, 임의의 특정 폴리펩티드가 또 다른 폴리펩티드에 최소한 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 지의 판단은 당분야에 공지된 방법들과 컴퓨터 프로그램/소프트웨어, 상기 BESTFIT 프로그램 (Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711)을 포함하나 이에 한정되지 않은 것들에 의해 결정된다. BESTFIT는 두 서열 사이의 최고의 상동 분절(segment)을 찾기 위하여 Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)의 국소 상동성 알고리즘을 이용한다. 본 발명에 따라 특정 서열이 기준 서열에 대하여 예를 들면, 95% 동일한 지를 판단하기 위하여, BESTFIT 또는 임의의 다른 서열 배열 프로그램이 이용될 때, 동일성 비율은 기준 폴리펩티드 서열 전장에 걸쳐 계산되며, 그리고 기준 서열내 총 아미노산 수의 최대 5%까지 상동성 갭(gap)이 허용되도록, 매개변수들이 설정된다.
본 명세서에서 이용된 것과 같이, VWF 서열 또는 FVIII 단백질 서열 안에서 "~에 대응하는 아미노산" 또는 "등가의(equivalent) 아미노산"는 제 1 VWF 또는 FVIII 서열과 제 2 VWF 또는 FVIII 서열 간에 동일성 또는 유사성이 최대가 되도록 배열함으로써 확인된다. 제 2 VWF 또는 FVIII 서열 안에서 등가의 아미노산을 식별하는데 이용되는 수는 상기 제 1 VWF 또는 FVIII 서열 안에서 대응하는 아미노산을 식별하는데 이용되는 수에 기초한다.
"융합" 또는 "키메라" 단백질은 제 2 아미노산에 연계된 제 1 아미노산을 포함하는데, 이들은 사실상 자연적으로 연계되지 않는다. 별도의 단백질들에 정상적으로 존재하는 아미노산 서열이 융합 폴리펩티드 안에 함께 있을 수 있으며, 또는 동일한 단백질에 정상적으로 존재하는 아미노산 서열이 융합 폴리펩티드 안에 새로운 배열로 대체될 수 있는데, 예컨대, 본 발명의 인자 VIII 도메인과 면역글로불린 Fc 도메인의 융합. 융합 단백질은 예를 들면, 화학적 합성, 또는 폴리뉴클레오티드의 창조 및 해독에 의해 융합 단백질이 만들어지는데, 이때 펩티드 영역들은 원하는 방식의 상관관계에서 인코드된다. 키메라 단백질은 공유, 비-펩티드 결합 또는 비-공유 결합에 의해 상기 제 1 아미노산 서열에 연합된 제 2 아미노산 서열을 더 포함할 수 있다.
본 명세서에서 이용된 것과 같이, 용어 "반감기(half-life)"는 생체내 특정 폴리펩티드의 생물학적 반감기를 지칭한다. 반감기는 대상에게 투여된 양의 절반이 상기 동물의 순환계 및/또는 다른 조직으로부터 제거되는데 필요한 시간으로 나타낼 수 있다. 주어진 폴리펩티드의 제거 곡선이 시간에 대한 함수로 구축될 때, 상기 곡선은 통상 신속한 α-단계(phase)와 더 오래 지속되는 β-단계로 된 이중상이다. 상기 α-국면은 전형적으로 혈관-내 그리고 혈관-외 공간 사이에 투여된 Fc 폴리펩티드의 평형을 나타내고, 그리고 상기 폴리펩티드의 크기에 의해 부분적으로 결정된다. 상기 β-국면은 전형적으로 혈관-내 공간에서 상기 폴리펩티드의 분해대사를 나타낸다. 일부 구체예들에 있어서, FVIII와 FVIII를 포함하는 키메라 단백질들은 단일국면이고, 따라서 알파 국면을 갖지 않고 단일 베타 국면만을 보유한다. 따라서, 특정 구체예들에 있어서, 용어 반감기는 본 명세서에서 이용된 것과 같이, β-상에 있는 상기 폴리펩티드의 반감기를 지칭한다. 인간에게서 인간 항체의 전형적인 β 국면 반감기는 21 일이다.
폴리뉴클레오티드 또는 폴리펩티드에 적용되는 용어 "이종기원(heterologous)"란 상기 폴리뉴클레오티드 또는 폴리펩티드가 비교되는 실체와는 별개의 실체로부터 유도됨을 의미한다. 따라서, VWF 단편에 연계된 이종기원의 폴리펩티드란 VWF 단편에 연계되어 있고, 상기 VWF 단편의 자연적으로 발생되는 부분이 아닌, 폴리펩티드 쇄를 의미한다. 예를 들면, 이종기원의 폴리뉴클레오티드 또는 항원은 상이한 종, 개체의 상이한 세포 유형, 또는 별개의 개체의 동일한 또는 상이한 유형으로부터 유도될 수 있다.
용어 "연계된(linked)"란 본 명세서에서 이용된 것과 같이, 제 2 아미노산 서열 또는 뉴클레오티드 서열에 각각 공유적으로 또는 비-공유적으로 연결된 제 1 아미노산 서열 또는 뉴클레오티드 서열을 지칭한다. 용어 "공유적으로 연계된" 또는 "공유 연계(linkage)"는 서로 연계된 두 모이어티 사이에 공유 결합, 예컨대 이황화결합, 펩티드 결합, 또는 하나 또는 그 이상의 아미노산, 예컨대 링커를 지칭한다. 상기 제 1 아미노산 또는 뉴클레오티드 서열은 상기 제 2 아미노산 또는 뉴클레오티드 서열에 직접적으로 연결되거나 또는 병치되며(juxtaposed) 또는 대안으로 개재(intervening) 서열에 의해 상기 제 1서열이 제 2 서열에 공유적으로 연결될 수 있다. 용어 "연계된"란 상기 C-말단 또는 N-말단에서 제 2 아미노산 서열에 제 1 아미노산 서열의 융합 뿐만 아니라, 전체 제 1 아미노산 서열 (또는 상기 제 2 아미노산 서열)이 상기 제 2 아미노산 서열 (또는 상기 제 1아미노산 서열, 각각)의 임의의 2개 아미노산으로 삽입된 것이 또한 포함된다. 한 구체예에서, 상기 제 1 아미노산 서열은 펩티드 결합 또는 링커에 의해 제 2 아미노산 서열에 연결될 수 있다 상기 제 1 뉴클레오티드 서열은 포스포디에스테르 결합 또는 링커에 의해 제 2 뉴클레오티드 서열에 연결될 수 있다. 상기 링커는 펩티드 또는 폴리펩티드 (폴리펩티드 쇄의 경우) 또는 뉴클레오티드 또는 뉴클레오티드 쇄 (뉴클레오티드 쇄의 경우) 또는 임의의 화학적 모이어티 (폴리펩티드와 폴리뉴클레오티드 쇄 모두의 경우)일 수 있다. 상기 공유 연계는 때로 (-) 또는 하이폰(hyphen)으로 나타낸다.
본 명세서에서 이용된 것과 같이, 용어 "~와 연합된(associated with)"란 제 1 아미노산 쇄와 제 2 아미노산 쇄 사이에 형성된 공유 또는 비-공유 결합을 지칭한다. 한 구체예에서, 용어 "~와 연합된"란 공유, 비-펩티드 결합 또는 비-공유 결합을 말한다. 일부 구체예들에 있어서, 상기 연합은 콜론, 예컨대, (:)으로 나타낸다. 또 다른 구체예에서, 연합은펩티드 결합을 제외한 공유 결합을 의미한다. 또 다른 구체예들에 있어서, 용어 "공유적으로 연합된"란 본 명세서에서 이용된 것과 같이, 공유 결합, 예컨대 이황화결합, 펩티드 결합, 또는 하나 또는 그 이상의 아미노산 (예컨대 링커)에 의해 2개의 모이어티 사이의 연합을 의미한다. 예를 들면, 아미노산 시스테인은 제 2 시스테인 잔기 상의 티올 기와 이황화결합 또는 다리를 형성할 수 있는 티올기를 포함한다. 대부분의 자연적으로 발생되는 IgG 분자들에 있어서, 상기 CH1 영역과 CL 영역은 이황화결합에 의해 연합되며, 두 개의 중쇄는 Kabat 넘버링 시스템 (위치 226 또는 229, EU 넘버링 시스템)에 따른 239와 242에 상응하는 위치에서 2개의 이황화결합에 의해 연합된다. 공유 결합의 실시예로는 펩티드 결합, 금속 결합, 수소 결합, 이황화결합, 시그마 결합, 파이(pi) 결합, 델타 결합, 글리코시드 결합, 어그노스틱(agnostic) 결합, 굽은(bent) 결합, 양극성 결합, Pi 백(back)결합, 이중 결합, 삼중 결합, 사중 결합, 5중 결합, 6중 결합, 접합(conjugation), 과접합(hyperconjugation), 방향성, 촉각성(hapticity), 또는 항결합(antibonding)을 포함하나 이에 한정되지 않는다. 비-공유 결합의 비-제한적 실시예로는 이온 결합 (예컨대 양이온-파이(pi) 결합 또는 염 결합), 금속 결합, 수소 결합 (예컨대 이중수소 결합, 이중수소 복합체, 낮은-방벽(low-barrier) 수소 결합, 또는 대칭 수소 결합), 반데르 발스 힘, London 분산력, 기계적인 결합, 할로겐 결합, 친금성(aurophilicity), 삽입(intercalation), 스태킹(stacking), 엔트로피 힘, 또는 화학적 극성(polarity)을 포함한다.
본 명세서에서 이용된 용어 "단량체-이량체 하이브리드"란 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄가 서로 이황화결합에 의해 연합되어 있는 제 1 폴리펩티드 쇄와 제 2 폴리펩티드가 포함된 키메라 단백질을 지칭하는데, 상기 제 1 쇄는 응고인자, 예컨대 인자 VIII, 그리고 Fc 영역을 포함하고, 상기 제 2 쇄는 응고 인자없이 Fc 영역을 포함하는, Fc 영역으로 필수적으로 구성된 또는 Fc 영역으로 구성된다. 상기 단량체-이량체 하이브리드 구조체는 따라서 오직 한 개의 응고인자를 갖는 단량체 양태와 2개의 Fc 영역을 갖는 이량체 양태가 포함된 하이브리드다.
본 명세서에서 이용된 것과 같이, 용어 "절단 부위" 또는 "효소적 절단 부위"는 효소에 의해 인지되는 부위를 지칭한다. 특정 효소적 절단 부위들은 세포내 가공 부위를 포함한다. 한 구체예에서, 폴리펩티드는 응고 단계 동안 활성화되는 효소에 의해 절단되는 효소 절단 부위를 갖고, 이러한 부위들의 절단은 응고 덩어리가 형성되는 부위에서 일어난다. 이러한 부위들의 예로는 예컨대 트롬빈, 인자 XIa 또는 인자 Xa에 의해 인지되는 부위들이다. 예시적인 FXIa 절단 부위들은 예컨대, TQSFNDFTR (서열 번호: 47)과 SVSQTSKLTR (서열 번호: 48)을 포함한다. 예시적인 트롬빈 절단 부위들은 예컨대, DFLAEGGGVR (서열 번호: 49), TTKIKPR (서열 번호: 50), LVPRG (서열 번호: 55) 그리고 ALRPR (서열 번호: 51의 아미노산 1 내지 5)을 포함한다. 당분야에는 다른 효소적 절단 부위들이 공지되어 있다.
본 명세서에서 이용된 것과 같이, 용어 "가공 부위(processing site)" 또는 "세포내 가공 부위(intracellular processing site)"는 상기 폴리펩티드 해독 이후 기능을 하는 효소를 표적으로 하는 폴리펩티드 내 효소 절단 부위를 지칭한다. 한 구체예에서, 이러한 효소들은 골지(Golgi) 관강으로부터 트란스-골지(Golgi) 격실로 운반되는 동안 기능을 한다. 세포내 가공 효소들은 세포로부터 상기 단백질의 분비에 앞서 폴리펩티드들을 절단한다. 이러한 가공 부위들의 실시예로는 예컨대 엔도펩티다제의 PACE/퓨린 (이때 PACE는 쌍을 이룬 염기성 아미노산 절단 효소의 축약형이다) 패밀리가 표적으로 하는 것들이 포함된다. 이들 효소는 상기 Golgi 막에 국소화되어 있고, 서열 모티프 Arg-[임의의 잔기]-(Lys 또는 Arg)-Arg의 카르복시 말단에서 단백질들을 절단한다. 본 명세서에서 이용된 것과 같이, "퓨린" 효소 패밀리는 예컨대 PCSK1 (또한 PC1/Pc3로도 공지됨), PCSK2 (또한 PC2로도 공지됨), PCSK3 (또한 퓨린 또는 PACE로도 공지됨), PCSK4 (또한 PC4로도 공지됨), PCSK5 (또한 PC5 또는 PC6으로도 공지됨), PCSK6 (또한 PACE4로도 공지됨), 또는 PCSK7 (또한 PC7/LPC, PC8, 또는 SPC7로도 공지됨)을 포함한다. 본 기술분야에는 다른 가공 부위들이 공지되어 있다.
용어 "퓨린"는 EC No. 3.4.21.75에 상응하는 효소들을 지칭한다. 퓨린은 서브틸리신-유사 프로프로테인 전환효소로써, 또한 PACE (P쌍을 이룬 염기성 A아미노산 C절단 E효소로도 공지됨). 퓨린은 비활성 전구체 단백질들의 일부분을 결실시켜, 이들을 생물학적으로 활성 단백질로 전환시킨다. 프로-펩티드의 세포내 운반 동안, 프로-펩티드는 골지 안의 퓨린 효소에 의해 성숙한 VWF로부터 절단된다.
하나 이상의 가공 또는 절단 부위를 포함하는 구조체에 있어서, 이러한 부위들은 동일하거나 또는 상이할 수 있음을 인지할 것이다.
본 명세서에서 이용된 것과 같이, 지혈 장애는 피브린 덩어리를 형성하는 능력이 손상되거나 또는 형성 불능으로 인하여 자발적으로 또는 외상의 결과로 대량 출혈을 특징으로 하는 유전적으로 계승된 또는 후천적으로 획득된 상태를 의미한다. 이러한 장애의 예로는 혈우병이 포함된다. 혈우병 A (인자 VIII 결핍), 혈우병 B (인자 IX 결핍 또는 "Christmas 질환") 그리고 혈우병 C (인자 XI 결핍, 가벼운 출혈 경향)의 3 가지 주요 형태가 있다. 다른 지혈 장애로는 예컨대 폰 빌레브란트 질환, 인자 XI 결핍 (PTA 결핍), 인자 XII 결핍, 피브리노겐의 결핍 또는 구조적 비정상, 프로트롬빈, 인자 V, 인자 VII, 인자 X 또는 인자 XIII, GPIb의 결함 또는 결핍인 Bernard-Soulier 증후군이 포함된다. VWF의 수용체인 GPIb는 불완전할 수 있고, 이는 1차 덩어리 형성 (1차 지혈)의 부족 및 출혈 증가, Glanzman와 Naegeli의 혈소판무력증 (Glanzmann 혈소판무력증)으로 이어질 수 있다. 간 부전(급성 및 만성 형태)에서, 간에 의해 응고 인자가 불충분하게 생성되고, 이로 인하여 출혈위험이 증가될 수 있다.
본 발명의 상기 키메라 분자들이 예방적으로 이용될 수 있다. 본 명세서에서 이용된 것과 같이, 용어 "예방적 처치(prophylactic treatment)"는 출혈 사건에 앞서 분자를 투여하는 것을말한다. 한 구체예에서, 일반 지혈 물질을 필요로 하는 대상은 외과술을 받고 있거나, 또는 받을 예정이다. 본 발명의 상기 키메라 단백질은 예방용으로 수술에 앞서 또는 수술 후에 투여될 수 있다. 본 발명의 상기 키메라 단백질은 급성 출혈 사건을 관리하기 위하여 수술하는 동안 또는 수술 후에 투여될 수 있다. 상기 외과술은 간 이식, 간 절제, 치과 과정 또는 줄기 세포 이식을 포함할 수 있으나, 이에 국한되지 않는다.
본 발명의 상기 키메라 단백질은 또한 요청에 의한(on-demand) (또한 "일시적(episodic)"이라고도 함) 처치에 이용된다. 용어 "요청에 의한 처치(on-demand treatment)" 또는 "일시적 처치(episodic treatment)"는 출혈 사건의 증상에 반응하여 또는 출혈을 야기하는 활동에 앞서 키메라 분자를 투여하는 것을 지칭한다. 한 측면에서, 상기 요청에 의한 (일시적) 처치는 가령, 손상 이후 또는 출혈이 예상되는, 가령, 외과수술에 앞서 출혈이 시작될 때 대상에게 제공될 수 있다. 또 다른 측면에서, 상기 요청에 의한 처치는 출혈 위험이 증가되는 활동, 가령, 접촉 스포츠를 하기 전에 제공될 수 있다.
본 명세서에서 이용된 것과 같이, 용어 "급성 출혈"는 잠재적 원인에 관계없이 출혈 사건을 지칭한다. 예를 들면, 대상은 외상, 요독증, 유전적 출혈 장애 (예컨대 인자 VII 결핍) 혈소판 장애, 또는 응고 인자에 대한 항체 발생으로 인한 저항성을 가지고 있을 수 있다.
본 명세서에서 이용된 것과 같이, 처치하다, 처치, 처치하는 것이란 예컨대 질환 또는 상태(condition)의 심각성 감소; 질환 과정의 기간 감소; 질환 또는 상태와 연합된 하나 또는 그 이상의 징후 개선; 상기 질환 또는 상태의 필수적인 치료없이 질환 또는 상태에 있는 대상에게 유익한 영향을 제공, 또는 질환 또는 상태와 연합된 하나 또는 그 이상의 징후의 예방을 지칭한다. 또 다른 구체예에서, 처치하는 또는 처치는 본 발명의 키메라 단백질 또는 VWF 단편을 투여함으로써, 대상내 FVIII의 대략 수준을 최소한 약 1 IU/dL, 2 IU/dL, 3 IU/dL, 4 IU/dL, 5 IU/dL, 6 IU/dL, 7 IU/dL, 8 IU/dL, 9 IU/dL, 10 IU/dL, 11 IU/dL, 12 IU/dL, 13 IU/dL, 14 IU/dL, 15 IU/dL, 16 IU/dL, 17 IU/dL, 18 IU/dL, 19 IU/dL, 또는 20 IU/dL의 수준으로 유지한다는 것을 의미한다. 또 다른 구체예에서, 처치하는 또는 처치는 약 1 내지 약 20 IU/dL, 약 2 내지 약 20 IU/dL, 약 3 내지 약 20 IU/dL, 약 4 내지 약 20 IU/dL, 약 5 내지 약 20 IU/dL, 약 6 내지 약 20 IU/dL, 약 7 내지 약 20 IU/dL, 약 8 내지 약 20 IU/dL, 약 9 내지 약 20 IU/dL, 또는 약 10 내지 약 20 IU/dL 사이의 FVIII의 대략 수준으로 유지한다는 것을 의미한다. 질환 또는 상태를 처치 또는 처치한다는 것은 비-혈우병 대상에서 상기 FVIII 활성을 최소한 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 또는 20%에 필적하는 수준으로 대상에서 FVIII 활성을 유지하는 것을 포함할 수 있다. 처치에 요구되는 대략적 최저 수준은 하나 또는 그 이상의 공지된 방법에의해 측정될 수 있으며, 각 개인에 따라 조정(증가 또는 감소)될 수 있다.
키메라 단백질들
본 발명은 생체내 FVIII 반감기 제한 인자 (예컨대 내생성 VWF)가 상기 FVIII 단백질에 연합되는 것을 방지 또는 저해함으로써, 인자 VIII 단백질의 반감기를 연장시키는 것에 관계한다. 내생성 VWF는 비-공유 복합체들에서 약 95% 내지 98% FVIII에 연합된다. FVIII 단백질에 결합된 내생성 VWF들은 다양한 방식으로 FVIII를 보호하는 것으로 알려져 있다. 예를 들면, 전장의 VWF (약 250 kDa를 갖는 다량체로써)는 프로테아제 절단 및 FVIII 활성화로부터 FVIII를 보호할 수 있고, 상기 FVIII 중쇄 및/또는 경쇄를 안정화시킬 수 있고, 그리고 소거 수용체들에 의한 FVIII 제거를 방지할 수 있다. 그러나, 동시에, 내생성 VWF는 음세포작용(pinocytosis)을 방지하고, 그리고 상기 VWF 제거 경로를 통하여 시스템으로부터 FVIII-VWF 복합체를 제거함으로써, 상기 FVIII 반감기를 제한한다. 실시예들에서 나타낸 것과 같이, 내생성 VWF는 반감기 증량제에 융합된 상기 FVIII의 단백질의 반감기가 야생형 FVIII 보다 약 2배 이상 더 길어지는 것을 방지하는 반감기-제한 인자로 보인다. 따라서, 본 발명은 부속 모이어티를 이용하여 내생성 VWF와 FVIII 단백질 사이에 상호작용을 방지 또는 저해하고, 이로 인하여 상기 VWF 제거 경로를 통하여 상기 FVIII 단백질이 제거되는 것을 방지 및/또는 음세포작용을 유도한다. 한 구체예에서, 상기 부속 모이어티는 상기 FVIII 단백질이 내생성 VWF에 결합하는 것을 방지 또는 저해할 수 있으며, 최소한 하나의 VWF-유사 FVIII 보호 특성을 갖는다. 또한, 상기 부속 모이어티는 내생성 VWF와의 상호작용을 방지 또는 저해함으로써, 이 시스템으로부터 FVIII 제거를 감소시킨다. 본 발명의 상기 부속 모이어티들은 FVIII 단백질에 결합 또는 연합(예컨대 비-공유 결합을 통하여)하고, 및/또는 상기 FVIII 단백질 상에서 VWF 결합 부위를 물리적 또는 화학적으로 차단시킨다. 따라서 상기 부속 모이어티에 연합된 상기 FVIII 단백질은 야생형 FVIII 또는 부속 모이어티가 연합되지 않은 FVIII와 비교하였을 때, 하나 또는 그 이상의 VWF 제거 수용체들에 의해 순환계로부터 좀더 서서히 제거된다.
본 발명의 상기 부속 모이어티들의 실시예로는 예컨대 폴리펩티드들 또는 상기 FVIII 단백질의 화학적 또는 물리적 변형, 추가들, 결손들, 또는 변이들이 포함된다. 본 발명에 유용한 상기 부속 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함할 수 있다. 상기 부속 모이어티로 유용한 폴리펩티드의 비-제한적 실시예로는 예컨대 본 명세서에서 설명된 VWF 단편, 면역글로불린 불변 영역 또는 이의 일부분, 트란스페린 또는 이의 단편, 알부민 또는 이의 단편, 알부민 결합 모이어티, HAP 서열, PAS 서열, 또는 이의 임의의 조합들이 포함된다. 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합이 포함된다. 본 발명에서 유용한 다른 모이어티들은 당업계에 공지되어 있다.
한 구체예에서, 상기 부속 모이어티는 공유 또는 비-공유 결합에 의해 상기 FVIII 단백질에 연합(또는 연계)된다. 그러나, 일부 경우들에 있어서, 상기 부속 모이어티와 상기 FVIII 단백질 사이의 물리적 차단 또는 화학적 연합 (예컨대 비-공유 결합)은 내생성 VWF 존재하에 상기 FVIII 단백질과 상기 부속 모이어티가 포함된 안정적 복합체를 제공할 정도로 강력하지 않을 수 있다. 예를 들면, 임의의 다른 연결없이 FVIII 단백질과 비-공유 결합을 형성하는 VWF 단편은 상기 VWF 단편 (예컨대 재조합 VWF, 예컨대, rVWF)이 내생성 VWF로 대체됨으로써, 생체내에서 내생성 VWF 존재하에 상기 FVIII 단백질로부터 용이하게 해리될 수 있다. 따라서, 내생성 VWF에 비-공유적으로 결합된 상기 FVIII 단백질은 상기 VWF 제거 경로를 거치게 될 것이며, 상기 시스템으로부터 제거될 것이다. 상기 부속 모이어티와 상기 FVIII 단백질의 분리를 방지하기 위하여, 일부 구체예들에 있어서, 상기 FVIII 단백질과 부속 모이어티 사이의 연계는 공유 결합, 예컨대 펩티드 결합, 하나 또는 그 이상의 아미노산, 또는 이황화결합이 존재한다. 특정 구체예들에 있어서, 상기 부속 모이어티와 상기 FVIII 단백질 사이의 연합 (예컨대, 연계)은 상기 FVIII 단백질과 상기 부속 모이어티 사이의 펩티드 결합이거나 또는 링커 ("FVIII/AM 링커")다. 상기 링커의 비-제한적 실시예는 본 명세서 도처에서 공개된다. 일부 구체예들에 있어서, 상기 부속 모이어티는 최소한 약 10개, 100개, 200개, 300개, 400개, 500개, 600개, 700개, 800개, 900개, 1000개, 1100개, 1200개, 1300개, 1400개, 1500개, 1600개, 1700개, 1800개, 1900개, 2000개, 2500개, 3000개, 또는 4000개의 아미노산을 포함하는, 필수적으로 구성된 또는 구성된 폴리펩티드다. 또 다른 구체예들에 있어서, 상기 부속 모이어티는 약 100 내지 약 200개 아미노산, 약 200 내지 약 300개 아미노산, 약 300 내지 약 400개 아미노산, 약 400 내지 약 500개 아미노산, 약 500 내지 약 600개 아미노산, 약 600 내지 약 700개 아미노산, 약 700 내지 약 800개 아미노산, 약 800 내지 약 900개 아미노산, 또는 약 900 내지 약 1000개의 아미노산을 포함하는, 필수적으로 구성된 또는 구성된 폴리펩티드다. 일부 구체예들에 있어서, 상기 FVIII 단백질과 공유적으로 연합된 상기 부속 모이어티는 본 명세서의 도처에서 설명된 VWF 단편이다.
특정 구체예들에 있어서, 상기 부속 모이어티는 FVIII 단백질 상의 하나 또는 그 이상의 VWF 결합 부위에 화학적(예컨대 비-공유적)으로 결합하거나 또는 이 부위를 물리적으로 차단한다. FVIII 단백질 상의 상기 VWF 결합 부위는 상기 FVIII 단백질의 A3 도메인 또는 C2 도메인 안에 위치한다. 여전히 다른 구체예들에 있어서, FVIII 단백질 상의 상기 VWF 결합 부위는 상기 A3 도메인과 C2 도메인 안에 위치한다. 예를 들면, FVIII 단백질 상의 상기 VWF 결합 부위는 서열 번호:16[전장 성숙한 FVIII]의 아미노산 1669 내지 1689 및/또는 2303 내지 2332에 상응할 수 있다.
또 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 부속 모이어티에 연계된 FVIII 단백질을 포함하고, 이때 상기 부속 모이어티는 VWF 분자, 예컨대 D' 도메인과 D3 도메인이 포함되지만, 상기 VWF제거 수용체 결합 부위는 포함되지 않은 VWF 단편이며, 그리고 상기 FVIII 단백질 상에서 상기 VWF 결합 부위를 차폐 또는 차단시키고, 이로 인하여 상기 FVIII 단백질과 내생성 VWF의 상호작용이 방지 또는 저해된다. 특정 구체예들에 있어서, 상기 부속 모이어티는 VWF 단편이다. 본 발명에 유용한 상기 VWF 단편은 상기 D' 도메인 및 상기 D3 도메인을 포함하고, 상기 FVIII 단백질에 대한 하나 또는 그 이상의 VWF-유사 특성을 여전히 제공하지만, 상기 VWF 단편은 상기 VWF 제거 경로를 겪지는 않는다. 상기 FVIII 단백질과 상기 부속 모이어티는 링커 (예컨대 FVIII/AM 링커)에 의해 공유적으로 연합될 수 있다. 한 구체예에서, 상기 링크는 절단가능한 링커일 수 있다. 링커들의 비-제한적 예들은 본 명세서 도처에서 공개된다.
여전히 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 FVIII 단백질과 면역글로불린 불변 영역 또는 이의 일부분 (예컨대, 부속 모이어티)을 포함하고, 이때 상기 면역글로불린 불변 영역 또는 이의 일부분은 상기 FVIII 단백질 상에서 상기 VWF 결합 부위를 차폐 또는 보호하고, 이로 인하여 상기 FVIII 단백질과 내생성 VWF의 상호작용이 저해 또는 방지된다. 여전히 다른 구체예들에 있어서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 Fc 영역이다.
한 측면에서, 본 발명은 본 명세서에서 공개된 하나 또는 그 이상의 상기 VWF 단편들이 포함된 키메라 또는 융합 단백질 또는 하이브리드 그리고 이의 용도에 관계된다. 상기 키메라 또는 융합 단백질은 하나 또는 그 이상의 이종기원(일부 경우 본 명세서에서 H 또는 H1으로 지칭됨)의 모이어티에 융합 또는 연계될 수 있다. 한 구체예에서, 상기 이종기원의 모이어티 (H1)는 자연적으로 발생되지 않는 및/또는 이종기원의 펩티드 또는 이종기원의 폴리펩티드이고 및/또는 상기 VWF 단편에 연계된다. 또 다른 구체예에서, 상기 이종기원의 모이어티 (H1)는 비-폴리펩티드 모이어티, 예컨대 화학적 변형 또는 펩티드 또는 폴리펩티드와 비-폴리펩티드 모이어티의 조합이다. 일부 구체예들에 있어서, 상기 VWF 단편들은 링커(또한 명세서에서 "VWF 링커"로 지칭되기도 함)에 의해 상기 이종기원의 모이어티 (H1)에 연계 또는 연결된다. 한 구체예에서, 상기 VWF 링커는 절단가능한 링커다. 상기 VWF 단편과 이종기원의 모이어티 (H1) 사이의 상기 링커의 비-제한적 예들은 본 명세서 도처에 공개된다.
한 구체예에서, 본 발명에 유용한 상기 이종기원의 모이어티 (H1)는 상기 VWF 단편들의 생물학적 활성 또는 기능 (예컨대, FVIII 단백질에 결합 또는 연합)에 상당한 영향을 주지 않으면서, 상기 VWF 단편들의 하나 또는 그 이상의 약동학 성질을 개선시킨다. 또 다른 구체예에서, 상기 VWF 단편에 연계된 상기 이종기원의 모이어티 (H1)는 VWF 단편들의 반감기를 연장시킬 수 있다. 상기 이종기원의 폴리펩티드 모이어티의 비-제한적 예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 이종기원의 비-폴리펩티드 모이어티의 비-제한적 예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함한다.
일부 구체예들에 있어서, 이종기원의 모이어티 (H1)는 공유 결합에 의해 상기 VWF 단편과 FVIII 단백질을 연결시키는데 이용될 수 있다. 상기 공유적 연계를 제공할 수 있는 상기 이종기원의 모이어티의 예로는 면역글로불린 불변 영역 또는 힌지 영역, 예컨대 Fc 영역 또는 FcRn 결합 짝이 포함된 이의 일부분이 포함되나 이에 국한되지 않는다. 특정 실시예에 있어서, 상기 FVIII 단백질은 제 1 Fc 영역에 연계되며, 상기 VWF 단편은 제 2 Fc 영역에 연계되며, 이때 상기 제 1Fc 영역과 제 2 Fc 영역은 하나 또는 그 이상의 이황화결합을 형성한다.
일부 구체예들에 있어서, 상기 이종기원의 모이어티 (본 명세서에서 때로 "H" 또는 "H1"로 지칭됨)는 면역글로불린 불변 영역 또는 이의 일부분이다. 상기 면역글로불린 불변 영역 또는 이의 일부분의 비-제한적 예들은 CH1 도메인, CH2 도메인, CH3 도메인, CH4 도메인, 힌지 도메인, 그리고 이의 2개 또는 그 이상의 조합으로 구성된 군으로부터 선택될 수 있다. 한 구체예에서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 최소한 하나의 CH1 도메인, 최소한 하나의 CH2 도메인, 최소한 하나의 CH3 도메인, 최소한 하나의 CH4 도메인, 또는 이의 기능적 단편들을 포함한다. 또 다른 구체예에서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 최소한 하나의 힌지 도메인 또는 이의 일부분 그리고 최소한 하나의 CH2 도메인 또는 이의 일부분을 포함한다 (예컨대 힌지-CH2 방향에서). 또 다른 구체예들에 있어서, 상기 면역글로불린 불변 도메인 또는 이의 일부분은 최소한 하나의 CH2 도메인 또는 이의 일부분 그리고 최소한 하나의 CH3 도메인 또는 이의 일부분을 포함한다 (예컨대 상기 CH2-CH3 방향에서). 상기 조합의 예로는 CH2 도메인, CH3 도메인, 그리고 힌지 도메인을 포함하나, 이에 한정되지 않으면, 이들은 Fc 영역 (도는 Fc 도메인) 예컨대 제 1 Fc 영역으로 또한 공지되어 있다. 또 다른 구체예들에 있어서, 상기 이종기원의 모이어티 (H1)는 링커에 의해 상기 VWF 단편에 연계된다. 특정 구체예들에 있어서, 상기 이종기원의 모이어티 (H1)는 본 명세서의 도처에서 공개된 FcRn 결합 짝이다. 또 다른 구체예들에 있어서, 상기 이종기원의 모이어티 (H1)는 힌지 영역이다.
특정 구체예들에 있어서, 상기 키메라 단백질은 제 2 (또는 추가적인) 이종기원의 모이어티 (본 명세서에서 때로 "H2"로 나타냄)를 더 포함한다. 상기 제 1 이종기원의 모이어티 (H1)와 제 2 이종기원의 모이어티 (H2)는 호환이용될 수 있으며, 동일하거나 또는 상이할 수 있다. 상기 제 2 이종기원의 모이어티 (H2)는 펩티드 결합, 하나 또는 그 이상의 아미노산, 또는 링커 (예컨대 FVIII에 연계된다면 FVIII 링커)에 의해 상기 키메라 단백질의 FVIII 단백질에 또는 다른 부위에 연계될 수 있다. 이러한 구조체들은 때로 FVIII/VWF 이형이량체로 불릴 수 있다. 한 구체예에서, 상기 이종기원의 모이어티 (H2)는 이종기원의 폴리펩티드를 포함한다. 또 다른 구체예에서, 상기 이종기원의 모이어티 (H2)는 비-폴리펩티드 모이어티를 포함한다. 또 다른 구체예들에 있어서, 상기 이종기원의 모이어티 (H2)는 이종기원의 모이어티와 비-폴리펩티드 모이어티의 조합을 포함한다. 상기 제 2 이종기원의 모이어티 (H2)는 반감기 증량제일 수 있다. 상기 제 2 이종기원의 폴리펩티드 모이어티 (H2)의 비-제한적 예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 이종기원의 비-폴리펩티드 모이어티의 비-제한적 예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함한다. 특정 구체예들에 있어서, 상기 제 1 이종기원의 모이어티 (H1)와 제 2 이종기원의 모이어티는 동일하거나 또는 상이하다. 비-공유 연합보다 더 강력한 연결, 예컨대, 키메라 단백질 내 상기 FVIII 단백질과 상기 VWF 단편 사이에 하나 또는 그 이상의 공유 결합이 제공되거나 또는 비-공유 연합과 공유 결합 모두가 제공된다면, 상기 제 1 이종기원의 모이어티 (H1)와 제 2 이종기원의 모이어티 (H2)중 하나 또는 이 둘 모두는 키메라 단백질내 상기 FVIII 단백질의 반감기를 연장시킬 수 있다. 상기 제 1 이종기원의 모이어티 (H1)에 융합된 또는 연계된 상기 VWF 단편이 상기 FVIII 단백질과 상기 내생성 VWF 단백질 사이의 상호작용을 방지 또는 저해시킴으로써 반감기 한도를 제거하면, 상기 이종기원의 모이어티들에 융합된 상기 FVIII 단백질은 이의 온전한 능력에 도달할 수 있고, 야생형 FVIII와 비교하였을 때 2-배 이상 더 긴 반감기를 보유할 수 있다.
특정 구체예들에 있어서, 상기 VWF 단편에 연계된 상기 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역)와 상기 FVIII 단백질에 연계된 상기 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)는 서로 연합되고, 이러한 연합으로 상기 VWF 단편이 생체내 내생성 VWF 으로 대체되는 것을 방지한다. 한 구체예에서, 상기 제 2 이종기원의 모이어티는 제 2 Fc 영역이며, 이때 상기 제 2 Fc 영역은 공유 결합, 예컨대 이황화결합, 펩티드 결합, 또는 링커 (하나 또는 그 이상의 아미노산)에 의해 상기 제 1 이종기원의 모이어티, 예컨대 상기 제 1Fc 영역에 연계 또는 연합된다. 예를 들면, 한 쪽 끝에서 상기 FVIII 단백질에 연계된 상기 제 2 이종기원의 모이어티 (예컨대 상기 제 2 Fc 영역)는 링커 (예컨대 scFc 링커)에 의해 상기 VWF 단편에 연계된 상기 제 1 이종기원의 모이어티 (예컨대 상기 제 1Fc 영역)에 추가 연계될 수 있거나, 또는 공유 또는 비-공유 결합에 의해 상기 제 1 이종기원의 모이어티에 더 연합될 수 있다. 또 다른 구체예에서, 상기 제 2 이종기원의 모이어티 (예컨대 상기 제 2 Fc 영역)는 제 1 이종기원의 모이어티에 이미 연계된 상기 VWF 단편에 연계된다. 일부 구체예들에 있어서, 상기 키메라 단백질은 VWF 단편과 제 1 이종기원의 모이어티가 포함된 제 1 폴리펩티드 쇄와 FVIII 단백질과 제 2 이종기원의 모이어티가 포함된 제 2 폴리펩티드 쇄를 포함하며, 이때 상기 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄는 연합되며, 이때 상기 제 1 이종기원의 모이어티가 포함된 제 1 폴리펩티드 쇄와 상기 제 2 이종기원의 모이어티가 포함된 상기 제 2 폴리펩티드 쇄 사이의 연합은 공유 결합이며, 따라서 상기 VWF 단편과 FVIII 단백질 간의 상호작용 유지가 허용된다. 동시에, 상기 FVIII 단백질과 비-공유 결합을 형성할 수 있는 내생성 VWF는 상기 VWF 단편이 포함된 공유적으로 연계된 폴리펩티드 쇄를 대체할 수 없다.
상기 제 1 이종기원의 모이어티 (H1)와 VWF 단편 사이의 링커 (예컨대 VWF 링커)는 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커일 수 있다. 상기 절단가능한 링커들은 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, 그랜자임-B, TEV, 엔테로키나제, 프로테아제 3C, 소르타제 A, MMP-12, MMP-13, MMP-17, MMP-20, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 프로테아제에 의해 절단될 수 있다. 응고 과정이 활성화될 때 이들 절단가능한 링커들에 의해 상기 VWF 단편은 상기 FVIII 단백질로부터 절단 및 해리되고, 이로 인하여 온전한 활성 능력을 갖는 FVIII 단백질이 생성된다.
또 다른 구체예들에 있어서, 상기 키메라 단백질은 VWF 단편, 절단가능한 링커, 제 1 이종기원의 모이어티 (H1), 가공가능한 링커, FVIII 단백질, 그리고 제 2 이종기원의 모이어티 (H2)가 임의의 순서로 포함된 단일 폴리펩티드 쇄로 만들어진다. 합성 이후, 분비에 앞서 세포내 프로테아제 효소에 의해 가공가능한 링커가 절단될 수 있고, 따라서 상기에서 설명된 것과 같이 2개의 폴리펩티드 쇄가 만들어질 수 있다. 분비에 앞서 상기 단일 쇄 구조체에 있어서, 상기 제 2 이종기원의 모이어티 (예컨대 상기 제 2 Fc 영역)는 가공가능한 링커에 의해 상기 VWF 단편에 연계될 수 있다. 특정 구체예들에 있어서, 하나 또는 그 이상의 링커는 하나 또는 그 이상의 절단 부위를 포함할 수 있다.
일부 구체예들에 있어서, 본 발명의 상기 키메라 단백질은 제 3의 이종기원의 모이어티 (본 명세서에서 때로 "H3"로 지칭됨)를 더 포함한다. 상기 제 3의 이종기원의 모이어티 (H3)는 반감기 증량제일 수 있다. 상기 이종기원의 모이어티 (H3)는 이종기원의 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이둘 모두의 조합을 포함할 수 있다. 상기 제 3 이종기원의 모이어티 (H3)의 비-제한적 실시예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 이의 임의의 유도체들 또는 이의 임의의 변이체들, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함한다. 상기 VWF 단편에 연계된 상기 제 1 이종기원의 모이어티 (H1), 상기 FVIII 단백질에 연계된 상기 제 2 이종기원의 모이어티 (H2), 그리고 상기 제 3 이종기원의 모이어티 (H3)는 동일하거나 또는 상이할 수 있다. 한 구체예에서, 상기 제 1 이종기원의 모이어티 (H1)는 상기 제 2 이종기원의 모이어티 (H2)와 동일하지만, 상기 제 3 이종기원의 모이어티 (H3)와는 상이하다. 또 다른 구체예에서, 상기 제 3 이종기원의 모이어티 (H3)는 상기 키메라단백질의 FVIII 단백질 또는 VWF 단편에 융합 또는 연계된다. 일부 구체예들에 있어서, 상기 제 3 이종기원의 모이어티는 상기 FVIII 단백질의 하나 또는 그 이상의 도메인들 안에 또는 상기 FVIII 단백질의 2개 도메인들 사이에 삽입된다.
한 구체예에서, 키메라 단백질은 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄를 포함하고, 이때 상기 제 1쇄는 임의선택적 링커 (예컨대 FVIII 링커)에 의해 제 1 이종기원의 모이어티 (H1), 예컨대 제 1 Fc 영역에 연계된 FVIII 단백질을 포함하고, 상기 제 2 쇄는 임의선택적 링커 (예컨대 VWF 링커)에 의해 제 2 이종기원의 모이어티 (H2), 예컨대 제 2 Fc 영역에 연계된 VWF 단편을 포함한다. 상기 FVIII 단백질은 FVIII 중쇄와 FVIII 경쇄 사이(예컨대, 서열 번호: 16의 아미노산 잔기 1648)에 제 3의 이종기원의 모이어티 (H3), 예컨대 임의의 반감기 연장 모이어티, 예컨대 알부민, 또는 PAS 서열를 더 포함할 수 있고, 따라서 단일 쇄 FVIII 단백질이 될 수 있다. 대안으로, 상기 FVIII 단백질은 이중 쇄 단백질, 예컨대, 공유 또는 비-공유 결합 (예컨대 금속 결합)에 의해 서로 연합된 상기 FVIII 중쇄와 FVIII 경쇄일 수 있으며, 이때 상기 중쇄는 제 3의 이종기원의 모이어티 (H3), 예컨대 비-구조적 반감기 연장 폴리펩티드, 알부민 또는 이의 단편 또는 PAS 서열에 더 연계된다. 또 다른 구체예에서, 키메라 단백질은 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄를 포함하고, 이때 상기 제 1 쇄는 임의선택적 링커 (예컨대, FVIII 링커)에 의해 제 1 이종기원의 모이어티 (H1), 예컨대 제 1 Fc 영역에 연계된 FVIII 단백질을 포함하고, 그리고 상기 제 2 쇄는 제 3의 이종기원의 모이어티 (H3), 예컨대 비-구조적 반감기 연장 폴리펩티드, 알부민 또는 PAS 서열에 연계되고, 다시 임의선택적 링커에 의해 제 2 이종기원의 모이어티 (H2), 예컨대 제 2 Fc 영역에 연계된 VWF 단편을 포함한다. 일부 구체예들에 있어서, 상기 제 3 이종기원의 모이어티 (H3) (예컨대 반감기 연장 폴리펩티드)는 상기 FVIII 단백질의 상기 C-말단 또는 N-말단에 연계될 수 있거나, 또는 상기 FVIII 단백질의 두 도메인 사이에 또는 상기 FVIII 단백질의 도메인 내 2개의 아미노산 사이에 삽입될 수 있다.
또 다른 구체예들에 있어서, 본 발명의 상기 키메라 단백질은 제 4의 이종기원의 모이어티 (본 명세서에서 때로 "H4"로 지칭됨) 및/또는 제 5의 이종기원의 모이어티 (본 명세서에서 때로 "H5"로 지칭됨)를 더 포함한다. 상기 제 4 또는 제 5의 이종기원의 모이어티는 또한 반감기 증량제일 수 있다. 상기 제 4의 이종기원의 모이어티 및/또는 상기 제 5의 이종기원의 모이어티는 상기 제 3의 이종기원의 모이어티와 동일하거나 또는 상이할 수 있다. 상기 이종기원의 모이어티는 이종기원의 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이둘 모두의 조합을 포함할 수 있다. 상기 제 4 또는 제 5의 이종기원의 모이어티의 비-제한적 실시예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 이의 임의의 유도체들 또는 이의 임의의 변이체들, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함한다. 상기 제 1 이종기원의 모이어티, 제 2 이종기원의 모이어티, 제 3 이종기원의 모이어티, 제 4 이종기원의 모이어티, 그리고 제 5 이종기원의 모이어티는 동일하거나 또는 상이할 수 있다. 일부 구체예들에 있어서, 상기 제 4 이종기원의 모이어티 (예컨대 반감기 연장 폴리펩티드)는 상기 FVIII 단백질의 상기 C-말단 또는 N-말단에 연계될 수 있거나, 또는 상기 FVIII 단백질의 두 도메인 사이에 또는 상기 FVIII 단백질의 도메인 내 2개의 아미노산 사이에 삽입될 수 있다. 또 다른 구체예들에 있어서, 상기 제 5 이종기원의 모이어티 (예컨대 반감기 연장 폴리펩티드)는 상기 FVIII 단백질의 상기 C-말단 또는 N-말단에 연계될 수 있거나, 또는 상기 FVIII 단백질의 두 도메인 사이에 또는 상기 FVIII 단백질의 도메인 내 2개의 아미노산 사이에 삽입될 수 있다.
특정 구체예들에 있어서, 상기 키메라 단백질은 FVIII 단백질, VWF 단편, 제 1 이종기원의 모이어티, 제 2 이종기원의 모이어티, 제 3의 이종기원의 모이어티, 제 4의 이종기원의 모이어티, 그리고 제 5의 이종기원의 모이어티를 포함하고, 이때 상기 제 1 이종기원의 모이어티와 제 2 이종기원의 모이어티는 상기 FVIII 단백질이 포함된 쇄와 상기 VWF 단편이 포함된 쇄 사이에 결합(예컨대 공유 결합)을 형성하고, 그리고 상기 제 3 이종기원의 모이어티, 제 4 이종기원의 모이어티, 그리고 제 5 이종기원의 모이어티는 반감기 증량제이며, 이때 상기 FVIII 단백질이 포함된 쇄와 상기 VWF 단편이 포함된 쇄 사이의 결합은 상기 FVIII와 VWF 단편 사이의 비-공유 상호작용보다 더 강력하고, 이로 인하여 상기 FVIII 단백질 생체내, 시험관내, 또는 생체외에서 내생성 VWF가 상기 FVIII 단백질에 결합되는 것이 방지된다.
또 다른 구체예들에 있어서, 상기 키메라 단백질은 FVIII 단백질, VWF 단편, 제 1 이종기원의 모이어티, 제 2 이종기원의 모이어티, 제 3의 이종기원의 모이어티, 제 4의 이종기원의 모이어티, 제 5의 이종기원의 모이어티, 그리고 제 6의 이종기원의 모이어티 (본 명세서에서 때로 "H6"로 지칭됨)를 포함하고, 이때 상기 제 1 이종기원의 모이어티와 제 2 이종기원의 모이어티는 상기 FVIII 단백질이 포함된 쇄와 상기 VWF 단편이 포함된 쇄 사이에 결합을 형성하고, 그리고 상기 제 3 이종기원의 모이어티, 제 4 이종기원의 모이어티, 제 5 이종기원의 모이어티, 그리고 제 6 이종기원의 모이어티는 반감기 증량제이며, 이때 상기 FVIII 단백질이 포함된 쇄와 상기 VWF 단편이 포함된 쇄 사이의 결합은 상기 FVIII와 VWF 단편 사이의 비-공유 상호작용보다 더 강력하고, 이로 인하여 상기 FVIII 단백질 생체내, 시험관내, 또는 생체외에서 내생성 VWF가 상기 FVIII 단백질에 결합되는 것이 방지된다.
일부 구체예들에 있어서, 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬러를 포함한다:
(aa) V-L1-H1-L2-H2
(bb) H2-L2-H1-L1-V,
(cc) H1-L1-V-L2-H2, 그리고
(dd) H2-L2-V-L1-H1,
이때 V는 본 명세서에서 설명된 VWF 단편을 포함하고;
각 L1과 L2는 임의선택적 링커를 포함하고; 그리고
H1는 제 1 이종기원의 모이어티를 포함하고; 그리고
H2는 임의선택적 제 2 이종기원의 모이어티를 포함한다. 상기 제 1 이종기원의 모이어티와 상기 제 2 이종기원의 모이어티중 하나 또는 둘 모두다 반감기 연장 모이어티일 수 있다. 한 구체예에서, H1은 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함한다. H1로 유용한 상기 폴리펩티드는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 이의 임의의 유도체들 또는 변이체들, 또는 이의 임의의 조합들을 포함할 수 있다. 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 그리고 히드록시에틸 전분 (HES), 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함할 수 있다. 또 다른 구체예에서, H2는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함한다. H2로 유용한 상기 폴리펩티드는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 이의 임의의 유도체들 또는 변이체들, 또는 이의 임의의 조합들을 포함할 수 있다. 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함할 수 있다. 특정 구체예들에 있어서, 포뮬라 (aa)와 (bb)에서 H1과 H2 사이의 링커는 가공가능한 링커다. 또 다른 구체예들에 있어서, 포뮬라 (aa)와 (bb)에서 상기 VWF 단편과 H1 사이의 링커는 절단가능한 링커, 예컨대 트롬빈에 의해 절단될 수 있는 트롬빈 절단가능한 링커다.
본 명세서에서 상기 폴리펩티드 포뮬라의 방향은 N-말단 (좌)으로부터 C-말단 (우) 방향이다. 예를 들면, 포뮬라 H-L-V는 포뮬라 NH2-H-L-V-COOH를 의미한다. 한 구체예에서, 본 명세서에서 설명된 포뮬라는 2개 모이어티 사이에 추가 서열을 포함할 수 있다. 예를 들면, 포뮬라 V-L1-H1-L2-H2는 다른 언급이 없는 한, V의 N-말단, V와 L1 사이, L1과 H1 사이, H1 또는 L2 사이, L2 또는 H2 사이, 또는 H2의 C-말단에서 서열을 더 포함할 수 있다. 또 다른 구체예에서, 하이폰(-)은 펩티드 결합 또는 하나 또는 그 이상의 아미노산을 나타낸다.
특이적 구체예들에 있어서, 키메라 단백질은 (a1) V-H, (a2) H-V, (a3) V-L-H, (a4) H-L-V, (a5) V-L1-H1-H2, (a6) H2-H1-L1-V, (a7) V-L1-H1:H2, (a8) H2:H1-L1-V, (a9) V-H1:H2, (b1) H2:H1-V, (b2) V-L1-H1-L2-H2, (b3) H2-L2-H1-L1-V, (b4) H1-V-H2, (b5) H1-L1-V-L2-H2, 및(b6) H2-L2-V-L1-H1로 구성된 군으로부터 선택된 하나 또는 그 이상의 포뮬라를 포함하거나, 이런 포뮬라로 필수적으로 구성되거나, 또는 이런 포뮬러로 구성되며, 이때 V는 본 명세서에서 설명된 하나 또는 그 이상의 상기 VWF 단편들을 포함하고, L, L1, 또는 L2는 링커를 포함하고, H 또는 H1은 제 1 이종기원의 모이어티를 포함한다. 한 구체예에서, 상기 제 1 이종기원의 모이어티 (H1)는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두일 수 있다. 상기 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 또는 이의 임의의 조합들을 포함할 수 있다. H1로 유용한 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들이 포함된다. 또 다른 구체예에서, H2는 제 2 이종기원의 모이어티를 포함한다. 상기 제 2 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두일 수 있다 상기 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 또는 이의 임의의 조합들을 포함할 수 있다. H1로 유용한 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들이 포함된다. 특정 구체예들에 있어서, 상기 제 1 이종기원의 모이어티와 제 2 이종기원의 모이어티 사이의 링커는 가공가능한 링커다. 다른 구체예들에 있어서, 상기 VWF 단편과 제 1 이종기원의 모이어티 사이 또는 제 2 이종기원의 모이어티 사이의 링커는 하나 또는 그 이상의 절단 부위들이 포함된 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커다.
본 발명의 상기 키메라 단백질은 (aa), (bb), (cc), (dd), (a1), (a2), (a3), (a4), (a5), (a6), (a7), (a8), (a9), (b1), (b2), (b3), (b4), (b5), 그리고 (b6)로 구성된 군에서 선택된 포뮬라를 포함하고, 그리고 상기 포뮬라의 VWF 단편에 공유적으로 연계된 또는 공유적으로 연합된 FVIII 단백질, 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역), 또는 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)를 포함한다. 한 구체예에서, 상기 FVIII 단백질은 공유 또는 비-공유 결합 또는 링커에 의해 상기 VWF 단편에 연계 또는 연합된다. 또 다른 구체예에서, 상기 FVIII 단백질은 공유 또는 비-공유 결합 또는 링커에 의해 상기 제 1 이종기원의 모이어티 또는 제 2 이종기원의 모이어티에 연계될 수 있다.
한 구체예에서, 본 발명의 키메라 단백질은 FVIII 단백질에 공유적으로 연계된 또는 공유적으로 연합된 본 명세서에서 설명된 VWF 단편을 포함한다. 예를 들면, 상기 키메라 단백질은 VWF 단편과 FVIII 단백질을 포함할 수 있고, 이때 상기 VWF 단편과 FVIII 단백질은 비-펩티드 공유 결합, 펩티드 결합, 비-공유 결합, 또는 링커, 예컨대 절단가능한 링커에 의해 결합된다. 특정 구체예에 있어서, 상기 VWF 단편과 상기 FVIII 단백질은 하나 또는 그 이상의 이황화결합에 의해 서로 결합 또는 상호작용한다. 또 다른 특이적 구체예에 있어서, 상기 VWF 단편은 FVIII의 상기 A3 도메인, FVIII의 상기 C2 도메인, 또는 FVIII의 A3 도메인과 C2 도메인 모두에서 비-공유 결합에 의해 상기 FVIII 단백질에 결합되거나 또는 FVIII 단백질과 상호작용한다. 또 다른 구체예에서, 상기 FVIII 단백질에 결합된 또는 이와 상호작용하는 상기 VWF 단편은 제 1 이종기원의 모이어티에 연계 또는 융합된다. 또 다른 구체예들에 있어서, 상기 VWF 단편에 결합된 또는 이와 상호작용하는 상기 FVIII 단백질은 제 2 이종기원의 모이어티에 더 연계 또는 융합된다. 일부 구체예들에 있어서, 상기 FVIII 단백질에 결합된 또는 이와 상호작용하는 상기 VWF 단편은 제 1 이종기원의 모이어티에 더 연계되고, 그리고 상기 FVIII 단백질은 제 2 이종기원의 모이어티에 더 연계된다. 특정 구체예들에 있어서, 상기 VWF 단편과 제 1 이종기원의 모이어티가 포함된 상기 제 1 폴리펩티드 쇄와 상기 FVIII 단백질과 제 2 이종기원의 모이어티가 포함된 상기 제 2 폴리펩티드 쇄는 서로 연합되고, 이러한 연합에 의해 상기 FVIII 단백질과 다른 모이어티들, 예컨대 내생성 VWF와의 상호작용이 허용되지 않는다. 한 구체예에서, 상기 연합은 공유 결합, 예컨대 이황화결합이다.
상기 VWF 단편 또는 FVIII 단백질 각각은 링커, 예컨대 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커에 의해 상기 제 1 및 제 2 이종기원의 모이어티에 결합 또는 연결될 수 있다. 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커는 본 명세서에서 VWF 링커로 표시될 수 있다. 상기 FVIII 단백질과 상기 제 2 이종기원의 모이어티 사이의 링커는 본 명세서에서 FVIII 링커로 표시될 수 있다. 또는, 상기 VWF 단편 또는 FVIII 단백질은 모두 링커, 예컨대 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커에 의해 상기 제 1 및 제 2 이종기원의 모이어티에 결합 또는 연결될 수 있다. 특정 구체예들에 있어서, 상기 VWF 단편에 연계된 상기 제 1 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함한다. 상기 제 1 이종기원의 폴리펩티드 모이어티의 비-제한적 실시예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 2개 또는 그 이상의 조합이 포함된다. 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES 또는 HAES), 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함한다. 또 다른 구체예들에 있어서, 상기 FVIII 단백질에 연계된 상기 제 2 이종기원의 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함한다. 상기 제 2 이종기원의 모이어티의 비-제한적 실시예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 비-폴리펩티드 모이어티의 비-제한적 실시예로는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES 또는 HAES), 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함한다. 일부 구체예들에 있어서, 상기 VWF 단편은 시험관내에서 소르타제 중재된 단백질 결찰에 의해 FVIII에 부착된다. 일부 구체예들에 있어서, 소르타제 인지 모티프가 이용된다.
한 구체예에서, 상기 제 1 이종기원의 모이어티는 면역글로불린 불변 영역 또는 이의 일부분이다. 한 특정 구체예에 있어서, 상기 제 1 이종기원의 모이어티는 제 1 Fc 영역이다. 일부 구체예들에 있어서, 상기 제 2 이종기원의 모이어티는 면역글로불린 불변 영역 또는 이의 일부분이다. 특정 구체예에 있어서, 상기 제 2 이종기원의 모이어티는 제 2 Fc 영역이다. 한 특정 구체예에 있어서, 상기 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 FVIII 단백질을 포함하고, 이때 상기 VWF 단편은 Fc 영역인 면역글로불린 불변 영역 또는 이의 일부분에 연계된다. 또 다른 구체예에서, 상기 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 FVIII 단백질을 포함하고, 이때 상기 FVIII 단백질은 Fc 영역인 면역글로불린 불변 영역 또는 이의 일부분에 연계된다. 또 다른 구체예들에 있어서, 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 FVIII 단백질을 포함하며, 이때 상기 VWF 단편은 제 1 Fc 영역인 제 1 면역글로불린 불변 영역에 연계되며, 그리고 상기 FVIII 단백질은 제 2 Fc 영역인 제 2 면역글로불린 불변 영역에 연계되며, 이때 상기 VWF 단편과 FVIII 단백질은 비-공유 결합에 의해 결합되거나 서로 상호작용하며 또는 상기 제 1 Fc 영역 또는 제 2 Fc 영역은 공유 결합에 의해 서로 연합된다. 여전히 다른 구체예들에 있어서, 상기 제 1 이종기원의 모이어티에 연계된 VWF 단편은 링커, 예컨대 가공가능한 링커에 의해 상기 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역에 더 연계된다. 한 측면에서, 상기 VWF 단편은 링커, 예컨대 VWF 링커, 예컨대 절단가능한 링커에 의해 상기 제 1 이종기원의 모이어티에 연계된다. 또 다른 측면에서, 상기 FVIII 단백질은 링커, 예컨대 FVIII 링커, 예컨대 절단가능한 링커에 의해 상기 제 2 이종기원의 모이어티에 연계된다. 상기 이종기원의 모이어티들의 비-제한적 실시예들은 본 명세서 도처에서 공개되며, 예컨대 면역글로불린 불변 영역 또는 이의 일부분은 단락 [0165] - [0193]에서, 알부민, 이의 단편 또는 변이체는 단락 [0194]-[0198]에서, HAP 서열은 단락 [0293]에서, 트란스페린, 단편들, 또는 이의 임의의 변이체들은 단락 [0204]-[0205]에서, 중합체, 예컨대 폴리에틸렌 글리콜은 단락 [0206] - [0213]에서, HES는 단락 [0214]-[0219]에서, 또는 PSA는 단락 [0220]에서, 그리고 PAS 서열은 단락 [0199]-[0202]에서 공개된다.
일부 구체예들에 있어서, 본 발명의 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬라를 포함하거나, 이 포뮬러로 필수적으로 구성되거나 또는 이 포뮬라로 구성된다:
(a) V-L1-H1- L3- C-L2-H2,
(b) H2-L2-C- L3- H1-L1-V,
(c) C-L2-H2- L3- V-L1-H1,
(d) H1-L1-V- L3-H2-L2-C,
(e) H1-L1-V-L3-C-L2-H2,
(g) H2-L2-C- L3- V-L1-H1,
(g) V-L1-H1-L3- H2-L2-C,
(g) C-L2-H2- L3- H1-L1-V,
(i) H2-L3-H1-L1-V-L2-C,
(j) C-L2-V-L1-H1-L3-H2,
(k) V-L2-C-L1-H1-L3-H2, 및
(l) H2-L3-H1-L1-C-L2-V,
이때 V는 본 명세서에서 설명된 VWF 단편이며;
각 L1 또는 L2는 임의선택적 링커, 예컨대 절단가능한 링커, 예컨대 트롬빈 절단가능한 링커이며;
L3은 임의선택적 링커, 예컨대 가공가능한 링커이며
각 H1 및 H2는 임의선택적 이종기원의 모이어티이며;
C는 FVIII 단백질이며;
(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이다.
다른 측면들에 있어서, 본 발명의 키메라 단백질은 다음으로 구성된 군으로부터 선택된 포뮬러를 포함한다:
(m) V-L1-H1: H2-L2-C,
(n) V-L1-H1:C-L2-H2;
(o) H1-L1-V:H2-L2-C;
(p) H1-L1-V:C-L2-H2;
(q) V:C-L1-H1:H2;
(r) V:H1-L1-C:H2;
(s) H2:H1-L1-C:V,
(t) C:V-L1-H1:H2, 및
(u) C:H1-L1-V:H2.
이때 V는 본 명세서에서 설명된 VWF 단편이며;
각 L1 또는 L2는 임의선택적 링커, 예컨대 트롬빈 절단가능한 링커이며;
각 H1 또는 H2는 임의선택적 이종기원의 모이어티이며;
(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이고; 그리고
C는 FVIII 단백질이며; (:)는 H1과 H2 사이의 화학적 또는 물리적 연합이다.
한 구체예에서, 하나 또는 그 이상의 상기 이종기원의 모이어티들은 반감기 증량제다. 반감기 증량제들은 당분야에 공지되어 있으며, 이러한 반감기 증량제들의 비-제한적 실시예로는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 이의 유도체 또는 변이체, 또는 이의 2개 또는 그 이상의 조합을 포함한다. 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함할 수 있다.
한 구체예에서, 포뮬라 (m) 내지 (u)에서 (:)은 화학적 연합, 예컨대 최소한 하나의 비-펩티드 결합을 나타낸다. 특정 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 공유 결합이다. 또 다른 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 비-공유 상호작용, 예컨대 이온 상호작용, 소수성 상호작용, 친수성 상호작용, 반 데르 발스 상호작용, 수소 결합이다. 또 다른 구체예들에 있어서, (:)는 비-펩티드 공유 결합이다. 여전히 다른 구체예들에 있어서, (:)는 펩티드 결합이다. 여전히 다른 구체예들에 있어서, 포뮬라(m) 내지 (u)에서 (:)는 두 서열 사이의 물리적 연합을 나타내고, 이때 제 1 서열의 일부분은 또 다른 모이어티와 제 2 서열의 일부분의 상호작용으로부터 제 2 서열의 일부분을 차폐 또는 차단시키기 위하여 제 2 서열에 근접해 있고, 그리고 이러한 물리적 연합은 상기 제 2 서열과 다른 모이어티들과의 상호작용 허용없이 유지된다.
본 발명의 구조체의 단순히 비-제한적 실시예로써 포뮬라 (a) - (u)가 본 명세서에 포함된다. 상기 폴리펩티드 포뮬라의 방향은 N-말단 (좌)으로부터 C-말단 (우) 방향으로 나타낸다. 예를 들면, 포뮬라 V-L1-H1-L3-C-L2-H2는 포뮬라 NH2-V-L1-H1-L3-C-L2-H2-COOH를 의미한다. 또한, 다른 언급이 없는 한, (:)은 상기 제 1 쇄의 임의의 부분과 제 2 쇄의 임의의 부분 사이에 공유 결합 또는 비-공유 결합에 의한 연합 또는 상호작용일 수 있다. 예를 들면, 포뮬라 V-H1:H2-C는 2개의 폴리펩티드 쇄를 갖고, 상기 제 1 쇄는 V-H1이며, 상기 제 2 쇄는 C-H2이며, 이때 상기 제 1 쇄에서 V는 상기 제 2 쇄에서 C와 상호작용하거나 연합되며 및/또는 상기 제 1 쇄에서 H1은 상기 제 2 쇄에서 H2와 상호작용 또는 연합된다. 일부 구체예들에 있어서, (:)는 공유, 비-펩티드 결합 또는 비-공유 결합을 의미한다.
특정 구체예들에 있어서, 키메라 단백질은 다음으로 구성된 군에서 선택된 포뮬라를 포함하거나, 이 포뮬라로 필수적으로 구성되거나, 또는 이 포뮬러로 구성된다:
(1) V:C, (2) H-V:C or C:V-H,
(3) V:C-H 또는 H-C:V, (4) V-H1:H2-C 또는 H1-V:C-H2,
(5) V:C-H1:H2 또는 H2:H1-C:V, (6) H2:H1-V:C 또는 C:V-H1:H2,
(7) H-L-V:C 또는 C:V-L-H, (8) V:C-L-H 또는 H-L-C:V,
(9) V-C 또는 C-V, (10) H-V-C 또는 C-V-H,
(11) V-H-C 또는 C-H-V, (12) V-C-H 또는 H-C-V,
(13) V-H1-C-H2 또는 H2-C-H1-V, (14) H1-V-C-H2 또는 H2-C-V-H1,
(15) H1-V-H2-C 또는 C-H2-V-H1, (16) V-H1-H2-C 또는 C-H2-H1-V,
(17) V-L-C 또는 C-L-V, (18) H-L-V-C 또는 C-V-L-H,
(19) H-V-L-C 또는 C-L-V-H, (20) V-L-H-C 또는 C-H-L-V,
(21) V-H-L-C 또는 C-L-H-V, (22) V-L-C-H 또는 H-C-L-V,
(23) V-C-L-H 또는 H-L-C-V, (24) H-L1-V-L2-C 또는 C-L2-V-L1-H,
(25) V-L-H1:H2-C 또는 C-H2:H1-L-V,
(26) V-H1:H2-L-C 또는 C-L-H2:H1-V,
(27) V:C-H1-H2 또는 H2-H1-C:V,
(28) H2-H1-V:C 또는 C:V-H1-H2,
(29) V:C-L-H1:H2 또는 H2:H1-L-C:V,
(30) H2:H1-L-V:C 또는 C:V-L-H1:H2,
(31) V-L1-H1:H2-L2-C 또는 L-L2-H2:H1-L1-V,
(32) V:C-L-H1-H2 또는 H2-H1-L-C:V,
(33) V:C-H1-L-H2 또는 H2-L-H1-C:V,
(34) V:C-L1-H1-L2-H2 또는 H2-L2-H1-L1-C:V,
(35) H2-H1-V:C 또는 C:V-H1-H2,
(36) H2-H1-L-V:C 또는 C:V-L-H1-H2,
(37) H2-L-H1-V:C 또는 C:V-H1-L-H2,
(38) H2-L2-H1-L1-V:C 또는 C:V-L1-H1-L2-H2,
(39) V-L1-H-L2-C 또는 C-L2-H-L1-V,
(40) V-L1-C-L2-H 또는 H-L2-C-L1-V,
(41) V-L-H1-C-H2 또는 H2-C-H1-L-V,
(42) V-H1-C-L-H2 또는 H2-L-C-H1-V,
(43) V-H1-L-C-H2 또는 H2-C-L-H1-V,
(44) H1-L-V-C-H2 또는 H2-C-V-L-H1,
(45) H1-V-L-C-H2 또는 H2-C-L-V-H1,
(46) H1-V-C-L-H 또는 H-L-C-V-H1,
(47) H1-L-V-H2-C 또는 C-H2-V-L-H1,
(48) H1-V-L-H2-C 또는 C-H2-L-V-H1,
(49) H1-V-H2-L-C 또는 C-L-H2-V-H1,
(50) V-L-H1-H2-C 또는 C-H2-H1-L-V,
(51) V-H1-L-H2-C 또는 C-H2-L-H1-V,
(52) V-H1-H2-L-C 또는 C-L-H2-H1-V,
(53) V-L1-H1-L2-C-H2 또는 H2-C-L2-H1-L1-V,
(54) V-L1-H1-C-L2-H2 또는 H2-L2-C-H1-L1-V,
(55) V-L1-H1-L2-C-L3-H2 또는 H2-L3-C-L2-H1-L1-V,
(56) V-H1-L1-C-L2-H2 또는 H2-L2-C-L1-H1-V,
(57) H1-L1-V-L2-C-H2 또는 H2-C-L2-V-L1-H1,
(58) H1-L1-V-C-L2-H2 또는 H2-L2-C-V-L1-H1,
(59) H1-L1-V-L2-C-L3-H2 또는 H2-L3-C-L2-V-L1-H1,
(60) H1-V-L1-C-L2-H2 또는 H2-L2-C-L1-V-H1,
(61) H1-L1-V-L2-H2-C 또는 C-H2-L2-V-L1-H1,
(62) H1-L1-V-H2-L2-C 또는 C-L2-H2-V-L1-H1,
(63) H1-L1-V-L2-H2-L3-C 또는 C-L3-H2-L2-V-L1-H1,
(64) H1-V-L1-H2-L2-C 또는 C-L2-H2-L1-V-H1,
(65) V-L1-H1-L2-H2-C 또는 C-H2-L2-H1-L1-V,
(66) V-L1-H1-H2-L2-C 또는 C-L2-H2-H1-L1-V,
(67) V-L1-H1-L2-H2-L3-C 또는 C-L3-H2-L2-H1-L1-V, 및
(68) V-H1-L1-H2-L2-C 또는 C-L2-H2-L1-H1-V,
V는 본 명세서에서 설명된 VWF 단편이며;
C는 FVIII 단백질이며;
H 또는 H1은 이종기원의 모이어티 또는 제 1 이종기원의 모이어티이며;
H2는 제 2 이종기원의 모이어티이며; 상기 제 1과 제 2 이종기원의 모이어티들은 동일하거나 또는 상이할 수 있고;
각 L, L1 또는 L2는 임의선택적 링커이며;
(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이고; 그리고
(:) 는 화학적 또는 물리적 연합이다. 상기 링커들은 각각 동일하거나 또는 상이할 수 있으며, 각각은 하나 또는 그 이상의 효소적 절단 부위가 포함된 절단가능한 링커일 수 있다. 상기 이종기원의 모이어티들은 당분야에 공지된 반감기 연장 기술일 수 있으며, 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두일 수 있다. 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 이의 임의의 유도체들 또는 이의 임의의 변이체들, 또는 이의 임의의 조합들 (예컨대 Fc 영역)을 포함할 수 있다. 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함할 수 있다. 각 H, H1, 또는 H2는 특징에 근거하여 개별적으로 선택될 수 있는데, 모두 동일하거나 또는 각각 상이할 수 있다. 상기 이종기원의 모이어티들의 비-제한적 예들은 본 명세서의 도처에서 공개되는데, 예컨대 면역글로불린 불변 영역 또는 이의 일부분은 단락[0126] - [0153]에서, 알부민 또는 단편 또는 변이체는 단락 [0154]-[0157]에서, 중합체, 예컨대 폴리에틸렌 글리콜은 단락[0166] - [0173]에서, 그리고 PAS 서열은 단락[0159]-[0162]에서 공개된다. 포뮬라 (1) - (68)은 단순히 본 발명의 구조체들의 비-제한적 예로써 본 명세서에 포함된다.
한 구체예에서, (:)는 화학적 연합, 예컨대 최소한 하나의 비-펩티드 결합을 나타낸다. 특정 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 공유 결합이다. 또 다른 구체예들에 있어서, 상기 화학적 연합, 예컨대, (:)는 비-공유 상호작용, 예컨대 이온 상호작용, 소수성 상호작용, 친수성 상호작용, 반 데르 발스 상호작용, 수소 결합이다. 또 다른 구체예들에 있어서, (:)는 비-펩티드 공유 결합이다. 여전히 다른 구체예들에 있어서, (:)는 펩티드 결합이다. 여전히 다른 구체예들에 있어서, (:)는 두 서열 사이의 물리적 연합을 나타내고, 이때 제 1 서열의 일부분은 또 다른 모이어티와 제 2 서열의 일부의 상호작용으로부터 제 2 서열의 일부분을 차폐 또는 차단시키기 위하여 제 2 서열에 근접해 있고, 그리고 이러한 물리적 연합은 상기 제 2 서열과 다른 모이어티들과의 상호작용 허용없이 유지된다.
한 구체예에서, 상기 키메라 단백질에서 상기 VWF 단편에 연계된 상기 제 1 이종기원의 모이어티 (H 또는 H1)는 제 1 Fc 영역이다. 또 다른 구체예에서, 상기 키메라 단백질에서 상기 FVIII 단백질에 연계된 상기 제 2 이종기원의 모이어티 (H2)는 제 2 Fc 영역이다.
특정 구체예들에 있어서, 본 발명의 키메라 단백질은 2개의 폴리펩티드 쇄, 즉, FVIII (예컨대 단일 쇄 FVIII)를 인코드하는 아미노산 서열과 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역)를 포함하는, 이들로 필수적으로 구성된 또는 구성된 제 1 쇄 그리고 D' 도메인과 D3 도메인을 포함하는VWF 단편을 인코드하는 아미노산 서열, 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역), 그리고 상기 VWF 단편과 상기 제 2 Fc 도메인 사이의 링커 (예컨대 VWF 링커)를 포함하는, 이들로 필수적으로 구성된 또는 구성된 제 2 쇄를 포함한다. 상기 VWF 단편과 제 2 Fc 도메인 사이의 상기 링커는 트롬빈 절단가능한 링커일 수 있다. 일부 구체예들에 있어서, 상기 단일 쇄 FVIII 단백질은 제 3의 이종기원의 모이어티, 예컨대 반감기 증량제를 포함하는데, 이 모이어티는 상기 FVIII 서열의 N-말단, C-말단 또는 이 서열 안의 하나 또는 그 이상의 부위에 연계된다.
다른 구체예들에 있어서, 본 발명의 키메라 단백질은 3개의 폴리펩티드 쇄를 포함하는데, 이때 제 1 쇄는 FVIII의 중쇄를 포함하고, FVIII의 중쇄로 필수적으로 구성되거나 또는 FVIII의 중쇄로 구성되며, 제 2 쇄는 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역)에 융합된 FVIII의 경쇄를 포함하거나, 이 경쇄로 필수적으로 구성되거나, 또는 이 경쇄로 구성되며 그리고 제 3의 폴리펩티드 쇄는 상기 D' 도메인과 상기 D3 도메인이 포함된 VWF 단편, 제 2 이종기원의 모이어티 (예컨대, 제 2 Fc 영역), 그리고 링커를 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성된다. 상기 VWF 단편과 제 2 이종기원의 모이어티 사이의 상기 링커는 트롬빈 절단가능한 링커일 수 있다. 일부 구체예들에 있어서, 상기 중쇄 FVIII는 제 3의 이종기원의 모이어티, 예컨대 반감기 증량제를 포함하는데, 이 모이어티는 상기 FVIII 서열의 N-말단, C-말단 또는 이 서열 안의 하나 또는 그 이상의 부위에 연계된다.
여전히 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 2개의 폴리펩티드 쇄, 즉, FVIII의 중쇄를 포함하고, FVIII의 중쇄로 필수적으로 구성되거나, 또는 FVIII 중쇄로 구성된 제 1쇄와 FVIII의 경쇄, 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역), 제 1 링커 (예컨대 하나 또는 그 이상의 세포내 가공 부위가 포함된 프로테아제 절단 부위), VWF 단편, 제 2 링커 (예컨대 트롬빈 절단가능한 링커), 그리고 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)를 포함하는, 이들로 필수적으로 구성된, 또는 이들로 구성된 제 2 쇄를 포함하고, 이때 FVIII의 상기 경쇄는 상기 제 1 이종기원의 모이어티 (예컨대 상기 제 1Fc 영역)에 연계되며, 이는 다시 상기 제 1링커 (예컨대 하나 또는 그 이상의 세포내 가공 부위들이 포함된 프로테아제 절단 부위를 갖는 가공가능한 링커)에 의해 상기 VWF 단편에 더 연계되고, 그리고 이때 상기 VWF 단편은 상기 제 2 링커(예컨대 트롬빈 절단가능한 링커)에 의해 상기 제 2 Fc 영역에 연계된다. 특정 구체예들에 있어서, 상기 제 1링커와 제 2 링커는 동일하거나 또는 상이하다.
특정 구체예들에 있어서, 본 발명의 키메라 단백질은 한 개의 폴리펩티드 쇄를 포함하는데, 이 쇄는 단일 쇄 FVIII 단백질, 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역), 제 1 링커 (예컨대 트롬빈 절단가능한 링커), VWF 단편, 제 2 링커 (예컨대 트롬빈 절단가능한 링커), 그리고 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)를 포함하며, 이때 상기 단일 쇄 FVIII 단백질은 상기 제 1 이종기원의 모이어티에 연계되며, 이는 상기 제 1 링커에 의해 상기 VWF 단편에 연계되며, 그리고 상기 VWF 단편은 상기 제 2 링커에 의해 제 2 Fc 영역에 연계된다. 한 구체예에서, 상기 제 1링커는 제 1 절단가능한 부위와 제 2 절단가능한 부위가 포함된 절단가능한 링커다. 또 다른 구체예에서, 상기 제 2 링커는 하나 또는 두 개의 절단가능한 부위가 포함된 절단가능한 링커다. 특정 구체예에 있어서, 상기 제 2 링커는 트롬빈 절단가능한 링커다. 본 발명에 유용한 상기 링커는 길이가 예컨대 최소한 10개, 50개, 100개, 200개, 300개, 400개, 500개, 600개, 또는 700개의 아미노산일 수 있다. 예를 들면, 상기 링커는 20개 아미노산, 35 개 아미노산, 42 개 아미노산, 73 개 아미노산, 또는 98 개의 아미노산일 수 있다.
특정 구체예들에 있어서, 상기 VWF 단편은 펩티드 결합 또는 링커에 의해 상기 FVIII 단백질에 직접적으로 연계된다. 상기 VWF 단편과 FVIII 단백질을 직접적으로 또는 링커를 통하여 연결시키는 한 가지 방법으로써, 효소적 결찰 (예컨대 소르타제)이 이용될 수 있다. 예를 들면, 소르타제는 카르복실-말단 분급(sorting) 신호를 인지하고 이를 절단함으로써, 표면 단백질을 변형시키는 원핵(prokaryotic) 효소 군을 지칭한다. 소르타제 효소들의 대부분 기질들의 경우, 상기 인지 신호는 모티프 LPXTG (Leu-Pro-any-Thr-Gly (서열 번호: 106), 그 다음 매우 소수성이 큰 경막(transmembrane) 서열, 그 다음 염기성 잔기 가령, 아르기닌의 클러스터로 구성된다. 결찰 짝의 활성 부위 Cys 잔기에 Thr 잔기의 일시적 부착과 함께, 상기 Thr와 Gly 사이에서 절단이 일어나며, 이어서 세포 벽에 공유적으로 단백질을 부착시키는 트란스펩티드화(transpeptidation)가 일어난다. 일부 구체예들에 있어서, 상기 결찰 짝은 Gly(n)을 포함한다.
한 구체예에서, 임의선택적 링커에 의해 소르타제 인지 모티프에 연계된 VWF 단편은 소르타제에 의해 Gly(n)에 연계된 FVIII 단백질에 융합될 수 있고, 이때 n은 임의의 정수일 수 있다. 결찰 구조체는 상기 VWF 단편 (구조체의 N-말단 부분)과 FVIII 단백질 (구조체의 C-말단 부분)을 포함하고, 이때 상기 소르타제 인지 모티프는 이들 사이에 삽입된다. 도 24(a)에서 예시적인 구조체를 보여준다. 또 다른 결찰 구조체는 상기 VWF 단편 (구조체의 N-말단 부분, 링커, 소르타제 인지 모티프, 그리고 FVIII 단백질 (구조체의 C-말단 부분)을 포함한다 (예컨대 도 24(c)) 또 다른 구체예에서, 임의선택적 링커에 의해 소르타제 인지 모티프에 연계된 FVIII 단백질은 소르타제에 의해 Gly(n)에 연계된 VWF 단편에 융합될 수 있고, 이때 n은 임의의 정수일 수 있다. 생성된 결찰 구조체는 상기 FVIII 단백질 (구조체의 N-말단 부분)과 상기 VWF 단편 (구조체의 C-말단 부분)을 포함하고, 이때 상기 소르타제 인지 모티프는 이들 사이에 삽입된다. 도 24(b)에서 예시적인 구조체를 보여준다. 또 다른 생성된 결찰 구조체는 상기 FVIII 단백질 (구조체의 N-말단 부분), 링커, 소르타제 인지 모티프, 그리고 VWF 단편 (구조체의 C-말단 부분)을 포함한다(예컨대 도 24(d)). 다른 구체예들에 있어서, 제 1 임의선택적 링커에 의해 소르타제 인지 모티프에 연계된 VWF 단편은 제 2 임의선택적 링커에 의해 트롬빈 절단 부위에 연계된 이종기원의 모이어티, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 예컨대 Fc 영역에 융합될 수 있다. 생성된 구조체는 상기 VWF 단편 (N-말단 부분), 제 1링커, 소르타제 인지 모티프, 프로테아제 절단 부위, 제 2 임의선택적 링커, 그리고 이종기원의 모이어티를 포함할 수 있다(예컨대 도 24(e)). 특정 구체예들에 있어서, 이러한 생성된 구조체는 상기 FVIII 단백질과 제 2 이종기원의 모이어티, 예컨대 면역글로불린 불변 영역 또는 이의 일부분, 예컨대 제 2 Fc 영역이 포함된 키메라 단백질의 일부분이다. 한 실시예에서, 또 다른 실시예에서, 키메라는 3개의 폴리펩티드 쇄, 즉, VWF 단편, 상기 제 1링커, 소르타제 인지 모티프, 프로테아제 절단 부위, 제 2 임의선택적 링커, 제 1 이종기원의 모이어티가 포함된 상기 제 1 쇄, 상기 FVIII 단백질의 경쇄와 제 2 이종기원의 모이어티가 포함된 상기 제 2 쇄, 그리고 상기 FVIII 단백질의 중쇄가 포함된 상기 제 3 쇄를 포함한다.
여전히 다른 구체예들에 있어서, VWF 단편과 FVIII 단백질이 서로 공유적으로 연합되거나 또는 서로 공유적으로 연계된, 상기 VWF 단편과 FVIII 단백질이 포함된 본 발명의 상기 키메라 단백질은 상기 VWF 단편이 없는 FVIII 단백질보다 면역원성이 약하다. 상기 감소된 면역원성은 더 적은 체액성 면역 반응, 예컨대 더 적은 중화 항체 역가, 또는 FVIII에 대항하는 세포-중재된 더 적은 면역 반응, 예컨대 다양한 사이토킨의 생산이 포함되나 이에 한정되지 않는다.
여전히 다른 구체예들에 있어서, 본 발명의 결과로써, 상기 VWF 단편이 없는 FVIII 단백질 또는 야생형 FVIII와 비교하였을 때 상기 FVIII 단백질(또는 키메라 단백질)의 반감기는 연장된다. 상기 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 FVIII 단백질 반감기보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 또는 최소한 약 12 배 더 길다. 한 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII의 반감기 보다 약 1.5-배 내지 약 20-배, 약 1.5 배 내지 약 15 배, 또는 약 1.5 배 내지 약 10 배 더 길다. 또 다른 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII 또는 상기 VWF 단편이 없는 FVIII 단백질 과 비교하였을 때, 약 2-배 내지 약 10-배, 약 2-배 내지 약 9-배, 약 2-배 내지 약 8-배, 약 2-배 내지 약 7-배, 약 2-배 내지 약 6-배, 약 2-배 내지 약 5-배, 약 2-배 내지 약 4-배, 약 2-배 내지 약 3-배, 약 2.5-배 내지 약 10-배, 약 2.5-배 내지 약 9-배, 약 2.5-배 내지 약 8-배, 약 2.5-배 내지 약 7-배, 약 2.5-배 내지 약 6-배, 약 2.5-배 내지 약 5-배, 약 2.5-배 내지 약 4-배, 약 2.5-배 내지 약 3-배, 약 3-배 내지 약 10-배, 약 3-배 내지 약 9-배, 약 3-배 내지 약 8-배, 약 3-배 내지 약 7-배, 약 3-배 내지 약 6-배, 약 3-배 내지 약 5-배, 약 3-배 내지 약 4-배, 약 4-배 내지 약 6 배, 약 5-배 내지 약 7-배, 또는 약 6-배 내지 약 8 배 연장된다. 또 다른 구체예들에 있어서, 상기 FVIII의 반감기는 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 25 시간, 최소한 약 26 시간, 최소한 약 27 시간, 최소한 약 28 시간, 최소한 약 29 시간, 최소한 약 30 시간, 최소한 약 31 시간, 최소한 약 32 시간, 최소한 약 33 시간, 최소한 약 34 시간, 최소한 약 35 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간이다. 여전히 다른 구체예들에 있어서, 상기 FVIII의 반감기는 약 15 시간 내지 약 2 주, 약 16 시간 내지 약 1 주, 약 17 시간 내지 약 1 주, 약 18 시간 내지 약 1 주, 약 19 시간 내지 약 1 주, 약 20 시간 내지 약 1 주, 약 21 시간 내지 약 1 주, 약 22 시간 내지 약 1 주, 약 23 시간 내지 약 1 주, 약 24 시간 내지 약 1 주, 약 36 시간 내지 약 1 주, 약 48 시간 내지 약 1 주, 약 60 시간 내지 약 1 주, 약 24 시간 내지 약 6일, 약 24 시간 내지 약 5 일, 약 24 시간 내지 약 4 일, 약 24 시간 내지 약 3 일, 또는 약 24 시간 내지 약 2 일이다.
일부 구체예들에 있어서, 한 대상 당 상기 FVIII 단백질의 평균 반감기는 약 15 시간, 약 16 시간, 약 17 시간, 약 18 시간, 약 19 시간, 약 20 시간, 약 21 시간, 약 22 시간, 약 23 시간, 약 24 시간 (1 일), 약 25 시간, 약 26 시간, 약 27 시간, 약 28 시간, 약 29 시간, 약 30 시간, 약 31 시간, 약 32 시간, 약 33 시간, 약 34 시간, 약 35 시간, 약 36 시간, 약 40 시간, 약 44 시간, 약 48 시간 (2 일), 약 54 시간, 약 60 시간, 약 72 시간 (3 일), 약 84 시간, 약 96 시간 (4 일), 약 108 시간, 약 120 시간 (5 일), 약 6일, 약 7 일(1 주), 약 8 일, 약 9 일, 약 10 일, 약 11 일, 약 12 일, 약 13 일, 또는 약 14 일이다.
특정 구체예들에 있어서, 상기 VWF 단편에 공유적으로 연계된 상기 FVIII 단백질의 반감기는 FVIII 또는 FVIII 단량체-이량체 하이브리드로 구성된 폴리펩티드와 비교하였을 때, FVIII/VWF 이중 녹아웃 ("DKO") 마우스에서 연장될 수 있다.
A) 폰 빌레브란트 인자 (VWF) 단편들
VWF (또한 F8VWF로도 알려짐)는 혈액 혈장에 존재하고, 내피 (Weibel-Palade 체), 거핵구 (혈소판의 α-과립), 그리고 내피아래 연결 조직에서 구성적으로 생산되는 큰 다량체 당단백질이다. 상기 기본 VWF 단량체는 2813개 아미노산 단백질이다. 모든 단량체는 특이적 기능을 가진 다수의 특이적 도메인들을 포함하는데, 상기 D'와 D3 도메인들 (이들은 함께 인자 VIII에 결합하고), A1 도메인 (혈소판 GPIb-수용체, 헤파린에 결합하고, 및/또는 콜라겐에도 결합가능하며), A3 도메인 (콜라겐에 결합하고), C1 도메인 (이때 상기 RGD 도메인은 활성화되었을 때 혈소판 인테그린 αIIbβ3에 결합하고), 그리고 상기 단백질의 C-말단에 있는 "시스테인 매듭"(VWF가 혈소판-유도된 성장 인자 (PDGF), 형질변환 성장 인자-β (TGFβ) 그리고 β-인간 융모성 성선자극호르몬 (βHCG)와 공유하는)이 있다.
인간 VWF의 상기 2813개 단량체 아미노산 서열은 Genebank에서 수탁 번호(Accession Number)_NP_000543.2__로 보고된다. 상기 인간 VWF를 인코드하는 뉴클레오티드 서열은 Genebank에서 수탁 번호__NM_000552.3_로 보고된다. 인간 VWF의 상기 뉴클레오티드 서열은 서열 번호: 1로 지정된다. 서열 번호: 2는 서열 번호:1에 의해 인코드된 아미노산 서열이다. 표1에는 VWF의 각 도메인이 열거되어 있다.
표 1

본 발명은 VWF의 D' 도메인과 D3 도메인이 포함된 폰 빌레브란트 인자 (VWF) 단편에 관한 것으로, 이때 상기 VWF 단편은 내생성 VWF (전장 VWF)가 FVIII 단백질에 결합되는 것을 저해한다. 한 구체예에서, 상기 VWF 단편은 FVIII 단백질에 결합되거나 또는 연합된다. FVIII 단백질에 결합 또는 연합됨으로써, 본 발명의 VWF 단편은 프로테아제 절단 및 FVIII 활성화로부터 FVIII를 보호하고, FVIII의 상기 중쇄와 경쇄를 안정화시키고, 그리고 소거 수용체들에 의한 FVIII 제거를 방지한다. 또 다른 구체예에서, 상기 VWF 단편은 FVIII 단백질에 결합 또는 연합되고, 그리고 상기 FVIII 단백질이 인지질과 활성화된 단백질 C에 결합되는 것을 차단 또는 방지한다. 상기 FVIII 단백질이 내생성, 전장 VWF에 결합되는 것을 방지 또는 저해함으로써, 본 발명의 상기 VWF 단편은 VWF 제거 수용체들에 의한 FVIII 제거를 감소시키고, 따라서 FVIII의 반감기를 연장시킨다. 따라서, FVIII 단백질의 반감기 연장은 VWF 제거 수용체 결합 부위가 부족한 상기 VWF 단편이 상기 FVIII 단백질에 결합 또는 연합하고, 그리고 상기 VWF 제거 수용체 결합 부위가 포함된 내생성 VWF로부터 상기 VWF 단편에 의한 상기 FVIII 단백질의 차폐 또는 보호로 인한 것이다. 상기 VWF 단편에 결합된 또는 보호된 상기 FVIII 단백질은 또한 FVIII 단백질의 재순환을 허용할 수 있다. 따라서, 상기 VWF 단편은 전장의 성숙한 VWF는 아닐 것이다. 전장의 VWF 분자에 포함된 상기 VWF 제거 경로 수용체 결합 부위들을 제거함으로써, 본 발명의상기 FVIII/VWF 이형이량체들은 상기 VWF 제거 경로로부터 분리되고, 이로써 FVIII 반감기는 더 연장된다.
상기 D' 도메인과 D3 도메인이 포함된 상기 VWF 단편은 A1 도메인, A2 도메인, A3 도메인, D1 도메인, D2 도메인, D4 도메인, B1 도메인, B2 도메인, B3 도메인, C1 도메인, C2 도메인, CK 도메인, 이의 하나 또는 그 이상의 단편들 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 VWF 도메인을 더 포함할 수 있다. 한 구체예에서, VWF 단편은 다음을 포함하거나, 다음으로 필수적으로 구성되거나, 또는 구성된다: (1) VWF의 상기 D'와 D3 도메인들 또는 이의 단편들; (2) VWF의 상기 D1, D', 와 D3 도메인들 또는 이의 단편들; (3) VWF의 상기 D2, D', 그리고 D3 도메인들 또는 이의 단편들; (4) VWF의 상기 D1, D2, D', 그리고 D3 도메인들 또는 이의 단편들; 또는 (5) VWF의 상기 D1, D2, D', D3, 그리고A1 도메인들 또는 이의 단편들. 상기 본 명세서에서 설명된 VWF 단편은 VWF 제거 수용체에 결합하는 부위를 포함하지 않는다. 또 다른 구체예에서, 상기 본 명세서에서 설명된 VWF 단편은 서열 번호: 2의 아미노산 764 내지 1274는 아니다. 본 발명의 상기 VWF 단편은 상기 VWF 단편에 연계된 또는 융합된 임의의 다른 서열을 포함하지만, 전장 VWF는 아니다. 예를 들면, 본 명세서에서 설명된 VWF 단편은 신호 펩티드를 더 포함할 수 있다.
한 구체예에서, 본 발명의 VWF 단편은 VWF의 D' 도메인과 D3 도메인을 포함하는데, 이때 상기 D' 도메인은 서열 번호:2의 아미노산 764 내지 866에 대하여 최소한 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 이때 상기 VWF 단편은 FVIII 단백질에 결합하여, 내생성 VWF 단편이 FVIII 단백질에 결합하는 것을 차폐, 저해 또는 방지한다. 또 다른 구체예에서, VWF 단편은 VWF의 D' 도메인과 D3 도메인을 포함하고, 이때 상기 D3 도메인은 서열 번호:2의 아미노산 867 내지 1240에 대하여 최소한 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 이때 상기 VWF 단편은 FVIII 단백질에 결합하여, 내생성 VWF 단편이 FVIII 단백질에 결합하는 것을 차폐, 저해 또는 방지한다. 일부 구체예들에 있어서, 본 명세서에서 설명된 VWF 단편은 VWF의 상기 D' 도메인과 D3 도메인을 포함, 필수적으로 이들로 구성, 또는 구성되며, 이들은 서열 번호: 2의 아미노산 764 내지 1240에 최소한 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 이때 상기 VWF 단편은 FVIII 단백질에 결합하여, 내생성 VWF 단편이 FVIII 단백질에 결합하는 것을 차폐, 저해 또는 방지한다. 다른 구체예들에 있어서, VWF 단편은 상기 D1, D2, D', 그리고 D3 도메인들 포함, 필수적으로 이들로 구성, 또는 구성되며, 서열 번호:2의 아미노산 23 내지 1240에 최소한 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 이때 상기 VWF 단편은 FVIII 단백질에 결합하여, 내생성 VWF 단편이 FVIII 단백질에 결합하는 것을 차폐, 저해 또는 방지한다. 여전히 다른 구체예들에 있어서, 상기 VWF 단편은 이에 작용가능하도록 연계된 신호 펩티드를 더 포함한다.
일부 구체예들에 있어서, 본 발명의 VWF 단편은 필수적으로 다음으로 구성되거나 또는 다음으로 구성된다: (1) 상기 D'D3 도메인, 상기 D1D'D3 도메인, D2D'D3 도메인, 또는 D1D2D'D3 도메인 그리고 (2) 최대 약 10개의 아미노산 (예컨대 서열 번호: 2의 아미노산 764 내지 1240로부터 서열 번호:2의 아미노산 764 내지 1250까지에서 임의의 서열), 최대 약 15개의 아미노산 (예컨대 서열 번호: 2의 아미노산 764 내지 1240로부터 서열 번호:2의 아미노산 764 내지 1255까지에서 임의의 서열), 최대 약 20개의 아미노산 (예컨대 서열 번호: 2의 아미노산 764 내지 1240로부터 서열 번호:2의 아미노산 764 내지 1260까지에서 임의의 서열), 최대 약 25개의 아미노산 (예컨대 서열 번호: 2의 아미노산 764 내지 1240로부터 서열 번호:2의 아미노산 764 내지 1265까지에서 임의의 서열), 또는 최대 약 30개의 아미노산 (예컨대 서열 번호: 2의 아미노산 764 내지 1240로부터 서열 번호:2의 아미노산 764 내지 1260까지에서 임의의 서열)의 추가 VWF 서열. 한 특정 구체예에 있어서, 상기 D' 도메인과 D3 도메인을 포함하는 또는 이들로 필수적으로 구성된 상기 VWF 단편은 서열 번호: 2의 아미노산 764 내지 1274가 아니며, 전장의 성숙한 VWF도 아니다.
또 다른 구체예들에 있어서, 상기 D1D2 도메인들에 연계된 상기 D'D3 도메인들이 포함된 상기 VWF 단편은 세포내 절단 부위, 예컨대 (PACE 또는 PC5에 의한 절단 부위)를 더 포함하며, 이로써 발현 시에 상기 상기 D'D3 도메인들로부터 상기 D1D2 도메인들의 절단이 허용된다. 세포내 절단 부위의 비-제한적인 실시예는 본 명세서의 도처에 공개된다.
여전히 다른 구체예들에 있어서, VWF 단편은 상기 D' 도메인과 D3 도메인을 포함하지만, (1) 서열 번호: 2의 아미노산 1241 내지 2813, (2) 서열 번호: 2의 아미노산 1270 내지 아미노산 2813, (3) 서열 번호: 2의 아미노산 1271 내지 아미노산 2813, (4) 서열 번호: 2의 아미노산 1272 내지 아미노산 2813, (5) 서열 번호: 2의 아미노산 1273 내지 아미노산 2813, 그리고 (6) 서열 번호: 2의 아미노산 1274 내지 아미노산 2813으로부터 선택된 아미노산 서열은 포함하지 않는다.
여전히 다른 구체예들에 있어서, 본 발명의 VWF 단편은 상기 D' 도메인, D3 도메인, 그리고 A1 도메인에 상응하는 아미노산 서열을 포함하거나, 이 서열로 필수적으로 구성되거나, 또는 이 서열로 구성되며 이때 상기 아미노산 서열은 서열 번호: 2의 아미노산 764 내지 1479에 대하여 최소한 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 이때 상기 VWF는 FVIII에 결합한다. 한 특정 구체예에 있어서, 상기 VWF 단편은 서열 번호: 2의 아미노산 764 내지 1274는 아니다.
일부 구체예들에 있어서, 본 발명의 VWF 단편은 D' 도메인과 D3 도메인을 포함하지만, (1) A1 도메인, (2) A2 도메인, (3) A3 도메인, (4) D4 도메인, (5) B1 도메인, (6) B2 도메인, (7) B3 도메인, (8) C1 도메인, (9) C2 도메인, (10) CK 도메인, (11) CK 도메인 및 C2 도메인, (12) CK 도메인, C2 도메인, 그리고 C1 도메인, (13) CK 도메인, C2 도메인, C1 도메인, B3 도메인, (14) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, (15) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, 그리고 B1 도메인, (16) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, B1 도메인, 그리고 D4 도메인, (17) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, B1 도메인, D4 도메인, 그리고 A3 도메인, (18) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, B1 도메인, D4 도메인, A3 도메인, 그리고 A2 도메인, (19) CK 도메인, C2 도메인, C1 도메인, B3 도메인, B2 도메인, B1 도메인, D4 도메인, A3 도메인, A2 도메인, 그리고 A1 도메인, 그리고 (20) 이의 임의의 조합들로 구성된 군으로부터 선택된 최소한 하나의 VWF 도메인을 포함하지 않는다.
여전히 다른 구체예들에 있어서, 상기 VWF 단편은 comprises 상기 D'D3 도메인들과 하나 또는 그 이상의 도메인들 또는 모듈(modules)을 포함한다. 이러한 도메인들 또는 모듈의 실시예로는 Zhour 및 다른 사람들, 2012년 4월 6일자로 Blood: DOI 10.1182/blood-2012-01-405134에서 공개된 도메인들 및 모듈을 포함하나 이에 한정되지 않는다. 예를 들면, 상기 VWF 단편은 상기 D'D3 도메인과 A1 도메인, A2 도메인, A3 도메인, D4N 모듈, VWD4 모듈, C8-4 모듈, TIL-4 모듈, C1 모듈, C2 모듈, C3 모듈, C4 모듈, C5 모듈, C5 모듈, C6 모듈, 그리고 이의 임의의 조합들로 구성된 군으로부터 선택된 하나 또는 그 이상의 도메인 또는 모듈을 포함할 수 있다.
여전히 다른 구체예들에 있어서, 상기 VWF 단편은 이종기원의 모이어티에 연계되고, 이때 상기 이종기원의 모이어티는 상기 VWF 단편의 N-말단 또는 상기 C-말단에 연계되거나 또는 상기 VWF 단편에서 2개 아미노산 사이에 삽입된다. 예를 들면, 상기 VWF 단편에서 상기 이종기원의 모이어티에 대한 삽입 부위는 상기 D' 도메인, 상기 D3 도메인, 또는 이 둘 모두 안에 존재할 수 있다. 상기 이종기원의 모이어티는 반감기 증량제일 수 있다.
특정 구체예들에 있어서, 본 발명의 VWF 단편은 다량체, 예컨대 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 또는 이보다 더 높은 차원의 다량체를 형성한다. 또 다른 구체예들에 있어서, 상기 VWF 단편은 오직 하나의 VWF 단편을 갖는 단량체다. 일부 구체예들에 있어서, 본 발명의 상기 VWF 단편은 하나 또는 그 이상의 아미노산 치환들, 결손들, 추가들, 또는 변형을 보유할 수 있다. 한 구체예에서, 상기 VWF 단편은 상기 VWF 단편이 이황화결합 또는 이량체 또는 다량체를 형성하지 못하도록 아미노산 치환들, 결손들, 추가들, 또는 변형을 포함할 수 있다. 또 다른 구체예에서, 상기 아미노산 치환은 상기 D' 도메인과 D3 도메인 안에 존재한다. 한 특정 구체예에 있어서, 본 발명의 VWF 단편은 서열 번호: 2의 잔기 1099, 잔기 1142, 또는 이 둘 모두의 잔기 1099 및 1142에 상응하는 잔기에서 최소한 하나의 아미노산 치환을 포함한다. 상기 최소한 하나의 아미노산 치환은 야생형 VWF에서 자연적으로 발생되지 않는 임의의 아미노산일 수 있다. 예를 들면, 상기 아미노산 치환은 시스테인이외의 임의의 아미노산, 예컨대 이소류신, 알라닌, 류신, 아스파라긴, 리신, 아스파르트산, 메티오닌, 페닐알라닌, 글루타민산, 트레오닌, 글루타민, 트립토판, 글리신, 발린, 프롤린, 세린, 티로신, 아르기닌, 또는 히스티딘일 수 있다. 또 다른 실시예에서, 상기 아미노산 치환은 상기 VWF 단편들의 다량체 형성을 방지 또는 저해하는 하나 또는 그 이상의 아미노산을 갖는다.
특정 구체예들에 있어서, 본 명세서에서 유용한 상기 VWF 단편은 FVIII와 상호작용을 개선시키기 위하여, 예컨대 FVIII에 대한 결합 친화력을 개선시키기 위하여 더 변형될 수 있다. 비-제한적 예로써, 상기 VWF 단편은 서열 번호: 2의 아미노산 764에 상응하는 잔기에서 세린 잔기를 포함하고, 서열 번호:2의 아미노산 773에 상응하는 잔기에서 리신 잔기를 포함한다. 잔기 764 및/또는 773은 FVIII에 대한 상기 VWF 단편들의 결합 친화력에 기여할 수 있다. 또 다른 구체예들에 있어서, 상기 VWF 단편은 다른 변형을 가질 수 있으며, 예컨대 상기 단편은 페길화될 수 있고, 글리코실화될 수 있고, 헤실화될 수 있고, 또는 폴리시알릴화될 수 있다.
B) 이종기원의 모이어티들
상기 이종기원의 모이어티는 이종기원의 폴리펩티드 또는 이종기원의 비-폴리펩티드 모이어티일 수 있다. 특정 구체예들에 있어서, 상기 이종기원의 모이어티는 당분야에 공지된 반감기 연장 분자이고, 그리고 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두의 조합을 포함한다. 상기 이종기원의 폴리펩티드 모이어티는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, 트란스페린 또는 이의 단편, PAS 서열, HAP 서열, 이의 유도체 또는 변이체, 또는 이의 임의의 조합들을 포함할 수 있다. 일부 구체예들에 있어서, 상기 비-폴리펩티드 결합 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함한다. 특정 구체예들에 있어서, 하나, 둘, 셋 또는 그 이상의 이종기원의 모이어티들이 존재할 수 있으며, 이들은 각각 동일하거나 또는 상이한 분자일 수 있다.
1) 면역글로불린 불변 영역 또는 이의 일부분
면역글로불린 불변 영역은 CH (불변 중쇄) 도메인들 (CH1, CH2, 등등.)으로 표시된 도메인들을 포함한다. 아이소타입(isotype), (즉 IgG, IgM, IgA IgD, 또는 IgE)에 따라, 상기 불변 영역은 3개 또는 4개의 CH 도메인을 포함할 수 있다. 일부 아이소타입 (예컨대 IgG) 불변 영역들은 힌지 영역을 또한 포함한다. Janeway 그리고 다른 사람들. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.참고
본 발명의 상기 키메라 단백질을 생산하기 위하여 수많은 상이한 원천들로부터 면역글로불린 불변 영역 또는 이의 일부분이 획득될 수 있다. 바람직한 구체예들에 있어서, 면역글로불린 불변 영역 또는 이의 일부분은 인간 면역글로불린으로부터 유도된다. 그러나, 상기 면역글로불린 불변 영역 또는 이의 일부분은 또 다른 포유동물 종 예를 들면, 설치류(예컨대 마우스, 랫, 토끼, 기니아 피그) 또는 비-인간 영장류 (예컨대 침팬지, 마카크) 종이 포함된 또 다른 포유동물의 면역글로불린으로부터 유도될 수 있다. 더욱이, 상기 면역글로불린 불변 영역 또는 이의 일부분은 IgM, IgG, IgD, IgA 및 IgE가 포함된 임의의 면역글로불린 분류, 그리고 IgGl, IgG2, IgG3 및 IgG4가 포함된 임의의 면역글로불린 아이소타입으로부터 유도될 수 있다. 한 구체예에서, 상기 인간 아이소타입 IgG1가 이용된다.
공개적으로 접근가능한 기탁 형태로 다양한 면역글로불린 불변 영역 유전자 서열 (예컨대 인간 불변 영역 유전자 서열)이 이용가능하다. 특정 효과물질 기능을 보유하는 (또는 특정 효과물질 기능이 부족한) 또는 면역원성을 감소시키도록 변형된 불변 영역 도메인 서열이 선택될 것이다. 항체들의 많은 서열 및 항체-인코딩 유전자들이 공개되어 있으며, 적합한 Ig 불변 영역 서열 (예컨대 힌지, CH2, 및/또는 CH3 서열, 또는 이의 일부분들)은 당업계 인지된 기술들을 이용하여 이들 서열로부터 유오될 수 있다. 본 발명의 폴리펩티드를 획득하기 위하여 전술한 임의의 방법들에 의해 획득된 유전자 물질은 변형 또는 합성될 수 있다. 본 발명의 범위에는 불변 영역 DNA 서열의 대립형질, 변이체 및 돌연변이들이 포괄된다는 것을 더 이해할 것이다.
상기 면역글로불린 불변 영역 또는 이의 일부분의 서열은 예컨대 폴리메라제 쇄 반응과 관심 도메인을 증폭시키기 위하여 선택된 프라이머들을 이용하여 클론시킬 수 있다. 항체로부터 상기 면역글로불린 불변 영역 또는 이의 일부분의 서열을 클론하기 위하여, 하이브리도마, 비장, 또는 림프 세포들로부터 mRNA가 단리될 수 있고, DNA로 역전사되고, 그리고 항체 유전자들은 PCR에 의해 증폭된다. PCR 증폭 방법들은 다음에서 상세하게 설명된다: 미국 특허 제 4,683,195; 4,683,202; 4,800,159; 4,965,188; 그리고, 예컨대 "PCR Protocols: A Guide to Methods and Applications" Innis 그리고 다른 사람들. eds., Academic Press, San Diego, CA (1990); Ho 그리고 다른 사람들. 1989. Gene 77:51; Horton 그리고 다른 사람들. 1993. Methods Enzymol. 217:270). PCR은 콘센선스 불변 영역 프라이머들에 의해 개시될 수 있으며 또는 아미노산 서열의 공개된 중쇄 및 경쇄 DNA에 기초된 좀더 특이적인 프라이머들에 의해 개시될 수 있다. 상기에서 논의된 바와 같이, PCR은 상기 항체 경쇄 및 중쇄를 인코드하는 DNA 클론들을 단리하는데 또한 이용될 수 있다. 이 경우에 있어서, 콘센선스 프라이머들 또는 더 큰 상동성 프로브, 가령, 마우스 불변 영역 프로브들에 의해 이 라이브러리가 선별될 수 있다. 항체 유전자들의 증폭에 적합한 다수의 프라이머 세트는 당업계에 공지되어 있다(예컨대 정제된 항체의 N-말단 서열에 근거한 5' 프라이머들(Benhar and Pastan. 1994. Protein Engineering 7:1509); cDNA 말단의 신속한 증폭(Ruberti, F. 그리고 다른 사람들. 1994. J. Immunol. Methods 173:33); 항체 리더 서열 (Larrick 그리고 다른 사람들. 1989 Biochem. Biophys. Res. Commun. 160:1250). 항체 서열의 클로닝은 Newman 및 다른 사람들, 1995년 1월 25일자로 제출된 미국 특허 제5,658,570호에서 더 설명되며, 이 특허는 참고자료에 편입된다.
본 명세서에 이용된 면역글로불린 불변 영역은 모든 도메인들과 힌지 영역 또는 이의 일부분들을 포함할 수 있다. 한 구체예에서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 CH2 도메인, CH3 도메인, 그리고 힌지 영역, 예컨대, Fc 영역 또는 FcRn 결합 짝을 포함한다.
본 명세서에서 이용된 것과 같이, 용어 "Fc 영역"는 예컨대 두 중쇄의 각 Fc 도메인들의 이량체의연합에 의해 형성되는 것과 같이, 고유 면역글로불린의 Fc 영역에 대응하는 폴리펩티드의 일부로정의된다. 고유한 Fc 영역은 또 다른 Fc 영역과 함께 동종이량체를 형성한다. 대조적으로, 용어 "유전적으로 융합된 Fc 영역" 또는 "단일-쇄 Fc 영역" (scFc 영역)은 본 명세서에서 이용된 것과 같이, 단일 폴리펩티드 쇄(예컨대, 단일 인접 유전자 서열 안에 인코드된) 안에서 유전적으로 연계된 Fc 도메인들을 포함하는 합성 이량체 Fc 영역을 지칭한다.
한 구체예에서, 상기 "Fc 영역"는 파파인 절단 부위(즉, IgG에서 잔기 216, 중쇄 불변 영역의 제1 잔기는 114)의 상류 바로 힌지 영역에서 시작하고, 상기 항체의 C-말단에서 종료되는 단일 면역글로불린 중쇄의 일부분을 지칭한다. 따라서, 완전한 Fc 도메인은 최소한 힌지 도메인, CH2 도메인, 그리고 CH3 도메인을 포함한다.
면역글로불린 아이소타입에 따라 면역글로불린 불변 영역의 Fc 영역은 상기 CH2, CH3, 그리고 CH4 도메인, 뿐만 아니라 힌지 영역을 포함할 수 있다. 면역글로불린의 Fc 영역이 포함된 키메라 단백질은 증가된 안정성, 증가된 혈청 반감기 (Capon 그리고 다른 사람들., 1989, Nature 337:525 참고) 뿐만 아니라 Fc 수용체 가령, 신생아의 Fc 수용체 (FcRn)에 대한 결합을 포함하는 몇 가지 바람직한 성질들을 키메라 단백질에게 부여한다 (미국 특허 6,086,875, 6,485,726, 6,030,613; WO 03/077834; US2003-0235536A1), 이들의 전문이 참고자료에 편입된다.
면역글로불린 불변 영역 또는 이의 일부분은 FcRn 결합 짝일 수 있다. FcRn은 성인 상피 조직에서 활성이 있으며, 내장의 관강, 폐 기도, 코의 표면, 질 표면, 결장 및 직장의 표현에서 발현된다(미국 특허 제6,485,726호). FcRn 결합 짝은 FcRn에 결합하는 면역글로불린의 일부다.
상기 FcRn 수용체는 인간을 포함하는 몇몇 포유 동물로부터 단리되었다. 인간 FcRn, 원숭이 FcRn, 랫 FcRn, 그리고 마우스 FcRn의 서열은 공지되어 있다 (Story 그리고 다른 사람들. 1994, J. Exp. Med. 180:2377). 상기 FcRn 수용체는 상대적으로 낮은 pH에서 IgG에 결합하고 (그러나 다른 면역글로불린 분류 가령, IgA, IgM, IgD, 및 IgE에는 결합하지 않고), 내강(luminal)으로부터 장막 방향으로 세포를 통과하도록 IgG를 활발하게 운반하고, 그 다음 내장 유체에서 발견되는 상대적으로 더 높은 pH에서 IgG를 방출한다. 이는 성인 상피 조직에서 발현되는데(미국 특허 제 6,485,726호, 제6,030,613호, 제6,086,875호; WO 03/077834; US2003-0235536A1) 폐와 내장 상피(Israel 그리고 다른 사람들. 1997, Immunology 92:69) 신장 기부 관 상피(Kobayashi 그리고 다른 사람들. 2002, Am. J. Physiol. Renal Physiol. 282:F358) 뿐만 아니라 코의 상피, 질 표면과 쓸개 길(biliary tree) 표면이 포함된다.
본 발명에 유용한 FcRn 결합 짝은 전체 IgG, IgG의 상기 Fc 단편, 그리고 FcRn 수용체의 온전한 결합 영역이 포함된 다른 단편들을 포함하는 FcRn 수용체가 특이적으로 결합할 수 있는 분자들을 포괄한다. FcRn 수용체에 결합하는 IgG의 Fc 부분 영역은 X-선 결정학에 근거하여 설명된다(Burmeister 그리고 다른 사람들. 1994, Nature 372:379). Fc와 FcRn의 주요 접촉 지역은 상기 CH2와 CH3 도메인의 접합부분 근처에 있다. Fc-FcRn 접촉은 단일 Ig 중쇄 안에 모두 있다. 상기 FcRn 결합 짝들은 전체 IgG, IgG의 상기 Fc 단편, 그리고 FcRn 수용체의 온전한 결합 영역이 포함된 다른 단편들을 포함한다. 주요 접촉 부위는 상기 CH2 도메인의 아미노산 잔기 248, 250-257, 272, 285, 288, 290-291, 308-311, 및 314 그리고 상기 CH3 도메인의 아미노산 잔기 385-387, 428, 및 433-436을 포함한다. 면역글로불린 또는 면역글로불린 단편들, 또는 영역들의 아미노산 넘버링에 대한 기준은 모두 Kabat 그리고 다른 사람들. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md를 토대로 한다.
Fc 영역 또는 FcRn에 결합된 FcRn 결합 짝들은 FcRn에 의해 상피 장벽을 통하여 효과적으로 왕복할 수 있으며, 따라서 원하는 치료 분자를 전신으로 투여하는 비-침습성 수단을 제공한다. 추가적으로, Fc 영역 또는 FcRn 결합 짝이 포함된 융합 단백질은 상기 FcRn를 발현시키는 세포들에 의해 세포막의 함입에 의해 내화된다(endocytosed). 그러나, 현저히 분해되는 대신, 이들 융합 단백질은 순환계로 다시 재순환되고, 따라서 이들 단백질의 생체내 반감기는 증가된다. 특정 구체예들에 있어서, 면역글로불린 불변 영역들의 일부는 이황화결합 및 다른 비-특이적 상호작용을 통하여 또 다른 Fc 영역 또는 또 다른 FcRn 결합 짝과 전형적으로 연합되어 이량체 및 더 높은 차수의 다량체를 형성하는 Fc 영역 또는 FcRn 결합 짝이다.
2개의 FcRn 수용체는 단일 Fc 분자에 결합할 수 있다. 결정학적 데이터는 각 FcRn 분자가 Fc 동종이량체의 단일 폴리펩티드에 결합한다는 것을 암시한다. 한 구체예에서, FcRn 결합 짝, 예컨대 IgG의 Fc 단편을 생물학적으로 활성 분자에 연계시키면 구강, 볼, 설하, 직장, 질, 코 경로를 통하여 생물학적으로 활성 분자를 투여하는 에어로졸로써, 또는 폐 경로, 또는 안구 경로를 통하여 운반하는 수단을 제공한다. 또 다른 구체예에서, 상기 키메라 단백질은 침습성, 예컨대 피하, 정맥으로 투여될 수 있다.
FcRn 결합 짝 영역은 FcRn 수용체에 의해 특이적으로 결합될 수 있는 분자 또는 이의 일부분이며, 결과적으로 상기 Fc 영역의 FcRn 수용체에 의해 활성 운반된다. 특이적으로 결합된이란 생리학적 조건에서 두 분자가 상대적으로 안정적인 복합체를 형성하는 것을 지칭한다. 특이적 결합은 중간 내지 높은 수용력(capacity)을 통상적으로 보유하는 비-특이적 결합과 구별되는 낮거나 중간정도의 수용력과 높은 친화력을 특징으로 한다. 전형적으로, 상기 친화력 상수 KA가 10₆ M^-1 보다 높거나, 또는 10⁸ M^-1보다 높을 때, 이 결합은 특이적이라고 간주된다. 필요하다면, 결합 조건들을 변화시킴으로써, 특이적 결합에 실질적인 영향을 주지 않으면서 비-특이적 결합을 감소시킬 수 있다. 적절한 결합 조건들 가령, 분자들의 농도, 용액의 이온 강도, 온도, 결합을 허용하는 시간, 차단 물질들 (예컨대 혈청 알부민, 우유 카제인)의 농도, 등은 당업자에 의해 통상적인 기술을 이용하여 최적화될 수 있다.
특정 구체예들에 있어서, 본 발명의 키메라 단백질은 상기 Fc 영역에 대한 Fc 수용체(FcR) 결합 성질을 부여하는데 충분한 하나 또는 그 이상의 절두된(truncated) Fc 영역들을 포함한다. 예를 들면, FcRn에 결합하는 Fc 영역의 일부 (예컨대, 상기 FcRn 결합 부분)는 IgG1의 약 아미노산 282-438을 포함하고, EU 넘버링 (주요 접촉 부위들은 상기 CH2 도메인의 아미노산 248, 250-257, 272, 285, 288, 290-291, 308-311, 및 314, 그리고 상기 CH3 도메인의 아미노산 잔기 385-387, 428, 및 433-436 이다. 따라서, 본 발명의 Fc 영역은 FcRn 결합 부분을 포함하거나, 이 부분으로 구성될 수 있다. FcRn 결합 부분들은 IgGl, IgG2, IgG3 및 IgG4가 포함된 임의의 아이소타입 중쇄들로부터 유도될 수 있다. 한 구체예에서, 인간 아이소타입 IgG1 항체의 FcRn 결합 부분이 이용된다. 또 다른 구체예에서, 인간 아이소타입 IgG4 항체의 FcRn 결합 부분이 이용된다.
또 다른 구체예에서, 상기 "Fc 영역"는 Fc 도메인의 아미노산 서열 또는 Fc 도메인으로부터 유도된 아미노산 서열을 포함한다. 특정 구체예들에 있어서, Fc 영역은 다음중 최소한 하나를 포함한다: 힌지 (예컨대 상부, 중간, 및/또는 하부 힌지 영역) 도메인 (EU 넘버링에 따른 항체 Fc 영역의 대략 아미노산 216-230), CH2 도메인 (EU 넘버링에 따른 항체 Fc 영역의 대략 아미노산 231-340), CH3 도메인 (EU 넘버링에 따른 항체 Fc 영역의 대략 아미노산 341-438), CH4 도메인, 또는 이의 변이체, 이의 일부분, 또는 이의 단편. 또 다른 구체예들에 있어서, Fc 영역은 온전한 Fc 도메인 (예컨대, 힌지 도메인, CH2 도메인, 그리고 CH3 도메인)을 포함한다. 일부 구체예들에 있어서, Fc 영역은 CH3 도메인 (또는 이의 일부분)에 융합된 힌지 도메인(또는 이의 일부분), CH2 도메인 (또는 이의 일부분)에 융합된 힌지 도메인(또는 이의 일부분), CH3 도메인 (또는 이의 일부분)에 융합된 CH2 도메인(또는 이의 일부분), 힌지 도메인 (또는 이의 일부분)과 CH3 도메인 (또는 이의 일부분) 모두에 융합된 CH2 도메인 (또는 이의 일부분)을 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성된다. 여전히 다른 구체예들에 있어서, Fc 영역은 CH2 도메인의 최소한 일부분 (예컨대 CH2 도메인의 전부 또는 일부)이 없다. 한 특정 구체예에 있어서, Fc 영역은 EU 번호 221 내지 447에 상응하는 아미노산을 포함하거나 또는 이 아미노산들로 구성된다.
본 명세에서 F, F1, 또는 F2로 명시된 Fc 영역들은 다수의 상이한 원천으로부터 획득될 수 있다. 한 구체예에서, 상기 폴리펩티드의 Fc 영역은 인간 면역글로불린으로부터 유도된다. 그러나, Fc 영역은 예를 들면, 설치류(예컨대 마우스, 랫, 토끼, 기니아 피그) 또는 비-인간 영장류 (예컨대 침팬지, 마카크) 종들이 포함된 또 다른 포유동물 종의 면역글로불린으로부터 유도될 수 있다는 사실을 인지해야 한다. 더욱이, 상기 Fc 도메인들 또는 이의 일부분들의 폴리펩티드는 IgM, IgG, IgD, IgA 및 IgE가 포함된 임의의 면역글로불린과 IgGl, IgG2, IgG3 및 IgG4가 포함된 임의의 면역글로불린 아이소타입으로부터 유도될 수 있다. 또 다른 구체예에서, 상기 인간 아이소타입 IgG1이 이용되었다.
특정 구체예들에 있어서, 상기 Fc 변이체는 전술한 야생형 Fc 도메인이 포함된 Fc 영역에 의해 부여되는 최소한 한 가지 효과물질 기능에 변화 (예컨대 Fc 수용체 (예컨대 FcγRI, FcγRII, 또는 FcγRIII) 또는 보체 단백질(예컨대 C1q)에 결합하는 Fc 영역의 능력의 개선 또는 감소) 또는 항체-의존적 세포독성 (ADCC), 식세포활동(phagocytosis), 또는 보체-의존적 세포독성 (CDCC))을 촉발시키는 능력의 개선 또는 감소)를 부여한다. 또 다른 구체예들에 있어서, 상기 Fc 변이체는 공작된(engineered) 시스테인 잔기를 제공한다.
본 발명의 상기 Fc 영역들은 효과물질 기능 및/또는 FcR 또는 FcRn 결합에 있어서 변화(예컨대 개선 또는 감소)를 부여하는 것으로 공지된 당분야에서 인지된 Fc 변이체들을 이용할 수 있다. 특이적으로, 본 발명의 결합 분자는 다음 자료에 공지된 아미노산 위치중 하나 또는 그 이상에서 변화(예를 들면, 치환)을 포함할 수 있다: 국제 PCT 공개 WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO02/44215A2, WO02/060919A2, WO03/074569A2, WO04/016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1, WO06/047350A2, 및 WO06/085967A2; 미국 특허 출원 공개 US2007/0231329, US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080057056; 또는 미국 특허 5,648,260; 5,739,277; 5,834,250; 5,869,046; 6,096,871; 6,121,022; 6,194,551; 6,242,195; 6,277,375; 6,528,624; 6,538,124; 6,737,056; 6,821,505; 6,998,253; 7,083,784; 7,404,956, 및 7,317,091, 이들 각각은 본 명세서에 편입된다. 한 구체예에서, 상기 특이적 변화 (예컨대 당분야에 공개된 하나 또는 그 이상의 아미노산의 특정 치환)는 하나 또는 그 이상의 상기 공개된 아미노산 위치에서 만들어질 수 있다. 또 다른 구체예에서, 상기 공개된 아미노산 위치중 하나 또는 그 이상의 위치에서 상이한 변화 (예컨대 당분야에 공개된 하나 또는 그 이상의 위치에서의 상이한 치환)가 만들어질 수 있다.
FcRn에 의해 결합되는 변형된 IgG 또는 Fc 단편들 또는 이의 일부분들을 만들기 위하여, IgG의 상기 Fc 영역 또는 FcRn 결합 짝은 잘 알려진 절차, 가령, 부위 지향된 돌연변이생성과 이와 유사한 절차들에 따라 변형될 수 있다. 이러한 변형은 FcRn 접촉 부위로부터 떨어진 변형 뿐만 아니라 상기 FcRn에 대한 결합을 보존 또는 오히려 강화시키는 접촉 부위 안의 변형을 포함한다. 예를 들면, 인간 IgG1 Fc (Fcγ1) 내 다음 단일 아미노산 잔기는 FcRn에 대한 Fc 결합 친화력의 상당한 상실 없이 치환될 수 있는데: P238A, S239A, K246A, K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T289A, K290A, R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V303A, V305A, T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A, A327Q, P329A, A330Q, P331A, E333A, K334A, T335A, S337A, K338A, K340A, Q342A, R344A, E345A, Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A, S375A, D376A, A378Q, E380A, E382A, S383A, N384A, Q386A, E388A, N389A, N390A, Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A, V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A, 및 K447A, 여기에서 예를 들면 P238A는 위치 238에서 야생형 프롤린은 알라닌으로 치환됨을 나타낸다. 예를 들면, 특이적 구체예는 매우 보존된 N-당화 부위가 제거되는, N297A 돌연변이가 포함된다. 알라닌에 추가하여, 상기 명시된 위치에서 상기 야생형 아미노산은 다른 아미노산으로 치환될 수 있다. 돌연변이들은 Fc 안에 단독으로 도입될 수 있고, 이로 인하여 고유한 Fc와 구별되는 100개 이상의 Fc 영역들이 발생된다. 추가적으로, 이들 개별 돌연변이의 2, 3 또는 그 이상의 조합이 함께 도입될 수 있고, 이로 인하여 수백개의 Fc 영역들이 발생된다. 더욱이, 본 발명의 구조체의 Fc 영역중 하나가 돌연변이될 수 있고, 구조체의 다른 Fc 영역은 전혀 돌연변이 되지 않거나, 또는 이들 모두는 상이한 돌연변이들에 의해 돌연변이될 수 있다.
상기 특정 돌연변이들은 Fc 영역 또는 FcRn 결합 짝에 새로운 기능을 부여할 수 있다. 예를 들면, 한 구체예는 매우 보존된 N-당화 부위가 제거된 N297A를 포함한다. 상기 돌연변이의 효과는 상기 면역원성을 감소시켜 Fc 영역의 순환 반감기의 강화시키고), 그리고 상기 Fc 영역이 FcRn에 대한 친화력의 손상없이, FcγRI, FcγRIIA, FcγRIIB, 및 FcγRIIIA에 결합할 수 없도록 하는 것이다(Routledge 그리고 다른 사람들. 1995, Transplantation 60:847; Friend 그리고 다른 사람들. 1999, Transplantation 68:1632; Shields 그리고 다른 사람들. 1995, J. Biol. Chem. 276:6591). 상기에서 설명된 돌연변이들로 인하여 발생된 새로운 기능의 추가 실시예로써, FcRn에 대한 친화력은 일부 경우들의 경우 야생형의 친화력보다 더 증가될 수 있다. 이러한 증가된 친화력은 증가된 결합율("on" rate), 감소된 해리율("off" rate) 또는 증가된 결합율과 감소된 해리율 모두를 반영할 수 있다. FcRn에 대한 증가된 친화력을 부여하는 것으로 보이는 돌연변이들의 실시예는 T256A, T307A, E380A, 및 N434A를 포함하나 이에 한정되지 않는다 (Shields 그리고 다른 사람들. 2001, J. Biol. Chem. 276:6591).
추가적으로, 최소한 3가지 Fc 감마 수용체는 IgG 상의 하부 힌지 영역, 일반적으로 아미노산 234-237 안에 결합 부위를 인지하는 것으로 보인다. 따라서, 새로운 기능 및 잠재적으로 감소된 면역원성의 또 다른 실시예들은 이 영역의 돌연변이로 발생될 수 있는데, 예를 들면 인간 IgG1 아미노산 233-236 "ELLG"를 IgG2의 대응하는 서열 "PVA" (한 개 아미노산 결손)으로 대체하는 것이다. 다양한 효과물질 기능을 중재하는 FcγRI, FcγRII, 및 FcγRIII 들은 이러한 돌연변이들이 도입되었을 때 IgG1에 결합하지 못할 것이라는 것을 보여주었다. Ward and Ghetie 1995, Therapeutic Immunology 2:77 그리고 Armour 그리고 다른 사람들. 1999, Eur. J. Immunol. 29:2613.
한 구체예에서, 상기 면역글로불린 불변 영역 또는 이의 일부분, 예컨대, Fc 영역은 서열 PKNSSMISNTP (서열 번호: 3) 그리고 임의선택적으로 HQSLGTQ (서열 번호: 4), HQNLSDGK (서열 번호: 5), HQNISDGK (서열 번호: 6), 또는 VISSHLGQ (서열 번호: 7) (미국 특허 제5,739,277)에서 선택된 서열을 더 포함하는 폴리펩티드다.
또 다른 구체예에서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 또 다른 면역글로불린 불변 영역 또는 이의 일부분과 하나 또는 그 이상의 이황화결합을 형성하는 힌지 영역 또는 이의 일부분에 있는 아미노산 서열을 포함한다. 상기 면역글로불린 불변 영역 또는 이의 일부분에 의한 이황화결합은 내생성 VWF가 상기 VWF 단편을 대체하지 못하고 그리고 상기 FVIII에 결합하지 못하도록, FVIII이 포함된 상기 제 1 폴리펩티드와 상기 VWF 단편이 포함된 제 2 폴리펩티드를 함께 위치시킨다. 따라서, 상기 제 1 면역글로불린 불변 영역 또는 이의 일부분과 제 2 면역글로불린 불변 영역 또는 이의 일부분 사이의 이황화결합은 내생성 VWF와 상기 FVIII 단백질 사이에 상호작용을 막는다. 상기 VWF와 상기 FVIII 단백질 사이의 이러한 상호작용 저해로 인하여 상기 FVIII 단백질의 반감기는 2배 한계를 넘을 수 있다. 상기 힌지 영역 또는 이의 일부분은 CH1, CH2, CH3, 이의 단편, 그리고 이의 임의의 조합들중 하나 또는 그 이상의 도메인에 더 연계될 수 있다. 특정 실시예에서, 면역글로불린 불변 영역 또는 이의 일부분은 힌지 영역과 CH2 영역 (예컨대 Fc 영역의 아미노산 221-340)을 포함한다.
특정 구체예들에 있어서, 상기 면역글로불린 불변 영역 또는 이의 일부분은 절반-글리코실화된다. 예를 들면, 2개의 Fc 영역 또는 FcRn 결합 짝이 포함된 상기 키메라 단백질은 제 1의 글리코실화된 Fc 영역 (예컨대 글리코실화된 CH2 영역) 또는 FcRn 결합 짝 그리고 제 2의 글리코실화안된 Fc 영역 (예컨대 글리코실화안된 CH2 영역) 또는 FcRn 결합 짝을 포함할 수 있다. 한 구체예에서, 링커는 상기 글리코실화된 영역과 글리코실화안된 Fc 영역 사이에 끼어있을 수 있다. 또 다른 구체예에서, 상기 Fc 영역 또는 FcRn 결합 짝은 온전하게 글리코실화되고, 예컨대, 상기 Fc 영역의 모든 영역은 글리코실화된다. 또 다른 구체예들에 있어서, 상기 Fc 영역은 글리코실화안될 수 있고, 예컨대, 상기 Fc 모이어티들중 어느 것도 글리코실화되지 않는다.
특정 구체예들에 있어서, 본 발명의 키메라 단백질은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 변이체들)에 아미노산 치환을 포함하는데, 이 치환은 상기 Ig 불변 영역의 항원-독립적 효과물질 기능, 특히 상기 단백질의 순환 반감기를 변경시킨다.
이러한 단백질들은 이들 치환이 없는 단백질과 비교하였을 때, FcRn에 대한 결합이 증가 또는 감소됨을 나타내고, 따라서, 혈청에서 반감기는 각각 증가되거나 또는 감소된다. FcRn에 대한 개선된 친화력을 갖는 Fc 변이체들은 더 긴 혈청 반감기를 보유할 것으로 예상되며, 이러한 분자들은 투여된 폴리펩티드의 긴 반감기가 필요할 때, 예컨대 만성 질환 또는 장애를 치료하기 위하여 포유류를 치료하는 방법에서 유용한 용도를 갖는다 (예컨대, 미국 특허 7,348,004, 7,404,956, 및 7,862,820 참고). 대조적으로, 감소된 FcRn 결합 친화력을 갖는 Fc 변이체들은 더 짧은 반감기를 가질 것으로 예상되며, 이러한 분자들은 짧아진 순환 시간이 유익할 때, 예컨대 생체내 진단 영상화 또는 출발 폴리펩티드가 상당기간 동안 순환계에 존재할 때 독성 부작용이 있는 경우, 포유류에게 투여시 또한 유용하다. 감소된 FcRn 결합 친화력을 갖는 Fc 변이체들은 태반을 통과할 가능성이 적고, 따라서 임산부의 질환 또는 장애 치료에 또한 유용하다. 추가로, 감소된 FcRn 결합 친화력이 바람직할 수 있는 다른 용도는 뇌, 신장 및/또는 간에서의 국소화가 바함직한 경우의 용도를 포함한다. 하나의 예시적인 구체예에 있어서, 본 발명의 상기 키메라 단백질은 맥관구조로부터 신장 사구체의 상피를 통한 운반 감소를 나타낸다. 또 다른 구체예에서, 본 발명의 상기 키메라 단백질은 뇌의 혈액 뇌 방벽(BBB)을 통과하여 혈관 공간으로 운반 감소를 나타낸다. 한 구체예에서, 변경된 FcRn 결합을 가진 단백질은 Ig 불변 영역의 "FcRn 결합 루프" 안에 하나 또는 그 이상의 아미노산 치환을 가진 최소한 하나의 Fc 영역 또는 FcRn 결합 짝 (예컨대, 하나 또는 2개의 Fc 영역 또는 FcRn 결합 짝)을 포함한다. 상기 FcRn 결합 루프는 야생형, 전장의 Fc 영역의 아미노산 잔기 280-299(EU 넘버링에 따라)을 포함한다. 또 다른 구체예들에 있어서, 변경된 FcRn 결합 친화력을 갖는 본 발명의 키메라 단백질 내 Ig 불변 영역 또는 이의 일부분은 15 Å FcRn "접촉 지대" 안에 하나 또는 그 이상의 아미노산 치환을 갖는 최소한 하나의 Fc 영역 또는 FcRn 결합 짝을 포함한다. 본 명세서에서 이용된 것과 같이, 용어 15 Å FcRn "접촉 지대"는 야생형, 전장 Fc 모이어티중 다음의 아미노산 위치에 있는 잔기들을 포함한다: 243-261, 275-280, 282-293, 302-319, 336- 348, 367, 369, 372-389, 391, 393, 408, 424, 425-440 (EU 넘버링). 또 다른 구체예들에 있어서, 변경된 FcRn 결합 친화력을 갖는 본 발명의 Ig 불변 영역 또는 이의 일부분은 다음의 EU 위치중 임의의 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환들을 갖는 최소한 하나의 Fc 영역 또는 FcRn 결합 짝을 포함한다: 256, 277-281, 283-288, 303-309, 313, 338, 342, 376, 381, 384, 385, 387, 434 (예컨대 N434A 또는 N434K), 그리고 438. 변경된 FcRn 결합 활성이 변경된 예시적인 아미노산 치환들은 국제 PCT 공개 번호 WO05/047327에 공개되어 있으며, 본 명세서의 참고자료에 편입되어 있다.
본 발명에 이용된 Fc 영역 또는 FcRn 결합 짝은 상기 키메라 단백질의 당화를 변경시키는 당분야에서 인지된 아미노산을 또한 포함할 수 있다. 예를 들면, 상기 VWF 단편 또는 FVIII 단백질에 연계된 상기 키메라 단백질의 Fc 영역 또는 FcRn 결합 짝은 감소된 당화 (예컨대, N- 또는 O-연계된 당화)로 이어지는 돌연변이를 갖는 Fc 영역을 포함하거나 또는 야생형 Fc 모이어티의 변경된 당형태(glycoform)(예컨대, 낮은 푸코오스 또는 푸코오스-없는 글리칸)를 포함할 수 있다.
한 구체예에서, 본 발명의 가공되지 않은 키메라 단백질은 본 명세서에서 설명된 Ig 불변 영역 또는 이의 일부분으로부터 독립적으로 선택된 2개 또는 그 이상의 Ig 불변역 영역 또는 이의 일부분을 갖는 유전적으로 융합된 Fc 영역(예컨대, scFc 영역)을 포함할 수 있다. 한 구체예에서, 이량체성 Fc 영역에서 상기 Fc 영역들은 동일하다. 또 다른 구체예에서, 상기 Fc 영역들중 최소한 2개는 상이하다. 예를 들면, 본 발명의 상기 단백질의 Fc 영역들 또는 FcRn 결합 짝들은 동일한 수의 아미노산 잔기들을 포함하거나 또는 하나 또는 그 이상의 아미노산 잔기 (예컨대 약 5 개 아미노산 잔기 (예컨대 1, 2, 3, 4, 또는 5개의 아미노산 잔기), 약 10 개의 잔기, 약 15 개의 잔기, 약 20 개의 잔기, 약 30 개의 잔기, 약 40 개의 잔기, 또는 약 50 개의 잔기) 만큼 길이가 상이할 수 있다. 여전히 다른 구체예들에 있어서, 본 발명의 상기 단백질의 Fc 영역들 또는 FcRn 결합 짝들은 하나 또는 그 이상의 아미노산 위치에서 서열이 상이할 수 있다. 예를 들면, 상기 Fc 영역들 또는 FcRn 결합 짝들중 최소한 2개는 약 5개 아미노산 위치 (예컨대 1, 2, 3, 4, 또는 5 개 아미노산 위치), 약 10 개 위치, 약 15 개 위치, 약 20 개 위치, 약 30 개 위치, 약 40 개 위치, 또는 약 50 개 위치)에서 상이할 수 있다.
2) 알부민 또는 이의 단편, 또는 이의 변이체
특정 구체예들에 있어서, 상기 VWF 단편에 연계된 또는 FVIII 단백질에 연계된 상기 이종기원의 모이어티는 알부민 또는 이의 기능성 단편이다. 또 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 FVIII 단백질과 알부민 또는 이의 단편을 포함하고, 이때 상기 알부민 또는 이의 단편은 상기 FVIII 단백질 상에서 상기 VWF 결합 부위를 차폐 또는 보호하고, 이로 인하여 상기 FVIII 단백질과 내생성 VWF의 상호작용이 저해 또는 방지된다.
전장 형태에서 609개 아미노산의 단백질인, 인간 혈청 알부민 (HSA, 또는 HA)인 혈청 삼투압의 상당 부분을 담당하고, 내생성 리간드들과 외생성 리간드들의 운반체로 기능한다. 용어 "알부민"는 본 명세서에서 이용된 것과 같이, 전장 알부민 또는 이의 기능성 단편, 이의 변이체, 이의 유도체, 또는 이의 유사체를 포함한다.
한 구체예에서, 상기 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 알부민, 이의 단편, 또는 이의 변이체를 포함하고, 이때 상기 VWF 단편은 알부민 또는 이의 단편 또는 이의 이의 변이체에 연계된다. 또 다른 구체예에서, 상기 키메라 단백질은 서로 결합된 상기 VWF 단편과 FVIII 단백질을 포함하며, 이때 상기 VWF 단편은 알부민 또는 이의 단편 또는 이의 변이체에 연계되며, VIII 활성을 갖는 상기 단백질은 알부민 또는 이의 단편 또는 이의 변이체에 연계되고, 상기 VWF 단편과 VIII 활성을 가진 상기 단백질은 모두 알부민 또는 이의 단편 또는 이의 변이체에 연계된다. 또 다른 구체예들에 있어서, 알부민 또는 이의 단편 또는 이의 변이체에 연계된 상기 VWF 단편이 포함된 키메라 단백질은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 및 PEG으로 구성된 군에서 선택된 이종기원 모이어티에 더 연계된다. 여전히 다른 구체예들에 있어서, 상기 키메라 단백질은 서로 결합된 상기 VWF 단편과 FVIII 단백질을 포함하고, 이때 상기 FVIII 단백질은 알부민 또는 이의 단편 또는 이의 변이체에 연계되며, 그리고 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 및 PEG으로 구성된 군에서 선택된 이종기원 모이어티에 더 연계된다. 여전히 다른 구체예들에 있어서, 상기 키메라 단백질은 알부민 또는 이의 단편 또는 이의 변이체에 연계된 상기 VWF 단편과 알부민 또는 이의 단편 또는 이의 변이체 에 연계된 FVIII 단백질을 포함하며, 상기 VWF 단편과 FVIII 단백질은 서로 결합되어 있고, 이때 상기 VWF 단편 활성은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 및 PEG으로 구성된 군으로부터 선택된 제 1 이종기원의 모이어티에 더 연계되며, 이때 상기 FVIII 단백질 활성은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 및 PEG으로 구성된 군으로부터 선택된 제 2 이종기원의 모이어티에 더 연계된다.
또 다른 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 상기 이종기원의 모이어티는 상기 VWF 단편 또는 FVIII 단백질의 반감기를 연장하는(또는 연장시킬 수 있는) 알부민 또는 이의 단편 또는 이의 변이체다. 알부민 또는 이의 단편들 또는 이의 임의의 변이체들의 추가 실시예들은 다음에 공개되어 있다: 기국 특허 공개 번호 2008/0194481A1, 2008/0004206 A1, 2008/0161243 A1, 2008/0261877 A1, 또는 2008/0153751 A1 또는 PCT 출원 공개 번호 2008/033413 A2, 2009/058322 A1, 또는 2007/021494 A2.
3) 알부민 결합 모이어티
특정 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 상기 이종기원의 모이어티는 알부민 결합 모이어티이며, 이는 알부민 결합 펩티드, 세균성 알부민 결합 도메인, 알부민-결합 항체 단편, 또는 이의 임의의 조합들을 포함한다. 예를 들면, 상기 알부민 결합 단백질은 세균성 알부민 결합 단백질, 항체 또는 도메인 항체가 포함된 항체 단편일 수 있다 (미국 특허 제6,696,245호 참고). 알부민 결합 단백질은 예를 들면, 세균성 알부민 결합 도메인, 가령, 스트렙토코커스 단백질 G중의 하나일 수 있다(Konig, T. and Skerra, A. (1998) J. Immunol. Methods 218, 73-83). 접합(conjugation) 짝으로 이용될 수 있는 알부민 결합 펩티드의 다른 실시예는 예를 들면, Cys-Xaa ₁ -Xaa ₂ -Xaa ₃ -Xaa ₄ -Cys 콘센선스 서열을 갖는 것들이며, 이때 Xaa ₁은 Asp, Asn, Ser, Thr, 또는 Trp이고; Xaa ₂는 Asn, Gln이며, H는, Ile, Leu, 또는 Lys이고; Xaa ₃은 Ala, Asp, Phe, Trp, 또는 Tyr이며; Xaa ₄는 Asp, Gly, Leu, Phe, Ser, 또는 Thr이다: US 특허 출원 2003/0069395 또는 Dennis 그리고 다른 사람들. (Dennis 그리고 다른 사람들. (2002) J. Biol. Chem. 277, 35035-35043).
4) PAS 서열
또 다른 구체예들에 있어서, 상기 VWF 단편 또는 상기 FVIII 단백질에 연계된 상기 이종기원의 모이어티는 PAS 서열이다. 한 구체예에서, 상기 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 PAS 서열을 포함하고, 이때 상기 VWF 단편은 상기 PAS 서열에 연계된다. 또 다른 구체예에서, 본 발명의 키메라 단백질은 FVIII 단백질과 PAS 서열을 포함하고, 이때 상기 PAS 서열은 상기 FVIII 단백질 상에서 상기 VWF 결합 부위를 차폐 또는 보호하고, 이로 인하여, 상기 FVIII 단백질과 내생성 VWF의 상호작용이 저해 또는 방지된다.
PAS 서열은 본 명세서에서 이용된 것과 같이, 주로 알라닌과 세린 잔기를 포함하는 아미노산 서열 또는 주로 알라닌, 세린, 및 프롤린 잔기를 포함하는 아미노산 서열을 의미하고, 이 아미노산 서열은 생리학적 상태에서 랜덤 코일(random coil) 형태를 만든다. 따라서, 상기 PAS 서열은 알라닌, 세린, 그리고 프롤린을 포함하는, 이들로 필수적으로 구성된, 또는 구성된 빌딩 블록, 아미노산 중합체 또는 서열 카세트이며, 상기 키메라 단백질에서 상기 이종기원의 모이어티의 일부분으로 이용될 수 있다. 그럼에도 불구하고, 알라닌, 세린, 그리고 프롤린 이외의 다른 잔기가 PAS 서열의 소수 구성분으로 추가될 때 아미노산 중합체는 또한 랜덤 코일을 형성할 수 있음을 당업자는 알고 있다. 용어 "소수 구성분(minor constituent)"는 본 명세서에서 이용된 것과 같이, 알라닌, 세린, 그리고 프롤린이외의 아미노산이 어느 정도 수준, 예컨대 최대 약 12%, 예컨대, 상기 PAS 서열의 100개 아미노산중 약 12개, 최대 약 10%, 즉 상기 PAS 서열의 100개 아미노산중 약 10개, 최대 약 9%, 예컨대, 100개 아미노산중 약 9개, 최대 약 8%, 예컨대, 100개 아미노산중 약 8개, 약 6%, 예컨대, 100개 아미노산중 약 6개, 약 5%, 예컨대, 100개 아미노산중 약 5개, 약 4%, 예컨대, 100개 아미노산중 약 4개, 약 3%, 예컨대, 100개 아미노산중 약 3개, 약 2%, 예컨대, 100개 아미노산중 약 2개, 약 1%, 예컨대, 100개 아미노산중 약 1개가 PAS 서열에 추가될 수 있음을 의미한다. 알라닌, 세린 및 프롤린과 상이한 아미노산은 Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr, 및 Val으로 구성된 군으로부터 선택될 수 있다.
생리학적 조건하에서, 상기 PAS 서열 편(stretch)은 랜점 코일 형태를 만들고, 이로 인하여 상기 VWF 인자 또는 응고 활성 단백질에게 증가된 증가된 생체내 및/또는 시험관내 증가된 안정성을 중재할 수 있다. 상기 랜덤 코일 도메인은 자체가 안정한 구조 또는 기능을 취하지 않기 때문에, 여기에 융합된 상기 VWF 단편 또는 FVIII 단백질에 의해 중재된 생물학적 활성은 필수적으로 보존된다. 또 다른 구체예들에 있어서, 랜덤 코일 도메인을 형성하는 상기 PAS 서열은 혈액 혈장내에서 단백질 가수분해, 면역원성, 등전점(isoelectric point)/정전기적 거동(electrostatic behavior), 세포 표면 수용체에 대한 결합 또는 내화(internalization)에 있어서 특히 생물학적으로 비활성이지만, 여전히 생분해가능하며, 이는 합성 중합체 가령, PEG보다 명백한 장점을 제공한다.
랜덤 코일 형태를 만드는 상기 PAS 서열의 비-제한적 예로는 ASPAAPAPASPAAPAPSAPA (서열 번호: 8), AAPASPAPAAPSAPAPAAPS (서열 번호: 9), APSSPSPSAPSSPSPASPSS (서열 번호: 10), APSSPSPSAPSSPSPASPS (서열 번호: 11), SSPSAPSPSSPASPSPSSPA (서열 번호: 12), AASPAAPSAPPAAASPAAPSAPPA (서열 번호: 13) 그리고 ASAAAPAAASAAASAPSAAA (서열 번호: 14) 또는 이의 임의의 조합들로 구성된 군으로부터 선택된 아미노산 서열을 포함한다. PAS 서열의 추가 실시예는 다음에 공지되어 있는데, 예컨대 미국 특허 공개. 번호 2010/0292130 A1와 PCT 출원 공개 번호 WO 2008/155134 A1.
5) HAP 서열
특정 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 이종기원의 모이어티는 글리신-풍부한 동종-아미노산 중합체 (HAP)다. 상기 HAP 서열은 길이가 최소한 50개 아미노산, 최소한 100 개 아미노산, 120 개 아미노산, 140 개 아미노산, 160 개 아미노산, 180 개 아미노산, 200 개 아미노산, 250 개 아미노산, 300 개 아미노산, 350 개 아미노산, 400 개 아미노산, 450 개 아미노산, 또는 500 개의 아미노산을 갖는 글리신의 반복 서열을 포함할 수 있다. 한 구체예에서, 상기 HAP 서열은 HAP 서열에 융합된 또는 연계된 모이어티의 반감기를 연장시킬 수 있다. 상기 HAP 서열의 비-제한적 예는 (Gly)_n, (Gly₄Ser)_n 또는 S(Gly₄Ser)_n을 포함하나 이에 한정되지 않고, 이때 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20이다. 한 구체예에서, n은 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40이다. 또 다른 구체예에서, n은 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200이다. 예컨대, Schlapschy M 그리고 다른 사람들., Protein Eng. Design Selection, 20: 273-284 (2007) 참고.
6) 트란스페린 또는 이의 단편
특정 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 이종기원의 모이어티는 트란스페린 또는 이의 단편이다. Any transferrin may be used to make the chimeric proteins of the invention. 예를 들면, 야생형 인간 Tf (Tf)는 두 개 주요 도메인, N (약 330개 아미노산)과 C (약 340개 아미노산)를 갖는, 대략 75 KDa (당화를 고려하지 않음)의 679개 아미노산 단백질이며, 유전자 복제로 유래된 것으로 보인다. GenBank 수탁번호 NM001063, XM002793, M12530, XM039845, XM 039847 및 S95936 (www.ncbi.nlm.nih.gov/) 참고, 이의 전체가 참고자료에 모두 편입된다. 트란스페린은 2개의 도메인, N 도메인과 C 도메인을 포함한다. N 도메인은 2개의 하위도메인, N1 도메인과 N2 도메인을 포함하고, 그리고 C 도메인은 2개의 하위도메인, C1 도메인과 C2 도메인을 포함한다.
한 구체예에서, 상기 키메라 단백질의 트란스페린 부분은 트란스페린 스플라이스(splice) 변이체를 포함한다. 한 실시예에서, 트란스페린 스플라이스 변이체는 인간 트란스페린의 스플라이스 변이체, 예컨대 Genbank Accession AAA61140일 수 있다. 또 다른 구체예에서, 스플라이스(splice)상기 키메라 단백질의 트란스페린 부분은 트란스페린 서열의 하나 또는 그 이상의 도메인, 예컨대 N 도메인, C 도메인, N1 도메인, N2 도메인, C1 도메인, C2 도메인 또는 이의 임의의 조합들을 포함한다.
7) 중합체, 예컨대 폴리에틸렌 글리콜 (PEG)
다른 구체예들에 있어서, 응고활성, 예컨대 FVIII 활성을 갖는 상기 VWF 단편 또는 단백질에 부착된 상기 이종기원의 모이어티는 당분야에 공지된 가용성 중합체, 가령, 폴리에틸렌 글리콜, 에틸렌 글리콜/프로필렌 글리콜 공중합체들, 카르복시메틸셀룰로오즈, 덱스트란, 또는 폴리비닐 알코올이 포함되나 이에 한정되지 않는다. 상기 이종기원의 모이어티 가령, 가용성 중합체는 상기 VWF 단편 또는 FVIII 단백질 내 임의의 위치 또는 N- 또는 C- 말단에서 임의의 위치에 부착될 수 있다. 여전히 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 FVIII 단백질과 PEG를 포함하고, 이때 PEG는 상기 FVIII 단백질 상에서 VWF 결합 부위를 차폐 또는 보호하고, 이로 인하여 상기 FVIII 단백질과 내생성 VWF의 상호작용이 저해 또는 방지된다.
특정 구체예들에 있어서, 상기 키메라 단백질은 상기 본 명세서에서 설명된 VWF 단편과 PEG를 포함하고, 이때 상기 VWF 단편은 PEG에 연계된다. 또 다른 구체예에서, 상기 키메라 단백질은 서로 결합된 상기 VWF 단편과 FVIII 단백질을 포함하고, 이때 상기 VWF 단편은 PEG에 연계되고, 상기 FVIII 단백질은 PEG에 연계되고, 또는 상기 VWF 단편과 FVIII 단백질 모두는 PEG에 연계된다. 또 다른 구체예들에 있어서, PEG에 연계된 상기 VWF 단편이 포함된 키메라 단백질은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 그리고 알부민, 이의 단편, 또는 이의 변이체로 구성된 군에서 선택된 이종기원의 모이어티에 더 연계된다. 여전히 다른 구체예들에 있어서, 상기 키메라 단백질은 서로 결합된 상기 VWF 단편과 FVIII 단백질을 포함하고, 이때 상기 FVIII 단백질은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 그리고 알부민, 이의 단편, 또는 이의 변이체로 구성된 군에서 선택된 이종기원의 모이어티에 더 연계된다. 여전히 다른 구체예들에 있어서, 상기 키메라 단백질은 PEG에 연계된 상기 VWF 단편과, PEG에 연계된 FVIII 단백질을 포함하고, 이때 상기 VWF 단편과 FVIII 단백질은 서로 결합되어 있으며, 이때 상기 VWF 단편 활성은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 그리고 알부민, 이의 단편, 또는 이의 변이체로 구성된 군에서 선택된 제 1 이종기원의 모이어티에 더 연계되고, 그리고 이때 상기 FVIII 단백질 활성은 면역글로불린 불변 영역 또는 이의 일부분 (예컨대 Fc 영역), PAS 서열, HES, 그리고 알부민, 이의 단편, 또는 이의 변이체로 구성된 군에서 선택된 제 2 이종기원의 모이어티에 더 연계된다.
또한 추가적인 장점들 가령, 증가된 용해도, 안정성 그리고 상기 폴리펩티드의 순환 시간, 또는 감소된 면역원성을 제공할 수 있는 화학적으로 변형된 본 발명의 상기 키메라 단백질 유도체들이 본 발명에 의해 제공된다(미국 특허 제4,179,337호 참고). 변형을 위한 화학적 모이어티들은 폴리에틸렌 글리콜, 에틸렌 글리콜/프로필렌 글리콜 공중합체들, 카르복시메틸셀룰로오즈, 덱스트란, 그리고 폴리비닐 알코올이 포함되나, 이에 한정되지 않는 물 가용성 중합체로 구성된 군으로부터 선택될 수 있다. 상기 키메라 단백질은 분자 내 무작위 위치에서 또는 N- 또는 C- 말단, 또는 분자내 예정된 위치에서 변형될 수 있고, 1개, 2개, 3개 또는 그 이상의 부작된 화학적 모이어티를 포함할 수 있다.
상기 중합체는 임의의 분자량을 가질 수 있고, 분지화되거나 또는 분지화되지 않을 수 있다. 폴리에틸렌 글리콜의 경우, 한 구체예에서, 취급 및 제작의 용이성을 위하여 분자량은 약 1 kDa 내지 약 100 kDa 범위다. 바람직한 프로파일(예컨대 지속적인 방출 기간이 바람직한 경우, 생물학적 활성에 임의의 효과, 취급의 용이, 항원성 수준 또는 결핍 및 단백질 또는 유사체에 대한 폴리에틸렌 글리콜의 다른 공지된 효과)에 따라 상이한 크기가 이용될 수 있다. 예를 들면, 상기 폴리에틸렌 글리콜은 약 200, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 10,000, 10,500, 11,000, 11,500, 12,000, 12,500, 13,000, 13,500, 14,000, 14,500, 15,000, 15,500, 16,000, 16,500, 17,000, 17,500, 18,000, 18,500, 19,000, 19,500, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 55,000, 60,000, 65,000, 70,000, 75,000, 80,000, 85,000, 90,000, 95,000, 또는 100,000 kDa의 평균 분자량을 가질 수 있다.
일부 구체예들에 있어서, 상기 폴리에틸렌 글리콜은 분지화된 구조를 가질 수 있다. 분지화된 폴리에틸렌 글리콜은 공개되어 있고, 예를 들면, 미국 특허 제5,643,575호; Morpurgo 및 다른 사람들,Appl. Biochem. Biotechnol. 56:59-72 (1996); Vorobjev 그리고 다른 사람들., Nucleosides Nucleotides 18:2745-2750 (1999); 그리고 Caliceti 및 다른 사람들,Bioconjug. Chem. 10:638-646 (1999), 이들 각각은 전문이 본 명세서의 참고자료에 편입된다.
본 발명의 각 키메라 단백질, VWF 단편, 또는 FVIII 단백질에 부착된 폴리에틸렌 글리콜 모이어티들의 수 (예컨대, 치환도(degree of substitution)) 또한 다변할 수 있다. 예를 들면, 본 발명의 페길화된 단백질들은 평균 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 17, 20, 또는 그 이상의 폴리에틸렌 글리콜 분자에 연계될 수 있다. 유사하게, 단백질 분자당 상기 평균 치환도는 가령, 1-3, 2-4, 3-5, 4-6, 5-7, 6-8, 7-9, 8-10, 9-11, 10-12, 11-13, 12-14, 13-15, 14-16, 15-17, 16-18, 17-19, 또는 18-20개 범위의 폴리에틸렌 글리콜 모이어티다. 치환도를 결정하는 방법이 논의되는데, 예를 들면, Delgado 및 다른 사람들,Crit. Rev. Thera. Drug Carrier Sys. 9:249-304 (1992).
일부 구체예들에 있어서, 상기 FVIII 단백질은 페길화될 수 있다. 페길화된 인자 VIII는 인자 VIII와 최소한 하나의 폴리에틸렌 글리콜 (PEG) 분자 사이에 형성된 접합체(conjugate)를 지칭할 수 있다.
또 다른 구체예들에 있어서, 본 발명에 이용된 FVIII 단백질은 하나 또는 그 이상의 중합체에 접합된다. 상기 중합체는 물-가용성이며, 인자 VIII에 공유적으로 또는 비-공유적으로 부착되거나 또는 인자 VIII에 접합된 다른 모이어티에 공유적으로 또는 비-공유적으로 부착될 수 있다. 상기 중합체의 비-제한적인 실시예는 폴리(알킬렌 옥시드), 폴리(비닐 피롤리돈), 폴리(비닐 알코올), 폴리옥사졸린, 또는 폴리(아크릴로일몰포린)일 수 있다. 중합체-접합된 FVIII의 추가 유형은 미국 특허 7,199,223에 공개되어 있다.
8) 히드록시에틸 전분 (HES)
특정 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 이종기원의 모이어티는 중합체, 예컨대 히드록시에틸 전분 (HES) 또는 이의 유도체다. 한 구체예에서, 키메라 단백질은 본 명세서에서 설명된 VWF 단편과 HES를 포함하고, 이때 상기 VWF 단편은 HES에 연계된다. 또 다른 구체예들에 있어서, 본 발명의 키메라 단백질은 히드록시에틸 전분 (HES)에 융합된 FVIII 단백질을 포함하며, 이때 상기 히드록시에틸 전분 또는 이의 유도체는 내생성 VWF로부터 상기 FVIII 단백질 상에 있는 VWF 결합 부위를 차폐 또는 보호하고, 이로 인하여 상기 FVIII 단백질과 내생성 VWF의 상호작용이 저해 또는 방지된다.
히드록시에틸 전분 (HES)는 자연적으로 발생되는 아밀로펙틴의 유도체이며, 체내에서 알파-아밀라제에 의해 분해된다. HES는 탄수화물 중합체 아밀로펙틴의 치환된 유도체이며, 옥수수 전분 안에 중량의 최대 95% 농도로 존재한다. HES는 유익한 생물학적 성질을 나타내고, 혈액 체적 대체 물질로 이용되고, 그리고 병원에서 혈액희석 요법에 이용된다 (Sommermeyer 그리고 다른 사람들., Krankenhauspharmazie, 8(8), 271-278 (1987); 그리고 Weidler 그리고 다른 사람들., Arzneim.-Forschung/Drug Res., 41, 494-498 (1991)).
아밀로펙틴은 포도당 모이어티들을 포함하는데, 이때 대부분 쇄에서 알파-1,4-글리코시드 결합이 존재하고, 분기(branching) 부위들에서는 알파-1,6-글리코시드 결합이 발견된다. 이 분자의 물리적-화학적 성질들은 글리코시드 결합 유형에 의해 주로 결정된다. 흠이 있는(nicked) 알파-1,4-글리코시드 결합으로 인하여, 턴 하나당 약 6개의 포도당-단량체들이 있는 나선 구조가 만들어진다. 중합체의 물리-화학적 성질 뿐만 아니라 생화학적 성질도 치환에 의해 변형될 수 있다. 히드록시에틸 기의 도입은 알칼리 히드록시에틸화를 통하여 이루어질 수있다. 반응 조건들을 조작함으로써 히드록시에틸화에 있어서 치환안된 포도당 단량체에서 각 히드록시기의 상이한 반응성을 활용하는 것이 가능하다. 이러한 사실 때문에, 당업자는 한정된 범위까지 치환된 패턴에 영향을 줄 수 있다.
HES는 분자량 분포와 치환도에 의해 주로 특징화된다. DS라고 나타내는 상기 치환도는 질량(molar) 치환에 관계되며, 이는 당업자에게 공지되어 있다. 상기에서, 구체적으로 p273에서 언급된 바와 같은 Sommermeyer 그리고 다른 사람들., Krankenhauspharmazie, 8(8), 271-278 (1987) 참고.
한 구체예에서, 히드록시에틸 전분은 1 내지 300 kD, 2 내지 200kD, 3 내지 100 kD, 또는 4 내지 70kD의 평균 분자량(중량 평균)을 갖는다. 히드록시에틸 전분은 0.1 내지 3, 바람직하게는 0.1 내지 2, 더 바람직하게는 0.1 내지 0.9, 바람직하게는 0.1 내지 0.8의 질량 치환도와, 히드록시에틸 기에 대하여 2 내지 20 범위의 C2:C6 치환 비율을 더 나타낼 수 있다. 약 130 kD의 평균 분자량을 갖는 HES의 비-제한적 예는 0.2 내지 0.8 가령, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 또는 0.8, 바람직하게는 0.4 내지 0.7 가령, 0.4, 0.5, 0.6, 또는 0.7의 치환도를 갖는 HES다. 특정 구체예에 있어서, 약 130 kD의 평균 분자량을 갖는 HES는 Fresenius의 VOLUVEN® 이다. VOLUVEN®는 저혈량증(hypovolaemia)의 치료법 및 예방을 위한 치료 처방에서 체적 대체용으로 이용되는 인공 콜로이드다. VOLUVEN® 은 130,000+/-20,000 D의 평균 분자량과, 0.4의 질량 치환 그리고 약 9:1의 C2:C6 비율을 특징으로 한다. 또 다른 구체예들에 있어서, 히드록시에틸 전분의 평균 분자량은 예컨대 4 내지 70 kD 또는 10 내지 70 kD 또는 12 내지 70 kD 또는 18 내지 70 kD 또는 50 내지 70 kD 또는 4 내지 50 kD 또는 10 내지 50 kD 또는 12 내지 50 kD 또는 18 내지 50 kD 또는 4 내지 18 kD 또는 10 내지 18 kD 또는 12 내지 18 kD 또는 4 내지 12 kD 또는 10 내지 12 kD 또는 4 내지 10 kD의 범위다. 여전히 다른 구체예들에 있어서, 이용되는 히드록시에틸 전분의 평균 분자량은 4 kD이상 그리고 70 kD 이하의 범위, 가령, 약 10 kD, 또는 9 내지 10 kD 또는 10 내지 11 kD 또는 9 내지 11 kD 범위, 또는 약 12 kD, 또는 11 내지 12 kD) 범위 또는 12 내지 13 kD 또는 1 내지 13 kD, 또는 약 18 kD, 또는 17 내지 18 kD 또는 18 내지 19 kD 또는 17 내지 19 kD, 또는 약 30 kD 범위, 또는 29 내지 30, 또는 30 내지 31 kD 범위, 또는 약 50 kD, 또는 49 내지 50 kD 또는 50 내지 51 kD 또는 49 내지 51 kD 범위에 있다
특정 구체예들에 있어서, 상기 이종기원의 모이어티는 상이한 평균 분자량 및/또는 상이한 치환도 및/또는 상이한 C2: C6 치환 비율을 갖는 히드록시 에틸 전분 혼합물일 수 있다. 따라서, 상이한 평균 분자량과 상이한 치환도 그리고 상이한 C2: C6 치환 비율을 갖는, 또는 상이한 평균 분자량과 상이한 치환도 그리고 동일한 또는 거의 동일한 C2:C6 치환 비율을 갖는, 또는 상이한 평균 분자량과 동일한 또는 거의 동일한 치환도를 갖고, 그리고 상이한 C2:C6 치환 비율을 갖는, 또는 동일한 또는 거의 동일한 평균 분자량을 갖고, 상이한 치환도와 상이한 C2:C6 치환 비율을 갖는, 또는 상이한 평균 분자량과 동일한 또는 거의 동일한 치환도 그리고 동일한 또는 거의 동일한 C2:C6 치환 비율을 갖는, 또는 동일한 또는 거의 동일한 평균 분자량, 상이한 치환도와 동일한 또는 거의 동일한 C2:C6 치환 비율을 갖는, 또는 동일한 또는 거의 동일한 평균 분자량을 갖고, 동일한 또는 거의 동일한 치환도와 상이한 C2: C6 치환 비율을 갖는, 또는 거의 동일한 평균 분자량, 거의 동일한 치환도 그리고 거의 동일한 C2:C6 치환 비율을 갖는, 히드록시 에틸 전분 혼합물이 이용될 수 있다.
9) 폴리시알산 (PSA)
특정 구체예들에 있어서, 상기 VWF 단편 또는 FVIII 단백질에 연계된 상기 비-폴리펩티드 이종기원의 모이어티는 중합체, 예컨대 폴리시알산 (PSAs) 또는 이의 유도체다. 폴리시알산 (PSAs)은 특정 세균성 균주, 포유류내 특정 세포에서 생산되는 시알산의 분지화안된 자연적으로 발생되는 중합체다 Roth J., 그리고 다른 사람들. (1993) Polysialic Acid: From Microbes to Man, eds Roth J., Rutishauser U., Troy F. A. (Birkhauser Verlag, Basel, Switzerland), pp 335-348.. 이들은 제한된 산 가수분해 또는 뉴라미니다제로 절단, 또는 자연적, 세균에 의해 유도된 중합체 형태의 분획화(fractionation)에 의해 n=80부터 또는 더 많은 시알산 잔기로부터 n=2 까지로 감소된 다양한 중합도를 가지도록 만들어질 수 있다. 상이한 폴리시알산의 조성물은 다양하여, 동종중합체 형태 즉 대장균(E. coli) 균주 K1와 B-군 수막구균의 피막(capsular) 폴리사카라이드가 포함된 알파-2,8-연계된 폴리시알산이 있고, 이들은 뉴런 세포 흡착 분자 (N-CAM)의 미발달 형태에서 또한 발견된다. 이형중합체 형태 또한 존재하는데? 가령, 대장균 균주 K92의 교대로 알파-2,8 와 알파-2,9 폴리시알산과 N. 메닝지티디스(N. meningitides)의 C군 폴리사카라이드의 형태가 존재한다. 시알산은 시알산이외의 단량체 가령, N. 메닝지티디스(N. meningitides)</의 W135 군 또는 Y 군과 교번 공중합체로 또한 발견될 수 있다. 포유동물에서 폴리시알산에 대한 공지된 수용체는 비록 없지만, 폴리시알산은 병원성 박테리아에 의한 면역 회피 및 보체 시스템, 그리고 태아 발생 동안 미성숙 뉴런의 신경교 접착성의 조절이 포함된 중요한 생물학적 기능을 갖는다(이때 상기 중합체는 항-접착성 기능을 갖는다) Cho 그리고 Troy, P.N.A.S., USA, 91 (1994) 11427-11431. 대장균(E. coli) 균주 K1의 알파-2,8-연계된 폴리시알산은 '콜로민산(colominic acid)'로 또한 알려져 있고, 본 발명을 구체화하는데 (다양한 길이로) 이용된다. 폴리시알산을 폴리펩티드에 부착 또는 접합시키는 다양한 방법들이 설명되고 있다(예를 들면, 미국 특허 제5,846,951; WO-A-0187922, 및 US 2007/0191597 A1 참고, 이들은 전문이 본 명세서의 참고자료에 편입된다.
C) FVIII 단백질
"FVIII 단백질"은 본 명세서에서 이용된 것과 같이, 다른 언급이 없는 한, 응고에서 정상적인 역할을 하는 기능성 FVIII 폴리펩티드를 의미한다. 용어 FVIII 단백질은 응고 경로에서 전장의 야생형 인자 VIII의 기능을 보유하는 이의 기능성 단편, 변이체, 유사체, 또는 유도체를 포함한다. "FVIII 단백질"은 FVIII 폴리펩티드 (또는 단백질) 또는 FVIII과 호환이용된다. 상기 FVIII 기능의 실시예를 들면 응고를 활성화, 인자 IX에 대한 공인자로 작용하는 능력, 또는 Ca2+ 및 인지질 존재하에서 인자 IX와 테나제 복합체를 형성하는 능력, 이 복합체는 인자 X를 활성화된 형태의 Xa로 전환시키는 것들이 포함되나 이에 한정되지 않는다. 상기 FVIII 단백질은 인간, 돼지, 개, 랫(rat), 또는 뮤린 FVIII 단백질일 수 있다. 또한, 인간의 FVIII와 다른 종들의 FVIII 간의 비교에 의해 기능에 필요한 것으로 보이는 보존된 잔기가 확인되었다 (Cameron 및 다른 사람들,Thromb. Haemost. 79:317-22 (1998); 미국 특허 6,251,632).
응고 시스템의 기능을 평가하는데 다수의 테스트가 이용가능하다: 활성화된 일부 트롭보플라스틴 시간(aPTT) 테스트, 색원체 분석, ROTEM 분석, 프로트롬빈 시간 (PT) 테스트 (INR을 결정하는데 또한 이용됨), 피브리노겐 테스트 (대개 상기 Clauss 방법에 의해), 혈소판 계산, 혈소판 기능 테스트 (대개 PFA-100에 의해), TCT, 출혈 시간, 혼합 테스트 (환자의 혈장과 정상 혈장을 혼합하였을 때 비정상이 교정되는지 여부), 응고 인자 분석, 항인지질 항체, D-이량체, 유전자 테스트 (예컨대 인자 V Leiden, 프로트롬빈 돌연변이 G20210A), 러셀북 살무사(Russell's viper) 독 시간 희석 (dRVVT), 다양한 혈소판 기능 테스트, 혈전탄성묘사도 (TEG 또는 Sonoclot), 혈전탄성측정 (TEM®, 예컨대, ROTEM®), 또는 유글로블린 용해 시간 (ELT).
상기 aPTT 테스트는 "고유한" (또한 접촉 활성화 경로라고도 함) 경로와 공통 응고 경로 모두의 효과를 측정하는 실행 지표다. 이 테스트는 상업적으로 이용가능한 재조합 응고인자, 예컨대 FVIII 또는 FIX의 응고 활성을 측정하는데 흔히 이용된다. 비본질적 경로를 측정하는 프로트롬빈 시간 (PT)과 함께 이용된다.
ROTEM 분석은 지혈(haemostasis)의 전체 역학: 응고시간, 덩어리 형성, 덩어리 안정성 그리고 용해에 대한 정보를 제공한다 혈전탄성측정에서 상기 상이한 매개변수들은 혈장 응고 시스템, 혈소판 기능, 피브린용해, 또는 이들 상호작용에 영향을 주는 많은 인자들의 활성에 의존적이다. 이 분석에 의해 2차 지혈의 완전한 모습이 제공될 수 있다.
상기 FVIII 폴리펩티드와 폴리뉴클레오티드 서열은 공지되어 있고, 많은 기능적 단편들, 돌연변이체들 그리고 변형된 형태들이 있다. 인간 FVIII 서열 (전장)의 예들은 서열 번호: 16 또는 18에서 부분 서열(subsequences)로 나타낸다.
표 2. 전장 FVIII (FVIII 신호 펩티드는 밑줄로 표시되고; FVIII 중쇄는 이중 밑줄로 표시되고; B 도메인은 이탤릭체로 표시되고; 그리고 FVIII 경쇄는 평이한 문자로 표시된다)
신호 펩티드: (서열 번호: 15)

성숙 인자 VIII (서열 번호: 16)*

표 3. 전장 FVIII를 인코드하는 뉴클레오티드 서열 (서열 번호: 17)*

*밑줄로 표시된 핵산은 신호 펩티드를 인코드한다.
FVIII 폴리펩티드들은 전장 FVIII, N-말단에서 Met 없는 전장 FVIII, 성숙한 FVIII (신호 서열 제외), N-말단에 추가 Met를 가진 성숙한 FVIII, 및/또는 상기 B 도메인의 전부 또는 일부 결손된 FVIII을 포함한다. 특정 구체예들에 있어서, FVIII 변이체들은 일부 또는 전부가 결손된, B 도메인 결손을 포함한다.
상기 인간 FVIII 유전자는 포유동물 세포들에서 단리 및 발현된다 (Toole, J. J., 및 다른 사람들,Nature 312:342-347 (1984); Gitschier, J., 및 다른 사람들,Nature 312:326-330 (1984); Wood, W. I., 및 다른 사람들,Nature 312:330-337 (1984); Vehar, G. A., 및 다른 사람들,Nature 312:337-342 (1984); WO 87/04187; WO 88/08035; WO 88/03558; 그리고 미국 특허 제4,757,006). 상기 FVIII 아미노산 서열은 미국 특허 제4,965,199호에서 나타낸 것과 같이 cDNA로부터 추정되었다. 또한, B-도메인이 부분적으로 또는 완전하게 결실된 FVIII가 소개된다: 미국 특허 4,994,371호 및 제4,868,112호. 일부 구체예들에 있어서, 상기 인간 FVIII B-도메인은 미국 특허 제5,004,803호에서 나타낸 것과 같이, 인간 인자 V B-도메인으로 대체된다. 인간 인자 VIII를 인코드하는 cDNA 서열과 아미노산 서열은 하기 미국 출원 공개에서 서열 번호: 17과 16으로 각각 나타낸다 No. 2005/0100990.
돼지 FVIII 서열은 Toole, J. J., 및 다른 사람들, Proc. Natl. Acad. Sci. USA 83:5939-5942 (1986)에서 공개된다. 더욱이, 돼지 비장 cDNA 라이브러리의 FVIII 서열의 PCR 증폭으로부터 획득된 온전한 돼지 cDNA 서열은 Healey, J. F., 및 다른 사람들, Blood 88:4209-4214 (1996)에서 보고되었다. 모든 도메인, 모든 아단위들, 그리고 특이적 아미노산 서열의 치환을 보유한 인간/돼지 하이브리드 FVIII는 미국 특허 제5,364,771호, Lollar와 Runge, 및 WO 93/20093에서 공개되었다. 좀더 최근에, 돼지 FVIII의 상기 A1과 A2 도메인의 뉴틀레오티드와 이에 대응하는 아미노산 서열 그리고, 대응하는 인간 도메인들을 대체한 돼지 A1 및/또는 A2 도메인을 가진 키메라 FVIII의 뉴클레오티드 및 이에 대응하는 아미노산 서열은 WO 94/11503에서 보고되었다. 미국 특허 제5,859,204호, Lollar, J. S.,는 또한 돼지 cDNA와 추론된 아미노산 서열을 공개한다. 미국 특허 제6,458,563호는 B-도메인-결실된 돼지 FVIII를 공개한다.
미국 특허 제5,859,204호, Lollar, J. S.는 감소된 항원성과 감소된 면역반응성을 갖는 FVIII의 기능적 돌연변이체들을 보고한다. 미국 특허 제6,376,463호, Lollar, J. S.는 또한 감소된 면역반응성을 갖는 FVIII의 돌연변이체들을 보고한다. 미국 출원 공개 번호 2005/0100990, Saenko 그리고 다른 사람들은 상기 FVIII의 A2 도메인에서 기능적 돌연변이드을 보고한다.
한 구체예에서, 상기 FVIII (또는 키메라 단백질의 FVIII 부분)은 서열 번호: 18의 아미노산 1 내지 1438의 FVIII 아미노산 서열, 또는 서열 번호: 16의 아미노산 1 내지 2332(신호 서열 없는) 또는 서열 번호: 15와 서열 번호: 18의 아미노산 -19 내지 1438의 FVIII 아미노산 서열 또는 서열 번호: 15와 서열 번호: 16의 아미노산 -19 내지 2332 (신호 서열과 함께)에 대하여 최소한 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일할 수 있고, 이때 상기 FVIII는 응고활성을 갖는데, 예컨대, 인자 X를 활성화된 인자 X로 전환시키는 공진자로써 인자 IX를 활성화시킨다. 상기 FVIII (또는 키메라 단백질의 FVIII 부분)는 서열 번호: 18의 아미노산 1 내지 1438 또는 서열 번호: 16의 아미노산 1 내지 2332 (신호 서열 없이)의 FVIII 아미노산 서열과 동일할 수 있다. 상기 FVIII는 신호 서열을 더 포함할 수 있다.
본 명세서에서 이용된 것과 같이, FVIII의 상기 "B-도메인"는 내부 아미노산 서열 동일성과 단백질분해성 절단 부위, 예컨대, 전장 인간 FVIII의 잔기 Ser741-Arg1648로 특징화된 당분야에 공지된 상기 B-도메인과 동일하다. 다른 인간 FVIII 도메인들은 다음의 아미노산 잔기에 의해 특징화된다: A1, 잔기 Ala1-Arg372; A2, 잔기 Ser373-Arg740; A3, 잔기 Ser1690-Asn2019; C1, 잔기 Lys2020-Asn2172; C2, 잔기 Ser2173-Tyr2332. 상기 A3-C1-C2 서열은 잔기 Ser1690-Tyr2332를 포함한다. 나머지 서열, 잔기 Glu1649-Arg1689는 통상적으로 상기 a3 산성 영역으로 불린다. 돼지, 마우스 그리고 개의 FVIII의 상기 B-도메인이 포함된 모든 도메인의 경계 위치 또한 당분야에 공지되어 있다. 한 구체예에서, FVIII의 상기 B 도메인은 결실된다 ("B-도메인-결실된 인자 VIII" 또는 "BDD FVIII"). BDD FVIII의 예는 표 4에서 VIII 부분 서열과 동일한 서열을 갖는 REFACTO® (재조합 BDD FVIII)이다. (BDD FVIII 중쇄는 이중 밑줄로 표시되고; B 도메인은 이탤릭체로 표시되고; 그리고 BDD FVIII 경쇄는 평이한 문자로 표시된다).
표 4
BDD FVIII (서열 번호: 18)

표 5. BDD FVIII를 인코딩하는 뉴클레오티드 서열 (서열 번호: 19)^*

*밑줄로 표시된 핵산은 신호 펩티드를 인코드한다.
"B-도메인-결실된 FVIII"는 하기 미국 특허에서 공개된 완전한 또는 일부 결손을 가질 수 있다: 미국 특허 6,316,226, 6,346,513, 7,041,635, 5,789,203, 6,060,447, 5,595,886, 6,228,620, 5,972,885, 6,048,720, 5,543,502, 5,610,278, 5,171,844, 5,112,950, 4,868,112, 그리고 6,458,563. 일부 구체예들에 있어서, 본 발명의 B-도메인-결실된 FVIII 서열은 다음에서 공개된 결손중 임의의 하나를 포함한다: 컬럼 4, 라인 4 부터 컬럼 5, 라인 28 및 실시예 1-5, 미국 특허 번호 6,316,226 (또한 미국 특허 6,346,513). 또 다른 구체예에서, B-도메인 결실된 인자 VIII는 S743/Q1638 B-도메인 결실된 인자 VIII (SQ BDD FVIII) (예컨대 아미노산 744 내지 아미노산 1637이 결손된 인자 VIII, 예컨대 서열 번호: 16의 아미노산 1-743과 아미노산 1638-2332, 예컨대, 서열 번호: 18를 갖는 인자 VIII)이다. 일부 구체예들에 있어서, 본 발명의 B-도메인-결실된 FVIII는 다음에 공개된 결손을 갖는다: 컬럼. 2, 26-51줄과 실시예 5-8, 미국 특허 5,789,203 (또한 미국 특허 6,060,447, 미국 특허 5,595,886, 및 미국 특허6,228,620). 일부 구체예들에 있어서, B-도메인-결실된 인자 VIII는 다음에 설명된 결손을 갖는다: 컬럼. 1, 라인 25 내지 컬럼 2, 라인 40, 미국 특허 5,972,885; 컬럼 6, 라인 1-22 및 실시예 1, 미국 특허6,048,720; 컬럼 2, 라인 17-46, 미국 특허 번호 5,543,502; 컬럼 4, 라인 22 내지 컬럼 5, 라인 36, 미국 특허 번호 5,171,844; 컬럼 2, 라인 55-68, 도 2, 그리고 실시예 1, 미국 특허 번호 5,112,950; 컬럼 2, 라인 2 내지 컬럼 19, 라인 21과 표 2, 미국 특허 번호 4,868,112; 컬럼 2, 라인 1 내지 컬럼 3, 라인 19, 컬럼 3, 라인 40 내지 컬럼 4, 라인 67, 컬럼 7, 라인 43 내지 컬럼 8, 라인 26, 그리고 컬럼 11, 라인 5 내지 컬럼 13, 라인 39, 미국 특허 번호 7,041,635; 또는 컬럼 4, 라인 25-53, 미국 특허 번호 6,458,563.
일부 구체예들에 있어서, B-도메인-결실된 FVIII는 상기 B 도메인의 대부분의 결손을 갖지만, WO 91/09122에서 공개된 바와 같이, 생체내 단백질분해성 가공에 의해 1차 해독 산물을 2개의 폴리펩티드 쇄로 만드는데 필수적인 상기 B 도메인의 아미노-말단 서열은 여전히 포함한다. 일부 구체예들에 있어서, B-도메인-결실된 FVIII는 아미노산 747-1638의 결손, 즉, 상기 B 도메인의 사실상 완전하게 결손되도록 작제된다. Hoeben R.C., 그리고 다른 사람들. J. Biol. Chem. 265 (13): 7318-7323 (1990). B-도메인-결실된 인자 VIII는 FVIII 아미노산 771-1666 또는 아미노산 868-1562의 결손을 또한 포함할 수 있다. Meulien P., 그리고 다른 사람들. Protein Eng. 2(4): 301-6 (1988). 본 발명의 일부가 되는 추가적인 B 도메인 결손은 다음을 포함한다: 아미노산 982 내지 1562 또는 760 내지 1639의 결손 (Toole 및 다른 사람들,Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 아미노산 797 내지 1562의 결손 (Eaton, 그리고 다른 사람들. Biochemistry (1986) 25:8343-8347)), 아미노산 741 내지 1646의 결손 (Kaufman (PCT published Application No. WO 87/04187)), 아미노산 747-1560의 결손 (Sarver, 및 다른 사람들,DNA (1987) 6:553-564)), 741 내지 1648의 결손 (Pasek (PCT 출원 번호 88/00831)), 또는 아미노산 816 내지 1598 또는 아미노산 741 내지 1648의 결손 (Lagner (Behring Inst. Mitt. (1988) No 82:16-25, EP 295597)). 또 다른 구체예들에 있어서, BDD FVIII는 하나 또는 그 이상의 N-연계된 당화 부위, 예컨대 전장 FVIII 서열의 아미노산에 대응하는 잔기 757, 784, 828, 900, 963, 또는 임의선택적으로 943을 유지하는 상기 B-도메인의 단편들이 포함된 FVIII 폴리펩티드를 포함한다. 상기 B-도메인 단편들의 실시예로는 상기 B-도메인의 226개 아미노산 또는 163개 아미노산을 포함하며, 이는 다음에 공개된다; Miao, H.Z., 및 다른 사람들, 혈액 103(a): 3412-3419 (2004), Kasuda, A, 및 다른 사람들,J. Thromb. Haemost. 6: 1352-1359 (2008), 그리고 Pipe, S.W., 및 다른 사람들,J. Thromb. Haemost. 9: 2235-2242 (2011) (예컨대, 상기 B 도메인의 첫 226개 아미노산 또는 163개 아미노산이 유지된다). 일부 구체예들에 있어서, 부분적인 B-도메인을 가진 상기 FVIII은 FVIII198 (서열 번호: 105)이다. FVIII198은 쇄 FVIIIFc 분자-226N6을 포함하는 부분적인 B-도메인이다. 226은 상기 FVIII B-도메인의 N-말단 226개 아미노산을 나타내고, N6는 상기 B-도메인에서 6개 N-당화 부위를 나타낸다. 여전히 다른 구체예들에 있어서, BDD FVIII는 상기 BDD FVIII 단백질의 발현을 개선시키기 위하여 잔기 309에서 점 돌연변이(Phe에서 Ser으로)를 더 포함한다. Miao, H.Z., 및 다른 사람들, Blood 103(a): 3412-3419 (2004) 참고. 여전히 다른 구체예들에 있어서, 상기 BDD FVIII는 상기 B-도메인의 일부분이 포함되지만, 하나 또는 그 이상의 퓨린 절단 부위 (예컨대 Arg1313 및 Arg 1648)가 포함되지 않는 FVIII 폴리펩티드를 포함한다. Pipe, S.W., 및 다른 사람들, J. Thromb 참고. Haemost. 9: 2235-2242 (2011). 전술한 각 결손은 임의의 FVIII 서열에 만들어질 수 있다.
본 발명에 유용한 FVIII 단백질은 하나 또는 그 이상의 추가적인 이종기원의 서열 또는 화학적 또는 물리적 변형을 갖는 FVIII을 포함할 수 있지만, 이러한 변형은 상기 FVIII 응고 활성에 영향을 주지 않는다. 이러한 이종기원의 서열 또는 화학적 또는 물리적 변형은 상기 FVIII 단백질의 C-말단 또는 N-말단에 융합되거나 또는 상기 FVIII 단백질 내 하나 또는 그 이상의 두 아미노산 잔기 사이에 삽입될 수 있다. 상기 FVIII 단백질 안에 이러한 삽입은 상기 FVIII 응고 활성 또는 FVIII 기능에 영향을 주지 않는다. 한 구체예에서, 상기 삽입들은 상기 FVIII 단백질의 약동학 성질 (예컨대 반감기)을 개선시킨다. 또 다른 구체예에서, 2, 3, 4, 5 또는 6개 부위 이상에 삽입이 있을 수 있다.
한 구체예에서, FVIII는 아미노산 1648 (전장 인자 VIII 또는 서열 번호: 16에서), 아미노산 754 (S743/Q1638 B-도메인 결실된 인자 VIII 또는 서열 번호: 16에서)의 아르기닌 바로 뒤, 또는 대응하는 아르기닌 잔기 (다른 변이체들의 경우)에서 절단되고, 이로 인하여 중쇄와 경쇄가 생성된다. 또 다른 구체예에서, FVIII는 금속 이온-중재된 비-공유 결합에 의해 연계 또는 연합된, 중쇄와 경쇄를 포함한다.
또 다른 구체예들에 있어서, FVIII는 아미노산 1648 (전장 인자 VIII 또는 서열 번호: 16에서), 아미노산 754 (S743/Q1638 B-도메인 결실된 인자 VIII 또는 서열 번호: 18에서)의 아르기닌 바로 뒤, 또는 대응하는 아르기닌 잔기 (다른 변이체들의 경우) 바로 뒤에서 절단되지 않은 단일 쇄 FVIII 이다 단일 쇄 FVIII는 하나 또는 그 이상의 아미노산 치환을 포함할 수 있다. 한 구체예에서, 상기 아미노산 치환은 전장 성숙한 인자 VIII 폴리펩티드 (서열 번호: 16)의 잔기 1648, 잔기 1645 또는 이 두 잔기 모두에서, 또는 SQ BDD 인자 VIII (서열 번호: 18)의 잔기 754, 잔기 751, 또는 이 두 잔기 모두에 대응하는 잔기에 있다. 상기 아미노산 치환은 아르기닌이외의 임의의 아미노산, 예컨대 이소류신, 류신, 리신, 메티오닌, 페닐알라닌, 트레오닌, 트립토판, 발린, 알라닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 프롤린, 셀레노시스테인, 세린, 티로신, 히스티딘, 오르니틴, 피로리신, 또는 타우린일 수 있다.
FVIII는 트롬빈에 의해 더 절단될 수 있고, 그 다음 FVIIIa로 활성화되어, 활성화된 인자 IX (FIXa)의 공인자로 작용한다. 그리고 활성화된 FVIII와 함께 상기 활성화된 FIX는 Xase 복합체를 형성하고, 그리고 인자 X를 활성화된 인자 X (FXa)로 전환시킨다. 활성화를 위하여, FVIII는 트롬빈에 의해 아미노산 372, 740, 및 1689 (상기 B-도메인 결실된 FVIII 서열에서 아미노산 372, 740,및 795에 상응하는)에서 3개의 아르기닌 잔기 다음에 절단되고, 이 절단으로 50kDa A1, 43kDa A2, 및 73kDa A3-C1-C2 쇄를 가진 FVIIIa가 생성된다. 한 구체예에서, 본 발명에 유용한 상기 FVIII 단백질은 비-활성 FVIII이다. 또 다른 구체예에서, 상기 FVIII 단백질은 활성화된 FVIII이다.
상기 VWF 단편에 연계된 또는 연합된 FVIII 폴리펩티드를 갖는 단백질은 서열 번호: 16 또는 18에 대하여 최소한 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함할 수 있고, 이때 상기 서열은 상기 FVIII 응고 활성을 보유하고, 예컨대, 인자 X를 활성화된 인자 X (FXa)로 전환시키는 공인자로써 인자 IX를 활성화시킨다.
본 명세서에서 이용된 것과 같이, "하이브리드" 폴리펩티드들과 단백질이란 제 1 이종기원의 모이어티에 임의선택적으로 융합된 제 1 폴리펩티드 쇄, 예컨대 상기 VWF 단편과 제 2 이종기원의 모이어티에 임의선택적으로 융합된 제 2 폴리펩티드 쇄, 예컨대 FVIII 단백질의 조합을 의미하고, 이로 인하여 이형이량체가 형성된다. 한 구체예에서, 하이브리드에서 상기 제 1 폴리펩티드와 제 2 폴리펩티드는 단백질-단백질 상호작용, 가령, 전하-전하 또는 소수성 상호작용을 통하여 서로 연합된다. 또 다른 구체예에서, 하이브리드에서 상기 제 1 폴리펩티드와 제 2 폴리펩티드는 이황화물 또는 다른 공유 결합(들)을 통하여 서로 연합된다. 하이브리드는 예를 들면, US 2004/101740 및 US 2006/074199에서 설명된다. 상기 제 2 폴리펩티드는 상기 제 1 폴리펩티드의 동일한 복사체일 수 있고 또는 비-동일 폴리펩티드일 수 있다. 한 구체예에서, 상기 제 1폴리펩티드는 VWF 단편-Fc 융합 단백질이며, 상기 제 2 폴리펩티드는 FcRn 결합 도메인을 포함하는, 이 도메인으로 필수적으로 구성된 또는 구성된 폴리펩티드이며, 이때 상기 제 1 폴리펩티드와 제 2 폴리펩티드는 서로 연합된다. 또 다른 구체예에서, 상기 제 1폴리펩티드는 VWF 단편-Fc 융합 단백질이고, 상기 제 2 폴리펩티드는 FVIII-Fc 융합 단백질을 포함하여, 이 하이브리드는 이형이량체가 된다. 상기 제 1 폴리펩티드와 제 2 폴리펩티드는 상기 제 1 Fc 영역과 제 2 Fc 영역 사이에 공유 결합, 예컨대 이황화 결합을 통하여 연합될 수 있다. 상기 제 1 폴리펩티드와 제 2 폴리펩티드는 상기 VWF 단편과 FVIII 단백질 사이에 결합에 의해 더 연합될 수 있다.
D) 링커
본 발명의 상기 키메라 단백질은 링커를 더 포함한다. 하나 또는 그 이상의 링커는 임의의 두 단백질 사이, 예컨대 상기 부속 모이어티와 FVIII 단백질 사이 ("FVIII/AM 링커"로도 또한 지칭됨), 상기 VWF 단편과 제 1 이종기원의 모이어티, 예컨대 제 1 Fc 영역 사이 ( "VWF 링커"로도 또한 지칭됨), FVIII 단백질과 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역 사이 ( "FVIII 링커"로도 지칭됨), 상기 VWF 단편과 FVIII 단백질 (예컨대 FVIII/AM 링커) 사이, 상기 VWF 단편과 제 2 이종기원의 모이어티 사이, 및/또는 FVIII 단백질과 제 1 이종기원의 모이어티 사이에 존재할 수 있다. 각 링커는 동일하거나 또는 상이한 서열을 가질 수 있다. 한 구체예에서, 상기 링커는 폴리펩티드 링커다. 또 다른 구체예에서, 상기 링커는 비-폴리펩티드 링커다.
본 발명에 유용한 상기 링커는 임의의 유기 분자를 포함할 수 있다. 한 구체예에서, 상기 링커는 중합체, 예컨대 폴리에틸렌 글리콜 (PEG) 또는 히드록시에틸 전분 (HES)이다. 또 다른 구체예에서, 상기 링커는 아미노산 서열 (예컨대 폴리펩티드 링커)이다. 상기 폴리펩티드 링커는 최소한 약 10 개, 20 개, 30 개, 40 개, 50 개, 60 개, 70 개, 80 개, 90 개, 100 개, 150 개, 200 개, 300 개, 400 개, 500 개, 600 개, 700 개, 800 개, 900 개, 1000 개, 1100 개, 1200 개, 1300 개, 1400 개, 1500 개, 1600 개, 1700 개, 1800 개, 1900 개, 또는 2000개 아미노산을 포함할 수 있다. 상기 링커는 1-5개의 아미노산, 1-10개의 아미노산, 1-20개의 아미노산, 10-50개의 아미노산, 50-100개의 아미노산, 100-200개의 아미노산, 200-300개의 아미노산, 300-400개의 아미노산, 400-500개의 아미노산, 500-600개의 아미노산, 600-700개의 아미노산, 700-800개의 아미노산, 800-900개의 아미노산, 또는 900-1000개의 아미노산을 포함할 수 있다.
폴리펩티드 링커의 실시예들은 당분야에 공지되어 있다. 한 구체예에서, 상기 링커는 서열 Gn을 포함한다. 상기 링커는 서열 (GA)n을 포함할 수 있다. 상기 링커는 서열 (GGS)n을 포함할 수 있다. 또 다른 구체예들에 있어서, 상기 링커는 (GGGS)n (서열 번호: 20)을 포함한다. 여전히 다른 구체예들에 있어서, 상기 링커는 서열 (GGS)n(GGGGS)n (서열 번호: 21)을 포함한다. 이들 경우에서, n은 1-100 사이 임의의 정수일 수 있다. 다른 경우들에 있어서, n은 1-20 사이의 정수, 즉., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20일 수 있다. 링커의 실시예로는 GGG, SGGSGGS (서열 번호: 22), GGSGGSGGSGGSGGG (서열 번호: 23), GGSGGSGGGGSGGGGS (서열 번호: 24), GGSGGSGGSGGSGGSGGS (서열 번호: 25), GGGGSGGGGSGGGGS (서열 번호: 26), 표 13에 있는 링커들 (서열 번호: 92, 93, 및 94), 그리고 표 14A에 있는 링커들 (서열 번호: 95, 96 및 97)을 포함하나 이에 한정되지 않는다. 상기 링커는 상기 VWF 단편 활성 또는 인자 VIII의 응고 활성을 제거하거나 또는 감소시키지 않는다. 임의선택적으로, 상기 링커는 상기 VWF 단편 활성 또는 인자 VIII 단백질의 응고 활성을 강화시키는데, 예컨대, 입체 장애 효과를 더 감소시키고, 그리고 상기 VWF 단편 또는 인자 VIII 부분이 이의 표적 결합 부위에 더 근접하도록 함으로써 강화시킨다.
한 구체예에서, 상기 키메라 단백질에 유용한 링커는 15-25개 길이의 아미노산이다. 또 다른 구체예에서, 상기 키메라 단백질에 유용한 링커는 15-20개 길이의 아미노산이다. 일부 구체예들에 있어서, 상기 키메라 단백질에 유용한 링커는 10-25개 길이의 아미노산이다. 다른 구체예들에 있어서, 상기 키메라 단백질에 유용한 링커는 15개 길이의 아미노산이다. 여전히 다른 구체예들에 있어서, 상기 키메라 단백질을 위한 링커는 (GGGGS)n (서열 번호: 27)이며, 여기에서 G는 글리신을 나타내고, S는 세린을 나타내고, 그리고 n은 1-20중 임의의 정수다.
E) 절단 부위
한 분자를 또 다른 분자로부터 풀어주기 위하여, 상기 링커는 화학적으로 (예컨대 에스테르 결합의 가수분해), 효소적으로 (즉, 프로테아제 절단 서열의 혼입), 또는 광분해적으로 (예컨대, 발색단 가령, 3-아미노-3-(2-니트로페닐) 프로피온산 (ANP))에 의해 절단될 수 있는 모이어티를 또한 혼입할 수 있다.
한 구체예에서, 상기 링커는 절단가능한 링커다. 상기 절단가능한 링커는 N-말단 또는 C-말단 또는 이 둘 모두에서 하나 또는 그 이상의 절단 부위를 포함할 수 있다. 또 다른 구체예에서, 상기 절단가능한 링커는 하나 또는 그 이상의 절단가능한 부위로 필수적으로 구성된 또는 구성된다. 다른 구체예들에 있어서, 상기 절단가능한 링커는 본 명세서에서 설명된 이종기원의 아미노산 링커 서열 또는 중합체와 하나 또는 그 이상의 절단가능한 부위를 포함한다.
특정 구체예들에 있어서, 절단가능한 링커는 숙주 세포에서 절단될 수 있는 (예컨대, 세포내 가공 부위) 하나 또는 그 이상의 절단 부위를 포함한다. 상기 절단 부위의 비-제한적 실시예로는 RRRR (서열 번호: 52), RKRRKR (서열 번호: 53), 그리고 RRRRS (서열 번호: 54)를 포함한다.
또 다른 구체예들에 있어서, 절단가능한 링커는 상기 절단가능한 링커가 포함된 키메라 단백질이 대상에게 투여된 후, 프로테아제에 의해 절단되는 하나 또는 그 이상의 절단 부위를 포함한다. 한 구체예에서, 상기 절단 부위는 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, MMP-12, MMP-13, MMP-17, 그리고 MMP-20으로 구성된 군에서 선택된 프로테아제에 의해 절단된다. 또 다른 구체예에서, 상기 절단 부위는 FXIa 절단 부위 (예컨대 KLTR↓AET (서열 번호: 29)), FXIa 절단 부위 (예컨대, DFTR↓VVG (서열 번호: 30)), FXIIa 절단 부위 (예컨대 TMTR↓IVGG (서열 번호: 31)), Kallikrein 절단 부위 (예컨대 SPFR↓STGG (서열 번호: 32)), FXIIa 절단 부위 (예컨대 LQVR↓IVGG (서열 번호: 33)), FIXa 절단 부위 (예컨대 PLGR↓IVGG (서열 번호: 34)), FXa 절단 부위 (예컨대 IEGR↓TVGG (서열 번호: 35)), FIIa (트롬빈) 절단 부위 (예컨대, LTPR↓SLLV (서열 번호: 36)), 엘라스타제-2 절단 부위 (예컨대, LGPV↓SGVP (서열 번호: 37)), 그랜자임-B 절단 (예컨대, VAGD↓SLEE (서열 번호: 38)), MMP-12 절단 부위 (예컨대 GPAG↓LGGA (서열 번호: 39)), MMP-13 절단 부위 (예컨대 GPAG↓LRGA (서열 번호: 40)), MMP-17 절단 부위 (예컨대 APLG↓LRLR (서열 번호: 41)), MMP-20 절단 부위 (예컨대 PALP↓LVAQ (서열 번호: 42)), TEV 절단 부위 (예컨대 ENLYFQ↓G (서열 번호: 43)), 엔테로키나제 절단 부위 (예컨대 DDDK↓IVGG (서열 번호: 44)), 프로테아제 3C (PRESCISSION™) 절단 부위 (예컨대 LEVLFQ↓GP (서열 번호: 45)), 그리고 소르타제 A 절단 부위 (예컨대 LPKT↓GSES) (서열 번호: 46)로 구성된 군으로부터 선택된다. 특정 구체예들에 있어서, 상기 FXIa 절단 부위는 예컨대 TQSFNDFTR (서열 번호: 47) 그리고 SVSQTSKLTR (서열 번호: 48)을 포함하나 이에 한정되지 않는다. 비-제한적 예시적인 트롬빈 절단 부위는 예컨대 DFLAEGGGVR (서열 번호: 49), TTKIKPR (서열 번호: 50), 또는 LVPRG (서열 번호: 55), 그리고 ALRPR을 포함하거나, 이 서열로 필수적으로 구성되거나 또는 구성된 서열(예컨대 ALRPRVVGGA (서열 번호: 51))을 포함한다.
특정 구체예에 있어서, 상기 절단 부위는 TLDPRSFLLRNPNDKYEPFWEDEEK (서열 번호: 56)이다.
폴리뉴클레오티드, 벡터, 숙주 세포들, 그리고 제조 방법
본 명세서에서 설명된 VWF 단편, 상기 VWF 단편과 이종기원의 모이어티가 포함된 키메라 단백질, FVIII 단백질과 부속 모이어티가 포함된 키메라 단백질, 또는 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질을 인코드하는 폴리펩티드가 또한 본 발명에서 제공된다. VWF 단편이 단일 폴리펩티드 쇄로써 키메라 단백질 내 이종기원의 모이어티 또는 FVIII 단백질에 연계되어 있을 때, 본 발명은 상기 이종기원의 모이어티 또는 상기 FVIII 단백질에 연계된 상기 VWF 단편을 인코드하는 폴리뉴클레오티드에 관계한다. 상기 키메라 단백질이 제 1 및 제 2 폴리펩티드 쇄, 즉 VWF 단편과 제 1 이종기원의 모이어티 (예컨대 제 1 Fc 영역)가 포함된 상기 제 1 폴리펩티드 쇄와 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역)가 포함된 상기 제 2 폴리펩티드 쇄를 포함하며, 이때 상기 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄는 서로 연합될 때, 폴리뉴클레오티드는 상기 제 1뉴클레오티드 서열과 제 2 뉴클레오티드 서열을 포함할 수 있다. 한 구체예에서, 상기 제 1뉴클레오티드 서열과 제 2 뉴클레오티드 서열은 동일 폴리뉴클레오티드 상에 있다. 또 다른 구체예에서, 상기 제 1뉴클레오티드 서열과 제 2 뉴클레오티드 서열은 상이한 두개의 폴리뉴클레오티드(예컨대 상이한 벡터) 상에 있다. 특정 구체예들에 있어서, 본 발명은 제 1 뉴클레오티드 쇄와 제 2 뉴클레오티드 쇄가 포함된 폴리뉴클레오티드 세트에 관계하며, 이때 상기 제 1뉴클레오티드 쇄는 상기 키메라 단백질의 VWF 단편을 인코드하고, 상기 제 2 뉴클레오티드 쇄는 상기 FVIII 단백질을 인코드한다.
또 다른 구체예들에 있어서, 상기 폴리뉴클레오티드 세트는 단백질 전환효소를 인코드하는 추가 뉴클레오티드 쇄 (예컨대 상기 키메라 폴리펩티드가 단일 폴리뉴클레오티드 쇄에 의해 인코드되는 경우 제 2 뉴클레오티드 쇄이며 또는 상기 키메라 단백질이 2개의 폴리뉴클레오티드 쇄에 의해 인코드될 때 제 3 뉴클레오티드 쇄임) 를 더 포함한다. 상기 단백질 전환효소는 프로프로테인 전환효소 서브틸리신/케신 유형 5 (PCSK5 또는 PC5), 프로프로테인 전환효소 서브틸리신/케신 유형 7 (PCSK7 또는 PC5), 효모 Kex 2, 프로프로테인 전환효소 서브틸리신/케신 유형 3 (PACE 또는 PCSK3), 그리고 이의 2개 또는 그 이상의 조합으로 구성된 군으로부터 선택될 수 있다. 일부 구체예들에 있어서, 상기 단백질 전환효소는 PACE, PC5, 또는 PC7이다. 특정 구체예에 있어서, 상기 단백질 전환효소는 PC5 또는 PC7이다. 국제 출원 번호 PCT/US2011/043568 참고, 이는 본 명세서에 참고자료에 편입된다. 또 다른 구체예에서, 상기 단백질 전환효소는 PACE/퓨린이다.
특정 구체예들에 있어서, 본 발명은 VWF의 D' 도메인과 D3 도메인이 포함된 VWF 단편을 인코드하는 제 1 뉴클레오티드 서열, FVIII 단백질을 인코드하는 제 2 뉴클레오티드 서열, 그리고 VWF의 D1 도메인과 D2 도메인을 인코드하는 제 3 뉴클레오티드 서열이 포함된 상기 폴리뉴클레오티드 세트를 포함한다. 이 구체예에 있어서, 상기 D1 도메인과 D2 도메인은 상기 D'D3 도메인의 적절한 이황화결합 형성과 폴딩을 위하여 별도로 발현된다(상기 VWF 단편의 D'D3 도메인과 연계되지 않음). 상기 D1D2 도메인 발현은 cis 또는 trans 일 수 있다.
본 명세서에서 이용된 것과 같이, 발현 벡터는 삽입된 코딩 서열의 전사 및 해독에 필수 요소들이 포함되거나, 또는 RNA 바이러스 벡터의 경우에 있어서, 적절한 숙주 세포 안으로 도입되었을 때 복제 및 해독에 필요한 요소들이 포함된 임의의 핵산 구조체를 지칭한다. 발현 벡터는 플라스미드, 파아지미드, 바이러스, 그리고 이의 유도체들을 포함할 수 있다.
본 발명의 발현 벡터는 상기 VWF 단편을 인코드하는 또는 상기 VWF 단편이 포함된 상기 키메라 단백질을 인코드하는 폴리뉴클레오티드를 포함할 것이다.
한 구체예에서, 상기 VWF 단편, 상기 제 2 이종기원의 모이어티 (예컨대 제 2 Fc 영역), 또는 상기 FVIII 단백질의 코딩 서열은 발현 조절 서열에 작용가능하도록 연계된다. 본 명세서에서 이용된 것과 같이, 두 핵산 서열은 각 성분 핵산 서열이 이의 기능을 유지할 수 있는 방식으로 공유적으로 연계되어 있을 때 작용가능하도록 연계된다. 유전자 발현 조절 서열의 영향 또는 제어하에 코딩 서열의 별현 또는 전사 및/또는 해독을 두는 방식으로 코딩 서열과 유전자 발현 조절 서열이 공유적으로 연계되어 있을 때 이들은 작용가능하도록 연계되어 있다고 말한다. 5' 유전자 발현 서열에서 프로모터의 유도로 상기 코딩 서열이 전사되고, 상기 두 DNA 서열 사이의 연계 본질이 (1) 틀-이동(frame-shift) 돌연변이의 도입하거나, (2) 상기 코딩 서열의 전사를 지시하는 프로모터 영역의 능력을 간섭하거나, 또는 (3) 대응하는 RNA 전사체가 단백질로 해독되는 능력을 간섭하지 않는다면, 두 DNA 서열은 작용가능하도록 연계되어 있다고 말한다. 따라서, 유전자 발현 서열이 생성되는 전사체가 상기 원하는 단백질 또는 폴리펩티드로 해독되도록 코딩 핵산 서열의 전사에 영향을 줄 수 있다면, 유전자 발현 서열은 이 코딩 핵산 서열에 작용가능하도록 연계되어 있을 것이다.
본 명세서에서 이용된 것과 같이, 유전자 발현 조절 서열은 임의의 조절 뉴클레오티드 서열, 가령, 프로모터 서열 또는 프로모터-인헨서 조합이며, 이 조합은 이에 작용가능하도록 연계된 코딩 핵산의 효과적인 전사 및 해독을 촉진시킨다. 상기 유전자 발현 조절 서열은 예를 들면, 포유동물 또는 바이러스 프로모터, 가령, 구성적(constitutive) 또는 유도성 프로모터일 수 있다. 구성적 포유동물 프로모터는 다음 유전자들: 하이포산틴 포스포리보실 전이효소 (HPRT), 아데노신 데아미나제, 피루베이트 키나제용 프로모터, 베타-액틴 프로모터, 그리고 다른 구성적 프로모터를 포함하나 이에 한정되지 않는다. 진핵 세포에서 구성적으로 기능을 하는 예시적인 바이러스 프로모터는 예를 들면, 사이토메갈로바이러스 (CMV), 유인원 바이러스 (예컨대, SV40), 파필로마 바이러스, 아데노바이러스, 인간 면역결핍 바이러스 (HIV), 라우스 육종 바이러스, 사이토메갈로바이러스, Moloney 백혈병 바이러스의 긴 말단 반복부(LTR)의 프로모터, 그리고 다른 레트로바이러스들, 그리고 단순 포진 바이러스의 티미딘 키나제 프로모터를 포함한다. 다른 구성적 프로모터들도 당업자에게 공지되어 있다. 본 발명의 유전자 발현 서열로 유용한 프로모터는 유도성 프로모터를 포함한다. 유도성 프로모터는 유도성 물질 존재하에 발현된다. 예를 들면, 메탈로티오닌 프로모터는 특정 금속 이온 존재 하에서 유도되어, 전사 및 해독을 촉진시킨다. 다른 유도성 프로모터는 당업자에게 공지되어 있다.
일반적으로, 상기 유전자 발현 조절 서열은 필연적으로 전사와 해독에 각각 관련된 5' 비-전사 및 5' 비-해독 서열, 가령, TATA 박스, 캡핑(capping) 서열, CAAT 서열, 그리고 이와 유사한 것들을 포함할 것이다. 특히, 이러한 5' 비-전사 서열은 작용가능하도록 연결된 코딩 핵산의 전사 조절을 위한 프로모터 서열이 포함된 프로모터 영역을 포함할 것이다. 상기 유전자 발현 서열은 원하는 경우 임의선택적으로 인헨서 서열 또는 상류 활성화물 서열을 포함한다.
바이러스 벡터는 다음의 바이러스로부터 얻은 핵산 서열을 포함하나 이에 한정되지 않는다: 레트로바이러스, 가령, Moloney 뮤린 백혈병 바이러스, Harvey 뮤린 육종 바이러스, 뮤린 유방 종양 바이러스, 그리고 라우스 육종 바이러스; 아데노바이러스, 아데노-연합된 바이러스; SV40-유형 바이러스; 폴리오마바이러스; Epstein-Barr 바이러스; 파필로마 바이러스; 포진 바이러스; 우두 바이러스; 소아마비 바이러스; 그리고 RNA 바이러스 가령, 레트로바이러스. 당분야에 공지된 다른 벡터를 용이하게 이용할 수 있다. 특정 바이러스 벡터는 비-세포변성(cytopathic) 진핵 바이러스에 기초하며, 이때 비-필수 유전자들은 관심 유전자로 대체되었다. 비-세포변성 바이러스는 레트로바이러스를 포함하는데, 이의 생명 주기는 게놈 바이러스 RNA를 DNA로 역전와, 후속적으로 숙주 세포 DNA에 프로바이러스적 통합이 관련된다. 레트로바이러스는 인간 유전자 치료 시험에 승인되었다. 복제-결함있는 (즉, 상기 원하는 단백질들의 합성은 지시할 수 있지만, 감염성 입자를 제조할 수 없는) 레트로바이러스가 가장 유용하다. 이러한 유전적으로 변경된 레트로바이러스 발현 벡터는 생체내에서 유전자들의 고효율 형질 유도에 일반적인 용도를 갖는다. 복제-결함있는 레트로바이러스를 만드는 표준 프로토콜 (외생 유전 물질을 플라스미드 안에 혼입시키는 단계, 플라스미드로 포장 세포 계통을 형질감염시키는 단계, 포장 세포 계통에 의해 재조합 레트로바이러스를 생산하는 단계, 조직 배양 배지로부터 바이러스 입자를 수집하는 단계, 그리고 표적 세포에 바이러스 입자를 감염시키는 단계를 포함)은 다음에서 제공된다: Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) 그리고 Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Cliffton, N.J. (1991).
한 구체예에서, 상기 바이러스는 아데노-연합된 바이러스, 이중-가닥으로 된 DNA 바이러스다. 상기 아데노-연합된 바이러스는 복제-결함있고, 광범위한 세포 유형 및 종을 감염시킬 수 있도록 조작될 수 있다. 아데노-연합된 바이러스는 추가 장점 가령, 열과 지질 용매 안정성; 조혈 세포들을 포함하는 다양한 세포들에서 높은 형질유도 빈도; 그리고 과다감염 저해가 부족하고, 따라서 다중의 일련의 형질유도가 허용되는 장점을 갖는다. 보고에 따르면, 상기 아데노-연합된 바이러스는 부위-특이적 방식으로 인간 세포 DNA에 혼입될 수 있고, 이로 인하여 삽입에 의한 돌연변이생성 가능성과 레트로바이러스 감염의 삽입된 유전자 발현 가변성이 최소화된다. 또한, 야생형 아데노-연합된 바이러스 감염은 선택적 압력없이 100회 이상의 계대동안 조직 배양에서 이어지고, 이것은 상기 아데노-연합된 바이러스 게놈 혼입이 상대적으로 안정한 사건임을 암시하는 것이다. 상기 아데노-연합된 바이러스는 염색체외 방식으로 또한 기능할 수 있다.
다른 벡터는 플라스미드 벡터를 포함한다. 플라스미드 벡터는 당분야에 방대하게 설명되고 있으며, 당업자들에게 잘 알려져 있다. 예컨대, Sambrook 및 다른 사람들, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989 참고. 과거 수년 동안, 플라스미드 벡터는 숙주 게놈 안에서 복제하지 못하고, 숙주 게놈 안으로 통합되는능력이 없기 때문에, 생체내에서 세포들에게 유전자 운반용으로 특히 유익하다는 것이 밝혀졌다. 그러나, 숙주 세포와 양립가능한 프로모터를 갖는 이들 플라스미드는 플라스미드 안에 유전자 작용가능하도록 인코드된 유전자로부터 펩티드를 발현시킬 수 있다. 상업적인 공급업자로부터 이용가능한 흔히 이용되는 일부 플라스미드는 pBR322, pUC18, pUC19, 다양한 pcDNA 플라스미드, pRC/CMV, 다양한 pCMV 플라스미드, pSV40, 그리고 pBlueScript를 포함한다. 특이적 플라스미드의 추가 예로는 pcDNA3.1, 목록 번호 V79020; pcDNA3.1/hygro, 목록 번호 V87020; pcDNA4/myc-His, 목록 번호 V86320; 그리고 pBudCE4.1, 목록 번호 V53220(이들 모두 Invitrogen (Carlsbad, CA.). 제품)를 포함한다. 당업자들에게는 다른 플라스미드들도 잘 알려져 있다. 추가적으로, 특이적 DNA 단편들을 제거 및/또는 추가하기 위하여 표준 분자 생물학 기술을 이용하여 플라스미드를 맞춤 제작할 수 있다.
본 발명의 단백질들을 생산하는데 이용될 수 있는 한 가지 곤충 발현 시스템에서, 오토그라파 칼리포니카(Autographa californica) 핵 폴리히드로시스 바이러스 (AcNPV)가 외부 유전자들을 발현하기 위한 벡터로 이용된다. 상기 바이러스는 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포에서 성장한다. 코딩 서열은 바이러스의 비-필수 영역 (예를 들면, 폴리헤드론 유전자) 안에 클론되고, ACNPV 프로모터 (예를 들면, 폴리헤드론 프로모터)의 조절하에 둘 수 있다. 코딩 서열의 성공적인 삽입으로 상기 폴리헤드론 유전자는 비활성화되고, 비-폐색된 재조합 바이러스 (즉, 상기 폴리헤드론 유전자에 의해 코드되는 단백질로 된 외피가 없는 바이러스)가 만들어진다. 그 다음 이들 재조합 바이러스는 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포들을 감염시키는데 이용되며, 이때 상기 삽입된 유전자는 발현된다. (예컨대, Smith 그리고 다른 사람들. (1983) J Virol 46:584; 미국 특허 제4,215,051호 참고). 이 발현 시스템의 추가적인 예들은 다음에서 찾아볼 수 있다: Ausubel 및 다른 사람들,eds. (1989) Current Protocols in Molecular Biology, Vol. 2, Greene Publish. Assoc. & Wiley Interscience.
본 발명의 단백질들을 발현시키는데 이용될 수 있는 또 다른 시스템은 글루타민 합성효소 유전자 발현 시스템이며, 또한 "GS 발현 시스템" (LonzBiologics PLC, Berkshire UK)이라고도 한다. 이 발현 시스템은 미국 특허 제5,981,216호에서 상세하게 설명된다.
포유동물 숙주 세포들에서, 다수의 바이러스 기반 발현 시스템이 이용될 수 있다. 아데노바이러스가 발현 벡터로 이용되는 경우, 코딩 서열은 아데노바이러스 전사/해독 조절 복합체, 예컨대, 후기 프로모터와 셋으로 갈라진(tripartite) 리더 서열에 결찰될 수 있다. 이 키메라 유전자는 시험관내 또는 생체내 재조합에 의해 상기 아데노바이러스 게놈 안에 삽입될 수 있다. 바이러스 게놈의 비-필수 영역 (예컨대, 영역 E1 또는 E3) 안에 삽입에 의해 감염된 숙주에서 생존하고, 펩티드를 발현시킬 수 있는 재조합 바이러스가 된다. 예컨대, Logan & Shenk (1984) Proc Natl Acad Sci USA 81:3655) 참고. 대안으로, 우두 7.5 K 프로모터가 이용될 수 있다. 예컨대, Mackett 그리고 다른 사람들. (1982) Proc Natl Acad Sci USA 79:7415; Mackett 그리고 다른 사람들. (1984) J Virol 49:857; Panicali 그리고 다른 사람들. (1982) Proc Natl Acad Sci USA 79:4927 참고.
생산 효율을 증가시키기 위하여, 효소적 절단 부위에 의해 분리되는 본 발명의 단백질의 다중 단위를 인코드하도록 폴리뉴클레오티드를 기획할 수 있다. 상기 폴리펩티드 단위들을 회수하기 위하여, 생성되는 폴리펩티드는 절단될 수 있다(예컨대, 적절한 효소로 처리함으로써) 이것은 단일 프로모터에 의해 구동되는 폴리펩티드들의 수율을 증가시킬 수 있다. 적절한 바이러스 발현 시스템에서 이용될 때, mRNA에 의해 인코드되는 각 폴리펩티드의 해독은 예컨대, 내부 리보솜 진입 부위, IRES에 의해 전사체 안에서 내부적으로 지도된다. 따라서, 상기 폴리시스트론 구조체는 단일, 거대 폴리시스트론 mRNA의 전사를 지시하고, 그 다음다중, 개별 폴리펩티드들의 해독을 지시한다. 이러한 방법은 폴리단백질들의 생산 및 효소적 가공을 제거하고, 단일 프로모터에 의해 구동되는 폴리펩티드들의 수율을 상당히 증가시킬 수 있다.
형질전환에 이용되는 벡터는 형질전환체를 식별하는데 이용되는 선택성 표식을 항상 포함할 것이다. 세균성 시스템에서, 이것은 항생제 저항 유전자 가령, 암피실린 또는 카나마이신을 포함할 수 있다. 배양된 포유동물 세포에서 이용되는 선택성 표식은 가령, 네오마이신, 하이그로마이신, 그리고 메토트렉세이트와 같은 약물에 대한 저항성을 부여하는 유전자들을 포함한다. 상기 선택성 표식은 증폭가능한 선택성 표식일 수 있다. 한 가지 증폭가능한 선택성 표식은 디하이드로폴레이트 환원효소(DHFR) 유전자다. Simonsen C C 그리고 다른 사람들. (1983) Proc Natl Acad Sci USA 80:2495-9. 선택성 표식들은 Thilly (1986) Mammalian Cell Technology, Butterworth Publishers, Stoneham, Mass., 에 의해 검토되며, 선택성 표식의 선택은 당업자의 인식 범위내에 있다.
선택성 표식들은 별도의 플라스미드를 통하여 동시에 관심 유전자와 함께 세포 안으로 도입되거나, 또는 동일한 플라스미드 상에서 도입될 수 있다. 동일한 플라스미드 상에서, 상기 선택성 표식과 상기 관심 유전자가 상이한 프로모터 또는 동일한 프로모터의 조절하에 있게 된다면, 후자 배열은 이중시스트론 메시지를 생산한다. 이러한 유형의 구조체들은 당업계에 공지되어 있다 (예를 들면, 미국 특허 제4,713,339호).
상기 발현 벡터는 재조합에 의해 생산된 단백질의 용이한 정제를 허용하는 테그(tag)를 인코드할 수 있다. 실시예는 벡터 pUR278을 포함하나 이에 한정되지 않으며 (Ruther 그리고 다른 사람들. (1983) EMBO J 2:1791), 이때 발현되는 단백질의 코딩 서열은 테그된 융합 단백질이 생산되도록 상기 벡터의 lac z 코딩 영역와 같은 틀 안에 결찰될 수 있고; pGEX 벡터는 글루타티온 S-전이효소 (GST) 테그와 함께 본 발명의 단백질을 발현시키는데 이용될 수 있다. 이들 단백질은 항상 가용성이며, 글루타티온-아가로즈 비드에 흡착후 유리(free) 글루타티온 존재하에 용리시킴으로써 세포로부터 용이하게 정제될 수 있다. 상기 벡터는 정제후 테그를 용이하게 제거하기 위하여 절단 부위 (트롬빈 또는 인자 Xa 프로테아제 또는 PRESCISSION PROTEASE^TM (Pharmacia, Peapack, N.J.))를 포함한다.
상기 발현 벡터 또는 벡터들은 상기 폴리펩티드들을 발현시킬 적합한 표적 세포 안으로 형질감염 또는 공동-형질감염된다. 당업계에 공지된 형질감염 기술은 인산칼슘염 침전 (Wigler 그리고 다른 사람들. (1978) Cell 14:725), 전기천공 (Neumann 그리고 다른 사람들. (1982) EMBO J 1:841), 그리고 리포좀-계통 시약들을 포함하나, 이에 한정되지 않는다. 본 명세서에서 기술된 단백질들을 발현시키기 위하여 원핵 및 진핵 세포들이 모두 포함된 다양한 숙주-발현 벡터 시스템이 이용될 수 있다. 이들 시스템에는 미생물 가령, 적절한 코딩 서열이 포함된 재조합 박테리오파아지 DNA 또는 플라스미드 DNA 발현 벡터로 형질변환된 박테리아(예컨대, 대장균); 적절한 코딩 서열이 포함된 재조합 효모 또는 곰팡이 발현 벡터로 형질변환된 효모 또는 사상균(filamentous fungi); 적절한 코딩 서열이 포함된 재조합 바이러스 발현 벡터 (예컨대, 바큘로바이러스)에 감염된 곤충 세포 계통; 적절한 코딩 서열이 포함된 재조합 바이러스 발현 벡터 (예컨대, 콜리플라워 모자이크(cauliflower mosaic) 바이러스 또는 담배 모자이크(tobacco mosaic) 바이러스)에 감염된 또는 재조합 플라스미드 발현 벡터 (예컨대, Ti 플라스미드)로 형질변환된 식물 세포 계통; 또는 포유동물 세포들 (예컨대, HEK 293, CHO, Cos, HeLa, HKB11, 그리고 BHK 세포들)이 포함된 동물 세포 계통이 포함되나 이에 한정되지 않는다.
한 구체예에서, 상기 숙주 세포는 진핵 세포다. 본 명세서에서 이용된 것과 같이, 진핵 세포는 확실한 핵을 갖는 임의의 동물 또는 식물 세포를 지칭한다. 동물의 진핵 세포들은 척추동물, 예컨대, 포유류의 세포들과 무척추동물 예컨대, 곤충의 세포들을 포함한다. 식물의 진핵 세포들은 특히 효모 세포들을 포함하나 이에 한정되지 않는다. 진핵 세포는 원핵 세포, 예컨대, 박테리아와 구별된다.
특정 구체예들에 있어서, 진핵 세포는 포유류 세포다. 포유동물 세포는 포유류로부터 유도된 임의의 세포다. 포유동물 세포들은 특히 포유동물 세포 계통을 포함하나, 이에 한정되지 않는다. 한 구체예에서, 상기 포유동물 세포는 인간 세포다. 또 다른 구체예에서, 상기 포유동물 세포는 인간 배아 신장 세포계통인 HEK 293 세포다. HEK 293 세포는 American Type Culture Collection, Manassas, VA의 CRL-1533, 그리고 Invitrogen (Carlsbad, Calif.)의 293-H 세포들, Catalog No. 11631-017 또는 293-F 세포들, Catalog No. 11625-019로 이용가능하다. 일부 구체예들에 있어서, 상기 포유동물 세포는 망막으로부터 유도된 인간 세포계통인 PER.C6^® 세포다. PER.C6^® 세포는 Crucell(Leiden, The Netherlands)에서 이용가능하다. 또 다른 구체예들에 있어서, 상기 포유동물 세포는 중국 헴스터 난소(CHO) 세포다. CHO 세포는 American Type Culture Collection, Manassas, VA에서 이용가능하다. (예컨대, CHO-K1; CCL-61). 여전히 다른 구체예들에 있어서, 상기 포유동물 세포는 새끼 헴스터 신장(BHK) 세포다. BHK 세포는 American Type Culture Collection, Manassas, Va에서 이용가능하다. (예컨대, CRL-1632). 일부 구체예들에 있어서, 상기 포유동물 세포는 HEK293 세포와 인간 B 세포 계통의 하이브리드 세포 계통인 HKB11 세포다. Mei 및 다른 사람들,Mol. Biotechnol. 34(2): 165-78 (2006).
한 구체예에서, 상기 VWF 단편 또는 본 발명의 상기 키메라 단백질을 인코드하는 플라스미드는 선택성 표식, 예컨대, 제오신 저항을 더 포함하고, 상기 VWF 단편 또는 상기 키메라 단백질의 생산을 위하여 HEK293 세포에 형질감염된다.
또 다른 구체예에서, 인자 VIII-Fc 융합 코딩 서열과 제 1 선택성 표식, 예컨대, 제오신 저항 유전자가 포함된 제 1 플라스미드 그리고 VWF 단편-Fc 코딩 서열과 제 2 선택성 표식, 예컨대, 네오마이신 저항 유전자가 포함된 제 2 플라스미드는 인자 VIII-Fc와 VWF-Fc의 하이브리드 생산을 위하여 HEK293 세포 안으로 공동-형질감염된다. 상기 제 1과 제 2 플라스미드는 동량(즉, 1:1 비율)으로 도입될 수 있고, 또는 동일하지않은 양으로 도입될 수 있다.
일부 구체예들에 있어서, 인자 VIII-Fc 융합 코딩 서열과 제 1 선택성 표식, 예컨대, 제오신 저항 유전자가 포함된 제 1 플라스미드 그리고 VWF 단편-Fc 코딩 서열과 제 2 선택성 표식, 예컨대, 네오마이신 저항 유전자가 포함된 제 2 플라스미드, 그리고 단백질 전환효소 코딩 서열 (예컨대 PC5 또는 퓨린)과 제 3의 선택성 표식, 예컨대, 하이그로마이신 저항 유전자가 포함된 제 3 플라스미드는 인자 VIII-VWF 단편 하이브리드 생산을 위하여 HEK293 세포 안으로 공동-형질감염된다. 상기 제 1과 제 2 플라스미드는 동량(즉, 1:1 몰 비율)으로 도입될 수 있고, 또는 동일하지않은 양으로 도입될 수 있다. 특정 구체예들에 있어서, 인자 VIII-Fc 융합 코딩 서열, VWF 단편-Fc 코딩 서열과 제 1 선택성 표식, 예컨대, 제오신 저항 유전자가 포함된 제 1 플라스미드 그리고 단백질 전환효소 코딩 서열 (예컨대 PC5 또는 퓨린)과 제 2의 선택성 표식, 예컨대, 하이그로마이신 저항 유전자가 포함된 제 2 플라스미드는 인자 VIII-VWF 단편 하이브리드 생산을 위하여 HEK293 세포 안으로 공동-형질감염된다. 한 구체예에서, 상기 FVIII-Fc 서열과 VWF 단편-Fc 서열을 인코드하는 뉴클레오티드 서열은 하나의 단일 폴리펩티드를 인코드하도록 연결될 수 있다. 또 다른 구체예에서, 상기 FVIII-Fc 서열과 VWF 단편-Fc 서열을 인코드하는 뉴클레오티드 서열은 두 개의 폴리펩티드 쇄로 인코드될 수 있다. 상기 인자 VIII-Fc 융합 코딩 서열과 VWF 단편-Fc 코딩 서열에 대한 프로모터는 상이하거나 또는 동일할 수 있다.
일부 구체예들에 있어서, 퓨린이 포함된 플라스미드는 상기 인자 VIII-Fc 코딩 서열 및/또는 VWF 단편-Fc 코딩 서열이 포함된 플라스미드와 공동-형질감염된다. 일부 구체예들에 있어서, 상기 퓨린 단백질은 상기 인자 VIII-Fc 융합 코딩 서열이 포함된 동일한 플라스미드에 존재한다. 일부 구체예들에 있어서, 상기 퓨린 단백질은 상기 VWF 단편-Fc 코딩 서열이 포함된 동일한 플라스미드에 존재한다. 일부 구체예들에 있어서, 상기 퓨린 단백질은 별도의 플라스미드 상에 존재한다.
여전히 다른 구체예들에 있어서, 형질감염 세포들은 안정적으로 형질감염된다. 이들 세포는 당업자에게 공지된 통상적인 기술을 이용하여 선택될 수 있고, 안정적인 세포 계통으로 유지될 수 있다.
상기 단백질의 DNA 구조체가 포함된 숙주 세포는 적절한 성장 배지에서 자란다. 본 명세서에서 이용된 것과 같이, 용어 "적절한 성장 배지"란 세포들의 성장에 요구되는 영양소들이 포함된 배지를 말한다. 세포 성장에 요구되는 영양소는 탄소원, 질소원, 필수 아미노산, 비타민, 미네랄, 그리고 성장 인자를 포함할 수 있다. 임의선택적으로, 상기 배지는 하나 또는 그 이상의 선택 인자를 포함할 수 있다. 임의선택적으로 상기 배지는 소의 송아지 혈청 또는 태아 송아지 혈청 (FCS)을 포함할 수 있다. 한 구체예에서, 상기 DNA 구조체가 포함된 세포들을 위한 성장 배지가 선택되는데, 예를 들면 약물 선별 또는 필수 영샹소가 결핍된 배지가 선택되고, 이러한 필수 영양소 결핍은 DNA 구조체 상에 있는 선택성 표식 또는 DNA 구조체와 공동-형질감염된 선택성 표식에 의해 보충되는 필수 영양소에서 약물 선택 또는 결핍에 의해 상기 DNA 구조체가 포함된 세포들을 보충 선택될 것이다. 상기 배지에는 IgG가 실질적으로 포함되어 있지 않다. 배양된 포유동물 세포들은 상업적으로 이용가능한 혈청-포함된 또는 혈청없는 배지 (예컨대, MEM, DMEM, DMEM/F12)에서 일반적으로 성장한다. 한 구체예에서, 상기 배지는 CD293 (Invitrogen, Carlsbad, CA.)이다. 또 다른 구체예에서, 상기 배지는 CD17 (Invitrogen, Carlsbad, CA.)이다. 이용되는 특정 세포 계통에 적합한 배지의 선택은 당업계의 인식 범위 내에 있다.
상기 VWF 단편과 제 2 이종기원의 모이어티 또는 FVIII 단백질을 공동 발현시키기 위하여, 상기 숙주 세포는 상기 VWF 단편과 제 2 이종기원의 모이어티 또는 FVIII 단백질 모두의 발현을 허용하는 조건하에 배양된다. 본 명세서에서 이용된 것과 같이, 배양은 최소한 한정된 시간 동안 시험관내에서 살아있는 세포를 유지시키는 것을 지칭한다. 유지란 살아있는 세포 집단의 증가가 포함될 수 있지만, 반드시 그럴 필요는 없다. 예를 들면, 배양물에서 유지된 세포는 집단이 정적(static)인 상태지만, 여전히 살아있고, 원하는 산물, 예컨대, 재조합 단백질 또는 재조합 융합 단백질을 생산할 수 있다. 진핵 세포의 배양에 적합한 조건은 당분야에 공지되어 있고, 배양 배지, 배지 보충물, 온도, pH, 산소 포화도, 그리고 이와 유사한 것들의 적절한 선택이 포함된다. 상업적 목적으로, 배양은 쉐이커 플라스크(shaker flasks), 롤러 바틀(roller bottles), 중공 파이버(hollow fiber) 생물배양기, 교반-탱크 생물 배양기, 에어리프트(airlift) 생물 배양기, Wave 생물 배양기, 및 다른 것들이 포함된 다양한 유형의 등업(scale-up) 시스템의 이용을 포함한다.
상기 세포 배양 조건은 상기 VWF 단편과 상기 제 2 이종기원의 모이어티 또는 FVIII 단백질과의 연합이 허용되도록 또한 선택된다. 상기 VWF 단편 및/또는 상기 FVIII 단백질의 발현을 허용하는 조건에는 비타민 K 원료의 존재가 포함된다. 예를 들면, 한 구체예에서, 안정적으로 형질감염된 HEK 293 세포들은 4 mM 글루타민이 보충된 CD293 배지 (Invitrogen, Carlsbad, CA) 또는 OptiCHO 배지 (Invitrogen, Carlsbad, CA)에서 배양된다.
한 측면에서, 본 발명은 a) 숙주 세포에 상기 VWF 단편이 인코드된 폴리뉴클레오티드를 형질감염시키고, 그리고 b) 상기 VWF 단편의 발현에 적합한 조건하에 배양 배지에서 상기 숙주 세포를 배양하고, 이때 상기 VWF 단편이 발현되는 것을 포함하는, 본 발명의 상기 VWF 단편을 발현시키고, 만들고 또는 생산하는 방법에 관계된다. 한 구체예에서, 본 발명은 성숙한 VWF 단백질 또는 이의 단편을 생산하는 방법에 관계하며, 이 방법은 a) VWF의 폴리펩티드 또는 이의 단편이 인코딩된 제 1 폴리뉴클레오티드와 단백질 전환효소, 예컨대 PC5, PC7, 또는 퓨린이 인코딩된 제 2 폴리뉴클레오티드를 숙주 세포에 형질감염시키고, 이때 제 1 폴리뉴클레오티드는 상기 VWF의 프로펩티드에 융합되고, 그리고 b) 성숙한 VWF 단백질 또는 이의 단편을 발현시키는데 적합한 조건하에 배양 배지에서 숙주 세포를 배양하는 것을 포함한다. 상기 VWF 단백질 또는 이의 단편을 인코드하는 상기 폴리뉴클레오티드는 VWF의 프레펩티드에 또한 융합될 수 있다. 상기 프레펩티드 서열은 분비 전, 세포질 망상구조로 삽입하는 동안 절단될 수 있다.
또 다른 측면에서, 본 발명은 이종기원의 모이어티 또는 FVIII 단백질에 연계 또는 연합된 상기 VWF 단편을 포함하는 키메라 단백질을 발현시키고, 만들고 또는 생산하는 방법에 관계되는데, 이 방법은 a) 하나 또는 그 이상의 숙주 세포에 상기 키메라 단백질이 인코드된 폴리뉴클레오티드 또는 폴리뉴클레오티드 세트를 형질감염시키고, 그리고 b) 상기 키메라 단백질의 발현에 적합한 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 것을 포함한다. 한 구체예에서, 본 발명은 키메라 단백질을 발현시키고, 만들고 또는 생산하는 방법에 관계되는데, 이 방법은 a) 이종기원의 모이어티에 연계된 VWF 단편이 인코딩된 제 1 폴리뉴클레오티드와 이종기원의 모이어티에 연계된 FVIII 단백질이 인코딩된 제 2 폴리뉴클레오티드를 숙주 세포에 형질감염시키고, 그리고 b) 상기 키메라 단백질의 발현에 적합한 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 것을 포함한다. 상기 제 1폴리뉴클레오티드와 제 2 폴리뉴클레오티드는 한 개 벡터 또는 두 개 벡터에 존재할 수 있다. 또 다른 구체예에서, 본 발명은 키메라 단백질을 발현시키고, 만들고 또는 생산하는 방법에 관계되는데, 이 방법은 a) 이종기원의 모이어티에 연계된 VWF 단편이 인코딩된 제 1 폴리뉴클레오티드,이종기원의 모이어티에 연계된 FVIII 단백질이 인코딩된 제 2 폴리뉴클레오티드 그리고 단백질 전환효소가 인코딩된 제 3 폴리뉴클레오티드를 숙주 세포에 형질감염시키고, 그리고 b) 상기 키메라 단백질의 발현에 적합한 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 것을 포함한다. 또 다른 구체예들에 있어서, 본 발명은 키메라 단백질을 발현시키고, 만들고 또는 생산하는 방법에 관계되는데, 이 방법은 a) 이종기원의 모이어티에 연계된 D' 도메인과 D3 도메인을 포함하는 VWF 단편이 인코딩된 제 1 폴리뉴클레오티드, 이종기원의 모이어티에 연계된 FVIII 단백질이 인코딩된 제 2 폴리뉴클레오티드 그리고 VWF의 D1 도메인과 D2 도메인이 인코딩된 제 3 폴리뉴클레오티드를 숙주 세포에 형질감염시키고, 그리고 b) 상기 키메라 단백질의 발현에 적합한 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 것을 포함한다. 한 구체예에서, 상기 제 1 폴리뉴클레오티드, 제 2 폴리뉴클레오티드, 그리고 제 3 폴리뉴클레오티드는 한 개 벡터 또는 별도의 벡터에 존재할 수 있다. 또 다른 구체예에서, 상기 제 1폴리뉴클레오티드와 제 2 폴리뉴클레오티드는 하나의 벡터에, 그리고 상기 제 3 폴리뉴클레오티드는 또 다른 벡터에 존재할 수 있다. 또 다른 구체예들에 있어서, 상기 제 1폴리뉴클레오티드와 제 3 폴리뉴클레오티드는 하나의 벡터에, 그리고 상기 제 2 폴리뉴클레오티드는 또 다른 벡터에 존재할 수 있다. 일부 구체예들에 있어서, 상기 제 2 폴리뉴클레오티드와 제 3 폴리뉴클레오티드는 하나의 벡터에, 그리고 상기 제 1 폴리뉴클레오티드는 또 다른 벡터에 존재할 수 있다.
추가 구체예들에 있어서, 상기 VWF 단편이 포함된 단백질 산물 또는 상기 VWF 단편이 포함된 키메라 단백질은 배지로 배출된다. 배지는 세포들로부터 분리되고, 농축되고, 여과되고, 그리고 2개 또는 3개의 친화력 컬럼, 예컨대, 단백질 A 컬럼과 1개 또는 2개의 음이온 교환 컬럼을 통과한다.
특정 측면에 있어서, 본 발명은 본 명세서에서 설명된 방법들에 의해 생산된 상기 VWF 단편 또는 상기 키메라 폴리펩티드에 관계한다.
시험관내 생산의 규모를 확대하여 본 발명의 상기 바람직한 변경된 폴리펩티드를 대량으로 제공할 수 있다. 조직 배양 조건하에 포유동물 세포 배양 기술은 당분야에 공지되어 있고, 예컨대 에어리프트 반응기 또는 연속 교반 반응기 내에서 균질한 현탁 배양, 또는, 예컨대 중공 파이버(hollow fibers), 미세캡슐, 아가로즈 마이크로비드 또는 세라믹 카트릿지에서 고정된 또는 포집된(entrapped) 세포 배양을 포함한다. 필요한 및/또는 바람직한 경우, 폴리펩티드 용액은 통상적인 크로마토그래피 방법, 예를 들면 겔 여과, 이온-교환 크로마토그래피, 소수성 상호작용 크로마토그래피 (HIC, DEAE-셀룰로오즈 상에서 크로마토그래피 또는 친화력 크로마토그래피에 의해 정제될 수 있다.
약제학적 조성물
본 발명의 상기 VWF 단편 또는 키메라 단백질이 포함된 조성물은 약학적으로 수용가능한 적합한운반체를 포함할 수 있다. 예를 들면, 조성물은 활성 화합물들을 작용부위로 운반하기 위하여 기획된 조제물로 가공을 용이하게 하는 부형제 및/또는 보조제를 포함할 수 있다.
상기 약제학적 조성물은 볼루스(bolus) 주사에 의해 장관외(parenteral) 투여 (즉 정맥내, 피하, 또는 근육내) 를 위하여 제형화될 수 있다. 주사용 제형은 추가된 보존제와 함께 단위 투약형, 예컨대, 앰플 안에 또는 다중용량 용기 안에 제공될 수 있다. 상기 조성물은 현탁액, 용액, 또는 오일 또는 수성 운반체 안에 유액의 형태가 될 수 있으며, 그리고 제형화 물질, 가령, 현탁, 안정화 및/또는 분산제가 포함될 수 있다. 대안으로, 상기 활성 성분은 적합한 운반체, 예컨대 발열원 없는 물과 함께 재구성될 수 있는 분말 형태일 수 있다.
장관외 투여용 적합한 제형은 물-가용성 형태, 예를 들면, 물-가용성 염의 형태로 상기 활성 화합물들의 수성 염을 또한 포함한다. 또한, 적합한 오일 주사 현탁액 형태로 상기 활성 화합물들의 현탁액이 투여될 수 있다. 적합한 친지성 용매 또는 운반체는 지방성 오일, 예를 들면, 참기름, 또는 합성 지방산 에스테르, 예를 들면, 에틸 올레이트 또는 트리글리세리드를 포함한다. 수성 주사 현탁액은 이 현탁액의 점성을 증가시키는 물질, 예를 들면, 카르복시메틸 셀룰로오즈 나트륨, 솔비톨 그리고 덱스트란을 포함하는 물질을 포함할 수 있다. 임의선택적으로, 상기 현탁액은 안정화제들을 또한 포함할 수 있다. 세포 또는 간질(interstitial) 공간으로 본 발명의 분자들을 운반하기 위하여 이 분자를 포집하는데 리포좀이 또한 이용될 수 있다. 예시적인 약학적으로 수용가능한 운반체는 생리학적으로 양립가능한 용매, 분산 배지, 코팅, 항균성 그리고 항진균성 물질들, 등장성 그리고 흡수 지연 물질들, 물, 염수, 인산염 완충된 염수, 덱스트로즈, 글리세롤, 에탄올 그리고 이와 유사한 것들이다. 일부 구체예들에 있어서, 상기 조성물은 등장성 물질들, 예를 들면, 당, 폴리알코올 가령, 만니톨, 솔비톨, 또는 염화나트륨을 포함한다. 또 다른 구체예들에 있어서, 상기 조성물은 약학적으로 수용가능한 물질들 가령, 가습 물질들 또는 소량의 보조 물질들 가령, 가습 또는 유화 물질들, 보존제 또는 완충액을 포함하는데, 이들은 상기 활성 성분들의 반감기 또는 효과를 강화시킨다.
본 발명의 조성물은 예를 들면, 액체 (예컨대 주사용 그리고 주입용 용액), 분산액, 현탁액, 반-고형 및 고형 투약형이 포함된 다양한 형태일 수 있다. 바람직한 형태는 투여 방식 및 치료 용도에 따라 달라진다.
상기 조성물은 용액, 현미-유액(micro emulsion), 분산, 리포좀, 또는 고농도 약물에 적합한 다른 정돈된 구조 형태로 제형화될 수 있다. 멸균 주사용 용액은 상기 열거된 하나 또는 그 이상의 성분과 함께, 필요한 양의 상기 활성 성분을 적절한 용매에 혼입시키고, 필요에 따라 여과 멸균하여 만들 수 있다. 일반적으로, 기본 분산 배지와 상기 열거된 것들중 필요한 성분이 포함된 멸균 운반체 안에 상기 활성 성분을 혼입시켜 분산액을 만든다. 멸균 주사용 용액의 제조를 위한 멸균 분말 경우에 있어서, 바람직한 제법은 진공 건조 및 동결건조이며, 상기 활성 성분 분말과 함께 이미 멸균 여과된 용액으로부터 임의의 추가 성분의 분말을 만든다. 용액의 적절한 유동성은 예를 들면, 코팅 가령, 레시틴의 사용에 의해, 분산액의 경우 요구되는 입자 크기의 유지에 의해 그리고 계면활성제의 사용에 의해 유지될 수 있다. 흡수를 지연시키는 물질, 예를 들면, 모노스테아레이트 염 및 젤라틴을 상기 조성물에 포함시킴으로써 주사용 조성물의 흡수가 연장될 수 있다.
상기 활성 성분은 조절된-방출 제형 또는 장치로 제형화될 수 있다. 이러한 제형 및 장치의 예로는 임플란트, 경피 패취, 그리고 마이크로포집된 운반 시스템을 포함한다. 생물분해가능한, 생물양립가능한 중합체들, 예를 들면, 에틸렌 비닐 아세테이트, 폴리안하이드리드, 폴리글리콜산, 콜라겐, 폴리오르소에스테르, 그리고 폴리락트산이 이용될 수 있다. 이러한 제형 및 장치를 준비하는 방법들은 당업계에 공지되어 있다. 예컨대 Sustained and controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.
주사용 데포우 제형은 생물분해가능한 중합체 가령, 폴리락티드-폴리글리코리드에 상기 약물의 마이크로포집된 매트릭스를 형성함으로써, 주사용 데포우 제형이 만들어질 수 있다. 중합체에 대한 약물의 비율, 그리고 이용되는 상기 중합체의 성질에 따라, 약물 방출 속도가 조절될 수 있다. 다른 예시적인 생물분해가능한 중합체들은 폴리오르소에스테르와 폴리안하이드리드다. 데포우 주사용 제형은 리포좀 또는 현미유액(microemulsions)에 상기 약물을 포집시켜 또한 만들 수 있다.
보충 활성 화합물들이 상기 조성물에 혼입될 수 있다. 한 구체예에서, 본 발명의 상기 VWF 단편 또는 상기 키메라 단백질은 또 다른 응고인자, 또는 이의 변이체, 단편, 유사체, 또는 유도체와 함께 제형화된다. 예를 들면, 상기 응고인자는 인자 V, 인자 VII, 인자 VIII, 인자 IX, 인자 X, 인자 XI, 인자 XII, 인자 XIII, 프로트롬빈, 피브리노겐, 폰 빌레브란트 인자 또는 재조합 가용성 조직 인자 (rsTF) 또는 전술한 임의의 활성화된 형태를 포함하나, 이에 한정되지 않는다. 지혈 물질의 응고인자는 항-피브린용해성 약물, 예컨대, 엡실론-아미노-카프로산, 트라넥사민산을 또한 포함할 수 있다.
원하는 최적의 반응을 제공하기 위하여 투약 섭생은 조정될 수 있다. 예를 들면, 단일 볼루스가 투여될 수 있고, 시간을 두고 몇 번의 분할된 투여 분량(dose)이 투여될 수 있거나, 또는 상기 분량은 치료 상태의 필요에 따라 표시된 것과 같이 비례적으로 감소되거나 또는 증가될 수 있다. 용이한 투여 및 투여의 균일성을 위하여 투약 단위 안에 장관외 조성물을 제형화하는 것이 유익하다. 예컨대 Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980) 참고.
상기 활성 화합물에 추가하여, 상기 액체 투약형은 비활성 성분들 가령, 물, 에틸 알코올, 에틸 카르보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부티렌글리콜, 디메틸포름아미드, 오일, 글리세롤, 테트하히드로푸르푸릴알코올, 폴리에틸렌 글리콜, 그리고 소르비탄의 지방산 에스테르를 포함할 수 있다.
적합한 약학 운반체의 비-제한적 예는 또한 다음에 설명된다: Remington's Pharmaceutical Sciences E. W. Martin. 부형제의 일부 실시예는 전분, 포도당, 락토오즈, 슈크로즈, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카 겔, 스테아르산 나트륨, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 건 탈지분유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올, 그리고 이와 유사한 것들을 포함한다. 상기 조성물은 pH 완충 시약들, 그리고 가습 또는 유화 물질들을 또한 포함할 수 있다.
구강 투여를 위하여, 상기 약제학적 조성물은 통상적 수단에 의해 만들어진 테블릿 또는 캡슐의 형태를 취할 수 있다. 상기 조성물은 액체, 예를 들면 시럽 또는 현탁액으로 또한 제조될 수도 있다. 상기 액체는 현탁 물질들 (예컨대, 솔비톨 시럽, 셀룰로오즈 유도체 또는 수소화된 지방, 유화 물질들 (레시틴 또는 아카시아), 비-수성 운반체 (예컨대, 아몬드 오일, 유성 에스테르, 에틸 알코올, 또는 분별된 식물성 오일), 그리고 보존제 (예컨대, 메틸 또는 프로필-p-히드록시벤조에이트 또는 소르브산)을 포함할 수 있다. 상기 조제물은 풍미, 발색 및 감미 물질들을 또한 포함할 수 있다. 대안으로, 상기 조성물은 물 또는 또 다른 적합한 운반체로 재구성을 위한 건조 산물로 제시될 수 있다.
볼(buccal) 투여를 위하여, 상기 조성물은 통상적 프로토콜에 따라 테블릿 또는 로젠지(lozenges) 형태를 취할 수 있다.
흡입에 의한 투여를 위하여, 본 발명에 따라 이용되는 상기 화합물들은 부형제와 함께, 또는 부형제 없이, 분무 에어로졸 형태, 또는 임의선택적으로 추진체, 예컨대, 디클로로디플로오르메탄, 트리클로로플로오로메탄, 디클로로테트라플로로메탄, 이산화탄소 또는 다른 적합한 가스와 함께, 감압된 팩 또는 분무기로부터 에어로졸 분무에 의해 통상적으로 전달된다. 가압된 에어로졸의 경우 예정된 양을 운반하는 벨브를 제공함으로써 상기 투약형 단위가 결정될 수 있다. 흡입기 또는 취입기에 사용을 위한 예컨대, 젤라틴 캡슐 및 카르릿지는 상기 화합물과 적합한 분말 베이스 가령, 락토오즈 또는 전분의 분말 혼합물이 포함되도록 제형화될 수 있다.
상기 약제학적 조성물은 예컨대 통상적 좌약 베이스 가령, 코코아 기름 또는 다른 글리세리드가 포함된 좌약 또는 유지 관장제로 직장 투여를 위하여 또한 제형화될 수 있다.
유전자 요법
출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 그리고 장요근에서 출혈로 구성된 군에서 선택된 출혈 질환 또는 장애의 처치에 유전자 요법을 이용하여 포유류, 예컨대 인간 환자에서 생산될 수 있는 본 발명의 VWF 단편 또는 키메라 단백질이 치료요법적으로 유익할 수 있다. 한 구체예에서, 상기 출혈 질환 또는 장애는 혈우병이다. 또 다른 구체예에서, 상기 출혈 질환 또는 장애는 혈우병 A이다. 이것은 적합한 발현 조절 서열에 작용가능하도록 연계된 적합한 VWF 단편 또는 키메라 단백질-인코딩 핵산을 투여하는 것에 관련된다. 특정 구체예에서, 이들 서열은 바이러스 벡터 안에 혼입된다. 이러한 유전자 요법에 적합한 바이러스 벡터는 아데노바이러스 벡터, 렌티바이러스 벡터, 바큘로바이러스 벡터, Epstein Barr 바이러스 벡터, 파포바바이러스 벡터, 우두 바이러스 벡터, 단순 포진 바이러스 벡터, 그리고 아데노 연합된 바이러스 (AAV) 벡터를 포함한다. 상기 바이러스 벡터는 복제-결함성 바이러스 벡터일 수 있다. 또 다른 구체예들에 있어서, 아데노바이러스 벡터는 이의 E1 유전자 또는 E3 유전자에 결손이 있다. 아데노바이러스 벡터가 이용될 때, 상기 포유류는 선택성 표식 유전자가 인코드된 핵산에 노출되지 않을 수 있다. 또 다른 구체예들에 있어서, 상기 서열은 당업자에게 공지된 비-바이러스 벡터에 혼입된다.
VWF 단편 또는 키메라 단백질을 이용하는 방법
본 발명의 한 측면은 내생성 VWF으로부터 FVIII 상에 있는 VWF 결합 부위를 차단 또는 차폐시킴으로써, FVIII와 내생성 VWF의 상호작용을 방지 또는 저해하는 것에 관한 것이다. 한 구체예에서, 본 발명은 야생형 FVIII 또는 FVIII 단량체-이량체 하이브리드보다 더 긴 반감기를 갖는 FVIII 단백질을 작제하는 방법에 관한 것으로, 상기 방법은 부속 모이어티를 상기 FVIII 단백질에 공유적으로 연합시키고, 이로 인하여 상기 FVIII 단백질과 부속 모이어티가 포함된 키메라 단백질이 만들어지는 것을 포함하며, 이때 상기 부속 모이어티는 상기 FVIII 단백질과 내생성 VWF와의 상호작용을 차폐 또는 방지한다. 상기 방법에 유용한 키메라 단백질은 본 명세서에 설명된 임의의 하나 또는 그 이상의 키메라 단백질을 포함한다.
본 발명의 또 다른 측면은 야생형 FVIII 또는 FVIII 단량체-이량체 하이브리드보다 더 긴 반감기를 갖는 FVIII 단백질을 필요로 하는 대상에게 투여하는 방법을 포함하는데, 상기 하이브리드는 2개의 폴리펩티드 쇄, 즉 FVIII와 Fc 영역이 인코드된 아미노산 서열로 구성된 제 1 쇄와 Fc 영역으로 구성된 제 2 쇄로 구성되며, 이때 상기 방법은 상기 본 명세서에서 설명된 VWF 단편 또는 상기 키메라 단백질을 상기 대상에게 투여하는 것을 포함한다. 단량체-이량체 하이브리드에서 상기 FVIII 아미노산 서열은 SQ FVIII 또는 야생형 FVIII일 수 있다.
한 구체예에서, 본 발명은 내생성 VWF와 FVIII 단백질의 상호작용을 방지 또는 저해하기 위하여, 부속 모이어티, 예컨대 본 명세서에서 설명된 VWF 단편 또는 상기 VWF 단편이 포함된 키메라 단백질을 이용하는 방법에 관계한다. 또 다른 구체예에서, 상기 VWF 단편과 상호작용할 수 있는 FVIII 단백질은 내생성 FVIII이다. 다른 구체예들에 있어서, 상기 VWF 단편과 상호작용할 수 있는 FVIII 단백질은 상기 VWF 단편 또는 상기 VWF 단편이 포함된 키메라 단백질을 대상에게 투여하기 전, 또는 투여 후 별도로 대상에게 투여되거나 동시에 투여되는 FVIII 조성물이다. 다른 구체예들에 있어서, 상기 VWF 단편에 결합할 수 있는 FVIII 단백질은 상기 VWF 단편 또는 상기 키메라 단백질과 함께 대상에게 투여되는 FVIII 조성물이다. 여전히 다른 구체예들에 있어서, 상기 VWF 단편에 결합할 수 있는 FVIII 단백질은 상기 VWF 단편에 존재하는 또는 상기 키메라 단백질 안에 VWF 단편과 연합된 FVIII이다. 상기 VWF 단편 또는 상기 VWF 단편이 포함된 키메라 단백질은 상기 FVIII 단백질에 결합되거나 또는 연합되어 있고, 따라서 상기 VWF 단편 또는 상기 키메라 단백질에 결합된 상기 FVIII 단백질의 반감기를 연장시킨다. 상기 VWF 단편 또는 상기 키메라 단백질에 결합된 FVIII 단백질은 VWF의 제거 경로로부터 차폐 또는 보호되어 있고, 따라서 상기 VWF 단편 또는 상기 키메라 단백질에 결합되지 않은 FVIII 단백질과 비교하였을 때 제거가 감소되었다. 따라서, 차폐된 상기 FVIII 단백질은 상기 VWF 단편 또는 상기 키메라 단백질에 결합되지 않은 또는 연합되지 않은 FVIII 단백질보다 더 긴 반감기를 갖는다. 특정 구체예들에 있어서, 본 발명의 VWF 단편 또는 키메라 단백질과 연합된 또는 이에 의해 보호된 상기 FVIII 단백질은 VWF 제거 수용체에 의해 제거되지 않는다. 다른 구체예들에 있어서, VWF 단편 또는 키메라 단백질과 연합된 또는 이에 의해 보호된 상기 FVIII 단백질은 상기 VWF 단편 또는 키메라 단백질과 연합되지 않은 또는 이에 의해 보호되지 않은 FVIII 단백질보다 시스템으로부터 더 천천히 제거된다.
한 측면에서, 본 발명의 상기 VWF 단편 또는 이를 포함하는 키메라 단백질은 상기 VWF 단편 또는 상기 키메라 단백질이 VWF 제거 수용체 결합 부위를 포함하고 있지 않기 때문에 순환계로부터 제거가 감소된다. 상기 VWF 단편은 시스템 내지 상기 VWF 제거 경로로부터 상기 VWF 단편에 결합된 또는 이와 연합된 FVIII의 제거를 방지 또는 저해한다. 본 발명에 유용한 상기 VWF 단편들은 내생성 VWF에 의해 제공되는 최소한 하나 또는 그 이상의 VWF-유사 FVIII 보호 성질을 또한 제공할 수 있다. 특정 구체예들에 있어서, 상기 VWF 단편들은 하나 또는 그 이상의 FVIII 제거 수용체 결합 부위를 감출 수 있고, 이로 인하여 자체 제거 경로에 의한 FVIII 제거가 방지될 수 있다.
또 다른 측면에서, 본 발명의 상기 VWF 단편 또는 키메라 단백질은 유형 2N 폰 빌레브란트 질환 (VWD)과 연합된 질환 또는 장애를 치료 또는 예방하는데 이용될 수 있다. 유형 2N VWD은 FVIII에 대한 VWF 결합의 결함으로 발생되는 질적인 VWF 결함이며, 이로 인하여 순환 FVIII의 수준이 낮아진다. 따라서, 상기 FVIII 단백질에 결합 또는 결합함으로써 본 발명의 상기 VWF 단편 또는 키메라 단백질은 상기 FVIII 단백질을 안정화시키고, 뿐만 아니라 순환계로부터 상기 FVIII 단백질 제거를 방지한다.
일부 구체예들에 있어서, 상기 VWF 단편 또는 키메라 단백질에 의해 시험관내 또는 생체내에서 내생성 VWF에 FVIII 단백질 결합이 방지 또는 저해될 수 있다.
상기 VWF 단편 또는 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질을 이를 필요로 하는 대상에게 투여하는 것을 포함하는, 상기 FVIII 단백질의 반감기를 증가시키는 방법이 또한 제공된다. 전장 VWF에 결합된 또는 연합된 비-활성화된 FVIII의 반감기는 혈장내에서 약 12 내지 14 시간이다. 순환계내 VWF가 거의 없는 VWD 유형 3에서, 상기 FVIII의 반감기는 고작 약 6 시간이며, 이는 FVIII의 농도 감소로 인하여, 이러한 환자에서 약하거나 중간 수준의 혈우병 A 증후로 이어진다. 본 발명의 VWF 단편에 연계된 또는 연합된 상기 FVIII 단백질의 반감기는 전장 VWF에 결합된 또는 연합된 비-활성화된 FVIII의 반감기보다 최소한 약 1.5 배, 1.6 배, 1.7 배, 1.8 배, 1.9 배, 2.0 배, 2.1 배, 2.2 배, 2.3 배, 2.4 배, 2.6 배, 2.7. 배, 2.8 배, 2.9 배, 3.0 배, 3.1 배, 3.2 배, 3.3 배, 3.4 배, 3.5 배, 3.6 배, 3.7 배, 3.8 배, 3.9 배, 또는 4.0 배 더 높이 증가될 수 있다. 한 구체예에서, 키메라 단백질 내 VWF 단편에 연계된 또는 연합된 상기 FVIII 단백질의 반감기는 전장 VWF에 결합된 또는 연합된 비-활성화된 FVIII의 반감기보다 최소한 약 2 배, 2.5 배, 3.0 배, 3.5 배, 4.0 배, 4.5 배, 5.0 배, 5.5 배, 6.0 배, 7 배, 8 배, 9 배, 또는 10 배 더 높이 증가된다. 또 다른 구체예에서, 키메라 단백질 내 VWF 단편에 연계된 또는 연합된 상기 FVIII 단백질의 반감기는 전장 VWF에 결합된 또는 연합된 비-활성화된 FVIII의 반감기보다 약 2 내지 약 5 배, 약 3 내지 약 10 배, 약 5 내지 약 15 배, 약 10 내지 약 20 배, 약 15 내지 약 25 배, 약 20 내지 약 30 배, 약 25 내지 약 35 배, 약 30 내지 약 40 배, 약 35 내지 약 45 배 더 높이 증가된다. 특정 구체예에 있어서, 키메라 단백질 내 VWF 단편에 연계된 또는 연합된 상기 FVIII 단백질의 반감기는 FVIII와 VWF 이중 녹아웃 마우스에서 야생형 FVIII의 반감기보다 최소한 약 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 배 더 높이 증가된다. 일부 구체예들에 있어서, 제 1 이종기원의 모이어티, 예컨대 제 1 Fc 영역에 융합된 VWF 단편과 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역에 연계된 FVIII 단백질이 포함된 키메라 단백질의 반감기는 FVIII 단백질과 2개의 Fc 영역이 포함되고, 이때 상기 FVIII 단백질은 2개 영역중 하나에 연계된 키메라 단백질 (예컨대, FVIII 단량체-이량체 하이브리드)의 반감기보다 더 길다. 또 다른 구체예들에 있어서, 제 1 이종기원의 모이어티, 예컨대 제 1 Fc 영역에 융합된 VWF 단편과 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역에 연계된 FVIII 단백질이 포함된 키메라 단백질의 반감기는 FVIII 단백질과 2개의 Fc 영역이 포함되고, 이때 상기 FVIII 단백질은 2개 영역중 하나에 연계된, 키메라 단백질 (예컨대, FVIII 단량체-이량체 하이브리드)의 반감기의 최소한 약 1.5 배, 2 배, 2.5 배, 3.5 배, 3.6 배, 3.7 배, 3.8 배, 3.9 배, 4.0 배, 4.5 배, 또는 5.0 배다.
일부 구체예들에 있어서, 본 발명의 결과로써 상기 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 FVIII 단백질 또는 야생형 FVIII과 비교하여 연장된다. 상기 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 FVIII 단백질 반감기보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 또는 최소한 약 12 배 더 길다. 한 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII의 반감기 보다 약 1.5-배 내지 약 20-배, 약 1.5 배 내지 약 15 배, 또는 약 1.5 배 내지 약 10 배 더 길다. 또 다른 구체예에서, 상기 FVIII의 반감기는 야생형 FVIII 또는 상기 VWF 단편이 없는 FVIII 단백질 과 비교하였을 때, 약 2-배 내지 약 10-배, 약 2-배 내지 약 9-배, 약 2-배 내지 약 8-배, 약 2-배 내지 약 7-배, 약 2-배 내지 약 6-배, 약 2-배 내지 약 5-배, 약 2-배 내지 약 4-배, 약 2-배 내지 약 3-배, 약 2.5-배 내지 약 10-배, 약 2.5-배 내지 약 9-배, 약 2.5-배 내지 약 8-배, 약 2.5-배 내지 약 7-배, 약 2.5-배 내지 약 6-배, 약 2.5-배 내지 약 5-배, 약 2.5-배 내지 약 4-배, 약 2.5-배 내지 약 3-배, 약 3-배 내지 약 10-배, 약 3-배 내지 약 9-배, 약 3-배 내지 약 8-배, 약 3-배 내지 약 7-배, 약 3-배 내지 약 6-배, 약 3-배 내지 약 5-배, 약 3-배 내지 약 4-배, 약 4-배 내지 약 6 배, 약 5-배 내지 약 7-배, 또는 약 6-배 내지 약 8 배 연장된다. 또 다른 구체예들에 있어서, 상기 FVIII의 반감기는 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 25 시간, 최소한 약 26 시간, 최소한 약 27 시간, 최소한 약 28 시간, 최소한 약 29 시간, 최소한 약 30 시간, 최소한 약 31 시간, 최소한 약 32 시간, 최소한 약 33 시간, 최소한 약 34 시간, 최소한 약 35 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간이다. 여전히 다른 구체예들에 있어서, 상기 FVIII의 반감기는 약 15 시간 내지 약 2 주, 약 16 시간 내지 약 1 주, 약 17 시간 내지 약 1 주, 약 18 시간 내지 약 1 주, 약 19 시간 내지 약 1 주, 약 20 시간 내지 약 1 주, 약 21 시간 내지 약 1 주, 약 22 시간 내지 약 1 주, 약 23 시간 내지 약 1 주, 약 24 시간 내지 약 1 주, 약 36 시간 내지 약 1 주, 약 48 시간 내지 약 1 주, 약 60 시간 내지 약 1 주, 약 24 시간 내지 약 6일, 약 24 시간 내지 약 5 일, 약 24 시간 내지 약 4 일, 약 24 시간 내지 약 3 일, 또는 약 24 시간 내지 약 2 일이다.
일부 구체예들에 있어서, 한 대상 당 상기 FVIII 단백질의 평균 반감기는 약 15 시간, 약 16 시간, 약 17 시간, 약 18 시간, 약 19 시간, 약 20 시간, 약 21 시간, 약 22 시간, 약 23 시간, 약 24 시간 (1 일), 약 25 시간, 약 26 시간, 약 27 시간, 약 28 시간, 약 29 시간, 약 30 시간, 약 31 시간, 약 32 시간, 약 33 시간, 약 34 시간, 약 35 시간, 약 36 시간, 약 40 시간, 약 44 시간, 약 48 시간 (2 일), 약 54 시간, 약 60 시간, 약 72 시간 (3 일), 약 84 시간, 약 96 시간 (4 일), 약 108 시간, 약 120 시간 (5 일), 약 6일, 약 7 일(1 주), 약 8 일, 약 9 일, 약 10 일, 약 11 일, 약 12 일, 약 13 일, 또는 약 14 일이다.
특정 구체예에 있어서, 본 발명의 상기 키메라 단백질의 반감기는 야생형 FVIII의 반감기 또는 BDD FVIII 보다 약 2배 더 길다. 또 다른 구체예에서, 상기 키메라 단백질의 반감기는 야생형 FVIII의 반감기 또는 BDD FVIII 보다 약 3배 더 길다.
또한, 본 발명은 출혈 질환 또는 장애를 치료 또는 예방하는 방법을 제공하는데, 이 방법은 상기 VWF 단편 또는 상기 키메라 단백질 (예컨대 제 1 이종기원의 모이어티, 예컨대 제 1 Fc 영역에 연계된 상기 VWF 단편과 제 2 이종기원의 모이어티, 예컨대 제 2 Fc 영역에 연계된 FVIII 단백질이 포함된 키메라 단백질, 이때 상기 VWF 단편은 상기 FVIII 단백질에 결합되거나 또는 연합되어 있다)의 유효량을 투여하는 것을 포함한다. 한 구체예에서, 상기 출혈 질환 또는 장애는 출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 그리고 장요근에서 출혈로 구성된 군으로부터 선택된다. 특정 구체예에 있어서, 상기 출혈 질환 또는 장애는 혈우병 A다.
상기 VWF 단편과 부속 모이어티, 예컨대 상기 본 명세서에서 VWF 단편과 본 발명에 의해 준비된 FVIII 단백질이 포함된 키메라 단백질은 지혈 장애가 있는 대상을 치료하는 방법과 일반 지혈 물질이 필요한 대상을 치료하는 방법이 포함되나, 이에 한정되지 않는 당업자가 인지할 수 있는 많은 용도를 갖는다. 한 구체예에서, 본 발명은 지혈 장애가 있는 대상을 치료하는 방법에 관련되며, 이 방법은 치료요법적으로 유효량의 상기 VWF 단편 또는 상기 키메라 단백질을 투여하는 것을 포함한다.
상기 키메라 단백질 내 FVIII 단백질은 음 전하를 띈 인지질 표면 상에 있는 인자 IX에 공인자로 작용하고, 이로 인하여 Xase 복합체가 형성됨으로써, 지혈 장애를 치료 또는 예방한다. 활성화된 응고 인자가 인지질 표면에 결합은 혈관 손상 부위에 이 공정을 국소화시킨다. 인지질 표면에서, 인자 VIIIa는 인자 IXa에 의한 인자 X 활성화의 최대 속도를 대략 200,000-배 증가시키고, 이로 인하여 트롬빈 생성이 많은 제 2 분출로 이어진다.
부속 모이어티, 예컨대 VWF 단편, 그리고 FVIII 단백질이 포함된 상기 키메라 단백질은 임의의 지혈 장애를 치료하는데 이용될 수 있다. 본 발명의 상기 키메라 단백질의 투여에 의해 치료될 수 있는 상기 지혈 장애는 혈우병 A, 뿐만 아니라 인자 VIII와 관련된 결핍 또는 구조적 비정상이 포함되나 이에 한정되지 않는다. 한 구체예에서, 상기 지혈 장애는 혈우병 A다.
부속 모이어티, 예컨대 VWF 단편, 그리고 FVIII 단백질이 포함된 상기 키메라 단백질은 임의의 지혈 장애가 있는 대상을 치료하는데 예방적으로 이용될 수 있다. 본 발명의 상기 키메라 단백질은 지혈 장애가 있는 대상에서 급성 출혈 사건을 치료하는데 이용될 수 있다. 또 다른 구체예에서, 상기 지혈 장애는 결함성 응고인자, 예컨대 폰 빌레브란트 인자의 결함으로 인한 것일 수 있다. 한 구체예에서, 상기 지혈 장애는 유전적 장애다. 또 다른 구체예에서, 상기 지혈 장애는 후천적 장애다. 상기 후천적 장애는 잠재적 2차 질환 또는 상태로 인한 것일 수 있다. 무관한 상태는 예를 들면, 암, 자가-면역 질환, 또는 임신이 될 수 있지만, 이에 한정되지 않는다. 상기 후천적 장애는 고령으로 인한 것이거나 또는 잠재적 2차 장애 (예컨대 암 화학요법)의 치료하기 위한 약물로 인할 것일 수 있다.
본 발명은 선천적 지혈 장애는 없지만, 항-FVIII 항체의 발달 또는 외과술로 인하여 지혈 장애를 얻게되는 2차 질환 또는 상태를 가진, 대상을 치료하는 방법에 또한 관계한다. 따라서 본 발명은 일반 지혈 물질을 필요로 하는 대상을 치료하는 방법에 관계하는데, 이 방법은 본 방법에 의해 준비된 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질의 치료요법적으로 유효량을 투여하는 것을 포함한다.
본 발명은 FVIII의 면역원성을 감소시키거나 또는 FVIII에 대항하여 더 적은 면역원성을 유도하는 방법에 또한 관계하는데, 이 방법은 본 명세서에서 설명된 VWF 단편, 키메라 단백질들, 또는 이를 인코드하는 폴리뉴클레오티드의 유효량을 투여하는 것을 포함한다.
한 구체예에서, 일반 지혈 물질을 필요로 하는 대상은 외과술을 받고 있거나, 또는 받을 예정이다. 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질은 예방적 섭생으로 외과술 전, 후, 또는 외과술을 받는 동안 투여될 수 있다. 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질은 급성 출혈 사건을 제어하기 위하여 외과술 전, 후, 또는외과술을 받는 동안 투여될 수 있다.
상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질은 지혈 장애가 없는 대상에거, 급성 출혈 사건을 치료하는데 이용될 수 있다. 상기 급성 출혈 사건은 심각한 외상, 예컨대 외과술, 차 사고, 상처, 열상 총상 또는 조절불능 출혈로 이어지는 임의의 다른 외상으로 인한 것일 수 있다. 출혈 사건의 비-제한적 실시예로는 출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 장요근에서 출혈, 그리고 이의 임의의 조합들을 포함한다.
예방적 용도에서, 본 발명의 키메라 단백질 또는 VWF 단편 또는 이의 칵테일이 포함된 하나 또는 그 이상의 조성물이 상기 질환 상태에 있지 않은 환자에게 투여되어, 환자의 저항을 강화시키거나 또는 질환 또는 장애와 연관된 징후를 감소시킨다. 이러한 양은 "예방적 유효 투여 분량(prophylactic effective dose)" 으로 정의된다. 치료 용도에서, 상기 질환의 진행이 감소되거나 또는 종료될 때까지, 그리고 이 환자가 질환의 징후중 일부 또는 전부가 개선될 때까지 상대적으로 짧은 간격에서 상대적으로 높은 투약량(예컨대, 분량당 약 1 내지 400 mg/kg의 폴리펩티드, 방사능면역접합체의 경우 5 내지 25 mg이 좀더 많이 이용되고, 사이토톡신-약물 변형된 폴리펩티드의 경우 더 높은 분량이 요구된다)이 때로 요구된다. 그 이후, 상기 환자에게 예방적 섭생이 투여될 수 있다.
일부 구체예들에 있어서, 본 발명의 키메라 단백질, VWF 단편, 또는 조성물은 요청에 의한(on-demand) 처치에 이용되는데, 출혈 사건, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부 (머리 외상), 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 또는 장요근에서 출혈에 대한 처치가 포함된다. 상기 대상은 수술적 예방, 수술 전후 관리, 또는 외과술을 위한 처치가 필요할 수 있다. 이러한 외과술은 예컨대 작은 외과술, 큰 외과술, 발치, 편도 절제, 서혜 헤르니아 절개, 활막절제, 무릎 관절 전치환술, 개두(craniotomy), 골합성, 외상 외과술, 두개내 외과술, 복막내 외과술, 흉곽내 외과술, 또는 관절 대체외과술을 포함한다.
한 구체예에서, 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질은 정맥내, 피하, 근육내, 또는 임의의 점막 표면, 예컨대, 구강, 설하, 볼, 비강, 직장, 질 점막을 통하여 또는 폐 경로를 통하여 투여된다. 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질은 출혈 부위로 상기 키메라 단백질의 서방을 허용하는 생물중합체 고형 지지대 안에 이식되거나 또는 연계될 수 있고 또는 붕대/드레싱안에 이식될 수도 있다. 상기 VWF 단편과 FVIII 단백질이 포함된 키메라 단백질의 투여 분량(dose)은 대상 및 이용되는 특정 투여경로에 따라 변화될 것이다. 투약량(dosages)은 체중 kg 당 0.1 내지 100,000 μg 범위가 될 것이다. 한 구체예에서, 상기 투약량 범위는 0.1-1,000 μg/kg이다. 또 다른 구체예에서, 상기 투약량 범위는 0.1-500 μg/kg이다. 상기 단백질은 지속적으로 또는 특정 간격으로 투여될 수 있다. 시험관내 분석을 이용하여 최적의 투여 분량 및/또는 투여 일정을 결정할 수 있다. 응고 인자 활성을 측정하는 시험관내 분석은 당분야에 공지되어 있고, 예컨대, STA-CLOT VIIa-rTF 응고분석 또는 ROTEM 응고분석이 있다. 추가적으로, 효과적인 투여 분량은 동물 모델, 예컨대, 혈우병 개로부터 획득된 투여 분량-반응 곡선으로부터 추정될 수 있다 (Mount 그리고 다른 사람들. 2002, Blood 99(8):2670).
지금까지 본 발명이 상세하게 설명되었으며, 다음의 실시예를 근거하여 좀더 명확하게 이해될 수있고, 이들 실시예는 오직 설명을 위하여 본 명세서에 제시된 것이며, 본 발명을 이에 한정하려는 의도는 없다. 모든 특허 및 공개문헌은 본 명세서의 참고자료에 명시적으로 편입된다.
실시예들
실시예를 통하여 다른 언급이 없는 한, 다음의 재료 및 방법들이 이용되었다.
재료 및 방법
일반적으로, 본 발명의 실시에서 다른 언급이 없는 한, 통상적 화학, 생물물리, 분자 생물, 재조합 DNA 기술, 면역학 (구체적으로, 예컨대 항체 기술), 그리고 전기영동에서 표준 기술들이 이용된다. 예컨대 Sambrook, Fritsch and Maniatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989); Antibody Engineering Protocols (Methods in Molecular Biology), 510, Paul, S., Humana Pr (1996); Antibody Engineering: A Practical Approach (Practical Approach Series, 169), McCafferty, Ed., Irl Pr (1996); Antibodies: A Laboratory Manual, Harlow 및 다른 사람들,CS.H.L. Press, Pub. (1999); 그리고 Current Protocols in Molecular Biology, eds. Ausubel 및 다른 사람들, John Wiley & Sons (1992).
실시예 1: 상이한 VWF 도메인들을 클로닝 (도 1)
(a) pSYN-VWF-001, 002, 003 및 004 클로닝
pSYN-VWF-001 내지 004는 아미노산 1-276 (001), 아미노산 1-477 (002), 아미노산 1-511 (003) 및 아미노산 1-716 (004)의 VWF-D'D3A 단백질 서열인 VWF 단편들이 인코드된 뉴클레오디트 서열을 포함한다. 아미노산 넘버링은 프로펩티드 없는 성숙한 VWF 서열을 나타내며, 이는 각각 서열 번호:2의 아미노산 764-1039 (001), 아미노산 764-1240 (002), 아미노산 764-1274 (003), 그리고 아미노산 764-1479 (004)을 나타낸다. 4가지 구조체는 모두 N-말단에서 합성된 단백질의 적절한 분비를 허용하는 상기 FVIII 신호 펩티드와 C-말단에서 단백질 정제에 이용되는 6xHis 테그를 갖는다. 다음 프라이머 조합을 이용하여 상기 구조체들이 합성되었다:
pSYN VWF- 001:
VIII 신호 및 BsiW1 부위를 가진 ESC48- Fwd -VWF-D'D3
TCGCGACGTACGGCCGCCACCATGCAAATAGAGCTCTCCACCTGCTTCTTTCTGTGC
CTTTTGCGATTCTGCTTTAGCCTATCCTGTCGGCCCCCCATG (서열 번호: 57)
6 His 및 Not1 부위를 가진 ESC50- Rev-VWF-일부 D'D3 (1-276 아미노산)
TGACCTCGAGCGGCCGCTCAGTGGTGATGGTGATGATGCAGAGGCACTTTTCTGGTG
TCAGCACACTG (서열 번호: 58)
pSYN VWF- 002:
VIII 신호 및 BsiW1 부위를 가진 ESC48- Fwd -VWF-D'D3
TCGCGACGTACGGCCGCCACCATGCAAATAGAGCTCTCCACCTGCTTCTTTCTGTGC
CTTTTGCGATTCTGCTTTAGCCTATCCTGTCGGCCCCCCATG (서열 번호: 59)
6His 그리고 Not 1 부위를 가진 ESC51- Rev- VWF D'D3 (1-477 아미노산)
TGACCTCGAGCGGCCGCTCAGTGGTGATGGTGATGATGCGGCTCCTGGCAGGCTTCA
CAGGTGAGGTTGACAAC (서열 번호: 60)
pSYN VWF- 003:
VIII 신호 및 BsiW1 부위를 가진 ESC48- Fwd -VWF-D'D3
TCGCGACGTACGGCCGCCACCATGCAAATAGAGCTCTCCACCTGCTTCTTTCTGTGC
CTTTTGCGATTCTGCTTTAGCCTATCCTGTCGGCCCCCCATG (서열 번호: 61)
6His 및 Not1 부위를 가진 ESC52- Rev-VWF-D'D3 일부 A1 (1-511 아미노산)
TGACCTCGAGCGGCCGCTCAGTGGTGATGGTGATGATGCCTGCTGCAGTAGAAATCG
TGCAACGGCGGTTC (서열 번호: 62)
pSYN VWF- 004:
VIII 신호 및 BsiW1 부위를 가진 ESC48- Fwd -VWF-D'D3
TCGCGACGTACGGCCGCCACCATGCAAATAGAGCTCTCCACCTGCTTCTTTCTGTGC
CTTTTGCGATTCTGCTTTAGCCTATCCTGTCGGCCCCCCATG (서열 번호:63)
6His 및 Not1 부위를 가진 ESC53-Rev- VWF-D'D3A1 (1-716 아미노산)
TGACCTCGAGCGGCCGCTCAGTGGTGATGGTGATGATGGCCCACAGTGACTTGTGCC
ATGTGGGG (서열 번호: 64)
VWF-001, 002, 003 및 004 구조체의 단백질은 단량체로 존재할 것으로 추정된다.
50 μl PCR 반응은 2 단계 PCR 증폭 주기: [94 ℃ 2분; (96 ℃ 30 초, 68 ℃ 2분)을 21회]를 이용하여 ESC 48/ESC50, ESC 48/ESC 51, ESC 48/ESC52, ESC48/ESC53 프라이머 조합과 주형으로 전장의 VWF 플라스미드와 함께 실행되었다. 정확한 크기의 밴드 (VWF 001의 경우 960bp; VWF 002의 경우 1460, VWF 003의 경우 1520bp; 그리고 VWF 004의 경우 2150bp)는 겔 추출 키트 (Qiagen, Valencia, Calif.)를 이용하여 겔 정제되고, pcDNA 4의 상기 BsiWI 와 Not1 제한절단 부위로 클로닝되어, 각 pSYN-VWF 001, 002, 003 및 004를 만들었다.
(b) pSYN-VWF-006 클로닝
pSYN-VWF-006은 VWF의 D1D2D'D3-CK (시스테인 매듭) 도메인을 포함한다. 이 구조체를 클로닝하기 위하여, D3 도메인과 CK 도메인의 일부분이 포함된 DNA의 합성은 외부에서 조달되었다(Genscript- 서열 번호 122026, 아래에 나타냄). Genscript 구조체의 이 단편은 전장 VWF를 코딩하는 상기 벡터, 예컨대, BamH1/EcoRV 절단된 pSYN-VWF 008 안으로 서브-클론되었다.
Genscript-서열 번호- 122026 (서열 번호: 65)

(c) pSYN-VWF-009, 010, 011, 012 및 013 클로닝
pSYN VWF 008 구조체는 pcDNA 3.1 안에 상기 전장 VWF 서열(서열 번호: 2의 아미노산 1-2813) 을 포함한다. 이 구조체는 763개의 아미노산 프로펩티드 (예컨대, D1D2 도메인)에 이어서 성숙한 VWF의 2050개 아미노산 서열을 포함한다. pSYN-VWF-009, 010, 011 및 012는 각각 VWF 001, 002, 003 그리고 004와 동일한 코딩 서열을 포함하지만, 추가로 N-말단에 상기 FVIII 신호 펩티드를 대신하여 D1D2 도메인(VWF 프로펩타이드)을 갖는다. pSYN-VWF-008은 Arg907에서 BamH1 부위와 코딩 영역의 끝(정지 코돈 다음)에 Not1 부위를 갖는다. pSYN-VWF-008, 001, 002, 003 및 004는 BamH1 및 Not1 제한 효소로 절단되었다. pSYN-VWF-001 (423 bp), pSYN- VWF-002 (1026 bp), pSYN-VWF- 003 (1128 bp) 그리고 pSYN-VWF-004 (1743 bp)로부터 삽입체는 bamH1/Not1 절단된 pSYN-VWF-008 (8242bp)에 결찰되어, pSYN-VWF-009 (D1D2D'D3: 서열 번호:2의 아미노산 1-1039); pSYN-VWF -010 (D1D2D'D3: 서열 번호:2의 아미노산 1-1240); pSYN-VWF-011 (D1D2D'D3: 서열 번호:2의 아미노산 1-1274); pSYN-VWF-012 (D1D2D'D3: 아미노산 1-1479)가 획득되었다. 4개 구조체 모두가 상기 C-말단에 6xHis 테그를 가진다. 형질감염 세포들에서, pSYN-VWF-009, 010, 011, 그리고 012는 프로펩티드로 합성되지만, 세포내 가공으로 인하여 분배된 산물은 임의의 프로펩티드 (D1D2)를 보유하지 않는다. 예를 들면 VWF-009 및 VWF-010을 이용한 도 6과 7에 각각 나타낸 것과 같이, 상기 VWF-009 구조체로부터 발현된 단백질은 단량체로 존재하고, 상기 VWF-010, 011, 그리고 012 구조체는 이량체로 존재하는 것으로 추정된다.
pSYN-VWF-010은 pSYN-VWF-013을 만드는데 이용되었으며, 이것은 서열 번호: 73에 대응하는 C336A와 C379A에서 2개 점 돌연변이를 갖는다 (아미노산 넘버링은 D1D2 도메인-VWF 서열 2 없는 성숙한 VWF 서열을 나타낸다). 이들 돌연변이는 VWF D'D3 도메인의 이량체화를 방지하는 것으로 예상된다.
(d) pSYN-VWF-025와 029 클로닝
pSYN-VWF-025는 pLIVE 벡터 안에 전장 VWF의 야생형 D1D2D'D3 서열을 포함하고, pSYN-VWF-029는 pLIVE 벡터 안에 C336A/C379A 돌연변이를 갖는 D1D2D'D3 도메인들을 포함한다. pSYN-VWF-025 및 029 클로닝을 위하여, 다음의 프라이머 조합이 이용되었다:
Nhe1 부위를 가진 ESC 89-fwd = CTCACTATAGGGAGACCCAAGCTGGCTAGCCG (서열 번호: 66)
Sal1를 가진 ESC 91-rev =
CTGGATCCCGGGAGTCGACTCGTCAGTGGTGATGGTGATGATG (서열 번호: 67)
3 단계 PCR 증폭 주기: [94 ℃ -2 분; (96 ℃ -30 초, 55 °C-30 초, 68 °C-4 분)을 21회]를 이용하여 ESC 89/ESC91 프라이머 조합 그리고 주형으로 pSYN-VWF-010 (pSYN-VWF-025의 경우) 또는 pSYN-VWF-013 (pSYN-VWF-029의 경우) 플라스미드와 함께 50 μl PCR 반응이 실행되었다. 정확한 크기의 밴드 (~3800bp)는 겔 추출 키트 (Qiagen, Valencia, Calif.)를 이용하여 겔 정제되고, pLIVE-Mirus 벡터 (Invitrogen, Carlsbad, Calif.)의 Nhe1 및 Sal1 제한절단 부위로 클로닝되어, pSYN-VWF-025 및 029를 만들었다.
(e) pSYN-VWF-031 클로닝
pSYN-VWF-031은 상기 VWFD1D2D'D3(C336A/C379A)과 Fc 서열 사이에 48개 아미노산 길이의 트롬빈 절단가능한 링커 (8x GGGGS (서열 번호: 110)+ 트롬빈 부위)를 갖는 D1D2D'D3(C336A/C379A) -Fc 구조체다. 이 구조체를 작제하기 위하여, VWF-Fc 영역은 구조체 pSYN-FVIII-064 (하기에서 FVIII-VWF 구조체로 지칭됨)로부터 증폭되었다. pSYN-FVIII-VWF는 Xba1 및 Nhe1로 절단되었다. 상기 VWF 단편과 Fc 영역이 포함된 4165bp의 생성된 삽입 영역을 주형으로 이용하여 프라이머 조합 LW 22/LW23에 의해 상기 VWF와 Fc 영역이 증폭되었다.
FVIII 신호 서열 및 BsiW1 부위를 가진 LW 22-FWD-VWF-D'D3
GCGCCGGCCGTACGATGCAAATAGAGCTCTCCACCTGCTTCTTTCTGTGCCTTTTGC
GATTCTGCTTTAGCCTATCCTGTCGGCCCCCCATG (서열 번호: 68)
정지 코돈 및 Not1 부위를 가진 LW 23-Rev- Fc
TCATCAATGTATCTTATCATGTCTGAATTCGCGGCCGCTCATTTACC (서열 번호:
69)
VWF 031 (서열 번호: 108)의 뉴클레오티드 서열

VWF 031 (서열 번호: 109)의 단백질 서열

LW22/LW23 증폭으로부터 획득된 PCR 산물(~2300bp)은 BsiW1/Not1 절단된 pSYN-VWF-002 안에 클론시켜, pSYN-VWF-014 중간생성물을 얻었다. pSYN-VWF-014는 FVIII 신호 펩티드-D'D3-20 아미노산 트롬빈 절단가능한 링커 그리고 이어서 상기 Fc 영역을 포함한다.
상기 D1D2D'D3-Fc 구조체를 만들기 위하여, 프라이머 조합 LW24/LW27을 이용한 표준 PCR 방법에 의해 pSYN-VWF-013으로부터 상기 D1D2D'D3 영역이 증폭되었다.
BsiW1 부위를 가진 LW24- Fwd- VWF D1D2D'D3 클로닝 올리고
GCGCCGGCCGTACGATGATTCCTGCCAGATTTGCCGGGGTG (서열 번호: 70)
EcoRV를 가진 LW27-Rev-VWF D'D3 올리고
CCACCGCCAGATATCGGCTCCTGGCAGGCTTCACAGGTGAG (서열 번호:71)
LW22/LW23 증폭으로부터 획득된 PCR 산물 (~3750bp)은 BsiW1/EcoRV 절단된 pSYN-VWF-014안에 클론시켜, pSYN-VWF-015 중간생성물을 얻었다. 상기 VWF 단편과 Fc 영역 사이에 링커 길이를 변화시켜 pSYN-VWF-031이 획득되었다.
전장의 VWF 단백질 서열은 표 1에 나타낸다.
VWF-D1D2D'D3 단백질 서열 1b (서열 번호: 72)

VWF-D'D3 단백질 서열 2 (서열 번호: 73)

실시예 2: 상기 제 2 Fc 쇄의 아미노 말단에서 FVIII-Fc와 VWF-D'D3 도메인이 포함된 이형이량체 구조체 (FVIII-VWF-Fc 이형이량체, 도 2)
(a) pSYN-FVIII-064의 클로닝
상기 FVIII-064 플라스미드는 세포 안에서 합성되는 동안 가공되는 효소 절단 부위를 가진 단일 쇄 FC (scFc) 골격(scaffold)을 포함한다. 상기 구조체는 전장 VWF의 FVIII 결합 도메인 ( D'D3)을 갖는다.
플라스미드 (pSYN-FVIII-064)는 FVIII-Fc 와 VWF-Fc 이형이량체 발현용으로 기획되었는데, 이때 상기 D'D3 도메인들은 FVIII에 결합되어, FVIII와 인지질 및 활성화된 단백질 C와의 상호작용이 방지되거나 및/또는 내생성 VWF에 결합이 방지 또는 저해된다. pSYN-FVIII-064로부터 단백질은 세포 안에서 단일 폴리펩티드로 발현되고, 이때 상기 FVIII-Fc 아단위의 C-말단은 6x (GGGGS) 폴리펩티드 링커 (서열 번호: 74)에 의해 상기 VWF D'D3-Fc 아단위의 N-말단에 연계된다. 또한, RRRRS (서열 번호: 75)와 RKRRKR (서열 번호: 76) 서열은 프로프로테인 전환효소에 의한 세포내 절단용 폴리펩티드 링커의 5'와 3'에 각각 삽입되고, 각 서열의 마지막에는 Arg이 있다. 따라서, 상기 세포들은 이중 쇄 FVIII-Fc/D'D3-Fc 이형이량체를 발현시킬 수 있으며, 이때 상기 FVIII-Fc 쇄는 C-말단에서 RRRRS 서열 (서열 번호: 75)을 보유하지만, 상기 링커 서열의 나머지는 제거되었다. 또 다른 3x (GGGGS) 폴리펩티드 링커 (서열 번호: 28)와 함께 트롬빈 절단 부위는 상기 VWF 도메인들과 Fc 영역 사이에 도입되어, FVIII-VWF 이형-이량체 단백질이 트롬빈에 의해 활성화되면 FVIII로부터 상기 VWF 단편 방출을 용이하게 하고, FVIII 와 다른 응고인자의 상호작용이 허용된다.
상기 제 1 Fc 영역의 일부와 이어서 6x (GGGGS) (서열 번호: 74), VWF-D'D3 도메인 (1-477aa; C336A/C379A 돌연변이), 3x (GGGGS) (서열 번호:28), 트롬빈 절단 부위 그리고 상기 제 2 Fc의 일부분이 포함된 상기 DNA 단편의 합성은 외부에서 조달되었다(Genscript-서열 번호 103069, 아래에 나타냄). Genscript 구조체의 단편은 두 Fc 도메인 사이에 절단가능한 링커가 있는 FVIII-Fc 구조체인 SalI/RsRII 절단된 pSYN-FVIII-049 안으로 서브클론되었다.
Genscript-서열 번호 103069 (서열 번호: 82):

(b) pSYN-FVIII-065의 클로닝
상기 FVIII-065 플라스미드는 제 2 Fc 영역에 부착된 VWF의 D'D3 도메인의 첫 276개 아미노산을 포함한다. 상기 VWF 단편은 프라이머 조합 ESC17 및 ESC41을 이용하여 PCR에 의해 전장 VWF 플라스미드 pSYN-VWF-008로부터 증폭되었다.
Cla1을 가진 ESC17-Fwd- VWF 클로닝 올리고
GTCCGGCATGAGAATCGATGTGTG (서열 번호: 77)
EcoRV를 가진 ESC41- Rev-VWF
CCTCCACCGCCAGATATCAGAGGCACTTTTC (서열 번호: 78)
예상된 크기의 밴드 (~692bp)는 겔 추출 키트 (Qiagen, Valencia, Calif.)로 겔 정제시키고, pSYN-FVIII-064의 Cla1과 EcoRV 부위 사이에 클론시켜 pSYN-FVIII-065을 만들었다.
실시예 3: pSYN-FVIII-159, 160, 178, 179의 클로닝 (도 3)
상기 VWF 단편과 Fc 영역 사이의 링커 길이를 다양하게 하기 위하여, pSYN-FVIII-064에서 VWF 접합과 20개 아미노산-링커 시작 부위에 EcoRV 부위가 도입되고, 그 다음 가변 크기 링커들이 PSYN-FVIII-064에서 20aa 링커를 대체하여 이용되었다. 상기 새로운 DNA 구조체들은 다음과 같다: 35 aa, 48 aa, 73 aa 그리고 98 aa 링커가 각각 포함된 pSYN-FVIII-159, 160, 178, 및 179.
pSYN-FVIII-159에 35개 아미노산-링커를 삽입하기 위하여, Integrated DNA Technologies, Inc (Coralville, IA)에 2개의 올리고(ESC78- 105bp 및 ESC79 -107bp)를 주문하였다. 올리고들은 표준 PCR 방법을 이용하여 어닐되고, 연장되었다:
프라이머들:
EcoRV 부위를 가진 ESC78- Fwd

(서열 번호: 79)
RsRII 부위를 가진 ESC79- Rev

(서열 번호: 80)
3 단계 PCR 증폭 주기: [(96 ℃ 30 초, 55 ℃ 30 초, 68 ℃ 30 초)를 25회]를 이용하여 ESC78/ESC79 프라이머 조합을 이용한 50 μl PCR 올리고 어닐링 및 연장 반응이 실시되었다. 예상된 크기의 밴드(~186bp)는 겔 추출 키트(Qiagen, Valencia, Calif.)로 겔 정제되었고, pSYN-FVIII-064의 EcoRV와 RsRII 제한절단 부위 사이에 클론되어 pSYN-FVIII-159를 얻었다.
(b) pSYN-FVIII-160, 178, 및 179 클로닝
pSYN-VIII-160은 상기 VWF 단편과 Fc 영역 사이에 48개 아미노산-링커를 갖는다. 48개 아미노산 길이 링커 (ISGG GGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS) (서열 번호: 81)와 상기 Fc 영역 일부를 코딩하는 DNA 단편의 합성은 외부조달되었다 (Genscript-서열 번호-132601, 아래 나타냄). 상기 Genscript 구조체의 단편은 상기 EcoRV/RsRII 절단된 pSYN-FVIII-0159에 서브클론되었다 (상기에서 언급됨).
Genscript-서열 번호-132601 (서열 번호: 83)

pSYN-VIII-178은 상기 VWF 단편과 Fc 영역 사이에 73개-아미노산 링커를 갖는다. 73-아미노산 링커

(서열 번호: 84)를 코딩하는 DNA 단편의 합성과 Fc 영역의 일부는 외부조달되었다(Genscript-서열 번호-144849, 아래에 나타냄). Genscript 구조체의 단편은 상기 EcoRV/RsRII 절단된 pSYN-FVIII-0159에 서브클론되었다 (상기에서 언급됨).
Genscript-서열 번호-144849 (서열 번호: 85)

pSYN-VIII-179는 상기 VWF 단편과 Fc 영역 사이에 98개 아미노산-링커를 갖는다. 98개 아미노산-링커를 코딩하는 DNA 단편의 합성

(서열 번호: 86)과 Fc 영역의 일부는 외부조달되었다(Genscript-서열 번호-144849 아래에 나타냄). Genscript 구조체의 단편은 상기 EcoRV/RsRII 절단된 pSYN-FVIII-0159에 서브클론되었다 (상기에서 언급됨).
Genscript-서열 번호-144849 (서열 번호:87)

pSYN-FVIII-180, 181, 그리고 182의 클로닝
pSYN-FVIII-180, 181, 그리고 182는 pSYN-FVIII-160로부터 작제되었다. K2093A 또는 F2093A 또는 K2093A/F2093A 돌연변이들은 pSYN-FVIII-160내 FVIII의 C1 도메인 안에 도입되어, pSYN-FVIII-180, pSYN-FVIII-181 그리고 pSYN-FVIII-182가 각각 형성되었다.
FVIII-VWF-Fc 이형이량체 단백질 서열 (서열 번호: 88)
(FVIII 서열 아미노산 위치 1-1457; 밑줄로 표시된 영역은 Fc 영역을 나타내고; 구불구불한 밑선은 제 1 Fc와 VWF 단편 사이의 절단가능한 링커를 나타내고; 이중 밑줄로 표시된 영역은 VWF 단편을 나타내고; 굵은 영역은 VWF 단편과 Fc 사이의 가변 길이의 절단가능한 링커를 나타낸다. FVIII-064, 159, 160, 178, 및 179 구조체들에서 상기 링커 길이는 다양하다).

실시예 4: FVIII-VWF DNA 구조체의 실시예 (도 4)
상기 VWF 단편과 FVIII 단백질은 도 4에 나타낸 것과 같이 통상적 재조합 DNA 기술을 이용하여 에 의해 링커 또는 또 다른 단백질 또는 폴리펩티드에 의해 함께 연계될 수 있다. 도 4a에서, 상기 VWF의 D1D2D'D3 도메인들은 다음의 48aa 링커-에 의해 상기 FVIII 단백질에 연계되고:ISGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS (서열 번호: 89) 그리고 미숙한 제거로부터 FVIII가 보호된다. D'D3의 FVIII 보호 활성을 더 강화시키기 위하여, 반감기 연장 능력을 보유한 또 다른 단백질 또는 폴리펩티드, 가령, 알부민 또는 PAS 서열 (이종기원의 모이어티들)이 상기 구조체에 혼입될 수 있다. 상기 이종기원의 모이어티, 예컨대 알부민 단백질 또는 PAS 서열은 상기 FVIII 분자의 상이한 위치에서 혼입될 수 있고; 도 4b-4d에서 몇 가지 예들을 보여주고 있다: FVIII의 N-말단 (4B), FVIII의 C-말단 (4C), 또는 상기 B 영역 (4D) 위치에서 혼입된다. 이들 구조체에서 상기 추가적인 단백질 서열은 상기 D'D3 보호 활성을 강화시킬 수 있고, FVIII 반감기를 더 연장시킬 수 있다.
또한, 이종기원의 모이어티, 예컨대 알부민 또는 PAS 서열은 도 4e-4g에 나타낸 것과 같이 상기 FVIII/VWF 이형이량체 구조체들 안에 또한 혼입될 수 있다. 도 4e에서, 이종기원의 모이어티, 예컨대 알부민 또는 PAS 서열은 상기 FVIII-148의 FVIII B 도메인 영역에 혼입되고; 도 4f에서, 이종기원의 모이어티, 예컨대 알부민 또는 PAS 서열은 상기 FVIII-136의 FVIII B 도메인 영역에 혼입되고; 도 4g에서, 이종기원의 모이어티, 예컨대 알부민 또는 PAS 서열은 D'D3 단편과 Fc를 연결시키는 링커로 이용된다. 이들 형태에서, FVIII 반감기 연장에 있어서 D'D3, Fc, 그리고 반감기 증량제인 이종기원의 모이어티 (예컨대 알부민/PAS 서열)의 공조 효과가 예상된다.
실시예 5: FVIIIFc-VWF 이형이량체를 위한 공동-형질감염 시스템의 플라스미드 작제 (도 5)
FVIIIFc-VWF 이형이량체 생산을 위한 3가지 DNA 구조체가 포함된 공동-형질감염 시스템이 생성되었다. 상기 제 1 DNA 구조체-pSYN-FVIII-155는 FVIII-Fc 융합 단백질을 인코드하고, 이때 단일 쇄 FVIII 단백질은 단일 Fc 단편에 직접적으로 융합되어 있으며, 그리고 상기 제 2 DNA 구조체는 D'D3-Fc 융합 단백질이 인코드된 pSYN-VWF-031 (상기에서 실시예 1에서 언급됨)이다. HEK293F 세포들은 상기 2개의 플라스미드와 함께 제 3 플라스미드(PC5)로 80:15:5 비율에서 형질감염되었다. PC5와 함께 공동-형질감염으로 상기 D1과 D2 영역의 완전한 프로펩티드 가공이 확보되어, 성숙한 D'D3 도메인들을 갖는다. 상기 합성된 단백질들은 FVIIIFc/D'D3Fc 이형이량체와 D'D3Fc 동종이량체로 분비되었고, 상기 FVIIIFc/D'D3Fc 이형이량체는 단백질 정제를 통하여 상기 D'D3Fc 동종이량체로부터 분리되었다.
pSYN-FVIII-155 성숙한 단백질 시퀀싱 (서열 번호: 90):

pSYN-FVIII-155 DNA 시퀀싱 (서열 번호: 91):

추가적인 VWF 단편들과 작제된 FVIIIFC-VWF 이형이량체들은 하기에 열거된다.
표 6. VWF 단편들과 FVIII/VWF 이형이량체 구조체들

실시예 6: 단백질 정제
VWF 단편들의 단백질 정제
상기 VWF 단편들은 2-단계 정제 방법을 통하여 정제되었다. 황산 니켈 전하를 띈 IMAC (고정된 금속 친화력 크로마토그래피) 컬럼은 1차 정제에 이용되었고, Fractogel DEAE 이온 교환 컬럼은 최종 정제에 이용되었다. 상기 정제 방법은 아래에서 상세하게 설명된다.
(a) 니켈 IMAC 상에서 VWF 단편의 1차 정제
14 mL 니켈 IMAC 세파로즈 HP 컬럼 [XK26/3]은 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5로 평형화되었다. 대략 7.2 L의 VWF 조건화된 매질은 100 mL의 1M HEPES @ pH 7.5와 600 mL의 5M NaCl로 조정되었다. 그 다음 80 mL의 1M 이미다졸 (@ pH 7.5)이 최종 농도 10 mM로 추가되었다. 7.8 L의 상기 조정된 VWF 조건화된 매질은 10 mL/min [113 cm/hour]으로 2-8°C에서 컬럼 상에 적하되었다. 상기 세척 단계는 13.3 mL/분 [150 cm/시]에서 실행되었다. 우선, 2x컬럼 용적 (CV) 세척은 정상적인 흐름{"DownFlow"}의 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5으로 실행되었다. 그 다음, 3xCV 세척은 역류{"UpFlow"}의 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5으로 실행되었다. 끝으로, 3xCV 세척은 정상적인 흐름{"DownFlow"}의 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5로 실행되었다. 용리는 10xCV 50% B1까지 구배 (25 mM HEPES, 500 mM NaCl, 500 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5)로 실행되었다. 분획 용적은 10 mL로 설정되었다. 그 다음 상기 컬럼은 100% B1로 박리(stripped)되었다. 이어서 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5로 세척되었다. 제 2 박리(Strip)는 1N NaOH로 실행되었다. 그 다음 상기 컬럼에 1M TRIS, 1M NaCl @ pH 7.8을 그리고 이어서 25 mM HEPES, 500 mM NaCl, 10 mM 이미다졸, 그리고 0.05% Tween-20 @ pH 7.5를 흘려보냈다. 끝으로, 상기 컬럼에 5 CV의 DPBS + 20% 에탄올을 흘려보내고, 4°C에서 보관되었다.
(b) Fractogel DEAE에서 VWF 단편의 2차 정제
VWF 단편의 2차 정제는 Fractogel DEAE @ pH 7.5에서 실행되었다. 먼저, 20 mL의 VWF 니켈 IMAC 용출액 (상기 VWF 단편 피크에 상응)은 변성 또는 환원 부형제를 이용하지 않고, 응집된 종들을 분리하기 위한 시도에서 200 mg의 Zwittergent 3-14 쌍성이온 청정제로 조정되었다. 상기 청정제가 용해된 이후, 상기 단백질은 대략 15분 동안 RT에 두었다. 그 다음, 상기 단백질은 4 g의 트레할로오스, 1 mL의 10% Tween-20, 5 mL의 1M HEPES @ pH 7.5 그리고 174 mL의 "Milli-Q" 물로 조정되었다. 상기 평형 완충액 "A12"는 25 mM HEPES, 50 mM NaCl, 1% 트레할로오스, 0.05% Tween-20 @ pH 7.5이었다. 상기 용리완충액 "B1"는 25 mM HEPES, 1000 mM NaCl, 1% 트레할로오스, 0.05% Tween-20 @ pH 7.5이었다. 상기 용리는 5+ CV 홀드(hold)와 함께 10 CV 50% B1까지 구배로 실행되었고, 이어서 100% B1까지 진행되는 단계가 이어졌다. 그 다음 상기 컬럼은 0.85% 인산으로 박리되었고, 이어서 1M TRIS, 1M NaCl @ pH 7.5로 박리되었다. 그 다음 상기 컬럼은 1N NaOH, 2M NaCl로 박리되었고, 이어서 1M TRIS, 1M NaCl @ pH 7.5로 박리되었다. 그 다음 상기 컬럼에 보관용 25 mM HEPES, 100 mM NaCl + 20% 에탄올 @ pH 7.5를 흘려보냈다.
(c) FVIII-VWF 이형이량체의 단백질 정제
상기 FVIII-VWF 이형이량체는 친화력 컬럼 (GE VIIISelect)에 의해 1차 정제되었고, 그 다음 Fractogal TMAE 이온 교환 컬럼으로 정제되었다. (McCue JT , Selvitelli K, Walker J, J Chromatogr A. 2009 Nov 6; 1216(45):7824-30. Epub 2009 Sep 23.)
FVIII-155/VWF-31의 정제를 위하여, 정화된 조건화된 배지의 완충액 교환에 접선 흐름 여과 (TFF) 단계가 이용되었다. 여과액 안에 표적이 된 단백질들은 친화력 크로마토그래피를 통하여 포획되었다. 약한 음이온 교환 크로마토그래피 단계가 실행되어, HMW 종을 감소시켰다. 상기 분자의 순도와 크기는 HPLC-SEC 및 SDS-PAGE에 의해 평가되었다. FVIII-155/VWF-31의 상이한 도메인들의 존재는 웨스턴 블랏팅에 의해 더 확인되었다. 상기 분자의 특이적 활성은 B-도메인 결실된 FVIII과 유사하였다.
(d) FVIII-VWF 이형이량체의 트롬빈 절단 (도 8)
FVIII-VWF-Fc 이형이량체 또는 FVIII-Fc (대조군)은 트롬빈 절단 완충액 (50 mM Tris, pH 7.4, 150 mM NaCl, 2 mM CaCl2, 5% 글리세롤)에서 1:10의 비율로 트롬빈과 혼합되었다. 이 반응물은 37 ˚C에서 20 분 동안 항온처리되었다. 절단된 산물은 4-12% 환원 트리스-글리신 겔 상에서 이동되었다. 절단안된 단백질은 대조군으로 이용되었다. 코마시(coomassie) 착색으로 밴드가 눈에 보이게 되었다.
(e) Octet 분석에 의해 FVIII-155/VWF-031의 VWF 결합 능력 평가
FVIII-155/VWF-031의 상기 VWF 결합 능력은 25 °C에서 트리스 결합 완충액 (50 mM Tris, pH 7.2, 150 mM NaCl, 5 mM CaCl₂)을 이용하여 ForteBio Octet 384 기구와 함께 Bio-Layer Interferometry (BLI) 기반 측정 (Octet 분석)으로 결정되었다. FVIII 결합을 결정하는 상기 Octet 분석은 상기 APS 바이오센서 상에서 인간 폰 빌레브란트 인자 (hVWF) (Haematologic Technologies Catalog No. HCVWF-0191)의 소수성 고정과 이어서 1.0% 소의 혈청 알부민 (Jackson ImmunoResearch Catalog No. 001-000-161) 결합을 바탕으로 하였다. 간단하게 설명하자면, hVWF (38.5 nM)는 트리스(Tris) 완충액에 희석되었고, 600 초 동안 APS 바이오센서에 걸쳐 로딩되었고, 반응 프로브 상에서 대략 3.0 - 3.5 nm 결합을 얻었다. 대조군 APS 프로브들은 기준 공제를 위하여 hVWF가 없는 상태에서 1.0% BSA와 함께 로딩되었다. 로딩 이후, 모든 프로브들은 새로운 기선을 확립하기 위하여 300 초 동안 트리스 완충액에서 항온처리되었다. 후속적으로, 바이오센서 프로브는 FVIII-155/VWF-031, FVIIIFc Drug Substance, 또는 rFVIII (60 nM)의 용액 안에서 실온에서 5분간 항온처리되었고, 5분 분리 단계가 이어졌다. 상기 Octet 데이터 분석 소프트웨어를 이용하여, 공제된 데이터 (반응 프로브에서 기준 프로브를 뺌)로부터 결합 반응(nm)이 유도되었다. 도 15에 나타낸 것과 같이, rFVIIIFc 및 rFVIII의 VWF 결합 친화력과 비교하였을 때, FVIII-155/VWF-031의 VWF 결합 친화력은 심각하게 손상되었다. 이것은 상기 FVIIIFc/VWF 이형이량체 안의 D'D3 단편에 의해 전장 VWF로부터 FVIII가 성공적으로 차폐되었음을 나타낸다.
실시예 7. VWF-FVIII 상호작용은 FVIII 반감기 연장에 있어서 제한 인자다.
순환하는 FVIII의 대부분(>95% 혈장 FVIII)은 FVIII-VWF 복합체로 존재한다. 이러한 FVIII-VWF 상호작용은 상기 VWF 제거 경로를 통하여 FVIII 제거를 촉진시키고, 따라서 상기 VWF 반감기 (T1/2)는 FVIII 반감기 연장의 제약이 된다. 이러한 가설을 평가하기 위하여, Fc 기술에 의한 FVIII 반감기 연장 제약은 FVIII 결함있는 마우스 (HemA 마우스, 고유한 VWF 유전자 보유)와 FVIII/VWF 결함있는 (FVIII-VWF 이중 녹아웃 (DKO)) 마우스에서 테스트되었다.
상기 HemA 마우스 또는 FVIII-VWF DKO 마우스는 단일 정맥 투여 분량으로 125 IU/kg (HemA 마우스) 또는 200 IU/kg (DKO 마우스)의 rFVIII 또는 rFVIIIFc로 처치되었다. 혈액 시료는 HemA 마우스에서 최대 72 시간 FVIII/VWF DKO 마우스에서는 최대 8시간까지 수집되었다. 그 다음 혈장 시료의 FVIII 활성은 FVIII 색원체 분석에 의해 측정되었다. 2가지 rFVIII 가변성의 약동학(PK) 프로파일은 WinNonline 프로그램을 이용하여 분석되었다.
표 7 및 도 9에서 볼 수 있는 것과 같이, FVIII/VWF DKO 마우스에서 rFVIIIFc는 rFVIII의 T₁ _/2 (예컨대,T₁ _/2 0.25hr)과 비교하였을 때 약 4.8 배 더 긴 T_1/2를 보여주었다 (예컨대,T₁ _/2 1.2hr). 대조적으로, HemA 마우스에서 테스트하였을 때, rFVIIIFc는 rFVIII와 비교하였을 때, 단지 1.8배 더 긴 T₁ _/2를 보여주었다. rFVIIIFc의 T₁ _/2는 13.7hr이었고, 이는 내생성 뮤린 VWF 반감기와 일치한다. 이것은 상기 FVIII-VWF 상호작용이 FVIII 반감기 연장에 있어서 제한 인자임을 나타내는 것이다. 2 배 이상의 FVIII 반감기 연장을 얻기 위하여, 상기 FVIII-VWF 상호작용은 제거되어야 할 것이다.
표 7: HemA 및 FVIIII/VWF DKO 마우스에서 FVIII PK

FVIII 색원체 분석
상기 COA테스트 SP FVIII 키트(DiaPharma (lot# N089019))를 이용하여 상기 FVIII 활성이 측정되었고, 모든 항온처리는 교반과 함께 37 ℃ 플레이트 히터 상에서 실행되었다.
rFVIII 표준 범위는 100 mIU/mL 내지 0.78 mIU/mL이었다. 모아둔 정상 인간 혈장 분석 대조군과 혈장 시료들 (1X Coatest 완충액으로 희석됨)은 Immulon 2HB 96-웰 플레이트에 이중으로 추가되었다(웰당 25 μL). 새로 준비된 IXa/FX/인지질 혼합물 (50 μL), 25 μL의 25mM CaCl₂, 그리고 50 μL의 FXa 기질이 순차적으로 각 웰에 추가되었고, 매번 추가 후 5분의 항온처리 시간을 두었다. 상기 기질로 항온처리 후, 25 μL의 20% 아세트산이 추가되어, 색 반응을 종료시키고, OD405의 흡수도는 SpectraMAX plus (Molecular Devices) 기구를 이용하여 측정되었다. 데이터는 SoftMax Pro 소프트웨어 (버젼 5.2)로 분석되었다. 정량화의 최저 수준(LLOQ)은 7.8 mIU/mL이다.
실시예 8. VWF D'D3 이량체는 FVIII 단백질가수분해와 제거로부터 FVIII을 보호한다 (도 10)
상기 VWF 단편들의 FVIII 보호 활성은 VWF 결함있는 마우스에서 내생성 뮤린 FVIII가 제거되지 않도록 보호하는 능력으로 평가되었다. 표 8의 1열에 열거된 상이한 VWF 단편들 (도 1, 실시예 1)은 마우스에게 이들 대응하는 DNA 구조체 100㎍/마우스의 유체역학적 주사에 의해 상기 VWF 결함있는 마우스의 혈액 순환계로 도입되었다. 상기 혈장 시료는 주사후 48시간에 수집되었고, 뮤린 FVIII 혈장 활성은 FVIII 색원체 분석에 의해 측정되었다. VWF 발현 수준은 VWF ELISA에 의해 측정되었다.
테스트된 VWF 단편들의 4가지 상이한 길이는 276, 477, 511, 및 716개의 아미노산이다. VWF의 제거 수용체의 결합 도메인 (716aa) 없이 FVIII 결합(276aa)에 필요한 VWF 단편들의 길이를 찾기 위하여 상기 276 내지 716개의 아미노산 범위가 테스트되었다. 상기 전장의 VWF와 D1D2D'D3CK 다량체는 FVIII 보호에 대한 양성 대조군으로 이용되었다. 혈액 순환에서, 상기 D1D2 도메인을 가진 합성된 VWF 단편들은 이량체로 존재하고, 그리고 상기 D1D2 도메인 없이 합성된 경우, 단량체로 존재한다.
유체역학주사 이후 혈장내 뮤린 FVIII 활성의 증가는 상기 VWF 단편들의 FVIII 보호 효과를 측정한다. 표 8과 도 10a-b에서 나타낸 주사전/후 FVIII 혈장의 유사한 수준으로 설명되는 것과 같이 상기 D'D3 단편의 첫 276aa개 아미노산은 FVIII 보호 활성을 갖지 않았다(도 10a). 그러나, 다른 VWF 단편들의 도입으로 FVIII 혈장 수준의 상당한 증가가 유도되었고, 이것은 이들 VWF 단편이 FVIII 제거 경로로부터 FVIII를 보호할 수 있음을 나타낸다.
표 8: VWF 단편의 도입 전/후 FVIII/VWF DKO 마우스 뮤린 FVIII 혈장 수준 (DNA 구조체들은 도 1에서 설명되었다)

주사 후 혈장 FVIII 활성과 전장 VWF의 D'D3 도메인이 포함된 VWF 단편들의 혈장 항원 수준 비율이 표 8에 열거되어 있다. 주사 후 FVIII/VWF 유사한 비율은 전장의 VWF와 상기 VWF 단편들의 2가지 이량체 형태에서 관찰되었고, 이들 두 VWF 단편 이량체는 전장 VWF와 동일한 FVIII 보호를 제공한다는 것을 의미한다. 또한, 대응하는 단량체들과 비교하였을 때, 상기 VWF 단편 이량체 이소폼에서 3배 더 높은 FVIII/VWF 비율이 관찰되었다: 상기 D'D3 (477aa) 이량체는 38.7 mIU/nmol의 FVIII/VWF 비율을 갖고; 상기 D'D3 (477aa) 단량체는 11.6 mIU/nmol의 FVIII/VWF 비율을 갖고: 상기 D'D3A1 (511aa) 이량체는 32.9 mIU/nmol의 FVIII/VWF 비율을 갖고; 그리고 상기 D'D3 (511aa) 단량체는 13.8 mIU/nmol의 FVIII/VWF 비율을 갖고, 이것은 상기 VWF 단편들의 이량체 이소폼이 이들의 대응하는 단량체들과 비교하여 더 나은 FVIII 보호를 제공한다는 것을 나타낸다.
표 9: 전장의 D'D3 단편의 FVIII 보호 효과

유체역학적 주사:
유체역학적주사는 가령, 마우스와 랫과 같은 작은 동물의 간으로 효과적이고 안전한 비-바이러스 유전자 전달 방법이다. 이것은 상기 동물 체중의 1/10 용적으로 약 5-7초안에 엔도톡신 없는 네이키드 플라스미드 DNA/염수 용액의 신속한 주사로 처음에 설명되었다. 상기 네이키드 플라스미드 DNA는 관심 유전자를 포함하고, 주사후 24시간 내에 주사된 DNA로부터 간에서 생산된 표적 단백질이 탐지될 수 있다. 그 다음 혈장 시료가 수거되여, 발현된 단백질의 치료요법적 특성이 연구되었다.
본 특허 출원의 명세서내에서 실행된 모든 유체역학적주사의 경우, 0.9% 멸균 염수 용액내 2 ml의 플라스미드 DNA는 약 4-7 초 안에 꼬리 정맥 주사를 통하여 20-35 g 체중을 가진 마우스에게 전달되었다. 상기 마우스는 정상 활성을 되찾을 때까지 처음 몇 시간 동안 면밀히 관찰되었다. 상기 혈액 시료가 안와 뒤 혈액 수집을 통하여 수집된 이후, 그 다음 혈장 시료가 획득되었고, 추가 분석을 위하여 -80 °C에 보관되었다.
VWF ELISA:
염소 항-인간 VWF 항체 (친화력 정제된, 생물학적 친화력, GAVWF-AP)는 웰당 0.5ug으로 포획 항체로 이용되었고, VWF-EIA-D (생물학적 친화력, VWF-EIA-D, 1:100 희석)는 상기 VWF ELISA에서 탐지 항체로 이용되었다. ELISA 분석은 표준 ELISA 과정에 따라 실행되었고, TMB는 HRP 기질로 이용되었고, PBST/1.5% BSA/0.5M NaCl 완충액은 차단 및 결합 완충액으로 이용되었다. 상기 분석 표준 범위는 100ng 내지 0.78ng이며, 분석의 최저 정량 한계(LLOQ)는 7.8ng/mL이다.
실시예 9: 전장의 VWF D'D3 단편 공동-투여는 FVIII-VWF DKO 마우스에서 rBDD-FVIII 반감기를 연장시킨다(도 11)
실시예 8에서 전장의 D'D3 단편은 내생성 FVIII의 제거 경로로부터 이를 보호할 수 있음이 설명되었다. D'D3 단백질의 FVIII 보호 활성을 더 평가하기 위하여, B 도메인 결실된 FVIII (rBDD-FVIII)와 D'D3 이량체 (VWF-010) 또는 rBDD-FVIII와 D'D3 단량체 (VWF-002)는 정맥내 주사를 통하여 200 IU/kg(rBDD-FVIII의 경우), 770 μg/kg(D'D3 이량체의 경우) 그리고 590 μg/kg(D'D3 단량체의 경우)로 FVIII-VWF DKO 마우스에게 투여되었다. 그 다음 rBDD-FVIII의 PK 프로파일은 주사 후 혈장 활성으로 모니터되었다. 상기 D'D3 단편들의 짧은 생체내 반감기로 인하여, 첫 공동-주사 후 3시간 후 시점에서, 바람직한D'D3 혈장 수준을 유지시키기 위하여 또 다른 투여 분량의 D'D3이 동일한 경로를 통하여 투여되었다.
PK 분석을 위하여, 주사 후 5분, 30분, 1 시간, 2 시간, 4 시간 그리고 6 시간 시점에서 안와-뒤 혈액 수집을 통하여 혈장 시료가 획득되었고, 혈장 FVIII 활성과 D'D3 항원 수준은 FVIII 색원체 분석과 VWF ELISA에 의해 분석되었다.
도11과 표 10에서 나타낸 것과 같이, 상기 D'D3 단량체는 rBDD-FVIII 반감기를 2.5 배 연장시켰고, 이의 회복은 1.8 배 개선시켰다. 상기 D'D3 이량체는 rBDD-FVIII 반감기를 4.1 배 연장시켰고, 이의 회복은 3.5 배 개선시켰다. 상기 D'D3 이소폼 모두로부터 개선된 평균 잔류 시간, 제거 및 AUC가 또한 관찰되었다. 그러나, 상기 D'D3 이량체는 이의 단량체 형태와 비교하였을 때, 모든 PK 매개변수에서 더 나은 결과를 얻었다.
요약하면, 전장의 D'D3의 공동-주사에 의해 rBDD-FVIII의 개선된 PK 프로파일에서 나타난 것과 같이, FVIII 제거 경로로부터 FVIII는 보호된다. 이러한 발견의 잠재적 임상 가치는 더 연구될 필요가 있다.
표 10 D'D3 단편들과 공동-투여되었을 때, FVIII-VWF DKO 마우스에서 BDD-FVIII PK 매개변수

실시예 10. FVIII-VWF DKO 마우스에서 D1D2 도메인을 가진 합성된 D'D3 단량체와 이의 이량체 이소폼은 동일한 FVIII 보호 활성을 갖고, FVIIIFc의 반감기를 ~4 배 더 연장시켰다 (도 12)
상기 D'D3 도메인들의 FVIII 보호 활성을 정량화하고, 상기 D'D3 이량체화가 이의 FVIII 보호 활성에 필수적인 것인지를 판단하기 위하여, 2개의 DNA 구조체 각각 (예컨대, VWF-025 (D1D2D'D3을 인코드하는 DNA 서열 포함) 및 VWF-029 (C336A 및 C379A 돌연변이와 함께 D1D2D'D3 코돈 DNA가 포함)) 각각은 유체역학적주사에 의해 FVIII/VWF DKO 마우스에게 투여되었다. 이 주사에 의해 상기 FVIII/VWF DKO 마우스에서 D'D3 이량체 (VWF-025) 또는 단량체 (VWF-029)가 발현되었다. 유체역학적주사 이후 5일 시점에서, rFVIIIFc의 단일 정맥내 투여 분량은 200 IU/kg로 투여되었고, rFVIIIFc IV 주사 후 5분, 4, 8,16, 24, 31, 40, 55, 66시간 시점에 혈장 시료가 수집되었다. 동일한 투여 분량으로 순수(naive) FVIII-VWF DKO 마우스에서 실행된 rFVIIIFc PK 연구는 rFVIIIFc 반감기 기선으로 이용되었다. 혈장 FVIII 활성은 FVIII 색원체 분석에 의해 분석되었다. 혈장 D'D3 수준은 VWF ELISA에 의해 측정되었고, rFVIIIFc PK 프로파일은 WinNonlin 프로그램을 이용하여 분석되었다.
표 11과 도 12에 나타낸 것과 같이, 순환계에서 상기 VWFD'D3 단편들과 함께, rFVIIIFc의 초기 회복은 D'D3 이량체의 경우 42%에서 75%로 증가되었고, D'D3 단량체의 경우 42%에서 60%로 증가되었다. rFVIIIFc의 T₁ _/2는 2.5 시간에서 각각 9.3 시간 및 9.2시간으로 또한 증가되었다. T₁ _/2와 유사하게, 상기 D'D3 단량체 및 이량체 발현 마우스에서 평균 잔류 시간, 제거 및 용적 분포에서 개선이 또한 관찰되었다. 전반적으로, D'D3 단량체와 이량체를 모두 발현하는 마우스에서 rFVIIIFc 반감기는 약 8배 개선되었고, AUC는 6배 개선되었다. 이의 이량체 이소폼과 동일하게, VWF의 프로펩티드(D1D2)를 가지도록 합성된 전장 VWF의 D'D3 단량체는 전장의 VWF 분자와 같이 완전한 FVIII 보호를 제공하는데 충분하다.
FVIII/VWF DKO 마우스에서, WT-FVIII는 0.25시간의 T₁ _/2를 갖는다.상기 Fc 융합 기술에 의해 FVIII T₁ _/2는 약 4.8배 증가된 1.2 시간으로 증가된다. 상기 Fc 융합 기술이 상기 D'D3 도메인과 복합되었을 때, 상기 FVIII T₁ _/2는 총 약 37배 증가된 9.3시간 (D'D3 이량체의 경우)과 9.2시간 (D'D3 단량체의 경우)으로 증가된다. (표 10) 이 결과로부터 상기 FVIII 반감기 연장에 있어서 Fc 융합과 D'D3 VWF 단편의 공조 효과가 설명되었다.
표 11: 혈액 순환계에서 D'D3 단편과 함께, D'D3 단편없이 rFVIIIFc PK 매개변수

실시예 11: HemA 마우스에서 FVIII-VWF 이형이량체 PK
FVIII-VWF 이형이량체의 선두 후보군 (가령, FVIII-155/VWF-031)의 PK 프로파일은 내생성 VWF로부터 FVIII을 차폐하는 능력과 FVIII 반감기 연장에 대한 이의 능력을 평가하기 위하여, HemA 마우스에서 테스트될 것이다.
HemA 마우스는 200 IU/kg의 선두 후보군의 단일 정맥내 투여 분량으로 처치될 것이며, 그 다음 5분, 4시간, 8시간, 24시간, 48시간, 72시간, 96시간 그리고 120시간 시점에서 혈장 시료가 수집되며, 혈장 활성은 FVIII 색원체 분석에 의해 테스트되며, 그리고 FVIII 가변 반감기는 WinNonlin 프로그램으로 계산될 것이다.
최적의 FVIII/VWF 이형이량체 구성에서, 내생성 VWF에 대한 FVIII 결합은 완전하게 저해될 것이며, 따라서, 실시예 7에서 나타낸 것과 같이, rFVIII의 기선 반감기는 7.6 시간에서 0.25 시간으로 감소될 것이다. D'D3 단편이 FVIII와 비-공유적으로 연합된 경우, 약 8 배의 반감기 혜택이 관찰되었다(실시예9). 상기 FVIII/VWF 이형이량체의 선두 후보에서, 상기 VWF 단편은 상기 FVIII 분자과 공유적으로 연합되고, 더 나은 FVIII 보호가 획득될 수 있다. 본 출원 발명은 상기 이용가능한 반감기 연장 기술과 복합되어, 2배 한계를 넘어 FVIII 반감기를 더 연장시키기 위한 문을 열었고, HemA 환자들은 가까운 미래에 더 오래 작용하는 FVIII 가변성을 기대할 수 있다.
내생성 VWF로부터 상기 FVIII 모이어티를 차폐하는 D'D3 단편의 능력을 평가하기 위하여, FVIII-155/VWF-031의 PK 프로파일이 HemA와 FVIII/VWF DKO 마우스에서 테스트되었다. HemA 또는 FVIII/VWF DKO 마우스는 200 IU/kg에서 FVIII-155/VWF-031 단일 정맥내 투여 분량으로 처치되었고, 투약 후 5분, 8시간, 24시간, 그리고 48 시간 시점에 혈장 시료가 수거되었다. 상기 혈장 시료의 FVIII 활성은 FVIII 색원체 분석에 의해 테스트되었고, FVIII-155/VWF-031의 반감기는 WinNonlin 프로그램을 이용하여 계산되었다.
rFVIIIFc와 rFVIII와 비교하였을 때, FVIII-155/VWF-031의 이중층 간섭측정(interferometry) (도 15, Octet; ForteBio Inc., Menlo Park, CA)에 의해 고정된 VWF에 대하여 심각하게 손상된 결합이 탐지되었다. 이것은 분자내 상기 D'D3 도메인이 고유 VWF 분자에 대한 상기 FVIII의 결합을 성공적으로 차단하였음을 보여준다. 따라서, 상이한 두 마우스 균주에서 rFVIII-155/VWF-031의 유사한 반감기가 예상되었다. 도 16 및 표 12A에 연구 결과들을 열거한다. 예상과 같이, rFVIII-155/VWF-031는 HemA 및 FVIII/VWF DKO 마우스 모두에서 필적할 수준의 PK 프로파일을 보유하였고, 이는 FVIIIFc/VWF 이형이량체의 반감기는 내생성 VWF의 반감기와 독립적임을 나타낸다. 이들 결과에서 상기 VWFD'D3 도메인들에 의한 rFVIIIFc와 내생성 VWF 사이의 상호작용 저해로 상기 FVIII 반감기 한계가 제거되고, 상기 VWFD'D3 도메인들 없이 획득가능한 반감기 (야생형 FVIII의 약 2배) 이상으로 FVIII 반감기의 연장 가능성을 열어둔다.
표 12A. FVIII/VWF DKO 마우스 및 HemA 마우스에서 FVIII-155/VWF-031 PK

상기 D'D3 도메인들의 FVIII 보호 활성은 FVIII/VWF DKO 마우스에서 FVIII-155/VWF-031와 FVIIIFc의 t₁ _/2를 비교함으로써 평가되었다. 단일 IV 투여 후, FVIII-155/VWF-031의 경우 5분, 8시간, 24시간 및 48시간 시점에서, 그리고 FVIIIFc의 경우 5분, 1 시간, 2시간, 4시간, 6시간 및 8시간 시점에서 혈액시료가 수집되었다. 혈장 시료의 상기 FVIII 활성은 FVIII 색원체 분석에 의해 테스트되었고, FVIII-155/VWF-031의 반감기는 WinNonlin 프로그램을 이용하여 계산되었다.
도 16b 및 표 12B는 DKO 마우스에서 rFVIIIFc에 비교하였을 때 FVIII-155/VWF-031에 대한 PK 프로파일이 상당히 개선됨을 보여주는데: t₁ _/2는 약 6배 증가; 그리고 제거 및 AUC는 약 5배 증가된다. 이 결과는 FVIIIFc/VWF 이형이량체에서 상기 D'D3 도메인은 일부 제거 경로로부터 상기 FVIII 모이어티를 보호하고, 따라서 전장의 VWF에 의해 정상적으로 제공되는 일부 보호를 제공한다는 것이 설명된다. 이 결론은 HemA 마우스에서 또한 확인된다. HemA 마우스에서 rFVIIIFc에 비교하였을 때, rFVIII-155/VWF-031는 더 짧은 t₁ _/2와 더 작은 AUC를 갖는데, 이 형태에서 상기 D'D3 도메인들 (VWF-031)은 상기 FVIII 단백질 (rFVIII-155)이 내생성 VWF에 결합하는 것을 성공적으로 막고, 어느 정도의 반감기 연장 성질, 뿐만 아니라 FVIII 반감기 제한 특성을 갖는다는 것을 의미한다. 전장의 VWF는 250 kDa이며, 다량체를 형성하여, 내생성 VWF은 최대 2 MDa까지 될 수 있고, 따라서 상기 VWF의 55 kDa D'D3 영역은 본 내용에서 더 큰 내생성 VWF에 의해 정상적으로 제공되는 동일한 보호를 제공하지 않는다는 가설과 일치된다. 상기 VWF 단편은 내생성 VWF가 rFVIII-155/VWF-031에 결합하는 것을 막기 때문에, HemA 마우스에서 이 특정 구조체의 반감기는 감소된다. 따라서, 상기 rFVIII-155/VWF-031 분자는 상기 FVIII 반감기 증량제 (내생성 VWF)가 상기 rFVIII-155/VWF-031에 결합하는 것을 막을 수 있음이 표 12B 결과에서 나타난다. 그러나, 상기 FVIII 반감기 제한 인자의 제거는 상기 FVIII 단백질의 반감기를 기존에 보여준 1.5배 또는 2배 이상으로 연장시킬 수 있는 가능성을 열었다는 것을 이 실험들은 보여준다. FVIII가 도 4에 나타낸 것과 같이 FVIII가 다른 반감기 연장 요소들과 복합될 때, FVIII의 상기 2배 반감기 연장 한계는 극복될 수 있다.
표 12B. FVIII/VWF DKO 마우스에서 FVIII-155/VWF-031과 FVIIIFc PK

실시예 12: FVIII/D'D3 이형이량체의 상기 D'D3-Fc 링커의 최적화 (도 13)
상기 VWF 제거 경로로부터 rFVIIIFc를 벗어나게 하고, 상기 2 배 FVIII 반감기 연장 한계를 없애기 위하여, 상기 VWF D'D3 단편을 상기 rFVIIIFc 분자에 혼입시켜 (도 2), FVIIIFc/VWF 이형이량체가 생성되었다. rFVIIIFc와 내생성 VWF 사이에 상호작용을 제거하고, 그리고 상기 D'D3 FVIII 보호 능력을 최대화시키기 위하여, 최적의 FVIII/D'D3 결합이 허용되도록 상기 D'D3 도메인과 Fc 영역 사이에 링커가 조정되었다. 더욱 최적화된 링커는 다소 덜 최적화된 링커 구조체보다 상기 D'D3 도메인이 FVIII를 더 많이 보호하도록 할 것이다. 이것은 FVIII/VWF DKO 마우스에서 상기 DNA 구조체의 유체역학적 주사에 의해 테스트될 수 있다. 더욱 최적화된 구조체는 상기 FVIIIFc/D'D3 이형이량체의 더 높은 정상 상태(steady state) 단백질 발현을 만들 것이다.
최적의 링커 선택을 위하여 3가지 상이한 FVIIIFc/D'D3 이형이량체 (도 3, 실시예 3)가 작제되었다. 상기 D'D3 도메인들과 Fc 영역 사이에 가능한 링커들이 표 13에 나열되어 있다. 이들 DNA 구조체는 유체역학적주사 ("HDI")에 의해 마우스당 100 μg으로 FVIII/VWF DKO 마우스에게 투여되었고, HDI 이후 48시간에 혈장 시료가 수집되었다. 순환 FVIIIFc/D'D3 이형이량체 활성은 FVIII 색원체 분석에 의해 분석되었다.
도 13에 연구 결과는 나타내었다. HDI 이후 48시간 시점에서, FVIII-064 및 FVIII-159는 유사한 발현 수준에 도달되었고, 이것은 상기 20aa-링커와 35aa-링커는 FVIII/D'D3 상호작용을 유사한 수준으로 촉진시킴을 나타낸다. 또 다른 한편, FVIII-160은 FVIII-064보다 상당히 더 높은 발현을 보여주었는데, 상기 48aa-링커가 20 aa 링커와 35aa 링커와 비교하였을 때 더 나은 FVIII/D'D3 결합을 허용한다는 것을 의미한다
상기 VWF 단편과 Fc 영역 사이의 최적의 링커는 상기 FVIIIFc/VWF 이형이량체의 주요 요소중 하나다. 최고 링커의 발견은 FVIII와 상기 VWF 단편 사이의 상호작용을 최적화시키고, FVIII가 내생성 VWF에 결합하는 것을 방지하고, FVIII가 상기 VWF 제거 경로를 벗어나가게 하며, 그리고 혈장 VWF 반감기를 넘어서 FVIII 반감기를 연장시킬 것이다.
표 13: D'D3과 Fc 단편 사이에 상이한 링커들

실시예 13: 단일 쇄 FVIII 안정성
상기 단일 쇄 FVIII 단백질은 이의 이중 쇄 이소폼(isoform)보다 더 안정할 것이다. 이 가설을 테스트하기 위하여, 2개의 DNA 구조체를 만들었다: FVIII-136 (상기 D'D3 도메인을 가진 가공가능한 FVIIIFc) 그리고 FVIII-148 (상기 D'D3 도메인을 가진 단일 쇄 (SC) FVIIIFc, FVIII 중쇄와 경쇄 사이의 절단을 방지하기 위하여 R1645A/R1648A 돌연변이가 포함됨).
두 플라스미드 모두가 유체역학적주사에 의해 FVIII/VWF DKO 마우스에게 투여되었다. 두 FVIIIFc/D'D3 이소폼의 발현 수준을 측정하기 위하여, 주사 후 24시간과 48시간 시점에 혈장 시료가 수집되었다. 도 14에 나타낸 것과 같이, 두 시간대 모두에서 SC-FVIIIFc/D'D3 구조체 (FVIII-148) (p=0.12, p=0.19)에 의해 더 나은 발현 경향이 관찰되었고, 이것은 단일 쇄 FVIII는 이의 이중 쇄 이소폼(FVIII-136)보다 더 안정적이거나 또는 더 잘 발현됨을 나타낸다. 2가지 FVIII 이소폼의 PK 프로파일과 이들의 세포 배양 발현 수준은 더 조사될 것이다. 더 나은 단백질 생산과 더 나은 생체내 FVIII 반감기를 얻기 위하여 통상적인 이중쇄 이소폼을 대신해서 단일 쇄 FVIII 이소폼이 이용될 가능성이 있다.
실시예 14. 페길화
하나 또는 그 이상의 폴리에틸렌 글리콜 (PEG) 분자들은 상기 FVIII 단백질, 상기 VWF 단편, 또는 이 둘 모두의 임의의 영역 내에 부착될 수 있다. FVIII는 결정 구조에 근거하여 이의 표면에 유리(free) 시스테인을 갖지 않기 때문에 (PDB:2R7E, Shen 그리고 다른 사람들., Blood 111:1240 (2008); PDB:3CDZ, Ngo, Structure, 16:597-606 (2008)), 한 가지 방법은 시스테인 포함된 펩티드 (예컨대, GGGSGCGGGS) (서열 번호: 107)를 상기 FVIII 단백질, 상기 VWF 단편, 또는 이 둘 모두의 안으로 삽입하거나 이에 연계시키는 것이다. 그 다음 말레이미드 포함된 PEG 분자들은 상기 재조합 FVIII 단백질에 도입된 상기 시스테인에 특이적으로 접합(conjugated)될 수 있다. 간단하게 설명하자면, 상기 Cys 삽입이 포함된 재조합 FVIII 단백질은 표준 분자 기술을 이용하여 작제될 수 있고, 포유동물 발현 시스템 (예컨대, HEK293, CHO, BHK21, PER.C6, 및 CAP 세포들)에서 발현된 상기 재조합 FVIII 단백질은 친화력 및 이온 교환 크로마토그래피를 통하여 정제될 수 있다. 상기 정제된 재조합 FVIII 단백질은 도입된 시스테인의 티올기를 노출시키기 위하여 트리스(2-카르복시에틸)포스핀 (TCEP)에 의해 환원되고, 그 다음 말레이미드 PEG와 반응된다. 생성된 재조합 FVIII 단백질은 응혈촉진(procoagulant) 활성과 연장된 반감기에 대하여 테스트된다.
PEG는 다음에서 공개된 위치중 최소한 하나에 부착되거나: 미국 출원 번호 61/670,553(이의 전문에 본 명세서의 참고자료에 편입됨), 또는 다른 적합한 삽입 부위들에 부착된다. 상기 페길화된 재조합 FVIII 단백질의 FVIII 활성은 FVIII 색원체 분석을 이용하여 분석된다. 상기 페길화된 재조합 FVIII 단백질의 PK는 전술한 것과 같이 HemA 마우스와 FVIII-VWF DKO 마우스에서 분석된다.
실시예 15: HemA 및 FVIII/VWF 이중 녹아웃 (DKO) 혈장에서 FVIII 안정성
상이한 FVIIIFc 융합의 혈장 안정성은 HemA 또는 FVIII/VWF 이중 녹아웃 (DKO) 혈장에서 테스트되었다. 안정성 분석을 위하여, 5 IU/ml의 다양한 FVIIIFc 단백질들이 37℃에서 마우스 HemA 또는 DKO 혈장과 항온처리되었다. FVIII 색원체 분석을 통하여 활성을 측정하기 위하여 상이한 시점에서 분획량(aliquots)이 수집되었다. 각 시간대의 활성은 중복 측정되었고, 평균 활성은 시간에 대한 함수로써 플롯되었다.
FVIIIFc 면역-침전 분석을 위하여, 5μg FVIIIFc는 24시간 동안 37℃에서 250μl의 PBS 또는 마우스 DKO 혈장과 함께 항온처리되었다. 실온에서 1시간 동안 5μg 양 항-FVIII 다클론성 항체 (ab61370)와 100μl 단백질 A 비드를 추가함으로써 FVIIIFc는 면역-침전되었다. 4x1ml PBS 세척 후, 50μl 1x 환원 SDS-PAGE 완충액에서 비드들이 재-현탁되었다. 가열 후, 20μl 시료 (즉 ~ 1μg FVIIIFc)는 4-15% Bio-Rad 착색 없는 겔에 적하되었다. 겔은 Bio-rad 시스템을 통하여 영상화되었고, FVIII 항-중쇄 항체 (GMA012)와 함께 웨스턴 분석되었다.
FVIIIFc (이중 쇄 FVIII 분자, 이 분자는 별도의 FVIII 중쇄와 경쇄를 갖고, 경쇄와 중쇄는 비-공유 상호작용에 의해 유지된다)의 활성은 HemA와 DKO 혈장 모두에서 시간에 따라 감소된다(도18a). VWF 중재된 보호의 부재로 인하여DKO 혈장에서 FVIIIFc 활성의 상실이 더 현저하였다. FVIII 활성의 상실은 주로 FVIII 중쇄 (HC)의 분리 또는 분해 때문이었다. DKO 혈장에서 24시간 항온처리 후 FVIIIFc 중쇄에서 약 75% 감소가 관찰되었다 (도 18b). 경쇄 (LC) (데이터 제시안됨) 또는 비-가공된/단일 쇄 FVIIIFc (즉 FVIII 분자 이때 경쇄와 중쇄는 여전히 공유적으로 잡혀있다-겔 도면에서 상위 밴드) (도18b)에서는 유의미한 감소가 관찰되지 않았다.
VWF는 생체내 FVIII 안정성을 증가시키는 것으로 제안되기 때문에, 키메라 단백질- FVIII-VWF 이형이량체 (FVIII155:VWF31, Fc를 통하여 FVIII에 공유적으로 부착된 VWF D'D3을 갖는)가 Hem A와 DKO 혈장에서 좀더 안정한지를 테스트하였다. 도 19에 나타낸 혈장 안정성 데이터로부터 D'D3의 존재로 HemA와 DKO 혈장 모두에서 FVIIIFc의 안정성이 증가되었다. D'D3 가 없는 단일 쇄 FVIIIFc (scFVIII)는 이들 실험에서 대조군으로 이용되었다 도 19에서 단일 쇄 FVIII는 이중 쇄 FVIIIFc보다 더 안정하였지만; 그러나 D'D3의 존재로 단일 쇄 FVIIIFc 분자의 상기 혈장 안정성이 상당히 더 증가되었다. 이것은 중쇄와 경쇄가 함께 잡혀있기 때문만이 아니라 다른 알려지지 않은 기전에 의해 D'D3은 FVIII를 안정화시킨다는 것을 암시한다.
실시예 16: VWF 가공을 위하여 퓨린/PACE의 사용
VWF는 매우 큰 프로-펩티드 (즉 VWF의 D1D2 도메인, ~85kDa)를 포함하고 있다는 관점에서 독특한 단백질이다. 상기 VWF 프로-펩티드는 VWF 분자의 적절한 폴딩(folding)을 위한 내부 샤프롱(chaperon)으로 작용한다. VWF 가공에 있어서 2가지 효소- PC5 및 퓨린 (PACE)가 테스트되었다. VWF031 구조체 (D1D2D'D3Fc)는 다양한 농도의 PC5 또는 PACE와 함께 HEK293 세포에 일시적으로 공동-형질감염되었다. 4 일 후, 조직 배양 배지가 수집되었고, 단백질 A 풀 다운(pull down)을 받았다. 매우 낮은 농도(2.5%)에서 조차도, 퓨린 (PACE)는 D'D3Fc로부터 상기 프로-펩티드(D1D2)의 제거에 있어서 10% PC5보다 더 효과가 있었다(도 20). D1D2 존재는 D'D3와 FVIII의 상호작용 방지에 연루되어 있기 때문에, D1D2 제거는 중요하다.
실시예 17: FVIII-VWF 이형이량체에서 VWF는 FVIII와 전장의 VWF와의 상호작용을 방지한다.
ForteBio octet 기구를 이용하여 전장의 VWF에 FVIII 구조체 155/VWF31 이형이량체의 결합이 테스트되었다(도 21a). 상기 결합 분석을 위하여, 전장의 VWF는 APS 센서를 이용하여 포획되었고, 1% BSA로 차단되었다. 차단 후, VWF 결합에 있어서 상이한 FVIII 구조체들이 테스트되었다. 예상과 같이, 야생형 FVIII와 FVIIIFc는 상기 VWF 센서에 강력하게 결합되었다. VWF에 대하여 친화력이 낮거나 없는 것으로 알려진 FVIII Y1680F 돌연변이체는 상당히 감소된 VWF 결합을 보여주었다. FVIII155/VWF31 이형이량체는 전장의 VWF에 전혀 결합하지 않았고, 이로써 FVIII-VWF 이형이량체내 D'D3와 FVIII는 차폐된다는 것이 확인된다.
FVIII-VWF 이형이량체에서 상기 D'D3 부분이 D'D3에 공유적으로 부착되지 않은 다른 FVIII 분자들과 상호작용할 수 있는 지를 판단하기 위하여 역 방향에서 동일한 실험이 실행되었다. 도 21b에서 볼 수 있는 것과 같이, 상기 VWF31 (D'D3Fc) 구조체가 단독으로 단백질 G 센서에 고정된 경우, 이 구조체는 FVIII에 강력하게 결합할 수 있지만, FVIII155:VWF31 이형이량체에서 상기 D'D3는 FVIII에 대하여 어떠한 결합도 보여주지 않았다. FVIII 만을 가진 단백질 G는 대조군으로 이용되었다. 이형이량체의 D'D3는 이에 공유적으로 부착된 오직 하나의 FVIII 분자와 상호작용하고, FVIII가 전장의 야생형 VWF 분자들과 상호작용을 방지할 수 있다는 사실이 이들 결합 실험에서 확인되었다.
FVIII 분자에 대하여 VWF D'D3의 정확한 결합 친화력을 측정하기 위하여, VWF031으로 표면 혈장 공명 실험이 실시되었다 (도 22). VWF031 구조체 (D'D3Fc)는 항-인간 IgG를 이용하여 포획되었고, B-도메인 결실된 FVIII는 D'D3Fc 포함된 칩 상으로 이동되었다. FVIII의 경우 약 10nM의 K_D가 관찰되었다. 전장의 야생형 VWF 분자의 것과 비교하였을 때, 이 친화력은 약 25-배 낮은 것이며, 문헌을 통하여 이미 보고된 것과 유사하다.
실시예 18: 이형이량체 활성 및 PK에 있어서 D'D3와 Fc 사이의 상이한 길이의 링커의 영향
D'D3와 Fc 사이의 트롬빈 절단가능한 링커의 길이 변화가 FVIII-VWF 이형이량체의 PK 및 활성에 임의의 영향을 끼치는 지를 점검하기 위하여, FVIII 155와 함께 상이한 VWF 구조체들을 공동-발현시켰다. 표 14A에 열거된 3가지 상이한 링커 길이 구조체(VWF031, VWF035 및 VWF036)들이 테스트되었다. 각 플라스미드는 FVIII155 플라스미드 (실시예 5)와 혼합되었고, 그리고 HEK293 세포로 형질감염되었다. 형질감염 후 4일 시점에, 세포 배양 배지를 회수하고, 10 IU/ml FVIII 색원성 활성으로 농축시켰다.
농축된 세포 배지를 100 IU/10 mL/kg 투여 분량으로 8-12 주령의 FVIII/VWF DKO 마우스에게 투여하였다. 투여 후 5분, 8시간, 16시간, 24시간, 32시간 그리고 48시간 시점에서 혈장 시료가 수집되었다. 상기 혈장 시료의 FVIII 활성은 FVIII 색원체 분석에 의해 분석되었고, 반감기는 WinNonlin-Phoenix 프로그램을 이용하여 계산되었다.
도 23에서 볼 수 있는 것과 같이, D'D3과 Fc 단편 사이의 상기 링커 길이가 48개 aa에서 73개 aa으로 또는 98개 aa으로 증가되었을 때, FVIIIFc/VWF 이형이량체의 상응하는 반감기는 증가되어, 각각 12.2시간과 13.3시간에 이르렀다. 이것은 48개 aa 길이 변이체보다 1.5 내지 1.6 배 증가를 나타낸다. 현재까지, 상기 D'D3 단편의 FVIII 보호 활성을 이용하기 위한 가장 최적의 링커는 98aa 링커이며, FVIIIFc/VWF 이형이량체 안으로 혼입되면 이의 반감기는 더 개선될 것이다.
FVIII 활성에 있어서 링커의 영향을 비교하기 위하여, 상이한 FVIII-VWF 이형이량체들을 발현시키는 세포의 조직 배양 배지에서 FVIII 색원성 및 aPTT 분석이 실행되었다. 비록 aPTT 활성은 이형이량체 구조체들에 있어서 색원성 활성과 비교하여 2-배 감소되었지만, 상기 링커가 트롬빈 부위 다음에 PAR1 부위를 포함하는 경우를 제외하고, 다양한 링커들 간에 유의미한 차이는 볼 수 없었다(표 14B).
표 14A. VWF D'D3과 Fc 사이에 가변 링커 서열

표 14B: 상이한 링커 길이와 이형이량체 활성

실시예 19: 소르타제 효소를 이용한 FVIII와 VWF 단편의 연계
또 다른 측면에서, VWF 단편 (예컨대 D1D2D'D3 또는 D'D3 도메인)은 소르타제 중재된 시험관내 단백질 결찰 방법에 의해 FVIII에 부착된다. 한 실시예에서, 스타필로코커스 아우레우스(Staphylococcus aureus) 소르타제 A (LPXTG) 인지 모티프는 VWF 단편의 C-말단에 그리고 Gly(n) 잔기 (이때 글리신 잔기 번호는 가변적임)는 FVIII의 N-말단에 도입되었다. 이용된 상기 FVIII 분자는 단일 쇄 또는 이중 쇄일 수 있다. 상기 소르타제 촉매된 트란스-펩티드화 반응은 상기 VWF 단편을 FVIII에 공유적으로 부착시킬 것이다. 인지 모티프의 역 방향이 또한 이들 단백질을 연계하는데 이용될 수 있는데, 이때 상기 N-말단에서 LPXTG 모티프가 있는 FVIII 및 상기 C-말단에서 Gly(n)가 있는 VWF 단편을 갖는다 (도 24-참고용으로 소르타제 결찰의 예를 보여준다). 상기 LPXTG 모티프와 글리신 잔기는 다른 소르타제 인지 서열로 대체될 수 있다.
소르타제 A 인지 서열이 포함된 VWF 단편 Fc 융합 단백질을 또한 만들었다. Fc 융합 구조체의 경우, VWF D1D2D'D3 단편은 소르타제 인지 서열과 트롬빈 절단 부위가 포함된 GS 링커를 통하여 IgG의 Fc 영역에 융합되었다(표 15와 16). 단백질이 일단 발현되고, 단백질 A 컬럼 상에서 정제되면, 상기 Fc 영역은 트롬빈 절단에 의해 제거될 것이다. 소르타제 A 인지 부위를 가진 생성된 VWF 단편은 그 다음 FVIII 분자와의 결찰에 이용될 수 있다 (도 24-참고로 소르타제 결찰 실시예-E열).
pSYN-VWF-051은 상기 VWF 단편과 Fc 영역 사이에 소르타제와 트롬빈 부위가 있는 54개 아미노산 링커를 갖는다. 54개 아미노산 링커 (ISGGGGSGGG GSGGGGSGGG GSGGGGSGGG GSLPETGALR PRVVGGGGSG GGGS) (서열 번호: 98)를 코딩하는 DNA 단편과 상기 Fc 영역 일부의 합성은 외부 조달되었다(Genewiz 서열 번호-10-210746313, 아래에 나타냄). 상기 Genewiz 구조체의 단편은 EcoRV/RsRII 절단된 pSYN-VWF-031로 서브-클론되었다.
Genewiz-서열 번호-10-210746313(서열 번호: 99)

N-말단 펜타글리신 포함된 단일 쇄 FVIII의 서열은 표 17과 18에서 보여준다.
표-15: pSYN-VWF051 (소르타제 A 인지 모티프와 VWF 단편과 Fc 사이에 트롬빈 절단가능한 링커가 있는 VWF D1D2D'D3Fc)의 뉴클레오티드 서열(서열 번호: 100)

표-16: VWF051 (소르타제 A 인지 모티프와 VWF 단편과 Fc 사이에 트롬빈 절단가능한 링커가 있는 VWF D1D2D'D3Fc; 소르타제 A 부위는 굵게 표시됨)의 단백질 서열 (서열 번호: 101)

표 17: FVIII 265 (N-말단에 펜타글리신이 있는 FVIII 단일 쇄 분자)의 뉴클레오티드 서열 (서열 번호: 102)

표 18: FVIII 265 (N-말단에 펜타글리신이 있는 FVIII 단일 쇄 분자; 펜타글리신은 굵게 표시됨)의 단백질 서열 (서열 번호: 103)

실시예 20: HemA와 FVIII/VWF 이중 녹아웃 (DKO) 혈장에서 FVIII198의 혈장 안정성 및 PK
FVIII 198 (부분적인 B-도메인 포함된 단일 쇄 FVIIIFc 분자-226N6; 이때 226은 상기 FVIII B-도메인의 N-말단 226개 아미노산을 나타내며, N6는 상기 B-도메인에서 6개의 N-당화 부위를 나타낸다)의 상기 혈장 안정성은 FVIII/VWF 이중 녹아웃 (DKO) 혈장에서 단일 쇄 FVIIIFc (FVIII 155/Fc와 비교되었다. 도 25에서 FVIII155와 FVIII198의 도식적 표시를 볼 수 있다.
상기 안정성 분석을 위하여, 5 IU/ml의 FVIII 198 또는 FVIIIFc 단백질은 37 ℃에서 마우스 또는 DKO 혈장과 함께 항온처리되었다. FVIII 색원체 분석으로 활성 측정을 하기 위하여 상이한 시점에서 분획량(Aliquots)이 수집되었다. 각 시간대의 활성은 중복 측정되었고, 평균 활성은 시간에 대한 함수로써 플롯되었다. 상기 안정성 분석에 있어서, 부분적인 B-도메인의 존재로 인하여 상기 단일 쇄 FVIIIFc의 안정성이 증가되었다 (도 26a).
상기 FVIII 198 (단일 쇄-B226N6)의 반감기는 DKO 마우스에서 FVIII155 (단일 쇄 B-도메인 결실된 FVIII)와 또한 비교되었다. FVIII 198은 FVIII155와 비교하였을 때 최소한 약 1.5배 더 긴 반감기를 갖는다 (도 26b). 이들 실험은 FVIII 안정성과 이의 생체내 반감기 사이에 공동-상관관계가 있다는 것을 암시한다.
FVIII198 뉴클레오티드 서열 (부분적인 B-도메인, 226 N6 을 갖는 FVIIIFc )(서열 번호: 104)

FVIII 198 단백질 서열 (서열 번호: 105)

실시예 21. VWF의 D1D2의 발현
D'D3 도메인의 적절한 폴딩(folding)은 이 도메인이 FVIII에 결합하는데 필수적이다. VWF 프로펩티드 (D1D2-아미노산 1-763)는 D'D3의 효과적인 이황화결합 형성과 폴딩에 요구된다. 이것은 D'D3 폴딩의 내부 샤프롱(chaperone) 역할을 한다. VWF 프로펩티드 (즉 D1D2 도메인)가 D'D3 도메인에 직접적으로 부착되고, D'D3의 정규적인 세포내 가공 (즉 cis) 동안에 제거되도록 VWF 단편을 만드는 VWF 구조체들이 발현되거나, 다른 플라스미드 즉 trans로부터 발현될 수 있다. 우리는 D1D2가 cis 또는 trans로 발현될 수 있도록 FVIII-VWF 이형이량체를 기획하였다.
VWF 053 클로닝: VWF 053 클론은 D1D2의 trans 발현을 위한 VWF 프로펩티드 (D1D2 도메인)를 발현시킨다. VWF 프로펩티드는 ESC 54와 ESC124를 이용하여 전장으로부터 PCR 증폭되었다.
BsiW1 부위를 가진 ESC54 - VWF 포워드( forward ) (서열 번호: 111)

Not1 부위- 리버스(reverse)를 가진 ESC 124 - D1D2 클로닝 올리고 (서열 번호: 112)

PCR 산물은 BsiW1와 Not1로 절단되었고, BsiW1/Not1 절단된 pCDNA 4에 결찰되었다.
VWF 053 (VWF D1D2-프로펩티드)의 뉴클레오티드 서열 (서열 번호: 113)

VWF 053 (VWF D1D2-Pro펩티드)의 단백질 서열 (서열 번호: 114)

상기 특이적 구체예들의 전술한 설명은 본 발명의 전반적인 특징을 충분히 드러내고, 당업자는 당업계 기술 범위내 지식을 적용함으로써, 과도한 실헙없이, 그리고 본 발명의 전반적인 개념을 벗어나지 않고, 이러한 특정 구체예들을 용이하게 변형하고, 다른 용도를 위하여 개작할 수 있을 것이다. 그래서, 그러한 적응 및 수정은, 여기서 제시된 가르침 및 가이드에 기반하여, 개시된 실시예의 균등물의 의미 및 범위 내에 있는 것으로 의도된다. 본 명세서의 용어 또는 구절은 설명을 목적으로 제공된 것으로써, 이에 한정되는 것은 아니며, 본 명세서의 용어 또는 구절은 기술 및 지침에 의거하여 당업자가 해석할 수 있다는 것을 인지할 것이다.
본 발명의 다른 구체예들은 본 명세서에서 공개된 본 발명의 명세서 및 실시를 고려하면, 당업자에게 자명할 것이다. 명세서 및 실시예들은 오직 예를 든 것이며, 본 발명의 실제 범위 및 사상은 다음의 청구범위를 통하여 나타낸다.
본 명세서에서 언급된 모든 특허 및 공개는 이들 전문이 본 명세서의 참고자료에 편입된다.

<110> Biogen Idec MA Inc. <120> CHIMERIC FACTOR VIII POLYPEPTIDES AND USES THEREOF <130> 2159.359PC04/EKS/C-K/E-H <150> US 61/586,099 <151> 2012-01-12 <150> US 61/586,654 <151> 2012-01-13 <150> US 61/667,901 <151> 2012-07-03 <150> US 61/734,954 <151> 2012-12-07 <160> 114 <170> KopatentIn 2.0 <210> 1 <211> 16842 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens <400> 1 atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60 ctttgtgcag aaggaactcg cggcaggtca tccacggccc tactaaggac ggtctaaacg 120 gccccacgac gaacgagacc gggagtaaaa cggtccctgg gaaacacgtc ttccttgagc 180 gccgtccagt aggtgccggg gatgcagcct tttcggaagt gacttcgtca acacctttga 240 tgggagcatg tacagctttg cgggatactg cagttacctc ctggcagggg gctgccagaa 300 ctacgtcgga aaagccttca ctgaagcagt tgtggaaact accctcgtac atgtcgaaac 360 gccctatgac gtcaatggag gaccgtcccc cgacggtctt acgctccttc tcgattattg 420 gggacttcca gaatggcaag agagtgagcc tctccgtgta tcttggggaa ttttttgaca 480 tccatttgtt tgtcaatggt tgcgaggaag agctaataac ccctgaaggt cttaccgttc 540 tctcactcgg agaggcacat agaacccctt aaaaaactgt aggtaaacaa acagttacca 600 accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 660 gaaactgagg ctgggtacta caagctgtcc ggtgaggcct tggcactgtg tccccctggt 720 ttctcagagg tacgggatac ggaggtttcc cgacatagat ctttgactcc gacccatgat 780 gttcgacagg ccactccgga atggctttgt ggccaggatc gatggcagcg gcaactttca 840 agtcctgctg tcagacagat acttcaacaa gacctgcggg ctgtgtggca actttaacat 900 taccgaaaca ccggtcctag ctaccgtcgc cgttgaaagt tcaggacgac agtctgtcta 960 tgaagttgtt ctggacgccc gacacaccgt tgaaattgta ctttgctgaa gatgacttta 1020 tgacccaaga agggaccttg acctcggacc cttatgactt tgccaactca tgggctctga 1080 gcagtggaga acagtggtgt gaaacgactt ctactgaaat actgggttct tccctggaac 1140 tggagcctgg gaatactgaa acggttgagt acccgagact cgtcacctct tgtcaccaca 1200 gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 1260 ctgtgggagc agtgccagct tctgaagagc acctcggtgt cttgcccgta gaggagggtc 1320 gtcgagtacg ttgtagagga gaccccttta cgtcttcccg gacaccctcg tcacggtcga 1380 agacttctcg tggagccaca ttgcccgctg ccaccctctg gtggaccccg agccttttgt 1440 ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg ctggagtgcg cctgccctgc 1500 aacgggcgac ggtgggagac cacctggggc tcggaaaaca ccgggacaca ctcttctgaa 1560 acacactcac acgacccccc gacctcacgc ggacgggacg cctcctggag tacgcccgga 1620 cctgtgccca ggagggaatg gtgctgtacg gctggaccga ccacagcgcg tgcagcccag 1680 tgtgccctgc tggtatggag ggaggacctc atgcgggcct ggacacgggt cctcccttac 1740 cacgacatgc cgacctggct ggtgtcgcgc acgtcgggtc acacgggacg accatacctc 1800 tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 1860 tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg atatccgtca cacacagggg 1920 aacgcggtcc tggacggtct cggacgtgta gttactttac acagtcctcg ctacgcacct 1980 accgacgtcg acgggactcc gacagctcct ggatgaaggc ctctgcgtgg agagcaccga 2040 gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc acctccctct ctcgagactg 2100 ctgtcgagga cctacttccg gagacgcacc tctcgtggct cacagggacg cacgtaaggc 2160 ctttcgcgat gggagggccg tggagggaga gagctctgac caacacctgc atttgccgaa 2220 acagccagtg gatctgcagc aatgaagaat gtccagggga gtgccttgtc actggtcaat 2280 cccacttcaa gagctttgac gttgtggacg taaacggctt tgtcggtcac ctagacgtcg 2340 ttacttctta caggtcccct cacggaacag tgaccagtta gggtgaagtt ctcgaaactg 2400 aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 2460 cactccttct ccattgtcat tgagactgtc cagtgtgctg ttgtctatga agtggaagtc 2520 accctagacg gtcatggacg accgggccct aacggtcctg gtgaggaaga ggtaacagta 2580 actctgacag gtcacacgac atgaccgcga cgctgtgtgc acccgctccg tcaccgtccg 2640 gctgcctggc ctgcacaaca gccttgtgaa actgaagcat ggggcaggag ttgccatgga 2700 tactggcgct gcgacacacg tgggcgaggc agtggcaggc cgacggaccg gacgtgttgt 2760 cggaacactt tgacttcgta ccccgtcctc aacggtacct tggccaggac atccagctcc 2820 ccctcctgaa aggtgacctc cgcatccagc atacagtgac ggcctccgtg cgcctcagct 2880 acggggagga cctgcagatg accggtcctg taggtcgagg gggaggactt tccactggag 2940 gcgtaggtcg tatgtcactg ccggaggcac gcggagtcga tgcccctcct ggacgtctac 3000 gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 3060 tgcggcctgt gtgggaatta caatggcaac cagggcgacg ctgaccctac cggcgccctc 3120 cgacgaccac ttcgacaggg ggcagatacg gcccttctgg acgccggaca cacccttaat 3180 gttaccgttg gtcccgctgc acttccttac cccctctggg ctggcrgagc cccgggtgga 3240 ggacttcggg aacgcctgga agctgcacgg ggactgccag gacctgcaga agcagcacag 3300 tgaaggaatg ggggagaccc gaccgyctcg gggcccacct cctgaagccc ttgcggacct 3360 tcgacgtgcc cctgacggtc ctggacgtct tcgtcgtgtc cgatccctgc gccctcaacc 3420 cgcgcatgac caggttctcc gaggaggcgt gcgcggtcct gacgtccccc acattcgagg 3480 cctgccatcg tgccgtcagc gctagggacg cgggagttgg gcgcgtactg gtccaagagg 3540 ctcctccgca cgcgccagga ctgcaggggg tgtaagctcc ggacggtagc acggcagtcg 3600 ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 3660 tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg ggcgacggga tggacgcctt 3720 gacggcgatg ctgcacacga ggacgagcct gccggcgctc acggacacgc cgcgggaccg 3780 gtcgatacgg cgccggacgc cggggagagg cgtgcgcgtc gcgtggcgcg agccaggccg 3840 ctgtgagctg aactgcccga aaggccaggt gtacctgcag tgcgggaccc cctgcaacct 3900 gcccctctcc gcacgcgcag cgcaccgcgc tcggtccggc gacactcgac ttgacgggct 3960 ttccggtcca catggacgtc acgccctggg ggacgttgga gacctgccgc tctctctctt 4020 acccggatga ggaatgcaat gaggcctgcc tggagggctg cttctgcccc ccagggctct 4080 acatggatga gaggggggac ctggacggcg agagagagaa tgggcctact ccttacgtta 4140 ctccggacgg acctcccgac gaagacgggg ggtcccgaga tgtacctact ctcccccctg 4200 tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 4260 atcttctcag accatcacac catgtgctac tgtgaggatg acgcacgggt tccgggtcac 4320 ggggacaatg atactgccac tctagaaggt cggtcttctg tagaagagtc tggtagtgtg 4380 gtacacgatg acactcctac gcttcatgca ctgtaccatg agtggagtcc ccggaagctt 4440 gctgcctgac gctgtcctca gcagtcccct gtctcatcgc agcaaaagga gcctatcctg 4500 cgaagtacgt gacatggtac tcacctcagg ggccttcgaa cgacggactg cgacaggagt 4560 cgtcagggga cagagtagcg tcgttttcct cggataggac tcggcccccc atggtcaagc 4620 tggtgtgtcc cgctgacaac ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga 4680 actatgacct ggagtgcatg agccgggggg taccagttcg accacacagg gcgactgttg 4740 gacgcccgac ttcccgagct cacatggttt tgcacggtct tgatactgga cctcacgtac 4800 agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 4860 tgtgtggccc tggaaaggtg tccctgcttc catcagggca tcgtacccga cacagagacc 4920 gacggagacg gggggcccgt accaggccgt actcttgtct acacaccggg acctttccac 4980 agggacgaag gtagtcccgt aggagtatgc ccctggagaa acagtgaaga ttggctgcaa 5040 cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac catgtgtgtg atgccacgtg 5100 tcctcatacg gggacctctt tgtcacttct aaccgacgtt gtgaacacag acagccctgg 5160 ccttcacctt gacgtgtctg gtacacacac tacggtgcac ctccacgatc ggcatggccc 5220 actacctcac cttcgacggg ctcaaatacc tgttccccgg ggagtgccag tacgttctgg 5280 tgcaggatta ctgcggcagt gaggtgctag ccgtaccggg tgatggagtg gaagctgccc 5340 gagtttatgg acaaggggcc cctcacggtc atgcaagacc acgtcctaat gacgccgtca 5400 aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 5460 tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgggaccct ggaaagccta 5520 ggatcacccc ttattcccta cgtcggtggg gagtcacttt acgttctttg cccagtggta 5580 ggaccacctc cctcctctct ttgagctgtt tgacggggag gtgaatgtga agaggcccat 5640 gaaggatgag actcactttg aggtggtgga gtctggccgg tacatcattc tgctgctggg 5700 aactcgacaa actgcccctc cacttacact tctccgggta cttcctactc tgagtgaaac 5760 tccaccacct cagaccggcc atgtagtaag acgacgaccc caaagccctc tccgtggtct 5820 gggaccgcca cctgagcatc tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg 5880 gcctgtgtgg gaattttgat gtttcgggag aggcaccaga ccctggcggt ggactcgtag 5940 aggcaccagg acttcgtctg tatggtcctc tttcacacac cggacacacc cttaaaacta 6000 ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 6060 tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccgtaggtct tgttactgga 6120 gtggtcgtcg ttggaggttc acctccttct gggacacctg aaacccttga ggacctttca 6180 ctcgagcgtc acacgactgt ccagaaaagt gcctctggac tcatcccctg ccacctgcca 6240 taacaacatc atgaagcaga cgatggtgga ttcctcctgt agaatcctta ccagtgacgt 6300 ggtcttttca cggagacctg agtaggggac ggtggacggt attgttgtag tacttcgtct 6360 gctaccacct aaggaggaca tcttaggaat ggtcactgca cttccaggac tgcaacaagc 6420 tggtggaccc cgagccatat ctggatgtct gcatttacga cacctgctcc tgtgagtcca 6480 ttggggactg cgcctgcttc gaaggtcctg acgttgttcg accacctggg gctcggtata 6540 gacctacaga cgtaaatgct gtggacgagg acactcaggt aacccctgac gcggacgaag 6600 tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 6660 aggacggcca cattgtgccc ccagagctgc gaggagagga acgctgtggt aacgacggat 6720 acgggtgcac acacgggtcg taccgttcca ccactggacc tcctgccggt gtaacacggg 6780 ggtctcgacg ctcctctcct atctccggga gaacgggtat gagtgtgagt ggcgctataa 6840 cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct gagccactgg cctgccctgt 6900 tagaggccct cttgcccata ctcacactca ccgcgatatt gtcgacacgt ggacggacag 6960 ttcagtgcac agtcgtggga ctcggtgacc ggacgggaca gcagtgtgtg gagggctgcc 7020 atgcccactg ccctccaggg aaaatcctgg atgagctttt gcagacctgc gttgaccctg 7080 aagactgtcc agtgtgtgag cgtcacacac ctcccgacgg tacgggtgac gggaggtccc 7140 ttttaggacc tactcgaaaa cgtctggacg caactgggac ttctgacagg tcacacactc 7200 gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 7260 cactgccaga tttgccactg tgatgttgtc aacctcacct caccgaccgg ccgcaaaacg 7320 gagtcctttc tttcagtgga acttagggtc actgggactc gtgacggtct aaacggtgac 7380 actacaacag ttggagtgga gtgaagcctg ccaggagccg ggaggcctgg tggtgcctcc 7440 cacagatgcc ccggtgagcc ccaccactct gtatgtggag gacatctcgg aaccgccgtt 7500 cacttcggac ggtcctcggc cctccggacc accacggagg gtgtctacgg ggccactcgg 7560 ggtggtgaga catacacctc ctgtagagcc ttggcggcaa gcacgatttc tactgcagca 7620 ggctactgga cctggtcttc ctgctggatg gctcctccag gctgtccgag gctgagtttg 7680 aagtgctgaa ggcctttgtg cgtgctaaag atgacgtcgt ccgatgacct ggaccagaag 7740 gacgacctac cgaggaggtc cgacaggctc cgactcaaac ttcacgactt ccggaaacac 7800 gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 7860 taccacgacg gctcccacgc ctacatcggg ctcaaggacc cacctgtact acctcgccga 7920 cgcgtagagg gtcttcaccc aggcgcaccg gcaccacctc atggtgctgc cgagggtgcg 7980 gatgtagccc gagttcctgg ggaagcgacc gtcagagctg cggcgcattg ccagccaggt 8040 gaagtatgcg ggcagccagg tggcctccac cagcgaggtc ttgaaataca cactgttcca 8100 ccttcgctgg cagtctcgac gccgcgtaac ggtcggtcca cttcatacgc ccgtcggtcc 8160 accggaggtg gtcgctccag aactttatgt gtgacaaggt aatcttcagc aagatcgacc 8220 gccctgaagc ctcccgcatc gccctgctcc tgatggccag ccaggagccc caacggatgt 8280 cccggaactt tgtccgctac ttagaagtcg ttctagctgg cgggacttcg gagggcgtag 8340 cgggacgagg actaccggtc ggtcctcggg gttgcctaca gggccttgaa acaggcgatg 8400 gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 8460 aacctcaagc agatccgcct catcgagaag caggcccctg caggtcccgg acttcttctt 8520 cttccagtaa cactagggcc acccgtaacc cggggtacgg ttggagttcg tctaggcgga 8580 gtagctcttc gtccggggac agaacaaggc cttcgtgctg agcagtgtgg atgagctgga 8640 gcagcaaagg gacgagatcg ttagctacct ctgtgacctt gcccctgaag cccctcctcc 8700 tcttgttccg gaagcacgac tcgtcacacc tactcgacct cgtcgtttcc ctgctctagc 8760 aatcgatgga gacactggaa cggggacttc ggggaggagg tactctgccc cccgacatgg 8820 cacaagtcac tgtgggcccg gggctcttgg gggtttcgac cctggggccc aagaggaact 8880 ccatggttct ggatgtggcg atgagacggg gggctgtacc gtgttcagtg acacccgggc 8940 cccgagaacc cccaaagctg ggaccccggg ttctccttga ggtaccaaga cctacaccgc 9000 ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 9060 atggaggagg tgattcagcg gatggatgtg ggccaggaca aagcaggacc ttcctagcct 9120 gttttaacca cttcggctga agttgtcctc gttcctcaag tacctcctcc actaagtcgc 9180 ctacctacac ccggtcctgt gcatccacgt cacggtgctg cagtactcct acatggtgac 9240 cgtggagtac cccttcagcg aggcacagtc caaaggggac atcctgcagc gggtgcgaga 9300 cgtaggtgca gtgccacgac gtcatgagga tgtaccactg gcacctcatg gggaagtcgc 9360 tccgtgtcag gtttcccctg taggacgtcg cccacgctct gatccgctac cagggcggca 9420 acaggaccaa cactgggctg gccctgcggt acctctctga ccacagcttc ttggtcagcc 9480 agggtgaccg ggagcaggcg ctaggcgatg gtcccgccgt tgtcctggtt gtgacccgac 9540 cgggacgcca tggagagact ggtgtcgaag aaccagtcgg tcccactggc cctcgtccgc 9600 cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 9660 ggagacatcc aggtggtgcc cattggagtg ggccctaatg gggttggacc agatgtacca 9720 gtggccttta ggacggagac tactctagtt ctccgacgga cctctgtagg tccaccacgg 9780 gtaacctcac ccgggattac ccaacgtgca ggagctggag aggattggct ggcccaatgc 9840 ccctatcctc atccaggact ttgagacgct cccccgagag gctcctgacc tggtgctgca 9900 ggttgcacgt cctcgacctc tcctaaccga ccgggttacg gggataggag taggtcctga 9960 aactctgcga gggggctctc cgaggactgg accacgacgt gaggtgctgc tccggagagg 10020 ggctgcagat ccccaccctc tcccctgcac ctgactgcag ccagcccctg gacgtgatcc 10080 ttctcctgga tggctcctcc ctccacgacg aggcctctcc ccgacgtcta ggggtgggag 10140 aggggacgtg gactgacgtc ggtcggggac ctgcactagg aagaggacct accgaggagg 10200 agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 10260 gccaatatag ggcctcgtct cactcaggtg tcagtgctgc tcaaagggtc gaagaataaa 10320 actactttac ttctcaaagc ggttccgaaa gtaaagtttt cggttatatc ccggagcaga 10380 gtgagtccac agtcacgacg agtatggaag catcaccacc attgacgtgc catggaacgt 10440 ggtcccggag aaagcccatt tgctgagcct tgtggacgtc atgcagcggg agggaggccc 10500 tcataccttc gtagtggtgg taactgcacg gtaccttgca ccagggcctc tttcgggtaa 10560 acgactcgga acacctgcag tacgtcgccc tccctccggg cagccaaatc ggggatgcct 10620 tgggctttgc tgtgcgatac ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa 10680 aggcggtggt catcctggtc gtcggtttag cccctacgga acccgaaacg acacgctatg 10740 aactgaagtc tttacgtacc acggtccggc cctcggagtt tccgccacca gtaggaccag 10800 acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 10860 acagtgttcc ctattggaat tggagatcgc tacgatgcag tgcctgcaga gacacctaag 10920 tcacctacgt cgtcgactac ggcggtccag gttgtctcac tgtcacaagg gataacctta 10980 acctctagcg atgctacgtc cccagctacg gatcttggca ggcccagcag gcgactccaa 11040 cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg gtcaccttgg gcaattcctt 11100 gggtcgatgc ctagaaccgt ccgggtcgtc cgctgaggtt gcaccacttc gaggtcgctt 11160 agcttctgga gggatggtac cagtggaacc cgttaaggaa cctccacaaa ctgtgctctg 11220 gatttgttag gatttgcatg gatgaggatg ggaatgagaa gaggcccggg gacgtctgga 11280 ccttgccaga ccagtgccac ggaggtgttt gacacgagac ctaaacaatc ctaaacgtac 11340 ctactcctac ccttactctt ctccgggccc ctgcagacct ggaacggtct ggtcacggtg 11400 accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 11460 cgggggctga ggccttcgtg ccctaacagc cagtcccctg tggcactgaa cggtcggtct 11520 accggtctgg aacgacttct cagtagccca gttgacactg gcccccgact ccggaagcac 11580 gggattgtcg gtcaggggac ttaaagtgga agagacctgt ggctgccgct ggacctgccc 11640 ctgygtgtgc acaggcagct ccactcggca catcgtgacc tttgatgggc agaatttcaa 11700 aatttcacct tctctggaca ccgacggcga cctggacggg gacrcacacg tgtccgtcga 11760 ggtgagccgt gtagcactgg aaactacccg tcttaaagtt gctgactggc agctgttctt 11820 atgtcctatt tcaaaacaag gagcaggacc tggaggtgat tctccataat ggtgcctgca 11880 gccctggagc aaggcagggc cgactgaccg tcgacaagaa tacaggataa agttttgttc 11940 ctcgtcctgg acctccacta agaggtatta ccacggacgt cgggacctcg ttccgtcccg 12000 tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 12060 gaggtgacgg tgaatgggag actggtctct gttccttacg acgtacttta ggtagctcca 12120 cttcgtgtca cgggagaggc agctcsacgt gtcactgtac ctccactgcc acttaccctc 12180 tgaccagaga caaggaatgc tgggtgggaa catggaagtc aacgtttatg gtgccatcat 12240 gcatgaggtc agattcaatc accttggtca catcttcaca ttcactccac aaaacaatga 12300 acccaccctt gtaccttcag ttgcaaatac cacggtagta cgtactccag tctaagttag 12360 tggaaccagt gtagaagtgt aagtgaggtg ttttgttact gttccaactg cagctcagcc 12420 ccaagacttt tgcttcaaag acgtatggtc tgtgtgggat ctgtgatgag aacggagcca 12480 atgacttcat gctgagggat caaggttgac gtcgagtcgg ggttctgaaa acgaagtttc 12540 tgcataccag acacacccta gacactactc ttgcctcggt tactgaagta cgactcccta 12600 ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 12660 cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgtgtcagt ggtgtctgac 12720 cttttgtgaa caagtcctta cctgacacgt cgccggtccc gtctgcacgg tcgggtagga 12780 cctcctcgtc acagaacagg ccgacagctc ccactgccag gtcctcctct taccactgtt 12840 tgctgaatgc cacaaggtcc tggctccagc cacattctat gccatctgcc agcaggacag 12900 ggctgtcgag ggtgacggtc caggaggaga atggtgacaa acgacttacg gtgttccagg 12960 accgaggtcg gtgtaagata cggtagacgg tcgtcctgtc ttgccaccag gagcaagtgt 13020 gtgaggtgat cgcctcttat gcccacctct gtcggaccaa cggggtctgc gttgactgga 13080 ggacacctga tttctgtgct aacggtggtc ctcgttcaca cactccacta gcggagaata 13140 cgggtggaga cagcctggtt gccccagacg caactgacct cctgtggact aaagacacga 13200 atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 13260 gatggcaacg tgagctcctg tggggaccat ccctccgaag tacagtacgg gtggtagaga 13320 ccagatgttg gtgacactcg taccgacagg ggccgtgaca ctaccgttgc actcgaggac 13380 acccctggta gggaggcttc gctgtttctg ccctccagat aaagtcatgt tggaaggcag 13440 ctgtgtccct gaagaggcct gcactcagtg cattggtgag gatggagtcc agcaccagtt 13500 cgacaaagac gggaggtcta tttcagtaca accttccgtc gacacaggga cttctccgga 13560 cgtgagtcac gtaaccactc ctacctcagg tcgtggtcaa cctggaagcc tgggtcccgg 13620 accaccagcc ctgtcagatc tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc 13680 agccctgccc cacggccaaa ggaccttcgg acccagggcc tggtggtcgg gacagtctag 13740 acgtgtacgg agtcgcccgc cttccagttg acgtgttgcg tcgggacggg gtgccggttt 13800 gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 13860 cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc cgagggtgca caccggacac 13920 acttcatcgg gcggaggcgg tcttacgtct ggtcacgacg gggctcatac tcacacacac 13980 actgggtcac tcgacactgg tgcccccagt gcctcactgt gaacgtggcc tccagcccac 14040 actgaccaac cctggcgagt gcagacccaa cttcacctgc gcctgcagga aggaggagtg 14100 acgggggtca cggagtgaca cttgcaccgg aggtcgggtg tgactggttg ggaccgctca 14160 cgtctgggtt gaagtggacg cggacgtcct tcctcctcac caaaagagtg tccccaccct 14220 cctgcccccc gcaccgtttg cccacccttc ggaagaccca gtgctgtgat gagtatgagt 14280 gtgcctgcaa ctgtgtcaac gttttctcac aggggtggga ggacgggggg cgtggcaaac 14340 gggtgggaag ccttctgggt cacgacacta ctcatactca cacggacgtt gacacagttg 14400 tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 14460 accacaacca cctgccttcc cgacaaggtg tgtgtccacc aggtgtcact cgacagggga 14520 acccatgaac cggagttggc ggtggttact gacaccgaca tggtgttggt ggacggaagg 14580 gctgttccac acacaggtgg gaagcaccat ctaccctgtg ggccagttct gggaggaggg 14640 ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg atgggcctcc gcgtggccca 14700 cttcgtggta gatgggacac ccggtcaaga ccctcctccc gacgctacac acgtggacgt 14760 ggctgtacct cctacggcac tacccggagg cgcaccgggt gtgctcccag aagccctgtg 14820 aggacagctg tcggtcgggc ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt 14880 gcctgccatc tgcctgtgag cacgagggtc ttcgggacac tcctgtcgac agccagcccg 14940 aagtgaatgc aagacgtact tccgctcacg acaccttcca cggacggtag acggacactc 15000 gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 15060 tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg caccactgac cgagtggcgc 15120 ccccctgagg gtcagaagga ccttctcaca gccgagggtc acccggaggg gcctcttggg 15180 gacggagtag ttactcacac tccgagtgaa ggaggaggtc tttatacaac aaaggaacgt 15240 ctcctgcccc cagctggagg tccctgtctg cccctcgggc tttcagctga gctgtaagac 15300 aggctcactt cctcctccag aaatatgttg tttccttgca gaggacgggg gtcgacctcc 15360 agggacagac ggggagcccg aaagtcgact cgacattctg ctcagcgtgc tgcccaagct 15420 gtcgctgtga gcgcatggag gcctgcatgc tcaatggcac tgtcattggg cccgggaaga 15480 ctgtgatgat cgatgtgtgc gagtcgcacg acgggttcga cagcgacact cgcgtacctc 15540 cggacgtacg agttaccgtg acagtaaccc gggcccttct gacactacta gctacacacg 15600 acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 15660 aagaccacct gcaacccctg ccccctgggt tacaaggaag tgctggacgg cgacgtacca 15720 cgtccacccc cagtagagac ctaagttcga cctcacgtcc ttctggtgga cgttggggac 15780 gggggaccca atgttccttc aaaataacac aggtgaatgt tgtgggagat gtttgcctac 15840 ggcttgcacc attcagctaa gaggaggaca gatcatgaca ctgaagcgtg atgagacgct 15900 ttttattgtg tccacttaca acaccctcta caaacggatg ccgaacgtgg taagtcgatt 15960 ctcctcctgt ctagtactgt gacttcgcac tactctgcga ccaggatggc tgtgatactc 16020 acttctgcaa ggtcaatgag agaggagagt acttctggga gaagagggtc acaggctgcc 16080 caccctttga tgaacacaag ggtcctaccg acactatgag tgaagacgtt ccagttactc 16140 tctcctctca tgaagaccct cttctcccag tgtccgacgg gtgggaaact acttgtgttc 16200 tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 16260 gagcctgagt gcaacgacat cactgccagg ctgcagtatg acagaacgac tccctccatt 16320 ttaatacttt taaggtccgt ggacgacact gtgtacactc ctcggactca cgttgctgta 16380 gtgacggtcc gacgtcatac tcaaggtggg aagctgtaag tctgaagtag aggtggatat 16440 ccactactgc cagggcaaat gtgccagcaa agccatgtac tccattgaca tcaacgatgt 16500 agttccaccc ttcgacattc agacttcatc tccacctata ggtgatgacg gtcccgttta 16560 cacggtcgtt tcggtacatg aggtaactgt agttgctaca gcaggaccag tgctcctgct 16620 gctctccgac acggacggag cccatgcagg tggccctgca ctgcaccaat ggctctgttg 16680 tgtaccatga ggttctcaat cgtcctggtc acgaggacga cgagaggctg tgcctgcctc 16740 gggtacgtcc accgggacgt gacgtggtta ccgagacaac acatggtact ccaagagtta 16800 gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 16842 <210> 2 <211> 2813 <212> PRT <213> Homo sapiens <220> <221> SIGNAL <222> (1)..(22) <223> VWF Signal Peptide <220> <221> DOMAIN <222> (23)..(763) <223> VWF D1D2 region <220> <221> DOMAIN <222> (764)..(866) <223> VWF D'Domain <220> <221> DOMAIN <222> (867)..(1240) <223> VWF D3 Domain <220> <221> DOMAIN <222> (1241)..(1479) <223> VWF A1 Domain <220> <221> UNSURE <222> (2016) <223> Xaa can be any naturally occurring amino acid <400> 2 Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile 1 5 10 15 Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr 20 25 30 Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly 35 40 45 Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly 50 55 60 Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys 65 70 75 80 Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu 85 90 95 Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro 100 105 110 Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys 115 120 125 Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly 130 135 140 Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly 145 150 155 160 Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln 165 170 175 Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala 180 185 190 Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser 195 200 205 Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln 210 215 220 Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu 225 230 235 240 Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu 245 250 255 Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala 260 265 270 Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His 275 280 285 Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys 290 295 300 Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met 305 310 315 320 Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu 325 330 335 Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His 340 345 350 Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn 355 360 365 Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys 370 375 380 Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp 385 390 395 400 Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg 405 410 415 Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys 420 425 430 Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu 435 440 445 Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val 450 455 460 Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu 465 470 475 480 Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu 485 490 495 Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu 500 505 510 Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn 515 520 525 Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro 530 535 540 Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln 545 550 555 560 Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met 565 570 575 Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe 580 585 590 Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys 595 600 605 Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly 610 615 620 Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val 625 630 635 640 Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln 645 650 655 Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu 660 665 670 Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe 675 680 685 Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys 690 695 700 Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp 705 710 715 720 Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met 725 730 735 His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val 740 745 750 Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg 755 760 765 Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu 770 775 780 Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met 785 790 795 800 Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg 805 810 815 His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln 820 825 830 Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr 835 840 845 Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp 850 855 860 Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly 865 870 875 880 Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp 885 890 895 Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys 900 905 910 Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu 915 920 925 Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys 930 935 940 Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg 945 950 955 960 Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg 965 970 975 His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val 980 985 990 Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr 995 1000 1005 Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser 1010 1015 1020 Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp 1025 1030 1035 1040 Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val 1045 1050 1055 Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn 1060 1065 1070 Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr 1075 1080 1085 Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile 1090 1095 1100 Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val Thr Trp 1105 1110 1115 1120 Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg 1125 1130 1135 Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala 1140 1145 1150 Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln 1155 1160 1165 Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly Lys Ile Leu Asp 1170 1175 1180 Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu 1185 1190 1195 1200 Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro 1205 1210 1215 Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu 1220 1225 1230 Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr 1235 1240 1245 Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu 1250 1255 1260 Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe 1265 1270 1275 1280 Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu 1285 1290 1295 Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys 1300 1305 1310 Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala Tyr 1315 1320 1325 Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg Ile Ala 1330 1335 1340 Ser Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr Ser Glu Val 1345 1350 1355 1360 Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile Asp Arg Pro Glu 1365 1370 1375 Ala Ser Arg Ile Ala Leu Leu Leu Met Ala Ser Gln Glu Pro Gln Arg 1380 1385 1390 Met Ser Arg Asn Phe Val Arg Tyr Val Gln Gly Leu Lys Lys Lys Lys 1395 1400 1405 Val Ile Val Ile Pro Val Gly Ile Gly Pro His Ala Asn Leu Lys Gln 1410 1415 1420 Ile Arg Leu Ile Glu Lys Gln Ala Pro Glu Asn Lys Ala Phe Val Leu 1425 1430 1435 1440 Ser Ser Val Asp Glu Leu Glu Gln Gln Arg Asp Glu Ile Val Ser Tyr 1445 1450 1455 Leu Cys Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp 1460 1465 1470 Met Ala Gln Val Thr Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu 1475 1480 1485 Gly Pro Lys Arg Asn Ser Met Val Leu Asp Val Ala Phe Val Leu Glu 1490 1495 1500 Gly Ser Asp Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe 1505 1510 1515 1520 Met Glu Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp Ser Ile His 1525 1530 1535 Val Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe 1540 1545 1550 Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu Ile 1555 1560 1565 Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu Arg Tyr 1570 1575 1580 Leu Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg Glu Gln Ala 1585 1590 1595 1600 Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala Ser Asp Glu Ile 1605 1610 1615 Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro Ile Gly Val Gly Pro 1620 1625 1630 Asn Ala Asn Val Gln Glu Leu Glu Arg Ile Gly Trp Pro Asn Ala Pro 1635 1640 1645 Ile Leu Ile Gln Asp Phe Glu Thr Leu Pro Arg Glu Ala Pro Asp Leu 1650 1655 1660 Val Leu Gln Arg Cys Cys Ser Gly Glu Gly Leu Gln Ile Pro Thr Leu 1665 1670 1675 1680 Ser Pro Ala Pro Asp Cys Ser Gln Pro Leu Asp Val Ile Leu Leu Leu 1685 1690 1695 Asp Gly Ser Ser Ser Phe Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser 1700 1705 1710 Phe Ala Lys Ala Phe Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr 1715 1720 1725 Gln Val Ser Val Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val Pro 1730 1735 1740 Trp Asn Val Val Pro Glu Lys Ala His Leu Leu Ser Leu Val Asp Val 1745 1750 1755 1760 Met Gln Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe 1765 1770 1775 Ala Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala 1780 1785 1790 Ser Lys Ala Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser Val 1795 1800 1805 Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val Phe Pro 1810 1815 1820 Ile Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg Ile Leu Ala 1825 1830 1835 1840 Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln Arg Ile Glu Asp 1845 1850 1855 Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe Leu His Lys Leu Cys 1860 1865 1870 Ser Gly Phe Val Arg Ile Cys Met Asp Glu Asp Gly Asn Glu Lys Arg 1875 1880 1885 Pro Gly Asp Val Trp Thr Leu Pro Asp Gln Cys His Thr Val Thr Cys 1890 1895 1900 Gln Pro Asp Gly Gln Thr Leu Leu Lys Ser His Arg Val Asn Cys Asp 1905 1910 1915 1920 Arg Gly Leu Arg Pro Ser Cys Pro Asn Ser Gln Ser Pro Val Lys Val 1925 1930 1935 Glu Glu Thr Cys Gly Cys Arg Trp Thr Cys Pro Cys Val Cys Thr Gly 1940 1945 1950 Ser Ser Thr Arg His Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu 1955 1960 1965 Thr Gly Ser Cys Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp Leu 1970 1975 1980 Glu Val Ile Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly 1985 1990 1995 2000 Cys Met Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser Val Glu Xaa 2005 2010 2015 His Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro 2020 2025 2030 Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met His 2035 2040 2045 Glu Val Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr Pro Gln 2050 2055 2060 Asn Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe Ala Ser Lys 2065 2070 2075 2080 Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly Ala Asn Asp Phe 2085 2090 2095 Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp Lys Thr Leu Val Gln 2100 2105 2110 Glu Trp Thr Val Gln Arg Pro Gly Gln Thr Cys Gln Pro Ile Leu Glu 2115 2120 2125 Glu Gln Cys Leu Val Pro Asp Ser Ser His Cys Gln Val Leu Leu Leu 2130 2135 2140 Pro Leu Phe Ala Glu Cys His Lys Val Leu Ala Pro Ala Thr Phe Tyr 2145 2150 2155 2160 Ala Ile Cys Gln Gln Asp Ser Cys His Gln Glu Gln Val Cys Glu Val 2165 2170 2175 Ile Ala Ser Tyr Ala His Leu Cys Arg Thr Asn Gly Val Cys Val Asp 2180 2185 2190 Trp Arg Thr Pro Asp Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val 2195 2200 2205 Tyr Asn His Cys Glu His Gly Cys Pro Arg His Cys Asp Gly Asn Val 2210 2215 2220 Ser Ser Cys Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp 2225 2230 2235 2240 Lys Val Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln 2245 2250 2255 Cys Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val 2260 2265 2270 Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg Lys 2275 2280 2285 Val Asn Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro Thr Cys 2290 2295 2300 Gly Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp Gln Cys Cys 2305 2310 2315 2320 Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys Asp Leu Pro Pro 2325 2330 2335 Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr Leu Thr Asn Pro Gly 2340 2345 2350 Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys Arg Lys Glu Glu Cys Lys 2355 2360 2365 Arg Val Ser Pro Pro Ser Cys Pro Pro His Arg Leu Pro Thr Leu Arg 2370 2375 2380 Lys Thr Gln Cys Cys Asp Glu Tyr Glu Cys Ala Cys Asn Cys Val Asn 2385 2390 2395 2400 Ser Thr Val Ser Cys Pro Leu Gly Tyr Leu Ala Ser Thr Ala Thr Asn 2405 2410 2415 Asp Cys Gly Cys Thr Thr Thr Thr Cys Leu Pro Asp Lys Val Cys Val 2420 2425 2430 His Arg Ser Thr Ile Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys 2435 2440 2445 Asp Val Cys Thr Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu Arg 2450 2455 2460 Val Ala Gln Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly 2465 2470 2475 2480 Phe Thr Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro 2485 2490 2495 Ser Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser 2500 2505 2510 Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro Cys 2515 2520 2525 Leu Ile Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile Gln Gln 2530 2535 2540 Arg Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys Pro Ser Gly 2545 2550 2555 2560 Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro Ser Cys Arg Cys 2565 2570 2575 Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr Val Ile Gly Pro Gly 2580 2585 2590 Lys Thr Val Met Ile Asp Val Cys Thr Thr Cys Arg Cys Met Val Gln 2595 2600 2605 Val Gly Val Ile Ser Gly Phe Lys Leu Glu Cys Arg Lys Thr Thr Cys 2610 2615 2620 Asn Pro Cys Pro Leu Gly Tyr Lys Glu Glu Asn Asn Thr Gly Glu Cys 2625 2630 2635 2640 Cys Gly Arg Cys Leu Pro Thr Ala Cys Thr Ile Gln Leu Arg Gly Gly 2645 2650 2655 Gln Ile Met Thr Leu Lys Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp 2660 2665 2670 Thr His Phe Cys Lys Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys 2675 2680 2685 Arg Val Thr Gly Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala Glu 2690 2695 2700 Gly Gly Lys Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu 2705 2710 2715 2720 Glu Pro Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val 2725 2730 2735 Gly Ser Cys Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly 2740 2745 2750 Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln 2755 2760 2765 Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val 2770 2775 2780 Ala Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn 2785 2790 2795 2800 Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys 2805 2810 <210> 3 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> polypeptide <400> 3 Pro Lys Asn Ser Ser Met Ile Ser Asn Thr Pro 1 5 10 <210> 4 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> polypeptide <400> 4 His Gln Ser Leu Gly Thr Gln 1 5 <210> 5 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> polypeptide <400> 5 His Gln Asn Leu Ser Asp Gly Lys 1 5 <210> 6 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> polypeptide <400> 6 His Gln Asn Ile Ser Asp Gly Lys 1 5 <210> 7 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> polypeptide <400> 7 Val Ile Ser Ser His Leu Gly Gln 1 5 <210> 8 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 8 Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro 1 5 10 15 Ser Ala Pro Ala 20 <210> 9 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 9 Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro 1 5 10 15 Ala Ala Pro Ser 20 <210> 10 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 10 Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala 1 5 10 15 Ser Pro Ser Ser 20 <210> 11 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 11 Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala 1 5 10 15 Ser Pro Ser <210> 12 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 12 Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro 1 5 10 15 Ser Ser Pro Ala 20 <210> 13 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 13 Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro 1 5 10 15 Ala Ala Pro Ser Ala Pro Pro Ala 20 <210> 14 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> PAS sequence <400> 14 Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro 1 5 10 15 Ser Ala Ala Ala 20 <210> 15 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> FVIII signal peptide <400> 15 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser <210> 16 <211> 2332 <212> PRT <213> Homo sapiens <400> 16 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys 965 970 975 Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys 980 985 990 Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala 995 1000 1005 Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn 1010 1015 1020 Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu Phe Lys 1025 1030 1035 1040 Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala 1045 1050 1055 Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys 1060 1065 1070 Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro Asp 1075 1080 1085 Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu Pro Glu 1090 1095 1100 Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser 1105 1110 1115 1120 Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys 1125 1130 1135 Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val 1140 1145 1150 Gly Lys Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe 1155 1160 1165 Pro Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu 1170 1175 1180 Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys 1185 1190 1195 1200 Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr 1205 1210 1215 Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr 1220 1225 1230 Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu 1235 1240 1245 Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His 1250 1255 1260 Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu 1265 1270 1275 1280 Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg 1285 1290 1295 Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys 1300 1305 1310 Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu Glu 1315 1320 1325 Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys Asn Met 1330 1335 1340 Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys 1345 1350 1355 1360 Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg 1365 1370 1375 Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys 1380 1385 1390 Val Ser Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu 1395 1400 1405 Phe Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys 1410 1415 1420 Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys 1425 1430 1435 1440 Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln 1445 1450 1455 Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr 1460 1465 1470 Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr 1475 1480 1485 Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp 1490 1495 1500 Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu 1505 1510 1515 1520 Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn 1525 1530 1535 Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu 1540 1545 1550 Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp Asp 1555 1560 1565 Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu 1570 1575 1580 Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser 1585 1590 1595 1600 Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly 1605 1610 1615 Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr 1620 1625 1630 Glu Arg Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1635 1640 1645 Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 1650 1655 1660 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr 1665 1670 1675 1680 Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg 1685 1690 1695 His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser 1700 1705 1710 Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1715 1720 1725 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr 1730 1735 1740 Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly 1745 1750 1755 1760 Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg 1765 1770 1775 Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr 1780 1785 1790 Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys 1795 1800 1805 Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala 1810 1815 1820 Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp 1825 1830 1835 1840 Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu 1845 1850 1855 Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr 1860 1865 1870 Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1875 1880 1885 Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1890 1895 1900 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala 1905 1910 1915 1920 Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln 1925 1930 1935 Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn 1940 1945 1950 Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1955 1960 1965 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu 1970 1975 1980 Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys 1985 1990 1995 2000 Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val 2005 2010 2015 Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile 2020 2025 2030 Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro 2035 2040 2045 Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr 2050 2055 2060 Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile 2065 2070 2075 2080 Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu 2085 2090 2095 Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 2100 2105 2110 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 2115 2120 2125 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 2130 2135 2140 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser 2145 2150 2155 2160 Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met 2165 2170 2175 Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala 2180 2185 2190 Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 2195 2200 2205 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn 2210 2215 2220 Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val 2225 2230 2235 2240 Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr 2245 2250 2255 Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr 2260 2265 2270 Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp 2275 2280 2285 Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg 2290 2295 2300 Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg 2305 2310 2315 2320 Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 2325 2330 <210> 17 <211> 7053 <212> DNA <213> Homo sapiens <400> 17 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60 accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120 ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180 acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240 gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300 gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360 ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420 gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480 aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540 gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600 gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660 tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720 gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780 ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840 accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900 cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960 gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020 gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080 gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140 gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200 tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260 cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320 aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380 attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440 ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500 gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560 ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620 actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680 gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740 agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800 aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860 cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920 tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980 attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040 atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100 atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160 atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220 agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280 ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340 ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400 atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460 gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520 cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580 catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640 aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700 tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760 agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820 tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880 aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940 aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000 gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060 aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120 attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180 gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240 aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300 gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360 ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420 caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480 aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540 ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600 ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660 gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720 aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780 ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840 aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900 aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960 agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020 ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080 aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140 aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200 caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260 atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320 agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380 aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440 ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500 aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560 cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620 gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680 ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740 ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800 tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860 aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920 atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980 gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040 attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100 gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160 gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220 gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280 tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340 tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400 ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460 cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520 catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580 gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640 acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700 atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760 ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820 aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880 tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940 gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000 gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060 attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120 cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180 caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240 tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300 cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360 atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420 accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480 cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540 cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600 agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660 acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720 caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780 ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840 atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900 gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960 ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020 gaggttctgg gctgcgaggc acaggacctc tac 7053 <210> 18 <211> 1438 <212> PRT <213> Artificial Sequence <220> <223> BDD FVIII <400> 18 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His 740 745 750 Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile 755 760 765 Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp 770 775 780 Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 785 790 795 800 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly 805 810 815 Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser 820 825 830 Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser 835 840 845 Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 850 855 860 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr 865 870 875 880 Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile 885 890 895 Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe 900 905 910 Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His 915 920 925 Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe 930 935 940 Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro 945 950 955 960 Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln 965 970 975 Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr 980 985 990 Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro 995 1000 1005 Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe 1010 1015 1020 His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met 1025 1030 1035 1040 Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn 1045 1050 1055 Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg 1060 1065 1070 Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val 1075 1080 1085 Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val 1090 1095 1100 Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe 1105 1110 1115 1120 Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly 1125 1130 1135 His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp 1140 1145 1150 Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp 1155 1160 1165 Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro 1170 1175 1180 Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser 1185 1190 1195 1200 Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys 1205 1210 1215 Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe 1220 1225 1230 Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro 1235 1240 1245 Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile 1250 1255 1260 Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys 1265 1270 1275 1280 Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile 1285 1290 1295 Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser 1300 1305 1310 Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln 1315 1320 1325 Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met 1330 1335 1340 Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser 1345 1350 1355 1360 Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln 1365 1370 1375 Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn 1380 1385 1390 Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu 1395 1400 1405 Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala 1410 1415 1420 Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1425 1430 1435 <210> 19 <211> 4371 <212> DNA <213> Artificial Sequence <220> <223> BDD FVIII <400> 19 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60 accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120 ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180 acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240 gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300 gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360 ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420 gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480 aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540 gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600 gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660 tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720 gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780 ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840 accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900 cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960 gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020 gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080 gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140 gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200 tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260 cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320 aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380 attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440 ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500 gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560 ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620 actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680 gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740 agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800 aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860 cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920 tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980 attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040 atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100 atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160 atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220 agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280 ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340 cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400 gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460 cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520 catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580 caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640 ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700 agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760 cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820 ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880 gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940 ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000 tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060 gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120 tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180 caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240 attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300 tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360 tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420 gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480 cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540 tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600 ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660 ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720 cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780 aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840 tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900 atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960 tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020 agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080 aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140 tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200 cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260 tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320 cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371 <210> 20 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 20 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 50 55 60 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 85 90 95 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 100 105 110 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 145 150 155 160 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 165 170 175 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 180 185 190 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 195 200 205 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 210 215 220 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 225 230 235 240 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 245 250 255 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 275 280 285 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 290 295 300 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 305 310 315 320 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 325 330 335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 340 345 350 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 355 360 365 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 370 375 380 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 385 390 395 400 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 405 410 415 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 420 425 430 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 435 440 445 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 450 455 460 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 465 470 475 480 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 485 490 495 Gly Gly Gly Ser 500 <210> 21 <211> 800 <212> PRT <213> Artificial Sequence <220> <223> linker <220> <221> REPEAT <222> (1)..(300) <223> Gly-Gly-Ser repeats 1 to 100 times <220> <221> REPEAT <222> (301)..(800) <223> Gly-Gly-Gly-Gly-Ser repeats 1 to 100 times <400> 21 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 1 5 10 15 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 20 25 30 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 35 40 45 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 50 55 60 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 65 70 75 80 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 85 90 95 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 100 105 110 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 115 120 125 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 130 135 140 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 145 150 155 160 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 165 170 175 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 180 185 190 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 195 200 205 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 210 215 220 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 225 230 235 240 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 245 250 255 Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 260 265 270 Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 275 280 285 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly 290 295 300 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 305 310 315 320 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 325 330 335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 340 345 350 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 355 360 365 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 370 375 380 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 385 390 395 400 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 405 410 415 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 420 425 430 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 435 440 445 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 450 455 460 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 465 470 475 480 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 485 490 495 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 500 505 510 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 515 520 525 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 530 535 540 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 545 550 555 560 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 565 570 575 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 580 585 590 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 595 600 605 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 610 615 620 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 625 630 635 640 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 645 650 655 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 660 665 670 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 675 680 685 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 690 695 700 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 705 710 715 720 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 725 730 735 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 740 745 750 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 755 760 765 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 770 775 780 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 785 790 795 800 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 22 Ser Gly Gly Ser Gly Gly Ser 1 5 <210> 23 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 23 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly 1 5 10 15 <210> 24 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 24 Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 25 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 25 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 1 5 10 15 Gly Ser <210> 26 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> linker <220> <221> REPEAT <222> (1)..(15) <223> Gly-Gly-Gly-Gly-Ser repeats 1 to 3 times <400> 26 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 27 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> linker <220> <221> REPEAT <222> (1)..(100) <223> Gly-Gly-Gly-Gly-Ser repeats 1 to 20 times <400> 27 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 50 55 60 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 85 90 95 Gly Gly Gly Ser 100 <210> 28 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> linker <220> <221> REPEAT <222> (1)..(15) <223> Gly-Gly-Gly-Gly-Ser is repeated 1 to 3 times <400> 28 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 29 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FXIa cleavage site <400> 29 Lys Leu Thr Arg Ala Glu Thr 1 5 <210> 30 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FXIa cleavage site <400> 30 Asp Phe Thr Arg Val Val Gly 1 5 <210> 31 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FXIIa cleavage site <400> 31 Thr Met Thr Arg Ile Val Gly Gly 1 5 <210> 32 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> Kallikrein cleavage site <400> 32 Ser Pro Phe Arg Ser Thr Gly Gly 1 5 <210> 33 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FVIIa cleavage site <400> 33 Leu Gln Val Arg Ile Val Gly Gly 1 5 <210> 34 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FIXa cleavage site <400> 34 Pro Leu Gly Arg Ile Val Gly Gly 1 5 <210> 35 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FXa cleavage site <400> 35 Ile Glu Gly Arg Thr Val Gly Gly 1 5 <210> 36 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> FIIa (thrombin) cleavage site <400> 36 Leu Thr Pro Arg Ser Leu Leu Val 1 5 <210> 37 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> Elastase-2 cleavage site <400> 37 Leu Gly Pro Val Ser Gly Val Pro 1 5 <210> 38 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> Granzyme-B cleavage site <400> 38 Val Ala Gly Asp Ser Leu Glu Glu 1 5 <210> 39 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> MMP-12 cleavage site <400> 39 Gly Pro Ala Gly Leu Gly Gly Ala 1 5 <210> 40 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> MMP-13 cleavage site <400> 40 Gly Pro Ala Gly Leu Arg Gly Ala 1 5 <210> 41 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> MMP-17 cleavage site <400> 41 Ala Pro Leu Gly Leu Arg Leu Arg 1 5 <210> 42 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> MMP-20 cleavage site <400> 42 Pro Ala Leu Pro Leu Val Ala Gln 1 5 <210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (6)..(7) <223> TEV cleavage site <400> 43 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 44 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> Enterokinase cleavage site <400> 44 Asp Asp Asp Lys Ile Val Gly Gly 1 5 <210> 45 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (6)..(7) <223> Protease C (PRESCISSION) cleavage site <400> 45 Leu Glu Val Leu Phe Gln Gly Pro 1 5 <210> 46 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <220> <221> SITE <222> (4)..(5) <223> Sortase A <400> 46 Leu Pro Lys Thr Gly Ser Glu Ser 1 5 <210> 47 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> cleavable linker <400> 47 Thr Gln Ser Phe Asn Asp Phe Thr Arg 1 5 <210> 48 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 48 Ser Val Ser Gln Thr Ser Lys Leu Thr Arg 1 5 10 <210> 49 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 49 Asp Phe Leu Ala Glu Gly Gly Gly Val Arg 1 5 10 <210> 50 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 50 Thr Thr Lys Ile Lys Pro Arg 1 5 <210> 51 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 51 Ala Leu Arg Pro Arg Val Val Gly Gly Ala 1 5 10 <210> 52 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 52 Arg Arg Arg Arg 1 <210> 53 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 53 Arg Lys Arg Arg Lys Arg 1 5 <210> 54 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 54 Arg Arg Arg Arg Ser 1 5 <210> 55 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 55 Leu Val Pro Arg Gly 1 5 <210> 56 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> cleavage and linker site <400> 56 Thr Leu Asp Pro Arg Ser Phe Leu Leu Arg Asn Pro Asn Asp Lys Tyr 1 5 10 15 Glu Pro Phe Trp Glu Asp Glu Glu Lys 20 25 <210> 57 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> ESC48-Fwd-VWF-D'D3 with VIII signal and BsiW1 site for pSYN VWF-001 <400> 57 tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60 ttgcgattct gctttagcct atcctgtcgg ccccccatg 99 <210> 58 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> ESC50- Rev- VWF- partial D'D3 (1-276 amino acid) with 6 His and Not1 site for pSYN VWF- 001 <400> 58 tgacctcgag cggccgctca gtggtgatgg tgatgatgca gaggcacttt tctggtgtca 60 gcacactg 68 <210> 59 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> ESC48- Fwd - VWF-D'D3 with VIII signal and BsiW1 site for pSYN VWF- 002 <400> 59 tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60 ttgcgattct gctttagcct atcctgtcgg ccccccatg 99 <210> 60 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> ESC51- Rev- VWF D'D3 (1-477 amino acid) with 6His and Not 1 site for pSYN VWF- 002 <400> 60 tgacctcgag cggccgctca gtggtgatgg tgatgatgcc tgctgcagta gaaatcgtgc 60 aacggcggtt c 71 <210> 61 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> ESC48- Fwd - VWF-D'D3 with VIII signal and BsiW1 site for pSYN VWF- 003 <400> 61 tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60 ttgcgattct gctttagcct atcctgtcgg ccccccatg 99 <210> 62 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> ESC52- Rev-VWF-D'D3 Partial A1 (1-511 amino acids) with 6His and Not1 site for pSYN VWF- 003 <400> 62 tgacctcgag cggccgctca gtggtgatgg tgatgatggc ccacagtgac ttgtgccatg 60 tgggg 65 <210> 63 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> ESC48- Fwd - VWF-D'D3 with VIII signal and BsiW1 site for pSYN VWF- 004 <400> 63 tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60 ttgcgattct gctttagcct atcctgtcgg ccccccatg 99 <210> 64 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> ESC53-Rev- VWF-D'D3A1 (1-716 amino acids) with 6His and Not1 site for pSYN VWF- 004 <400> 64 tgacctcgag cggccgctca gtggtgatgg tgatgatggc ccacagtgac ttgtgccatg 60 tgggg 65 <210> 65 <211> 1313 <212> DNA <213> Artificial Sequence <220> <223> cloned vector <400> 65 ggatcctagt ggggaataag ggatgcagcc acccctcagt gaaatgcaag aaacgggtca 60 ccatcctggt ggagggagga gagattgagc tgtttgacgg ggaggtgaat gtgaagaggc 120 ccatgaagga tgagactcac tttgaggtgg tggagtctgg ccggtacatc attctgctgc 180 tgggcaaagc cctctccgtg gtctgggacc gccacctgag catctccgtg gtcctgaagc 240 agacatacca ggagaaagtg tgtggcctgt gtgggaattt tgatggcatc cagaacaatg 300 acctcaccag cagcaacctc caagtggagg aagaccctgt ggactttggg aactcctgga 360 aagtgagctc gcagtgtgct gacaccagaa aagtgcctct ggactcatcc cctgccacct 420 gccataacaa catcatgaag cagacgatgg tggattcctc ctgtagaatc cttaccagtg 480 acgtcttcca ggactgcaac aagctggtgg accccgagcc atatctggat gtctgcattt 540 acgacacctg ctcctgtgag tccattgggg actgcgcctg cttctgcgac accattgctg 600 cctatgccca cgtgtgtgcc cagcatggca aggtggtgac ctggaggacg gccacattgt 660 gcccccagag ctgcgaggag aggaatctcc gggagaacgg gtatgagtgt gagtggcgct 720 ataacagctg tgcacctgcc tgtcaagtca cgtgtcagca ccctgagcca ctggcctgcc 780 ctgtgcagtg tgtggagggc tgccatgccc actgccctcc agggaaaatc ctggatgagc 840 ttttgcagac ctgcgttgac cctgaagact gtccagtgtg tgaggtggct ggccggcgtt 900 ttgcctcagg aaagaaagtc accttgaatc ccagtgaccc tgagcactgc cagatttgcc 960 actgtgatgt tgtcaacctc acctgtgaag cctgccagga gccgggaggc ctggtggtgc 1020 ctcccacaga tgccccggtg agccccacca ctctgtatgt ggatgagacg ctccaggatg 1080 gctgtgatac tcacttctgc aaggtcaatg agagaggaga gtacttctgg gagaagaggg 1140 tcacaggctg cccacccttt gatgaacaca agtgtcttgc tgagggaggt aaaattatga 1200 aaattccagg cacctgctgt gacacatgtg aggagcctga gtgcaacgac atcactgcca 1260 ggctgcagta tgtcaaggtg ggaagctgta agtctgaagt agaggtggat atc 1313 <210> 66 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> ESC 89-fwd with Nhe1site <400> 66 ctcactatag ggagacccaa gctggctagc cg 32 <210> 67 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> ESC 91-rev with Sal1 <400> 67 ctggatcccg ggagtcgact cgtcagtggt gatggtgatg atg 43 <210> 68 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> LW 22-FWD-VWF-D'D3 with FVIII signal sequence and BsiW1 site <400> 68 gcgccggccg tacgatgcaa atagagctct ccacctgctt ctttctgtgc cttttgcgat 60 tctgctttag cctatcctgt cggcccccca tg 92 <210> 69 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> LW 23-Rev- Fc with stop codon and Not1 site <400> 69 tcatcaatgt atcttatcat gtctgaattc gcggccgctc atttacc 47 <210> 70 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> LW24- Fwd- VWF D1D2D'D3 cloning oligo with BsiW1 site <400> 70 gcgccggccg tacgatgatt cctgccagat ttgccggggt g 41 <210> 71 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> LW27-Rev-VWF D'D3 oligo with EcoRV <400> 71 ccaccgccag atatcggctc ctggcaggct tcacaggtga g 41 <210> 72 <211> 1240 <212> PRT <213> Artificial Sequence <220> <223> VWF-D1D2D'D3 <400> 72 Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile 1 5 10 15 Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr 20 25 30 Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly 35 40 45 Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly 50 55 60 Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys 65 70 75 80 Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu 85 90 95 Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro 100 105 110 Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys 115 120 125 Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly 130 135 140 Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly 145 150 155 160 Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln 165 170 175 Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala 180 185 190 Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser 195 200 205 Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln 210 215 220 Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu 225 230 235 240 Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu 245 250 255 Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala 260 265 270 Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His 275 280 285 Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys 290 295 300 Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met 305 310 315 320 Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu 325 330 335 Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His 340 345 350 Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn 355 360 365 Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys 370 375 380 Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp 385 390 395 400 Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg 405 410 415 Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys 420 425 430 Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu 435 440 445 Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val 450 455 460 Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu 465 470 475 480 Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu 485 490 495 Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu 500 505 510 Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn 515 520 525 Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro 530 535 540 Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln 545 550 555 560 Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met 565 570 575 Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe 580 585 590 Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys 595 600 605 Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly 610 615 620 Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val 625 630 635 640 Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln 645 650 655 Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu 660 665 670 Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe 675 680 685 Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys 690 695 700 Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp 705 710 715 720 Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met 725 730 735 His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val 740 745 750 Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg 755 760 765 Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu 770 775 780 Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met 785 790 795 800 Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg 805 810 815 His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln 820 825 830 Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr 835 840 845 Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp 850 855 860 Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly 865 870 875 880 Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp 885 890 895 Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys 900 905 910 Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu 915 920 925 Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys 930 935 940 Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg 945 950 955 960 Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg 965 970 975 His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val 980 985 990 Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr 995 1000 1005 Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser 1010 1015 1020 Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp 1025 1030 1035 1040 Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val 1045 1050 1055 Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn 1060 1065 1070 Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr 1075 1080 1085 Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile 1090 1095 1100 Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val Thr Trp 1105 1110 1115 1120 Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg 1125 1130 1135 Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala 1140 1145 1150 Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln 1155 1160 1165 Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly Lys Ile Leu Asp 1170 1175 1180 Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu 1185 1190 1195 1200 Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro 1205 1210 1215 Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu 1220 1225 1230 Thr Cys Glu Ala Cys Gln Glu Pro 1235 1240 <210> 73 <211> 477 <212> PRT <213> Artificial Sequence <220> <223> VWF-D'D3 <400> 73 Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp 1 5 10 15 Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr 20 25 30 Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro 35 40 45 Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys 50 55 60 Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys 65 70 75 80 Ile Gly Cys Asn Thr Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr 85 90 95 Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr 100 105 110 Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr 115 120 125 Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile 130 135 140 Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys 145 150 155 160 Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly 165 170 175 Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val 180 185 190 Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser 195 200 205 Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr 210 215 220 Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln 225 230 235 240 Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val 245 250 255 Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg 260 265 270 Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met 275 280 285 Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val 290 295 300 Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val 305 310 315 320 Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys 325 330 335 Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly 340 345 350 Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu 355 360 365 Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn 370 375 380 Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu 385 390 395 400 Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro 405 410 415 Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp 420 425 430 Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys 435 440 445 Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys 450 455 460 Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro 465 470 475 <210> 74 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> VWF-D'D3 domain (1-477aa; C336A/C379A mutation) <220> <221> REPEAT <222> (1)..(30) <223> Gly-Gly-Gly-Gly-Ser repeats 6 times <400> 74 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 <210> 75 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 75 Arg Arg Arg Arg Ser 1 5 <210> 76 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 76 Arg Lys Arg Arg Lys Arg 1 5 <210> 77 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> ESC17-Fwd- VWF cloning oligo with Cla1 <400> 77 gtccggcatg agaatcgatg tgtg 24 <210> 78 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> ESC41- Rev-VWF with EcoRV <400> 78 cctccaccgc cagatatcag aggcactttt c 31 <210> 79 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> ESC78- Fwd with EcoRV site <400> 79 aaagtgcctc tgatatctgg cggtggaggt tccggtggcg ggggatccgg tggcggggga 60 tccggtggcg ggggatccgg tggcggggga tccctggtcc cccgg 105 <210> 80 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> ESC79- Rev with RsRII site <400> 80 gaagaggaag actgacggtc cgcccaggag ttctggagct gggcacggtg ggcatgtgtg 60 agttttgtcg cctccgctgc cccgggggac cagggatccc ccgccac 107 <210> 81 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 81 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 <210> 82 <211> 1781 <212> DNA <213> Artificial Sequence <220> <223> pSYN-FVIII-049, which is FVIII-Fc construct with a cleavable linker in between two Fc domains; Genscript-Sequence number 103069 <400> 82 ccgtcgacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg atgcatgagg 60 ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa cggcgccgcc 120 ggagcggtgg cggcggatca ggtgggggtg gatcaggcgg tggaggttcc ggtggcgggg 180 gatccggcgg tggaggttcc ggtgggggtg gatcaaggaa gaggaggaag agaagcctat 240 cctgtcggcc ccccatggtc aagctggtgt gtcccgctga caacctgcgg gctgaagggc 300 tcgagtgtac caaaacgtgc cagaactatg acctggagtg catgagcatg ggctgtgtct 360 ctggctgcct ctgccccccg ggcatggtcc ggcatgagaa tcgatgtgtg gccctggaaa 420 ggtgtccctg cttccatcag ggcaaggagt atgcccctgg agaaacagtg aagattggct 480 gcaacacttg tgtctgtcgg gaccggaagt ggaactgcac agaccatgtg tgtgatgcca 540 cgtgctccac gatcggcatg gcccactacc tcaccttcga cgggctcaaa tacctgttcc 600 ccggggagtg ccagtacgtt ctggtgcagg attactgcgg cagtaaccct gggacctttc 660 ggatcctagt ggggaataag ggatgcagcc acccctcagt gaaatgcaag aaacgggtca 720 ccatcctggt ggagggagga gagattgagc tgtttgacgg ggaggtgaat gtgaagaggc 780 ccatgaagga tgagactcac tttgaggtgg tggagtctgg ccggtacatc attctgctgc 840 tgggcaaagc cctctccgtg gtctgggacc gccacctgag catctccgtg gtcctgaagc 900 agacatacca ggagaaagtg tgtggcctgt gtgggaattt tgatggcatc cagaacaatg 960 acctcaccag cagcaacctc caagtggagg aagaccctgt ggactttggg aactcctgga 1020 aagtgagctc gcagtgtgct gacaccagaa aagtgcctct ggactcatcc cctgccacct 1080 gccataacaa catcatgaag cagacgatgg tggattcctc ctgtagaatc cttaccagtg 1140 acgtcttcca ggactgcaac aagctggtgg accccgagcc atatctggat gtctgcattt 1200 acgacacctg ctcctgtgag tccattgggg actgcgccgc attctgcgac accattgctg 1260 cctatgccca cgtgtgtgcc cagcatggca aggtggtgac ctggaggacg gccacattgt 1320 gcccccagag ctgcgaggag aggaatctcc gggagaacgg gtatgaggct gagtggcgct 1380 ataacagctg tgcacctgcc tgtcaagtca cgtgtcagca ccctgagcca ctggcctgcc 1440 ctgtgcagtg tgtggagggc tgccatgccc actgccctcc agggaaaatc ctggatgagc 1500 ttttgcagac ctgcgttgac cctgaagact gtccagtgtg tgaggtggct ggccggcgtt 1560 ttgcctcagg aaagaaagtc accttgaatc ccagtgaccc tgagcactgc cagatttgcc 1620 actgtgatgt tgtcaacctc acctgtgaag cctgccagga gccgatcgat ggcggtggag 1680 gttccggtgg cgggggatcc ctggtccccc ggggcagcgg aggcgacaaa actcacacat 1740 gcccaccgtg cccagctcca gaactcctgg gcggaccgtc a 1781 <210> 83 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> A fragment of the Genscript construct was sub cloned into the EcoRV/RsRII digested pSYN-FVIII-0159; Genscript-Sequence no-132601 <400> 83 aaagtgcctc tgatatctgg cggtggaggt tccggtggcg ggggatccgg cggtggaggt 60 tccggcggtg gaggttccgg tggcggggga tccggtggcg ggggatccct ggtcccccgg 120 ggcagcggcg gtggaggttc cggtggcggg ggatccgaca aaactcacac atgcccaccg 180 tgcccagctc cagaactcct gggcggaccg tcagtcttcc 220 <210> 84 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> pSYN-VIII-178 has a 73 amino acids linker in between the VWF fragment and the Fc region; synthesis of DNA fragment coding for 73 amino acids linker <400> 84 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly 50 55 60 Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 <210> 85 <211> 299 <212> DNA <213> Artificial Sequence <220> <223> Genscript-Sequence #-144849 <400> 85 gcctgccagg agccgatatc tggcggtgga ggttccggtg gcgggggatc cggcggtgga 60 ggttccggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggtggcggg 120 ggatccggcg gtggaggttc cggcggtgga ggttccggtg gcgggggatc cggtggcggg 180 ggatccctgg tcccccgggg cagcggcggt ggaggttccg gtggcggggg atccgacaaa 240 actcacacat gcccccgtgc ccagctccag aactcctggg cggaccgtca gtcttcctc 299 <210> 86 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 86 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 50 55 60 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 65 70 75 80 Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 85 90 95 Gly Ser <210> 87 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> Genscript-Sequence #-144849 <400> 87 gcctgccagg agccgatatc tggcggtgga ggttccggtg gcgggggatc cggcggtgga 60 ggttccggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggtggcggg 120 ggatccggcg gtggaggttc cggcggtgga ggttccggtg gcgggggatc cggcggtgga 180 ggttccggtg gcgggggatc cggcggtgga ggttccggcg gtggaggttc cggtggcggg 240 ggatccggtg gcgggggatc cctggtcccc cggggcagcg gcggtggagg ttccggtggc 300 gggggatccg acaaaactca cacatgccca ccgtgcccag ctccagaact cctgggcgga 360 ccgtcagtct tcctcttccc 380 <210> 88 <211> 2449 <212> PRT <213> Artificial Sequence <220> <223> FVIII-VWF-Fc heterodimer <400> 88 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu 755 760 765 Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln 770 775 780 Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu 785 790 795 800 Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe 805 810 815 Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp 820 825 830 Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln 835 840 845 Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 850 855 860 Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His 865 870 875 880 Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile 885 890 895 Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser 900 905 910 Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg 915 920 925 Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val 930 935 940 Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp 945 950 955 960 Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu 965 970 975 Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His 980 985 990 Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe 995 1000 1005 Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys 1010 1015 1020 Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn 1025 1030 1035 1040 Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly 1045 1050 1055 Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met 1060 1065 1070 Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe 1075 1080 1085 Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr 1090 1095 1100 Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile 1105 1110 1115 1120 Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser 1125 1130 1135 Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met 1140 1145 1150 Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr 1155 1160 1165 Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile 1170 1175 1180 Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu 1185 1190 1195 1200 Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln 1205 1210 1215 Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu 1220 1225 1230 Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu 1235 1240 1245 Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile 1250 1255 1260 Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His 1265 1270 1275 1280 Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu 1285 1290 1295 Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp 1300 1305 1310 Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp 1315 1320 1325 Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp 1330 1335 1340 Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln 1345 1350 1355 1360 Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu 1365 1370 1375 Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp 1380 1385 1390 Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe 1395 1400 1405 Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro 1410 1415 1420 Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His 1425 1430 1435 1440 Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu 1445 1450 1455 Tyr Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu 1460 1465 1470 Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu 1475 1480 1485 Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser 1490 1495 1500 His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu 1505 1510 1515 1520 Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr 1525 1530 1535 Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn 1540 1545 1550 Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro 1555 1560 1565 Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln 1570 1575 1580 Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val 1585 1590 1595 1600 Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val 1605 1610 1615 Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro 1620 1625 1630 Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr 1635 1640 1645 Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val 1650 1655 1660 Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu 1665 1670 1675 1680 Ser Pro Gly Lys Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly 1685 1690 1695 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 1700 1705 1710 Gly Ser Gly Gly Gly Gly Ser Arg Lys Arg Arg Lys Arg Ser Leu Ser 1715 1720 1725 Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg 1730 1735 1740 Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu 1745 1750 1755 1760 Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met 1765 1770 1775 Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe 1780 1785 1790 His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys 1795 1800 1805 Asn Thr Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val 1810 1815 1820 Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe 1825 1830 1835 1840 Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val 1845 1850 1855 Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly 1860 1865 1870 Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr 1875 1880 1885 Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn 1890 1895 1900 Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser 1905 1910 1915 1920 Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp 1925 1930 1935 Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu 1940 1945 1950 Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp 1955 1960 1965 Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly 1970 1975 1980 Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro 1985 1990 1995 2000 Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr 2005 2010 2015 Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp 2020 2025 2030 Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr 2035 2040 2045 Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Ala Phe Cys Asp 2050 2055 2060 Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val 2065 2070 2075 2080 Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn 2085 2090 2095 Leu Arg Glu Asn Gly Tyr Glu Ala Glu Trp Arg Tyr Asn Ser Cys Ala 2100 2105 2110 Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys Pro 2115 2120 2125 Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly Lys Ile 2130 2135 2140 Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val 2145 2150 2155 2160 Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu 2165 2170 2175 Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val 2180 2185 2190 Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Ile Asp Gly Gly Gly Gly 2195 2200 2205 Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Asp Lys 2210 2215 2220 Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro 2225 2230 2235 2240 Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser 2245 2250 2255 Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp 2260 2265 2270 Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn 2275 2280 2285 Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val 2290 2295 2300 Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu 2305 2310 2315 2320 Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys 2325 2330 2335 Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr 2340 2345 2350 Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr 2355 2360 2365 Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu 2370 2375 2380 Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu 2385 2390 2395 2400 Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys 2405 2410 2415 Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu 2420 2425 2430 Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly 2435 2440 2445 Lys <210> 89 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> a 48-amino acid linker <400> 89 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 <210> 90 <211> 1665 <212> PRT <213> Artificial Sequence <220> <223> pSYN-FVIII-155 mature protein <400> 90 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Ala His 740 745 750 Gln Ala Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile 755 760 765 Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp 770 775 780 Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 785 790 795 800 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly 805 810 815 Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser 820 825 830 Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser 835 840 845 Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu 850 855 860 Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr 865 870 875 880 Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile 885 890 895 Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe 900 905 910 Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His 915 920 925 Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe 930 935 940 Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro 945 950 955 960 Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln 965 970 975 Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr 980 985 990 Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro 995 1000 1005 Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe 1010 1015 1020 His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met 1025 1030 1035 1040 Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn 1045 1050 1055 Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg 1060 1065 1070 Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val 1075 1080 1085 Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val 1090 1095 1100 Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe 1105 1110 1115 1120 Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly 1125 1130 1135 His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp 1140 1145 1150 Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp 1155 1160 1165 Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro 1170 1175 1180 Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser 1185 1190 1195 1200 Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys 1205 1210 1215 Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe 1220 1225 1230 Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro 1235 1240 1245 Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile 1250 1255 1260 Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys 1265 1270 1275 1280 Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile 1285 1290 1295 Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser 1300 1305 1310 Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln 1315 1320 1325 Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met 1330 1335 1340 Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser 1345 1350 1355 1360 Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln 1365 1370 1375 Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn 1380 1385 1390 Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu 1395 1400 1405 Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala 1410 1415 1420 Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr Asp Lys 1425 1430 1435 1440 Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro 1445 1450 1455 Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser 1460 1465 1470 Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp 1475 1480 1485 Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn 1490 1495 1500 Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val 1505 1510 1515 1520 Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu 1525 1530 1535 Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys 1540 1545 1550 Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr 1555 1560 1565 Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr 1570 1575 1580 Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu 1585 1590 1595 1600 Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu 1605 1610 1615 Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys 1620 1625 1630 Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu 1635 1640 1645 Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly 1650 1655 1660 Lys 166 <210> 91 <211> 5052 <212> DNA <213> Artificial Sequence <220> <223> pSYN-FVIII-155 <400> 91 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60 accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120 ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180 acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240 gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300 gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360 ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420 gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480 aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540 gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600 gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660 tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720 gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780 ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840 accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900 cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960 gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020 gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080 gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140 gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200 tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260 cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320 aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380 attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440 ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500 gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560 ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620 actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680 gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740 agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800 aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860 cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920 tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980 attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040 atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100 atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160 atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220 agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280 ttctctcaaa acccaccagt cttgaaagcc catcaggcgg aaataactcg tactactctt 2340 cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400 gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460 cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520 catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580 caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640 ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700 agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760 cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820 ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880 gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940 ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000 tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060 gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120 tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180 caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240 attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300 tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360 tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420 gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480 cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540 tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600 ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660 ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720 cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780 aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840 tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900 atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960 tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020 agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080 aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140 tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200 cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260 tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320 cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact 4380 cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc 4440 cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg 4500 gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag 4560 gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc 4620 agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc 4680 tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc 4740 cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc 4800 agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc 4860 aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc 4920 ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc 4980 tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg 5040 tctccgggta aa 5052 <210> 92 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> GFVIII-159 <400> 92 Ile Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg 1 5 10 15 Gly Ser Gly <210> 93 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> GFVIII-160 <400> 93 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly 20 25 30 Ser Gly <210> 94 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> FVIII-064 <400> 94 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 <210> 95 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> VWF031 <400> 95 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 <210> 96 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> VWF035 <400> 96 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly 50 55 60 Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 <210> 97 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> VWF036 <400> 97 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 50 55 60 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 65 70 75 80 Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 85 90 95 Gly Ser <210> 98 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> pSYN-VWF-051 linker <400> 98 Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 Leu Pro Glu Thr Gly Ala Leu Arg Pro Arg Val Val Gly Gly Gly Gly 35 40 45 Ser Gly Gly Gly Gly Ser 50 <210> 99 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> Genewiz-Sequence no-10-210746313 <400> 99 aggagccgat atctggcggt ggaggttccg gtggcggggg atccggcggt ggaggttccg 60 gcggtggagg ttccggtggc gggggatccg gtggcggggg atccttacct gaaactggag 120 ccctgcggcc ccgggtcgtc ggcggtggag gttccggtgg cgggggatcc gacaaaactc 180 acacatgccc accgtgccca gctccagaac tcctgggcgg accgtcagtc tt 232 <210> 100 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> pSYN-VWF051 <400> 100 atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60 ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120 gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180 ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240 agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300 accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360 gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420 gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480 ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540 acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600 gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660 ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720 gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780 ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840 gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900 tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960 tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020 ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080 acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140 aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200 aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260 cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320 acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380 ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440 cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500 gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560 tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620 ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680 gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740 gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800 ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860 tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920 gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980 tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040 gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100 tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160 atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220 agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280 agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340 ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400 agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460 tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520 acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580 catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640 ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700 aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760 tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820 gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880 tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940 tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000 ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060 tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120 tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180 agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240 ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300 tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360 aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420 gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480 gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540 aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600 gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660 cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720 atatctggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggcggtgga 3780 ggttccggtg gcgggggatc cggtggcggg ggatccttac ctgaaactgg agccctgcgg 3840 ccccgggtcg tcggcggtgg aggttccggt ggcgggggat ccgacaaaac tcacacatgc 3900 ccaccgtgcc cagctccaga actcctgggc ggaccgtcag tcttcctctt ccccccaaaa 3960 cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 4020 agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 4080 gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 4140 accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 4200 gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 4260 caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 4320 tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 4380 ccggagaaca actacaagac cacgcctccc gtgttggact ccgacggctc cttcttcctc 4440 tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 4500 gtgatgcatg aggctctgca caaccactac acgcagaaga gcctctccct gtctccgggt 4560 aaatga 4566 <210> 101 <211> 1521 <212> PRT <213> Artificial Sequence <220> <223> VWF051 <400> 101 Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile 1 5 10 15 Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr 20 25 30 Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly 35 40 45 Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly 50 55 60 Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys 65 70 75 80 Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu 85 90 95 Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro 100 105 110 Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys 115 120 125 Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly 130 135 140 Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly 145 150 155 160 Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln 165 170 175 Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala 180 185 190 Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser 195 200 205 Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln 210 215 220 Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu 225 230 235 240 Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu 245 250 255 Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala 260 265 270 Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His 275 280 285 Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys 290 295 300 Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met 305 310 315 320 Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu 325 330 335 Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His 340 345 350 Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn 355 360 365 Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys 370 375 380 Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp 385 390 395 400 Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg 405 410 415 Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys 420 425 430 Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu 435 440 445 Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val 450 455 460 Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu 465 470 475 480 Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu 485 490 495 Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu 500 505 510 Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn 515 520 525 Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro 530 535 540 Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln 545 550 555 560 Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met 565 570 575 Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe 580 585 590 Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys 595 600 605 Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly 610 615 620 Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val 625 630 635 640 Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln 645 650 655 Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu 660 665 670 Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe 675 680 685 Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys 690 695 700 Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp 705 710 715 720 Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met 725 730 735 His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val 740 745 750 Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg 755 760 765 Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu 770 775 780 Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met 785 790 795 800 Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg 805 810 815 His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln 820 825 830 Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr 835 840 845 Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp 850 855 860 Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly 865 870 875 880 Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp 885 890 895 Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys 900 905 910 Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu 915 920 925 Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys 930 935 940 Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg 945 950 955 960 Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg 965 970 975 His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val 980 985 990 Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr 995 1000 1005 Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser 1010 1015 1020 Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp 1025 1030 1035 1040 Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val 1045 1050 1055 Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn 1060 1065 1070 Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr 1075 1080 1085 Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Ala Phe Cys Asp Thr Ile 1090 1095 1100 Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val Thr Trp 1105 1110 1115 1120 Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg 1125 1130 1135 Glu Asn Gly Tyr Glu Ala Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala 1140 1145 1150 Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln 1155 1160 1165 Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly Lys Ile Leu Asp 1170 1175 1180 Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu 1185 1190 1195 1200 Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro 1205 1210 1215 Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu 1220 1225 1230 Thr Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Gly Gly Gly Ser Gly 1235 1240 1245 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 1250 1255 1260 Gly Gly Ser Gly Gly Gly Gly Ser Leu Pro Glu Thr Gly Ala Leu Arg 1265 1270 1275 1280 Pro Arg Val Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Lys 1285 1290 1295 Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro 1300 1305 1310 Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser 1315 1320 1325 Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp 1330 1335 1340 Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn 1345 1350 1355 1360 Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val 1365 1370 1375 Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu 1380 1385 1390 Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys 1395 1400 1405 Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr 1410 1415 1420 Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr 1425 1430 1435 1440 Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu 1445 1450 1455 Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu 1460 1465 1470 Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys 1475 1480 1485 Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu 1490 1495 1500 Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly 1505 1510 1515 1520 Lys <210> 102 <211> 4389 <212> DNA <213> Artificial Sequence <220> <223> FVIII 265 <400> 102 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgga 60 ggaggaggag gagccaccag aagatactac ctgggtgcag tggaactgtc atgggactat 120 atgcaaagtg atctcggtga gctgcctgtg gacgcaagat ttcctcctag agtgccaaaa 180 tcttttccat tcaacacctc agtcgtgtac aaaaagactc tgtttgtaga attcacggat 240 caccttttca acatcgctaa gccaaggcca ccctggatgg gtctgctagg tcctaccatc 300 caggctgagg tttatgatac agtggtcatt acacttaaga acatggcttc ccatcctgtc 360 agtcttcatg ctgttggtgt atcctactgg aaagcttctg agggagctga atatgatgat 420 cagaccagtc aaagggagaa agaagatgat aaagtcttcc ctggtggaag ccatacatat 480 gtctggcagg tcctgaaaga gaatggtcca atggcctctg acccactgtg ccttacctac 540 tcatatcttt ctcatgtgga cctggtaaaa gacttgaatt caggcctcat tggagcccta 600 ctagtatgta gagaagggag tctggccaag gaaaagacac agaccttgca caaatttata 660 ctactttttg ctgtatttga tgaagggaaa agttggcact cagaaacaaa gaactccttg 720 atgcaggata gggatgctgc atctgctcgg gcctggccta aaatgcacac agtcaatggt 780 tatgtaaaca ggtctctgcc aggtctgatt ggatgccaca ggaaatcagt ctattggcat 840 gtgattggaa tgggcaccac tcctgaagtg cactcaatat tcctcgaagg tcacacattt 900 cttgtgagga accatcgcca ggcgtccttg gaaatctcgc caataacttt ccttactgct 960 caaacactct tgatggacct tggacagttt ctactgtttt gtcatatctc ttcccaccaa 1020 catgatggca tggaagctta tgtcaaagta gacagctgtc cagaggaacc ccaactacga 1080 atgaaaaata atgaagaagc ggaagactat gatgatgatc ttactgattc tgaaatggat 1140 gtggtcaggt ttgatgatga caactctcct tcctttatcc aaattcgctc agttgccaag 1200 aagcatccta aaacttgggt acattacatt gctgctgaag aggaggactg ggactatgct 1260 cccttagtcc tcgcccccga tgacagaagt tataaaagtc aatatttgaa caatggccct 1320 cagcggattg gtaggaagta caaaaaagtc cgatttatgg catacacaga tgaaaccttt 1380 aagactcgtg aagctattca gcatgaatca ggaatcttgg gacctttact ttatggggaa 1440 gttggagaca cactgttgat tatatttaag aatcaagcaa gcagaccata taacatctac 1500 cctcacggaa tcactgatgt ccgtcctttg tattcaagga gattaccaaa aggtgtaaaa 1560 catttgaagg attttccaat tctgccagga gaaatattca aatataaatg gacagtgact 1620 gtagaagatg ggccaactaa atcagatcct cggtgcctga cccgctatta ctctagtttc 1680 gttaatatgg agagagatct agcttcagga ctcattggcc ctctcctcat ctgctacaaa 1740 gaatctgtag atcaaagagg aaaccagata atgtcagaca agaggaatgt catcctgttt 1800 tctgtatttg atgagaaccg aagctggtac ctcacagaga atatacaacg ctttctcccc 1860 aatccagctg gagtgcagct tgaggatcca gagttccaag cctccaacat catgcacagc 1920 atcaatggct atgtttttga tagtttgcag ttgtcagttt gtttgcatga ggtggcatac 1980 tggtacattc taagcattgg agcacagact gacttccttt ctgtcttctt ctctggatat 2040 accttcaaac acaaaatggt ctatgaagac acactcaccc tattcccatt ctcaggagaa 2100 actgtcttca tgtcgatgga aaacccaggt ctatggattc tggggtgcca caactcagac 2160 tttcggaaca gaggcatgac cgccttactg aaggtttcta gttgtgacaa gaacactggt 2220 gattattacg aggacagtta tgaagatatt tcagcatact tgctgagtaa aaacaatgcc 2280 attgaaccaa gaagcttctc tcaaaaccca ccagtcttga aggcccatca ggccgaaata 2340 actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac catatcagtt 2400 gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag cccccgcagc 2460 tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg ggattatggg 2520 atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt ccctcagttc 2580 aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt ataccgtgga 2640 gaactaaatg aacatttggg cctcctcggc ccatatataa gagcagaagt tgaagataat 2700 atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc tagccttatt 2760 tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt caagcctaat 2820 gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa agatgagttt 2880 gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt gcactcaggc 2940 ctgattggac cccttctggt ctgccacact aacacactga accctgctca tgggagacaa 3000 gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa aagctggtac 3060 ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat ggaagatccc 3120 acttttaaag agaattatcg cttccatgca atcaatggct acataatgga tacactacct 3180 ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat gggcagcaat 3240 gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa aaaagaggag 3300 tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga aatgttacca 3360 tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca tgctgggatg 3420 agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat ggcttctgga 3480 cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc cccaaagctg 3540 gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc cttttcttgg 3600 atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca gggtgcccgt 3660 cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct tgatgggaag 3720 aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt tggcaatgtg 3780 gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg atacatccgt 3840 ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat gggctgtgat 3900 ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga tgcacagatt 3960 actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa agctcgactt 4020 cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa agagtggctg 4080 caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg agtaaaatct 4140 ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga tggccatcag 4200 tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca agactccttc 4260 acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg aattcacccc 4320 cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga ggcacaggac 4380 ctctactga 4389 <210> 103 <211> 1462 <212> PRT <213> Artificial Sequence <220> <223> FVIII 265 <400> 103 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Gly Gly Gly Gly Gly Ala Thr Arg Arg Tyr Tyr Leu Gly 20 25 30 Ala Val Glu Leu Ser Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu 35 40 45 Pro Val Asp Ala Arg Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe 50 55 60 Asn Thr Ser Val Val Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp 65 70 75 80 His Leu Phe Asn Ile Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu 85 90 95 Gly Pro Thr Ile Gln Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu 100 105 110 Lys Asn Met Ala Ser His Pro Val Ser Leu His Ala Val Gly Val Ser 115 120 125 Tyr Trp Lys Ala Ser Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln 130 135 140 Arg Glu Lys Glu Asp Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr 145 150 155 160 Val Trp Gln Val Leu Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu 165 170 175 Cys Leu Thr Tyr Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu 180 185 190 Asn Ser Gly Leu Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu 195 200 205 Ala Lys Glu Lys Thr Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala 210 215 220 Val Phe Asp Glu Gly Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu 225 230 235 240 Met Gln Asp Arg Asp Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His 245 250 255 Thr Val Asn Gly Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys 260 265 270 His Arg Lys Ser Val Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro 275 280 285 Glu Val His Ser Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn 290 295 300 His Arg Gln Ala Ser Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala 305 310 315 320 Gln Thr Leu Leu Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile 325 330 335 Ser Ser His Gln His Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser 340 345 350 Cys Pro Glu Glu Pro Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu 355 360 365 Asp Tyr Asp Asp Asp Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe 370 375 380 Asp Asp Asp Asn Ser Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys 385 390 395 400 Lys His Pro Lys Thr Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp 405 410 415 Trp Asp Tyr Ala Pro Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys 420 425 430 Ser Gln Tyr Leu Asn Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys 435 440 445 Lys Val Arg Phe Met Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu 450 455 460 Ala Ile Gln His Glu Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu 465 470 475 480 Val Gly Asp Thr Leu Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro 485 490 495 Tyr Asn Ile Tyr Pro His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser 500 505 510 Arg Arg Leu Pro Lys Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu 515 520 525 Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly 530 535 540 Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe 545 550 555 560 Val Asn Met Glu Arg Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu 565 570 575 Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser 580 585 590 Asp Lys Arg Asn Val Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser 595 600 605 Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly 610 615 620 Val Gln Leu Glu Asp Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser 625 630 635 640 Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His 645 650 655 Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe 660 665 670 Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr 675 680 685 Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met 690 695 700 Ser Met Glu Asn Pro Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp 705 710 715 720 Phe Arg Asn Arg Gly Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp 725 730 735 Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala 740 745 750 Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln 755 760 765 Asn Pro Pro Val Leu Lys Ala His Gln Ala Glu Ile Thr Arg Thr Thr 770 775 780 Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val 785 790 795 800 Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln 805 810 815 Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala 820 825 830 Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu 835 840 845 Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val 850 855 860 Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly 865 870 875 880 Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu 885 890 895 Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro 900 905 910 Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln 915 920 925 Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr 930 935 940 Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe 945 950 955 960 Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp 965 970 975 Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr 980 985 990 Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu 995 1000 1005 Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn 1010 1015 1020 Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro 1025 1030 1035 1040 Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met 1045 1050 1055 Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp 1060 1065 1070 Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe 1075 1080 1085 Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala 1090 1095 1100 Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro 1105 1110 1115 1120 Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu 1125 1130 1135 His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln 1140 1145 1150 Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr 1155 1160 1165 Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His 1170 1175 1180 Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp 1185 1190 1195 1200 Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr 1205 1210 1215 Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile 1220 1225 1230 Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn 1235 1240 1245 Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly 1250 1255 1260 Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg 1265 1270 1275 1280 Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu 1285 1290 1295 Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser 1300 1305 1310 Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn 1315 1320 1325 Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly 1330 1335 1340 Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu 1345 1350 1355 1360 Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln 1365 1370 1375 Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile 1380 1385 1390 Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly 1395 1400 1405 Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val 1410 1415 1420 Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro 1425 1430 1435 1440 Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys 1445 1450 1455 Glu Ala Gln Asp Leu Tyr 1460 <210> 104 <211> 5691 <212> DNA <213> Artificial Sequence <220> <223> FVIII198 <400> 104 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60 accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120 ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180 acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240 gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300 gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360 ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420 gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480 aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540 gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600 gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660 tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720 gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780 ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840 accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900 cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960 gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020 gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080 gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140 gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200 tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260 cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320 aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380 attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440 ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500 gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560 ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620 actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680 gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740 agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800 aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860 cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920 tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980 attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040 atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100 atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160 atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220 agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280 ttctctcaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340 ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400 atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460 gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520 cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580 catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640 aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700 tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760 agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820 tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880 aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940 aaaaatgtat cgtcagaaat aactcgtact actcttcagt cagatcaaga ggaaattgac 3000 tatgatgata ccatatcagt tgaaatgaag aaggaagatt ttgacattta tgatgaggat 3060 gaaaatcaga gcccccgcag ctttcaaaag aaaacacgac actattttat tgctgcagtg 3120 gagaggctct gggattatgg gatgagtagc tccccacatg ttctaagaaa cagggctcag 3180 agtggcagtg tccctcagtt caagaaagtt gttttccagg aatttactga tggctccttt 3240 actcagccct tataccgtgg agaactaaat gaacatttgg gactcctggg gccatatata 3300 agagcagaag ttgaagataa tatcatggta actttcagaa atcaggcctc tcgtccctat 3360 tccttctatt ctagccttat ttcttatgag gaagatcaga ggcaaggagc agaacctaga 3420 aaaaactttg tcaagcctaa tgaaaccaaa acttactttt ggaaagtgca acatcatatg 3480 gcacccacta aagatgagtt tgactgcaaa gcctgggctt atttctctga tgttgacctg 3540 gaaaaagatg tgcactcagg cctgattgga ccccttctgg tctgccacac taacacactg 3600 aaccctgctc atgggagaca agtgacagta caggaatttg ctctgttttt caccatcttt 3660 gatgagacca aaagctggta cttcactgaa aatatggaaa gaaactgcag ggctccctgc 3720 aatatccaga tggaagatcc cacttttaaa gagaattatc gcttccatgc aatcaatggc 3780 tacataatgg atacactacc tggcttagta atggctcagg atcaaaggat tcgatggtat 3840 ctgctcagca tgggcagcaa tgaaaacatc cattctattc atttcagtgg acatgtgttc 3900 actgtacgaa aaaaagagga gtataaaatg gcactgtaca atctctatcc aggtgttttt 3960 gagacagtgg aaatgttacc atccaaagct ggaatttggc gggtggaatg ccttattggc 4020 gagcatctac atgctgggat gagcacactt tttctggtgt acagcaataa gtgtcagact 4080 cccctgggaa tggcttctgg acacattaga gattttcaga ttacagcttc aggacaatat 4140 ggacagtggg ccccaaagct ggccagactt cattattccg gatcaatcaa tgcctggagc 4200 accaaggagc ccttttcttg gatcaaggtg gatctgttgg caccaatgat tattcacggc 4260 atcaagaccc agggtgcccg tcagaagttc tccagcctct acatctctca gtttatcatc 4320 atgtatagtc ttgatgggaa gaagtggcag acttatcgag gaaattccac tggaacctta 4380 atggtcttct ttggcaatgt ggattcatct gggataaaac acaatatttt taaccctcca 4440 attattgctc gatacatccg tttgcaccca actcattata gcattcgcag cactcttcgc 4500 atggagttga tgggctgtga tttaaatagt tgcagcatgc cattgggaat ggagagtaaa 4560 gcaatatcag atgcacagat tactgcttca tcctacttta ccaatatgtt tgccacctgg 4620 tctccttcaa aagctcgact tcacctccaa gggaggagta atgcctggag acctcaggtg 4680 aataatccaa aagagtggct gcaagtggac ttccagaaga caatgaaagt cacaggagta 4740 actactcagg gagtaaaatc tctgcttacc agcatgtatg tgaaggagtt cctcatctcc 4800 agcagtcaag atggccatca gtggactctc ttttttcaga atggcaaagt aaaggttttt 4860 cagggaaatc aagactcctt cacacctgtg gtgaactctc tagacccacc gttactgact 4920 cgctaccttc gaattcaccc ccagagttgg gtgcaccaga ttgccctgag gatggaggtt 4980 ctgggctgcg aggcacagga cctctacgac aaaactcaca catgcccacc gtgcccagct 5040 ccagaactcc tgggcggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 5100 atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 5160 gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 5220 cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 5280 gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 5340 atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 5400 cccccatccc gggatgagct gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 5460 ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 5520 aagaccacgc ctcccgtgtt ggactccgac ggctccttct tcctctacag caagctcacc 5580 gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 5640 ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaatg a 5691 <210> 105 <211> 1896 <212> PRT <213> Artificial Sequence <220> <223> FVIII 198 <400> 105 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 755 760 765 Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp 770 775 780 Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys 785 790 795 800 Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser 805 810 815 Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr 820 825 830 Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn 835 840 845 Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly 850 855 860 Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu 865 870 875 880 Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys 885 890 895 Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn 900 905 910 Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met 915 920 925 Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys 930 935 940 Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu 945 950 955 960 Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu 965 970 975 Ser Ser Trp Gly Lys Asn Val Ser Ser Glu Ile Thr Arg Thr Thr Leu 980 985 990 Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu 995 1000 1005 Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser 1010 1015 1020 Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val 1025 1030 1035 1040 Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg 1045 1050 1055 Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe 1060 1065 1070 Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu 1075 1080 1085 Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val 1090 1095 1100 Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr 1105 1110 1115 1120 Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly 1125 1130 1135 Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr 1140 1145 1150 Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp 1155 1160 1165 Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val 1170 1175 1180 His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu 1185 1190 1195 1200 Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe 1205 1210 1215 Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met 1220 1225 1230 Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr 1235 1240 1245 Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp 1250 1255 1260 Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr 1265 1270 1275 1280 Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser 1285 1290 1295 Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu 1300 1305 1310 Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser 1315 1320 1325 Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His 1330 1335 1340 Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr 1345 1350 1355 1360 Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala 1365 1370 1375 Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr 1380 1385 1390 Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile 1395 1400 1405 Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln 1410 1415 1420 Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile 1425 1430 1435 1440 Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser 1445 1450 1455 Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile 1460 1465 1470 Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu 1475 1480 1485 His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met 1490 1495 1500 Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys 1505 1510 1515 1520 Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met 1525 1530 1535 Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg 1540 1545 1550 Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln 1555 1560 1565 Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly 1570 1575 1580 Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser 1585 1590 1595 1600 Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys 1605 1610 1615 Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn 1620 1625 1630 Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln 1635 1640 1645 Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu 1650 1655 1660 Ala Gln Asp Leu Tyr Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala 1665 1670 1675 1680 Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro 1685 1690 1695 Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val 1700 1705 1710 Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val 1715 1720 1725 Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln 1730 1735 1740 Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln 1745 1750 1755 1760 Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala 1765 1770 1775 Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro 1780 1785 1790 Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr 1795 1800 1805 Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser 1810 1815 1820 Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr 1825 1830 1835 1840 Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr 1845 1850 1855 Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe 1860 1865 1870 Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys 1875 1880 1885 Ser Leu Ser Leu Ser Pro Gly Lys 1890 1895 <210> 106 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> sortase recognition motif <220> <221> UNSURE <222> (3) <223> Xaa can be any naturally occurring amino acid <400> 106 Leu Pro Xaa Thr Gly 1 5 <210> 107 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> cysteine containing peptide <400> 107 Gly Gly Gly Ser Gly Cys Gly Gly Gly Ser 1 5 10 <210> 108 <211> 4548 <212> DNA <213> Artificial Sequence <220> <223> VWF 031 <400> 108 atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60 ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120 gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180 ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240 agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300 accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360 gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420 gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480 ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540 acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600 gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660 ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720 gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780 ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840 gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900 tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960 tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020 ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080 acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140 aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200 aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260 cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320 acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380 ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440 cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500 gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560 tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620 ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680 gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740 gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800 ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860 tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920 gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980 tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040 gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100 tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160 atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220 agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280 agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340 ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400 agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460 tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520 acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580 catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640 ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700 aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760 tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820 gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880 tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940 tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000 ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060 tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120 tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180 agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240 ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300 tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360 aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420 gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480 gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540 aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600 gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660 cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720 atatctggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggcggtgga 3780 ggttccggtg gcgggggatc cggtggcggg ggatccctgg tcccccgggg cagcggcggt 3840 ggaggttccg gtggcggggg atccgacaaa actcacacat gcccaccgtg cccagctcca 3900 gaactcctgg gcggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 3960 atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 4020 gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 4080 gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 4140 tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 4200 gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 4260 ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 4320 tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 4380 accacgcctc ccgtgttgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 4440 gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 4500 cacaaccact acacgcagaa gagcctctcc ctgtctccgg gtaaatga 4548 <210> 109 <211> 1515 <212> PRT <213> Artificial Sequence <220> <223> VWF 031 <400> 109 Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile 1 5 10 15 Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr 20 25 30 Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly 35 40 45 Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly 50 55 60 Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys 65 70 75 80 Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu 85 90 95 Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro 100 105 110 Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys 115 120 125 Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly 130 135 140 Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly 145 150 155 160 Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln 165 170 175 Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala 180 185 190 Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser 195 200 205 Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln 210 215 220 Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu 225 230 235 240 Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu 245 250 255 Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala 260 265 270 Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His 275 280 285 Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys 290 295 300 Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met 305 310 315 320 Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu 325 330 335 Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His 340 345 350 Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn 355 360 365 Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys 370 375 380 Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp 385 390 395 400 Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg 405 410 415 Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys 420 425 430 Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu 435 440 445 Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val 450 455 460 Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu 465 470 475 480 Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu 485 490 495 Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu 500 505 510 Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn 515 520 525 Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro 530 535 540 Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln 545 550 555 560 Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met 565 570 575 Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe 580 585 590 Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys 595 600 605 Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly 610 615 620 Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val 625 630 635 640 Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln 645 650 655 Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu 660 665 670 Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe 675 680 685 Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys 690 695 700 Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp 705 710 715 720 Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met 725 730 735 His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val 740 745 750 Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg 755 760 765 Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu 770 775 780 Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met 785 790 795 800 Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg 805 810 815 His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln 820 825 830 Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr 835 840 845 Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp 850 855 860 Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly 865 870 875 880 Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp 885 890 895 Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys 900 905 910 Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu 915 920 925 Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys 930 935 940 Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg 945 950 955 960 Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg 965 970 975 His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val 980 985 990 Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr 995 1000 1005 Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser 1010 1015 1020 Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp 1025 1030 1035 1040 Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val 1045 1050 1055 Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn 1060 1065 1070 Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr 1075 1080 1085 Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Ala Phe Cys Asp Thr Ile 1090 1095 1100 Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val Val Thr Trp 1105 1110 1115 1120 Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg 1125 1130 1135 Glu Asn Gly Tyr Glu Ala Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala 1140 1145 1150 Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln 1155 1160 1165 Cys Val Glu Gly Cys His Ala His Cys Pro Pro Gly Lys Ile Leu Asp 1170 1175 1180 Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu 1185 1190 1195 1200 Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro 1205 1210 1215 Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu 1220 1225 1230 Thr Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Gly Gly Gly Ser Gly 1235 1240 1245 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 1250 1255 1260 Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly 1265 1270 1275 1280 Gly Gly Ser Gly Gly Gly Gly Ser Asp Lys Thr His Thr Cys Pro Pro 1285 1290 1295 Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro 1300 1305 1310 Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr 1315 1320 1325 Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn 1330 1335 1340 Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg 1345 1350 1355 1360 Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val 1365 1370 1375 Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser 1380 1385 1390 Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys 1395 1400 1405 Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp 1410 1415 1420 Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe 1425 1430 1435 1440 Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu 1445 1450 1455 Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe 1460 1465 1470 Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly 1475 1480 1485 Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr 1490 1495 1500 Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 1505 1510 1515 <210> 110 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> linker <220> <221> REPEAT <222> (1)..(5) <223> Gly-Gly-Gly-Gly-Ser repeat <400> 110 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser 35 40 <210> 111 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> ESC54-VWF forward with BsiW1 site <400> 111 cgcttcgcga cgtacggccg ccaccatgat tcctgccaga tttgccgggg tgctgcttgc 60 tc 62 <210> 112 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> ESC 124 - D1D2 cloning oligo with Not1 site-reverse <400> 112 ctagactcga gcggccgctc accttttgct gcgatgagac aggggactgc tgaggacagc 60 60 <210> 113 <211> 2289 <212> DNA <213> Artificial Sequence <220> <223> VWF 053 (VWF D1D2-propeptide) <400> 113 atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60 ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120 gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180 ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240 agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300 accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360 gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420 gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480 ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540 acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600 gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660 ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720 gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780 ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840 gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900 tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960 tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020 ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080 acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140 aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200 aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260 cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320 acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380 ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440 cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500 gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560 tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620 ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680 gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740 gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800 ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860 tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920 gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980 tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040 gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100 tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160 atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220 agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280 agcaaaagg 2289 <210> 114 <211> 763 <212> PRT <213> Artificial Sequence <220> <223> VWF 053 (VWF D1D2-Propeptide) <400> 114 Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile 1 5 10 15 Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr 20 25 30 Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly 35 40 45 Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly 50 55 60 Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys 65 70 75 80 Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu 85 90 95 Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro 100 105 110 Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys 115 120 125 Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly 130 135 140 Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly 145 150 155 160 Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln 165 170 175 Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala 180 185 190 Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser 195 200 205 Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln 210 215 220 Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu 225 230 235 240 Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu 245 250 255 Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala 260 265 270 Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His 275 280 285 Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys 290 295 300 Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met 305 310 315 320 Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu 325 330 335 Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His 340 345 350 Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn 355 360 365 Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys 370 375 380 Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp 385 390 395 400 Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg 405 410 415 Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys 420 425 430 Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu 435 440 445 Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val 450 455 460 Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu 465 470 475 480 Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu 485 490 495 Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu 500 505 510 Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn 515 520 525 Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro 530 535 540 Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln 545 550 555 560 Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met 565 570 575 Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe 580 585 590 Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys 595 600 605 Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly 610 615 620 Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val 625 630 635 640 Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln 645 650 655 Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu 660 665 670 Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe 675 680 685 Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys 690 695 700 Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp 705 710 715 720 Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met 725 730 735 His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val 740 745 750 Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg 755 760

Claims

공유 결합에 의해 연계된 인자 VIII ("FVIII") 단백질과 부속 모이어티 (AM)가 포함된 키메라 단백질에 있어서, 상기 부속 모이어티는 내생성 VWF가 상기 FVIII 단백질에 결합되는 것을 저해 또는 방지하는, 키메라 단백질.
청구항 1에 있어서, 상기 공유 결합은 내생성 VWF 존재하에서 상기 FVIII 단백질로부터 상기 부속 모이어티의 분리를 방지하는, 키메라 단백질.
청구항 1 또는 2에 있어서, 상기 공유 결합은 펩티드 결합인, 키메라 단백질.
청구항 1 내지 3 중 어느 하나의 항에 있어서, 상기 공유 결합은 이황화결합인, 키메라 단백질.
청구항 1 내지 4 중 어느 하나의 항에 있어서, 상기 공유 결합은 상기 FVIII 단백질과 부속 모이어티 사이의 링커인, 키메라 단백질.
청구항 1 내지 5 중 어느 하나의 항에 있어서, 상기 부속 모이어티는 상기 FVIII 단백질이 VWF 제거 경로를 통하여 제거되는 것을 방지하는, 키메라 단백질.
청구항 1 내지 6 중 어느 하나의 항에 있어서, 상기 부속 모이어티는 상기 FVIII 단백질 상의 VWF 결합 부위를 차폐 또는 차단시킴으로써, 내생성 VWF가 상기 FVIII 단백질에 결합되는 것을 저해 또는 방지하는, 키메라 단백질.
청구항 7에 있어서, 상기 VWF 결합 부위는 상기 FVIII 단백질의 A3 도메인 또는 C2 도메인 또는 상기 A3 도메인과 C2 도메인 모두에 위치하는, 키메라 단백질.
청구항 8에 있어서, 상기 VWF 결합 부위는 서열 번호: 16의 아미노산 1669 내지 1689 그리고 아미노산 2303 내지 2332에 상응하는 아미노산 서열인, 키메라 단백질.
청구항 1 내지 9 중 어느 하나의 항에 있어서, 상기 키메라 단백질은 FVIII 반감기 제한 인자를 포함하지 않는, 키메라 단백질.
청구항 10에 있어서, 상기 FVIII 반감기 제한 인자는 전장 VWF 단백질 또는 성숙 VWF 단백질을 포함하는, 키메라 단백질.
청구항 1 내지 11 중 어느 하나의 항에 있어서, 상기 FVIII 단백질의 반감기는 내생성 VWF 존재하에서 상기 FVIII 단백질의 반감기 한계를 넘어서 연장가능한, 키메라 단백질.
청구항 1 내지 12 중 어느 하나의 항에 있어서, 상기 부속 모이어티는 최소한 하나의 VWF-유사 FVIII 보호 특성을 갖는, 키메라 단백질.
청구항 13에 있어서, 상기 VWF-유사 FVIII 보호 특성은 하나 또는 그 이상의 프로테아제 절단으로부터 상기 FVIII 단백질을 보호하고, 활성화로부터 상기 FVIII 단백질을 보호하고, 상기 FVIII 단백질의 중쇄 및/또는 경쇄를 안정화시키고, 또는 하나 또는 그 이상의 소거 수용체들에 의해 상기 FVIII 단백질의 제거를 방지하는 것이 포함된, 키메라 단백질.
청구항 1 내지 14 중 어느 하나의 항에 있어서, 상기 부속 모이어티는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함하는, 키메라 단백질.
청구항 15에 있어서, 상기 폴리펩티드는 길이가 최소한 약 40 개, 최소한 약 50 개, 최소한 약 60 개, 최소한 약 70 개, 최소한 약 80 개, 최소한 약 90 개, 최소한 약 100 개, 최소한 약 110 개, 최소한 약 120 개, 최소한 약 130 개, 최소한 약 140 개, 최소한 약 150 개, 최소한 약 200 개, 최소한 약 250 개, 최소한 약 300 개, 최소한 약 350 개, 최소한 약 400 개, 최소한 약 450 개, 최소한 약 500 개, 최소한 약 550 개, 최소한 약 600 개, 최소한 약 650 개, 최소한 약 700 개, 최소한 약 750 개, 최소한 약 800 개, 최소한 약 850 개, 최소한 약 900 개, 최소한 약 950 개, 또는 최소한 약 1000개 아미노산의 아미노산 서열을 포함하는, 키메라 단백질.
청구항 1 내지 16 중 어느 하나의 항에 있어서, 상기 부속 모이어티는 VWF 단편, 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 17에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 17에 있어서, 상기 부속 모이어티는 VWF의 D' 도메인과 D3 도메인이 포함된 VWF 단편을 포함하고, 이때 상기 VWF 단편은 공유 결합에 추가하여, 비-공유 결합에 의해 상기 FVIII 단백질에 연합된, 키메라 단백질.
청구항 17 또는 19에 있어서, 상기 VWF 단편은 단량체인, 키메라 단백질.
청구항 19 또는 20에 있어서, 상기 VWF 단편은 서로 하나 또는 그 이상이 연계된 2, 3, 4, 5, 또는 6개의 VWF 단편을 포함하는, 키메라 단백질.
청구항 1 내지 21 중 어느 하나의 항에 있어서, 상기 VWF 단편은 최소한 하나의 이종기원의 모이어티 (H1) 그리고 상기 VWF 단편과 이종기원의 모이어티 (H1) 사이에 임의선택적 링커를 포함하는, 키메라 단백질.
청구항 22에 있어서, 상기 VWF 단편에 연계된 최소한 하나의 이종기원의 모이어티 (H1)는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함하는, 키메라 단백질.
청구항 22 또는 23에 있어서, 상기 이종기원의 모이어티 (H1)는 상기 FVIII 단백질의 반감기를 연장시키는 모이어티를 포함하는, 키메라 단백질.
청구항 24에 있어서, 상기 이종기원의 모이어티 (H1)는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 24에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 25에 있어서, 상기 이종기원의 모이어티 (H1)는 제 1 Fc 영역을 포함하는, 키메라 단백질.
청구항 24에 있어서, 상기 이종기원의 모이어티 (H1)는 최소한 약 50개 아미노산, 최소한 약 100 개 아미노산, 최소한 약 150 개 아미노산, 최소한 약 200 개 아미노산, 최소한 약 250 개 아미노산, 최소한 약 300 개 아미노산, 최소한 약 350 개 아미노산, 최소한 약 400 개 아미노산, 최소한 약 450 개 아미노산, 최소한 약 500 개 아미노산, 최소한 약 550 개 아미노산, 최소한 약 600 개 아미노산, 최소한 약 650 개 아미노산, 최소한 약 700 개 아미노산, 최소한 약 750 개 아미노산, 최소한 약 800 개 아미노산, 최소한 약 850 개 아미노산, 최소한 약 900 개 아미노산, 최소한 약 950 개 아미노산, 또는 최소한 약 1000 개 아미노산이 포함된 아미노산 서열을 포함하는, 키메라 단백질.
청구항 22에 있어서, 상기 키메라 단백질은 상기 VWF 단편과 이종기원의 모이어티 (H1) 사이에 절단 가능한 링커를 포함하는, 키메라 단백질.
청구항 29에 있어서, 상기 절단가능한 링커는 하나 또는 그 이상의 절단가능한 부위를 포함하는, 키메라 단백질.
청구항 29 또는 30 중 어느 하나의 항에 있어서, 상기 절단가능한 링커는 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, 그랜자임-B, TEV, 엔테로키나제, 프로테아제 3C, 소르타제 A, MMP-12, MMP-13, MMP-17, 그리고 MMP-20으로 구성된 군에서 선택된 프로테아제에 의해 절단될 수 있는, 키메라 단백질.
청구항 29에 있어서, 상기 절단가능한 링커는 TLDPRSFLLRNPNDKYEPFWEDEEK (서열 번호: 56)를 포함하는, 키메라 단백질.
청구항 29 내지 32 중 어느 하나의 항에 있어서, 상기 절단가능한 링커는 RRRR (서열 번호: 52), RKRRKR (서열 번호: 53), RRRRS (서열 번호: 54), TQSFNDFTR (서열 번호: 47), SVSQTSKLTR (서열 번호: 48), DFLAEGGGVR (서열 번호: 49), TTKIKPR (서열 번호: 50), LVPRG (서열 번호: 55), ALRPRVVGGA (서열 번호: 51), KLTRAET (서열 번호: 29), DFTRVVG (서열 번호: 30), TMTRIVGG (서열 번호: 31), SPFRSTGG (서열 번호: 32), LQVRIVGG (서열 번호: 33), PLGRIVGG (서열 번호: 34), IEGRTVGG (서열 번호: 35), LTPRSLLV (서열 번호: 36), LGPVSGVP (서열 번호: 37), VAGDSLEE (서열 번호: 38), GPAGLGGA (서열 번호: 39), GPAGLRGA (서열 번호: 40), APLGLRLR (서열 번호: 41), PALPLVAQ (서열 번호: 42), ENLYFQG (서열 번호: 43), DDDKIVGG (서열 번호: 44), LEVLFQGP (서열 번호: 45), 그리고 LPKTGSES (서열 번호: 46)로 구성된 군에서 선택된 아미노산 서열이 포함된 하나 또는 그 이상의 절단 부위를 포함하는, 키메라 단백질.
청구항 1 내지 33 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 FVIII와 최소한 하나의 이종기원의 모이어티 (H2)를 포함하는, 키메라 단백질.
청구항 34에 있어서, 상기 이종기원의 모이어티 (H2)는 상기 FVIII 단백질의 반감기를 연장시킬 수 있는, 키메라 단백질.
청구항 34 또는 35에 있어서, 상기 이종기원의 모이어티 (H2)는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함하는, 키메라 단백질.
청구항 34 또는 35에 있어서, 상기 이종기원의 모이어티 (H2)는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 34 또는 35에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 34에 있어서, 상기 이종기원의 모이어티 (H2)는 제 2 Fc 영역을 포함하는, 키메라 단백질.
청구항 1 내지 39 중 어느 하나의 항에 있어서, 키메라 단백질은 상기 VWF 단편, 제 1 이종기원의 모이어티, 그리고 링커가 포함된 제 1 폴리펩티드 쇄와 상기 FVIII 단백질과 제 2 이종기원의 모이어티가 포함된 2 폴리펩티드 쇄를 포함하고, 이때 상기 제 1 폴리펩티드 쇄와 제 2 폴리펩티드 쇄는 공유 결합에 의해 서로 연계된, 키메라 단백질.
청구항 40에 있어서, 상기 제 1 이종기원의 모이어티와 상기 제 2 이종기원의 모이어티는 공유 결합에 의해 서로 연계되며, 이때 상기 공유 결합은 상기 제 1 폴리펩티드 쇄 내 VWF 단편이 생체내 내생성 VWF으로 대체되는 것을 방지하는, 키메라 단백질.
청구항 41에 있어서, 상기 공유 결합은 이황화결합인, 키메라 단백질.
청구항 34 내지 42 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 링커에 의해 상기 제 2 이종기원의 모이어티 (H2)에 연계된, 키메라 단백질.
청구항 43에 있어서, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커는 절단가능한 링커인, 키메라 단백질.
청구항 34 내지 44에 있어서, 상기 제 1 이종기원의 모이어티 (H1)와 제 2 이종기원의 모이어티 (H2)는 링커에 의해 연계된, 키메라 단백질.
청구항 45에 있어서, 상기 링커는 scFc 링커인, 키메라 단백질.
청구항 46에 있어서, 상기 scFc 링커는 가공가능한(processable) 링커인, 단백질.
청구항 1 내지 47에 있어서, 다음으로 구성된 군으로부터 선택된 포뮬라(formula)를 포함하는, 키메라 단백질:
(a) V-L1-H1-L3-C-L2-H2,
(b) H2-L2-C-L3-H1-L1-V,
(c) C-L2-H2-L3-V-L1-H1,
(d) H1-L1-V-L3-H2-L2-C,
(e) H1-L1-V-L3-C-L2-H2,
(f) H2-L2-C-L3-V-L1-H1,
(g) V-L1-H1-L3-H2-L2-C,
(h) C-L2-H2-L3-H1-L1-V,
(i) H2-L3-H1-L1-V-L2-C,
(j) C-L2-V-L1-H1-L3-H2,
(k) V-L2-C-L1-H1-L3-H2, 및
(l) H2-L3-H1-L1-C-L2-V,
이때 V는 VWF의 D' 도메인과 D3 도메인이 포함된 VWF 단편을 포함하고;
L1은 임의선택적 링커이며;
L2는 임의선택적 링커이며;
(a) 내지 (f)에서 L3은 임의선택적 링커이며,
(g) 내지 (l)에서 L3은 임의선택적 scFc 링커이며,
H1과 H2는 각각 임의선택적 이종기원의 모이어티를 포함하고;
C는 FVIII 단백질을 포함하고; 그리고
(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이다.
청구항 1 내지 47에 있어서, 다음으로 구성된 군으로부터 선택된 포뮬라(formula)를 포함하는, 키메라 단백질:
(m) V-L1-H1: H2-L2-C,
(n) V-L1-H1:C-L2-H2;
(o) H1-L1-V:H2-L2-C;
(p) H1-L1-V:C-L2-H2;
(q) V:C-L1-H1:H2;
(r) V:H1-L1-C:H2;
(s) H2:H1-L1-C:V,
(t) C:V-L1-H1:H2, 및
(u) C:H1-L1-V:H2,
이때 V는 VWF의 D' 도메인과 D3 도메인이 포함된 VWF 단편이며;
L1은 임의선택적 링커이며;
L2는 임의선택적 링커이며;
H1은 제 1 이종기원의 모이어티이며;
H2는 제 2 이종기원의 모이어티이며;
C는 FVIII 단백질이며;
(-)는 펩티드 결합 또는 하나 또는 그 이상의 아미노산이고; 그리고
(:) 는 상기 H1과 H2 사이의 공유 결합이다.
청구항 48과 49에 있어서, 상기 VWF 단편과 FVIII 단백질은 공유 결합에 추가하여 비-공유 결합, 펩티드 결합, 또는 하나 또는 그 이상의 아미노산에 의해 서로 연합된, 키메라 단백질.
청구항 48 또는 49에 있어서, 상기 VWF 단편은 내생성 VWF가 상기 FVIII 단백질에 결합하는 것을 저해 또는 방지하는, 키메라 단백질.
청구항 49 내지 51 중 어느 하나의 항에 있어서, 상기 H1과 H2 사이의 공유 결합은 이황화결합인, 키메라 단백질.
청구항 48 내지 52 중 어느 하나의 항에 있어서, H1은 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함하는, 키메라 단백질.
청구항 53에 있어서, H1은 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 53 또는 54에 있어서, H1은 제 1 Fc 영역을 포함하는, 키메라 단백질.
청구항 53에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 48 내지 56 중 어느 하나의 항에 있어서, H2는 폴리펩티드, 비-폴리펩티드 모이어티, 또는 이 둘 모두를 포함하는, 키메라 단백질.
청구항 57에 있어서, H2는 면역글로불린 불변 영역 또는 이의 일부분, 알부민 또는 이의 단편, 알부민 결합 모이어티, PAS 서열, HAP 서열, 트란스페린 또는 이의 단편, 또는 이의 임의의 조합을 포함하는, 키메라 단백질.
청구항 48 내지 58 중 어느 하나의 항에 있어서, H2는 제 2 Fc 영역을 포함하는, 키메라 단백질.
청구항 59에 있어서, 상기 비-폴리펩티드 모이어티는 폴리에틸렌 글리콜 (PEG), 폴리시알산, 히드록시에틸 전분 (HES), 이의 유도체, 또는 이의 임의의 조합들을 포함하는, 키메라 단백질.
청구항 60에 있어서, 상기 공유 결합은 이황화결합인, 키메라 단백질.
청구항 1 내지 61 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 제 3 이종기원의 모이어티 (H3)를 포함하는, 키메라 단백질.
청구항 1 내지 62 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 제 4 이종기원의 모이어티 (H4)를 포함하는, 키메라 단백질.
청구항 1 내지 63 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 제 5 이종기원의 모이어티 (H5)를 포함하는, 키메라 단백질.
청구항 1 내지 64 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 제 6 이종기원의 모이어티 (H6)를 포함하는, 키메라 단백질.
청구항 61 내지 65 중 어느 하나의 항에 있어서, 상기 제 3 이종기원의 모이어티 (H3), 제 4 이종기원의 모이어티 (H4), 제 5 이종기원의 모이어티 (H5), 제 6 이종기원의 모이어티 (H6)중 하나 또는 그 이상은 상기 FVIII 단백질의 반감기를 연장시킬 수 있는, 키메라 단백질.
청구항 1 내지 66 중 어느 하나의 항에 있어서, 제 3 이종기원의 모이어티 (H3), 제 4 이종기원의 모이어티 (H4), 제 5 이종기원의 모이어티 (H5), 그리고 제 6 이종기원의 모이어티 (H6)는 FVIII의 C 말단 또는 N 말단에 연계되거나 또는 FVIII의 두 아미노산 사이에 삽입된, 키메라 단백질.
청구항 1 내지 67 중 어느 하나의 항에 있어서, 제 3 이종기원의 모이어티 (H3), 제 4 이종기원의 모이어티 (H4), 제 5 이종기원의 모이어티 (H5), 또는 제 6 이종기원의 모이어티 (H6)중 하나 또는 그 이상은 최소한 약 50개 아미노산, 최소한 약 100 개 아미노산, 최소한 약 150 개 아미노산, 최소한 약 200 개 아미노산, 최소한 약 250 개 아미노산, 최소한 약 300 개 아미노산, 최소한 약 350 개 아미노산, 최소한 약 400 개 아미노산, 최소한 약 450 개 아미노산, 최소한 약 500 개 아미노산, 최소한 약 550 개 아미노산, 최소한 약 600 개 아미노산, 최소한 약 650 개 아미노산, 최소한 약 700 개 아미노산, 최소한 약 750 개 아미노산, 최소한 약 800 개 아미노산, 최소한 약 850 개 아미노산, 최소한 약 900 개 아미노산, 최소한 약 950 개 아미노산, 또는 최소한 약 1000 개의 아미노산이 포함된 아미노산 서열을 포함하는, 키메라 단백질.
청구항 1 내지 68 중 어느 하나의 항에 있어서, 상기 FVIII의 반감기는 야생형 FVIII 보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 또는 최소한 약 12 배 더 길게 연장되는, 키메라 단백질.
청구항 1 내지 69 중 어느 하나의 항에 있어서, 상기 FVIII 단백질의 반감기는 최소한 약 10 시간, 최소한 약 11 시간, 최소한 약 12 시간, 최소한 약 13 시간, 최소한 약 14 시간, 최소한 약 15 시간, 최소한 약 16 시간, 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간인, 키메라 단백질.
청구항 22 내지 70 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커 또는 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커는 링커의 N-말단 영역에서 제 1 절단 부위(P1), 링커의 C-말단 영역에서 제 2 절단 부위(P2), 또는 이 둘 모두를 더 포함하는, 키메라 단백질.
청구항 22 내지 71 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커, 또는 이 둘 모두는 TLDPRSFLLRNPNDKYEPFWEDEEK (서열 번호: 56)을 포함하는, 키메라 단백질.
청구항 22 내지 71 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커, 또는 이 둘 모두는 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, 그랜자임-B, TEV, 엔테로키나제, 프로테아제 3C, 소르타제 A, MMP-12, MMP-13, MMP-17, 그리고 MMP-20으로 구성된 군에서 선택된 프로테아제에 의해 절단되는, 키메라 단백질.
청구항 22 내지 73 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커, 또는 이 둘 모두는 RRRR (서열 번호: 52), RKRRKR (서열 번호: 53), RRRRS (서열 번호: 54), TQSFNDFTR (서열 번호: 47), SVSQTSKLTR (서열 번호: 48), DFLAEGGGVR (서열 번호: 49), TTKIKPR (서열 번호: 50), LVPRG (서열 번호: 55), ALRPRVVGGA (서열 번호: 51), KLTRAET (서열 번호: 29), DFTRVVG (서열 번호: 30), TMTRIVGG (서열 번호: 31), SPFRSTGG (서열 번호: 32), LQVRIVGG (서열 번호: 33), PLGRIVGG (서열 번호: 34), IEGRTVGG (서열 번호: 35), LTPRSLLV (서열 번호: 36), LGPVSGVP (서열 번호: 37), VAGDSLEE (서열 번호: 38), GPAGLGGA (서열 번호: 39), GPAGLRGA (서열 번호: 40), APLGLRLR (서열 번호: 41), PALPLVAQ (서열 번호: 42), ENLYFQG (서열 번호: 43), DDDKIVGG (서열 번호: 44), LEVLFQGP (서열 번호: 45), 그리고 LPKTGSES (서열 번호: 46)로 구성된 군에서 선택된 아미노산 서열을 포함하는, 키메라 단백질.
청구항 71 내지 74 중 어느 하나의 항에 있어서, 상기 제 1 효소적 절단 부위와 제 2 효소적 절단 부위는 동일하거나 또는 상이한, 키메라 단백질.
청구항 5 내지 75 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 부속 모이어티 사이의 링커, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 그리고 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커중 하나 또는 그 이상은 약 1 내지 약 2000개의 아미노산 길이를 갖는, 키메라 단백질.
청구항 5 내지 75 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 부속 모이어티 사이의 링커, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 그리고 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커중 하나 또는 그 이상은 최소한 약 10개, 20 개, 30 개, 40 개, 50 개, 60 개, 70 개, 80 개, 90 개, 100 개, 110 개, 120 개, 130 개, 140 개, 150 개, 160 개, 170 개, 180 개, 190 개, 200 개, 210 개, 220 개, 230 개, 240 개, 250 개, 300 개, 350 개, 400 개, 450 개, 500 개, 550 개, 600 개, 650 개, 700 개, 750 개, 800 개, 850 개, 900 개, 950 개, 1000 개, 1200 개, 1400 개, 1600 개, 1800 개, 또는 2000 개 아미노산 길이를 갖는, 키메라 단백질.
청구항 5 내지 77 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 부속 모이어티 사이의 링커, 상기 FVIII 단백질과 제 2 이종기원의 모이어티 사이의 링커, 그리고 상기 VWF 단편과 제 1 이종기원의 모이어티 사이의 링커중 하나 또는 그 이상은 gly/ser 펩티드를 포함하는, 키메라 단백질.
청구항 78에 있어서, 상기 gly/ser 펩티드는 포뮬라 (Gly4Ser)n 또는 S(Gly4Ser)n를 갖고, 이때 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 또는 100으로 구성된 군에서 선택된 양의 정수인, 키메라 단백질.
청구항 79에 있어서, 상기 (Gly4Ser)n 링커는 (Gly4Ser)3 또는 (Gly4Ser)4인, 키메라 단백질.
청구항 5 내지 80 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 부속 모이어티 사이의 링커는 절단가능한 링커인, 키메라 단백질.
청구항 81에 있어서, 상기 절단가능한 링커는 하나 또는 그 이상의 트롬빈 절단 부위를 포함하는, 키메라 단백질.
청구항 81 또는 82에 있어서, 상기 절단가능한 링커는 TLDPRSFLLRNPNDKYEPFWEDEEK (서열 번호: 56)를 포함하는, 키메라 단백질.
청구항 81 내지 83 중 어느 하나의 항에 있어서, 절단가능한 링커는 인자 XIa, 인자 XIIa, 칼리크레인, 인자 VIIa, 인자 IXa, 인자 Xa, 인자 IIa (트롬빈), 엘라스타제-2, 그랜자임-B, TEV, 엔테로키나제, 프로테아제 3C, 소르타제 A, MMP-12, MMP-13, MMP-17, 그리고 MMP-20로 구성된 군에서 선택된 프로테아제에 의해 절단되는, 키메라 단백질.
청구항 81 내지 83 중 어느 하나의 항에 있어서, 상기 절단가능한 링커는 RRRR (서열 번호: 52), RKRRKR (서열 번호: 53), RRRRS (서열 번호: 54), TQSFNDFTR (서열 번호: 47), SVSQTSKLTR (서열 번호: 48), DFLAEGGGVR (서열 번호: 49), TTKIKPR (서열 번호: 50), LVPRG (서열 번호: 55), ALRPRVVGGA (서열 번호: 51), KLTRAET (서열 번호: 29), DFTRVVG (서열 번호: 30), TMTRIVGG (서열 번호: 31), SPFRSTGG (서열 번호: 32), LQVRIVGG (서열 번호: 33), PLGRIVGG (서열 번호: 34), IEGRTVGG (서열 번호: 35), LTPRSLLV (서열 번호: 36), LGPVSGVP (서열 번호: 37), VAGDSLEE (서열 번호: 38), GPAGLGGA (서열 번호: 39), GPAGLRGA (서열 번호: 40), APLGLRLR (서열 번호: 41), PALPLVAQ (서열 번호: 42), ENLYFQG (서열 번호: 43), DDDKIVGG (서열 번호: 44), LEVLFQGP (서열 번호: 45), 그리고 LPKTGSES (서열 번호: 46)로 구성된 군에서 선택된 아미노산 서열을 포함하는, 키메라 단백질.
청구항 5 내지 85 중 어느 하나의 항에 있어서, 상기 FVIII 단백질과 상기 부속 모이어티 사이의 링커는 소르타제 인지 모티프를 더 포함하는, 키메라 단백질.
청구항 86에 있어서, 상기 소르타제 인지 모티프는 서열 LPXTG (서열 번호: 106)을 포함하는, 키메라 단백질.
청구항 19 내지 87 중 어느 하나의 항에 있어서, 상기 VWF 단편은 VWF의 D' 도메인과 D3 도메인을 포함하는, 키메라 단백질.
청구항 88에 있어서, 상기 VWF 단편은 내생성 VWF가 FVIII 단백질에 결합하는 것을 저해 또는 방지하는, 키메라 단백질.
청구항 88 또는 89에 있어서, 상기 VWF 단편의 D' 도메인의 아미노산 서열은 서열 번호: 2의 아미노산 764 내지 866에 대하여 최소한 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한, 키메라 단백질.
청구항 88 내지 90 중 어느 하나의 항에 있어서, 상기 VWF 단편의 D3 도메인의 아미노산 서열은 서열 번호: 2의 아미노산 867 내지 1240에 대하여 최소한 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한, 키메라 단백질.
청구항 88 내지 91 중 어느 하나의 항에 있어서, 상기 VWF 단편은 서열 번호: 2의 잔기 1099, 잔기 1142, 또는 이들 두 잔기 1099와 1142에 상응하는 잔기에서 최소한 하나의 아미노산 치환이 포함된, 키메라 단백질.
청구항 88 내지 91 중 어느 하나의 항에 있어서, 상기 VWF 단편의 서열에서 시스테인을 제외한 아미노산이 서열 번호: 2의 잔기 1099, 잔기 1142, 또는 이들 두 잔기 1099와 1142에 상응하는 잔기를 대체하는, 키메라 단백질.
청구항 88 내지 93 중 어느 하나의 항에 있어서, 상기 VWF 단편의 서열은 서열 번호: 2의 아미노산 764 내지 1240을 포함하는, 키메라 단백질.
청구항 88 내지 94 중 어느 하나의 항에 있어서, 상기 VWF 단편은 VWF의 상기 D1 도메인, D2 도메인, 또는 D1 및 D2 도메인을 더 포함하는, 키메라 단백질.
청구항 88 내지 95 중 어느 하나의 항에 있어서, 상기 VWF 단편은 상기 A1 도메인, A2 도메인, A3 도메인, D4 도메인, B1 도메인, B2 도메인, B3 도메인, C1 도메인, C2 도메인, CK 도메인, 이의 하나 또는 그 이상의 단편들 그리고 이의 임의의 조합들로 구성된 군에서 선택된 VWF 도메인을 더 포함하는, 키메라 단백질.
청구항 88 내지 95 중 어느 하나의 항에 있어서, 상기 VWF 단편은 다음으로 필수적으로 구성된 또는 구성된, 키메라 단백질: (1) VWF의 상기 D'와 D3 도메인들 또는 이의 단편들; (2) 상기 VWF의 D1, D', 및 D3 도메인들 또는 이의 단편들; (3) 상기 VWF의 D2, D', 및 D3 도메인들 또는 이의 단편들; (4) 상기 VWF의 D1, D2, D', 및 D3 도메인들 또는 이의 단편들; 또는 (5) 상기 VWF의 D1, D2, D', D3, 및 A1 도메인들 또는 이의 단편들.
청구항 88 내지 97 중 어느 하나의 항에 있어서, 키메라 단백질에 작용가능하도록 연계된 VWF의 신호 펩티드를 더 포함하는, 키메라 단백질.
청구항 19 내지 98 중 어느 하나의 항에 있어서, 상기 VWF 단편은 페길화되고, 글리코실화되고, 헤실화되고, 또는 폴리시알릴화되는, 키메라 단백질.
청구항 1 내지 99 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 상기 A1 도메인, A2 도메인, B 도메인, A3 도메인, C1 도메인, C2 도메인, 하나 또는 그 이상의 이의 단편, 그리고 이의 임의의 조합들로 구성된 군에서 선택된 FVIII의 하나 또는 그 이상의 도메인을 포함하는, 키메라 단백질.
청구항 100에 있어서, 상기 FVIII 단백질은 상기 A1 도메인, A2 도메인, A3 도메인, 그리고 C1 도메인, 그리고 임의선택적 C2 도메인을 포함하는, 키메라 단백질.
청구항 100 또는 101에 있어서, 상기 FVIII 단백질 상기 B 도메인 또는 이의 일부분을 포함하는, 키메라 단백질.
청구항 100 내지 102 중 어느 하나의 항에 있어서, 서열 번호: 16 또는 서열 번호: 18에 대하여 최소한 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 키메라 단백질.
청구항 100 내지 103 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 SQ B 도메인 결실된 FVIII인, 키메라 단백질.
청구항 100 내지 104 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 단일 쇄 FVIII를 포함하는, 키메라 단백질.
청구항 105에 있어서, 상기 단일 쇄 FVIII는 전장의 성숙한 인자 VIII 폴리펩티드 (서열 번호: 16)의 잔기 1648, 잔기 1645, 또는 이 둘 모두에 상응하는 잔기에서 또는 SQ BDD 인자 VIII (서열 번호: 18)의 잔기 754, 잔기 751, 또는 이 둘 모두에 상응하는 잔기에서 최소한 하나의 아미노산 치환을 포함하는, 키메라 단백질.
청구항 106에 있어서, 상기 아미노산 치환은 아르기닌을 제외한 아미노산인, 키메라 단백질.
청구항 1 내지 107 중 어느 하나의 항에 있어서, 상기 FVIII 단백질은 제 1 쇄와 제 2 쇄를 포함하고, 상기 제 1 쇄는 FVIII의 중쇄를 포함하고, 상기 제 2 쇄는 인자 VIII의 경쇄를 포함하며, 이때 상기 중쇄와 경쇄는 금속 결합에 의해 연합된, 키메라 단백질.
청구항 1 내지 108 중 어느 하나의 항에 따른 상기 키메라 단백질을 인코드하는 폴리뉴클레오티드.
청구항 110에 있어서, PC5, PC7, 또는 퓨린을 인코드하는 추가 폴리뉴클레오티드 서열이 더 포함된, 폴리뉴클레오티드.
청구항 109 또는 110에 있어서, VWF의 D1 도메인과 D2 도메인을 인코드하는 추가 폴리뉴클레오티드 서열이 더 포함된, 폴리뉴클레오티드.
청구항 109 내지 111 중 어느 하나의 항에 따른 폴리뉴클레오티드 그리고 상기 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드 세트에 작용가능하도록 연계된 하나 또는 그 이상의 프로모터가 포함된 벡터 또는 벡터들.
청구항 112에 있어서, PC5, PC7, 또는 퓨린을 인코드하는 제 2 폴리뉴클레오티드 쇄가 포함된 추가 벡터를 더 포함하는, 벡터 또는 벡터들.
청구항 112 또는 113에 있어서, VWF의 D1 도메인과 D2 도메인을 인코드하는 폴리뉴클레오티드 서열이 포함된 추가 벡터를 더 포함하는, 벡터 또는 벡터들.
청구항 109 내지 111중 임의의 하나에 따른 폴리뉴클레오티드 또는 청구항 112 내지 114중 임의의 하나에 따른 벡터가 포함된 숙주 세포.
청구항 115에 있어서, PC5, PC7, 또는 퓨린을 인코드하는 추가 벡터가 포함된, 숙주 세포.
청구항 115 또는 116에 있어서, VWF의 D1 도메인과 D2 도메인을 인코드하는 폴리뉴클레오티드 서열이 포함된 추가 벡터를 더 포함하는, 숙주 세포.
청구항 115 또는 118에 있어서, 포유동물 세포인, 숙주 세포.
청구항 118에 있어서, 상기 포유동물 세포는 HEK293 세포, CHO 세포, 그리고 BHK 세포로 구성된 군에서 선택되는, 숙주 세포.
청구항 1 내지 108 중 어느 하나의 항에 따른 키메라 단백질, 청구항 109 또는 111에 따른 폴리뉴클레오티드, 청구항 112 또는 114에 따른 벡터, 또는 청구항 115와 118 중 어느 하나의 항에 따른 숙주 세포, 그리고 약학적으로 수용가능한 운반체를 포함하는 약제학적 조성물.
청구항 120에 있어서, 상기 키메라 단백질의 FVIII 단백질의 반감기는 상기 VWF 단편이 없는 키메라 단백질의 FVIII 단백질 반감기와 비교하였을 때, FVIII/VWF 이중 녹아웃 ("DKO") 마우스에서 연장된, 조성물.
청구항 120 또는 121에 있어서, 상기 FVIII의 반감기는 야생형 FVIII보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 최소한 약 12 배, 최소한 20 배, 최소한 30 배, 또는 최소한 40 배 더 길게 연장된, 조성물.
청구항 120 또는 122에 있어서, 상기 인자 VIII의 반감기는 최소한 6 시간, 최소한 7 시간 최소한 9 시간, 최소한 10 시간, 최소한 11 시간, 최소한 12 시간, 최소한 15 시간, 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 25 시간, 최소한 약 26 시간, 최소한 약 27 시간, 최소한 약 28 시간, 최소한 약 29 시간, 최소한 약 30 시간, 최소한 약 31 시간, 최소한 약 32 시간, 최소한 약 33 시간, 최소한 약 34 시간, 최소한 약 35 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간인, 조성물.
청구항 120 내지 123 중 어느 하나의 항에 있어서, 국소 투여, 안구내 투여, 장관외 투여, 수막강내 투여, 경막하 투여 그리고 경구 투여로 구성된 군에서 선택된 경로에 의해 투여되는, 조성물.
청구항 124에 있어서, 상기 장관외 투여는 정맥내 또는 피하 투여인, 조성물.
청구항 120 내지 125 중 어느 하나의 항에 있어서, 출혈 질환 또는 상태의 치료를 필요로 하는 대상에서 출혈 질환 또는 상태를 치료하는데 이용되는, 조성물.
청구항 126에 있어서, 상기 출혈 질환 또는 상태는 출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 장요근에서 출혈그리고 이의 임의의 조합들로 구성된 군에서 선택되는, 조성물.
청구항 126 또는 127에 있어서, 상기 대상은 외과술을 받기로 예정된, 조성물.
청구항 126 또는 127 중 어느 하나의 항에 있어서, 상기 치료는 예방적 또는 일시적(episodic) 치료인, 조성물.
FVIII 단백질과 내생성 VWF의 상호작용을 방지 또는 저해시키는 방법에 있어서, 이 방법은 청구항 1 내지 108 중 어느 하나의 항에 따른 키메라 단백질, 청구항 109 내지 111 중 어느 하나의 항에 따른 상기 폴리뉴클레오티드, 청구항 112 내지 114 중 어느 하나의 항에 따른 벡터, 또는 청구항 115 내지 119 중 어느 하나의 항에 따른 숙주 세포, 또는 청구항 120 내지 129 중 어느 하나의 항에 따른 조성물의 유효량을 이를 필요로 하는 대상에게 추가하는 것을 포함하며, 이때 상기 VWF 단편은 상기 FVIII 단백질과 내생성 VWF의 상호작용을 저해 또는 방지하는, 방법.
FVIII 단백질의 반감기 제한 인자를 제거 또는 감소시키는 방법에 있어서, 상기 방법은 청구항 1 내지 108 중 어느 하나의 항에 따른 키메라 단백질, 청구항 109 내지 111 중 어느 하나의 항에 따른 폴리뉴클레오티드, 청구항 112 내지 114 중 어느 하나의 항에 따른 벡터, 또는 청구항 115 내지 119 중 어느 하나의 항에 따른 숙주 세포, 또는 청구항 120 내지 129 중 어느 하나의 항에 따른 조성물의 유효량을 추가하는 것을 포함하며, 이때 상기 키메라 단백질 또는 상기 폴리뉴클레오티드, 상기 벡터에 의해 인코드된, 또는 상기 숙주 세포에 의해 발현되는 키메라 단백질은 상기 FVIII 단백질과 내생성 VWF의 상호작용을 저해 또는 방지하는, 방법.
FVIII 단백질의 반감기를 연장 또는 증가시키는 방법에 있어서, 이때 상기 방법은 청구항 1 내지 108 중 어느 하나의 항에 따른 키메라 단백질, 청구항 109 내지 111 중 어느 하나의 항에 따른 폴리뉴클레오티드, 청구항 112 내지 114 중 어느 하나의 항에 따른 벡터, 또는 청구항 115 내지 119 중 어느 하나의 항에 따른 숙주 세포, 또는 청구항 120 내지 129 중 어느 하나의 항에 따른 조성물의 유효량을 추가하는 것을 포함하며, 이때 상기 키메라 단백질의 VWF 단편은 상기 FVIII 단백질과 내생성 VWF의 상호작용을 저해 또는 방지하는, 방법.
청구항 132에 있어서, 상기 FVIII 단백질의 반감기는 야생형 FVIII보다 최소한 약 1.5 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 4 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 11 배, 또는 최소한 약 12 배 더 길게 연장된, 방법.
청구항 133에 있어서, 상기 인자 VIII의 반감기는 최소한 약 17 시간, 최소한 약 18 시간, 최소한 약 19 시간, 최소한 약 20 시간, 최소한 약 21 시간, 최소한 약 22 시간, 최소한 약 23 시간, 최소한 약 24 시간, 최소한 약 26 시간, 최소한 약 27 시간, 최소한 약 28 시간, 최소한 약 29 시간, 최소한 약 30 시간, 최소한 약 31 시간, 최소한 약 32 시간, 최소한 약 33 시간, 최소한 약 34 시간, 최소한 약 35 시간, 최소한 약 36 시간, 최소한 약 48 시간, 최소한 약 60 시간, 최소한 약 72 시간, 최소한 약 84 시간, 최소한 약 96 시간, 또는 최소한 약 108 시간인, 방법.
출혈 질환 또는 상태의 치료를 필요로 하는 대상에게서 출혈 질환 또는 상태를 치료하는 방법에 있어서, 이 방법은 청구항 1 내지 108 중 어느 하나의 항에 따른 키메라 단백질, 청구항 109 내지 111 중 어느 하나의 항에 따른 폴리뉴클레오티드, 청구항 112 내지 114 중 어느 하나의 항에 따른 벡터, 또는 청구항 115 내지 119 중 어느 하나의 항에 따른 숙주 세포, 또는 청구항 120 내지 129 중 어느 하나의 항에 따른 조성물의 유효량을 투여하는 것을 포함하며, 이때 상기 출혈 질환 또는 장애는 출혈 응고 장애, 출혈관절증, 근육 출혈, 구강 출혈, 대량출혈, 근육으로 대량출혈, 구강 대량출혈, 외상, 외상 두부, 위장 출혈, 두개내 대량출혈, 복막내 대량출혈, 흉곽내 대량출혈, 뼈 골절, 중추신경계 출혈, 인두뒤 공간에서 출혈, 복막후방 공간에서 출혈, 장요근에서 출혈, 그리고 이의 임의의 조합들로 구성된 군에서 선택되는, 방법.
청구항 135에 있어서, 상기 치료는 예방적 또는 요청에 의한(일시적) 치료인, 방법.
청구항 130 내지 136 중 어느 하나의 항에 있어서, 상기 유효량은 0.1 μg/kg 내지 500 mg/kg인, 방법.
청구항 130 내지 137 중 어느 하나의 항에 있어서, 상기 키메라 단백질, 폴리뉴클레오티드, 숙주 세포, 또는 조성물은 국소 투여, 안구내 투여, 장관외 투여, 수막강내 투여, 경막하 투여 그리고 경구 투여로 구성된 군에서 선택된 경로에 의해 투여되는, 방법.
청구항 138에 있어서, 상기 장관외 투여는 정맥내 투여, 피하 투여, 근육내 투여, 그리고 경피 투여로 구성된 군에서 선택되는, 방법.
청구항 130 내지 139 중 어느 하나의 항에 있어서, 상기 대상은 인간인, 방법.
청구항 140에 있어서, 상기 대상은 혈우병 A를 앓고 있는, 방법.
키메라 단백질를 만드는 방법에 있어서, 이 방법은 청구항 109 내지 111 중 어느 하나의 항에 따른 폴리뉴클레오티드 또는 청구항 112 내지 114 중 어느 하나의 항에 따른 벡터를 하나 또는 그 이상의 숙주 세포에 형질감염시키고, 그리고 상기 숙주 세포 안에서 상기 VWF 단편 또는 상기 키메라 단백질을 발현시키는 것을 포함하는, 방법.
청구항 142에 있어서, 상기 벡터는 가공 효소가 인코드된 폴리뉴클레오티드를 더 포함하는, 방법.
청구항 143에 있어서, 상기 가공 효소는 PACE인, 방법.
청구항 144에 있어서, PACE는 상기 VWF 단편의 D1D2 도메인들을 절단하는, 방법.
청구항 142 및 143에 있어서, VWF의 D1 도메인과 D2 도메인를 발현시키는 폴리뉴클레오티드 서열로 하나 또는 그 이상의 숙주 세포를 형질감염시키는 것이 더 포함된, 방법.
청구항 1 내지 108 중 어느 하나의 항에 따른 상기 키메라 단백질을 작제하는 방법에 있어서, 이 방법은 소르타제 효소 존재하에 공유 결합으로 상기 부속 모이어티를 상기 FVIII 단백질에 결찰시키는 것을 포함하는, 방법.