KR20220092583A - 인자 viii 폴리펩타이드 - Google Patents
인자 viii 폴리펩타이드 Download PDFInfo
- Publication number
- KR20220092583A KR20220092583A KR1020227018508A KR20227018508A KR20220092583A KR 20220092583 A KR20220092583 A KR 20220092583A KR 1020227018508 A KR1020227018508 A KR 1020227018508A KR 20227018508 A KR20227018508 A KR 20227018508A KR 20220092583 A KR20220092583 A KR 20220092583A
- Authority
- KR
- South Korea
- Prior art keywords
- factor viii
- leu
- ser
- val
- glu
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/36—Blood coagulation or fibrinolysis factors
- A61K38/37—Factors VIII
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/48—Hydrolases (3) acting on peptide bonds (3.4)
- A61K38/482—Serine endopeptidases (3.4.21)
- A61K38/4846—Factor VII (3.4.21.21); Factor IX (3.4.21.22); Factor Xa (3.4.21.6); Factor XI (3.4.21.27); Factor XII (3.4.21.38)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/755—Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/00031—Uses of virus other than therapeutic or vaccine, e.g. disinfectant
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/00041—Use of virus, viral particle or viral elements as a vector
- C12N2710/00042—Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14123—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14142—Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Diabetes (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 상응하는 야생형 인자 VIII과 비교하여 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 폴리펩타이드를 제공하며, 여기서 하나 이상의 치환 돌연변이는 인자 VIII 폴리펩타이드의 2개 도메인 사이의 도메인 간(inter-domain) 계면(interface)에 위치한다. 또한, 본 발명의 인자 VIII 폴리펩타이드를 인코딩하는 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드, 이러한 폴리뉴클레오타이드를 포함하는 재조합 AAV 작제물, 이러한 재조합 AAV 작제물을 포함하는 AAV 바이러스 입자, 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, 또는 AAV 바이러스 입자를 포함하는 조성물, 및 요법에서 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 및 조성물의 용도가 제공된다.
Description
본 발명은 인자 VIII(FVIII) 폴리펩타이드, 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드, 및 재조합 AAV 작제물에 관한 것이다. 나아가, 본 발명은 본 발명의 재조합 AAV 작제물을 포함하는 AAV 바이러스 입자, 및 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자를 포함하는 조성물에 관한 것이다. 본 발명은 또한, 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 및/또는 조성물을 사용하는 방법, 및 용도에 관한 것이다.
A형 혈우병(haemophilia A)은 혈액 응고 인자 VIII의 결핍에 의해 야기되는 출혈 장애이다. 이는 세계적으로 1 : 4,000 내지 1 : 5,000의 남자 신생아에게 영향을 미친다. 대부분의 사례는 X-연관 열성 특성(X-linked recessive trait)으로서 유전된다. 현재의 치료는 인자 VIII 단백질의 빈번한 정맥내 주사(주당 2 내지 3회)를 수반한다. 이러한 치료는 출혈을 억제시키는 데 고도로 효과적이지만, 이는 치유적이지는 않고 비용이 매우 많이 들어서(£150,000/환자/년), 세계에서 대부분의 A형 혈우병 환자에 의해 선호되지 않게 된다. A형 혈우병에 대한 유전자 요법은 인자 VIII 유전자의 기능적 복사체를 유병(affected) 환자에게 이전시킨 후 인자 VIII의 지속적인 내인성 생성을 통해 치유에 대한 잠재성을 제공한다.
인자 VIII은 6개의 도메인, 즉, A1-A2-B-A3-C1-C2로 구성된다. 인자 VIII은 폰 빌레브란트(von Willebrand) 인자에 결합된 채로 혈류에서 비활성 형태로 순환된다. 손상에 반응하여, 인자 VIII은 활성화되고(그 후에 종종 인자 VIIIa로 지칭됨), 폰 빌레브란트 인자로부터 분리된다. 인자 VIIIa는 응고 캐스케이드에서 인자 IXa와 상호작용한다. 특히, 인자 FVIIIa는 인자 X의 활성화에서 인자 IXa에 대한 보조인자이다.
본 발명은 특정 아미노산 치환(치환 돌연변이)을 포함하는 인자 VIII 폴리펩타이드에 관한 것이다. 인자 VIII은 A1-A2-B 도메인, 및 A3-C1-C2 도메인으로 구성된 헤테로이량체성 복합체로서 비활성 형태로 발현되고 순환된다. 인자 VIII은 트롬빈에 의한 단백분해성 절단에 의해 활성화된다. 트롬빈 절단 후, 인자 VIII은 A1 도메인, A2 도메인, 및 A3-C1-C2 도메인으로 구성된 헤테로삼량체성 복합체를 형성하고 입체배좌(conformational) 변화를 겪으며, 이는 인자 IXa에의 결합 및 인자 X의 활성화를 가능하게 한다. 활성화 후, 인자 VIIIa는 추가의 단백분해를 겪을 수 있고/있거나 헤테로삼량체성 복합체의 각각의 성분은 서로로부터 해리되어, 인자 VIIIa를 비활성화시킬 수 있다. 본 발명자들은, 인자 VIII 폴리펩타이드의 고유 활성도(specific activity)를 증가시키는, 인자 VIII의 도메인의 계면(interface)에 위치한 소정의 아미노산의 치환을 식별하였다. 인자 VIII 폴리펩타이드의 고유 활성도를 증가시키는 것은, 응고가 발생하기 위해 더 적은 양의 인자 VIII 폴리펩타이드가 필요할 수 있음을 의미한다.
제1 양태에서, 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드가 제공되며, 여기서 FVIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간(inter-domain) 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도를 갖는다.
제2 양태에서, 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드가 제공되며, 여기서 인자 VIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는다.
제3 양태에서, 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드가 제공되며, 여기서 인자 VIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현된다.
제4 양태에서, 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드가 제공되며, 여기서 인자 VIII 아미노산 서열은
a.
SEQ ID NO: 1의 M662 또는 H693에 상응하는 아미노산의 치환; 또는
b.
시스테인 잔기로의 제1 아미노산 및 제2 아미노산을 포함하는 아미노산의 쌍의 치환
으로 이루어진 군으로부터 선택되는 하나 이상의 치환 돌연변이를 포함하고,
1.
제1 아미노산은 SEQ ID NO: 1의 M147, S149 또는 S289에 상응하고 제2 아미노산은 SEQ ID NO: 1의 E1969, E1970 또는 N1977에 상응하거나;
2.
제1 아미노산은 SEQ ID NO: 1의 T667, T669, N684, L687, I689, S695 또는 F697에 상응하고 제2 아미노산은 SEQ ID NO: 1의 S1791, G1799, A1800, R1803, E1844, S1949, G1981, V1982, 또는 Y1979에 상응하거나;
3.
제1 아미노산은 SEQ ID NO: 1의 A108, T118 또는 V137에 상응하고 제2 아미노산은 SEQ ID NO: 1의 N2172, Q2329 또는 Y2332에 상응한다.
제5 양태에서, 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드가 제공되며, 여기서 인자 VIII 뉴클레오타이드 서열은 본 발명의 인자 VIII 폴리펩타이드를 인코딩한다.
제6 양태에서, 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함하는 재조합 AAV 작제물이 제공되며, 여기서 인자 VIII 뉴클레오타이드 서열은 본 발명의 인자 VIII 폴리펩타이드를 인코딩한다.
제7 양태에서, 본 발명의 재조합 AAV 작제물을 포함하는 AAV 바이러스 입자가 제공된다.
제8 양태에서, 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자 및 약학적으로 허용 가능한 부형제를 포함하는 조성물이 제공된다.
제9 양태에서, 치료 방법에 사용하기 위한 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물이 제공된다.
제10 양태에서, 유효량의 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물을 환자에게 투여하는 단계를 포함하는 치료 방법이 제공된다.
제11 양태에서, 치료 방법에 사용하기 위한 약제의 제조에 있어서 본 발명의 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물의 용도가 제공된다.
도 1은 수성상으로부터 비-수성상(옥타놀)으로의 아미노산의 자유 에너지(△G) 전이에 대한 윔리-화이트(Wimley-White) 소수성 스케일을 도시한다. 더 음성의 △G 값은 수성상으로부터 비-수성상으로의 더 선호할 만한 전이와 관련이 있고, 더 소수성 아미노산을 의미한다.
도 2는 임의의 치환 돌연변이가 결여된 FVIII-SQ('95') 대조군과 비교하여, 각각의 변이체에 대한 많은 대안적인 치환된 잔기를 포함하여, 몇몇 상이한 아미노산 치환 돌연변이 변이체에 대한 SA(고유 활성도)의 배수-변화(fold-change)를 도시한다. 변이체 65(H693W)는 95와 비교하여 SA의 상승을 나타낸다.
도 3은 임의의 치환 돌연변이가 결여된 FVIII-SQ('95') 대조군과 비교하여, 몇몇 상이한 이중 시스테인 치환 돌연변이 변이체에 대한 SA의 배수-변화를 도시한다. 많은 변이체는 95와 비교하여 SA의 상승을 나타낸다.
도 4는 치환 돌연변이를 포함하는 일련의 인자 VIII 폴리펩타이드의 인자 VIII 고유 활성도를 도시한다. 고유 활성도에 미치는 치환 돌연변이의 효과는 임의의 치환 돌연변이를 포함하지 않은 인자 VIII-SQ 대조군과 비교하여, 'SQ' 및 '96-106' 인자 VIII 폴리펩타이드에서 평가되었다. 오차 막대는 ELISA 및 활성 검정에서 시료 2벌(duplicate)로부터의 표준 편차를 나타낸다.
도 5는 2 × 1012 vg/kg의, 작제물 FRE72-SP5-FVIIICo19(26-96-106)-SpA(SEQ ID NO: 27); FRE72-SP5-FVIIICo19-SQ-SpA(SEQ ID NO: 32); 또는 네이티브(native) FVIII 신호 펩타이드, SpA 및 간-특이적 프로모터와 함께 코돈-최적화된 FVIII-SQ-인코딩 서열을 포함하는 비교인자(comparator) 작제물(SEQ ID NO: 34)로부터 제조된 AAV8 바이러스 입자가 정맥내로 주사된 C7BL/6 FVIII 넉아웃 마우스의 혈장에서 주사-후 6주째에 인자 VIII 고유 활성도를 도시한다. **P = 0.0038. 좌측 패널은 미접촉(naive) 대조군과 비교하여, FRE72-SP5-FVIIICo19(26-96-106)-SpA(좌측 컬럼) 및 비교인자 작제물(중간 컬럼)의 고유 활성도를 도시하고; 우측 패널은 FRE72-SP5-FVIIICo19-SQ-SpA(좌측 컬럼) 및 비교인자 작제물(우측 컬럼)의 고유 활성도를 도시한다.
서열 목록의 설명
도 2는 임의의 치환 돌연변이가 결여된 FVIII-SQ('95') 대조군과 비교하여, 각각의 변이체에 대한 많은 대안적인 치환된 잔기를 포함하여, 몇몇 상이한 아미노산 치환 돌연변이 변이체에 대한 SA(고유 활성도)의 배수-변화(fold-change)를 도시한다. 변이체 65(H693W)는 95와 비교하여 SA의 상승을 나타낸다.
도 3은 임의의 치환 돌연변이가 결여된 FVIII-SQ('95') 대조군과 비교하여, 몇몇 상이한 이중 시스테인 치환 돌연변이 변이체에 대한 SA의 배수-변화를 도시한다. 많은 변이체는 95와 비교하여 SA의 상승을 나타낸다.
도 4는 치환 돌연변이를 포함하는 일련의 인자 VIII 폴리펩타이드의 인자 VIII 고유 활성도를 도시한다. 고유 활성도에 미치는 치환 돌연변이의 효과는 임의의 치환 돌연변이를 포함하지 않은 인자 VIII-SQ 대조군과 비교하여, 'SQ' 및 '96-106' 인자 VIII 폴리펩타이드에서 평가되었다. 오차 막대는 ELISA 및 활성 검정에서 시료 2벌(duplicate)로부터의 표준 편차를 나타낸다.
도 5는 2 × 1012 vg/kg의, 작제물 FRE72-SP5-FVIIICo19(26-96-106)-SpA(SEQ ID NO: 27); FRE72-SP5-FVIIICo19-SQ-SpA(SEQ ID NO: 32); 또는 네이티브(native) FVIII 신호 펩타이드, SpA 및 간-특이적 프로모터와 함께 코돈-최적화된 FVIII-SQ-인코딩 서열을 포함하는 비교인자(comparator) 작제물(SEQ ID NO: 34)로부터 제조된 AAV8 바이러스 입자가 정맥내로 주사된 C7BL/6 FVIII 넉아웃 마우스의 혈장에서 주사-후 6주째에 인자 VIII 고유 활성도를 도시한다. **P = 0.0038. 좌측 패널은 미접촉(naive) 대조군과 비교하여, FRE72-SP5-FVIIICo19(26-96-106)-SpA(좌측 컬럼) 및 비교인자 작제물(중간 컬럼)의 고유 활성도를 도시하고; 우측 패널은 FRE72-SP5-FVIIICo19-SQ-SpA(좌측 컬럼) 및 비교인자 작제물(우측 컬럼)의 고유 활성도를 도시한다.
서열 목록의 설명
일반적인 정의
달리 정의되지 않는 한, 본원에 사용되는 기술적 및 과학적 용어는 본 발명이 속한 당업계의 당업자에 의해 보편적으로 이해되는 것과 동일한 의미를 갖는다.
일반적으로, 용어 "포함하는(comprising)"은 포함하지만 이로 제한되지 않는 것으로 의미되는 것으로 의도된다. 예를 들어, 어구 "인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드"는, 인자 VIII 폴리펩타이드가 인자 VIII 아미노산 서열을 갖지만 인자 VIII 폴리펩타이드가 추가 아미노산을 함유할 수 있음을 의미하는 것으로 해석되어야 한다. 유사하게는, 어구 "인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드"는 인자 VIII 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드를 지칭하지만, 폴리뉴클레오타이드는 추가의 뉴클레오타이드를 함유할 수 있다.
본 발명의 일부 구현예에서, 단어 "포함하는"은 어구 "본질적으로 ~로 구성되는"으로 대체된다. 용어 "본질적으로 ~로 구성되는"은, 특정한 추가 성분, 즉, 주제의 본질적인 특징에 실질적으로 영향을 미치지 않는 성분이 존재할 수 있음을 의미한다.
본 발명의 일부 구현예에서, 단어 "포함하는"은 어구 "~로 구성되는"으로 대체된다. 용어 "~로 구성되는"은 제한적인 것으로 의도된다. 예를 들어, 어구 "인자 VIII 아미노산 서열로 구성되는 인자 VIII 폴리펩타이드"는, 인자 VIII 폴리펩타이드가 인자 VIII 아미노산 서열을 갖고 어떠한 추가의 아미노산을 갖지 않음을 의미하는 것으로 해석되어야 한다. 유사하게는, 어구 "인자 VIII 뉴클레오타이드 서열로 구성되는 폴리뉴클레오타이드"는, 폴리뉴클레오타이드가 인자 VIII 뉴클레오타이드 서열을 갖고 어떠한 추가의 뉴클레오타이드를 갖지 않음을 의미하는 것으로 이해되어야 한다.
본 발명의 일부 구현예에서, 단어 "갖는다"는 단어 "포함하다" 또는 어구 "~로 구성되다"로 대체될 수 있다.
용어 "단백질" 및 "폴리펩타이드"는 본원에서 상호 교환적으로 사용되고, 임의의 길이의 아미노산의 중합체성 사슬을 지칭하는 것으로 의도된다.
용어 "핵산 분자", "핵산 서열", "폴리뉴클레오타이드" 및 "뉴클레오타이드 서열"은 본원에서 상호 교환적으로 사용되고, 임의의 길이의 뉴클레오타이드의 중합체성 사슬을 지칭하는 것으로 의도된다.
용어 "치환 돌연변이" 및 "아미노산 치환"은 본원에서 상호 교환적으로 사용되고, 상이한 아미노산으로의 아미노산 서열 내 하나의 아미노산의 치환을 의미하는 것으로 의도된다. 어구 아미노산 X"의 치환", 또는 "치환되는(될) 아미노산 X"에서, 아미노산 X는 아미노산 서열 내에 존재하고 대체될 원래의 또는 네이티브 아미노산이다. 예를 들어, 메티오닌의 치환은, 네이티브 메티오닌 아미노산이 다른 아미노산에 의해 대체됨을 의미한다. 어구 아미노산 Y"로의 치환"에서, 아미노산 Y는 아미노산 서열 내 원래의 또는 네이티브 아미노산을 대체하는 상이한 아미노산이다. 예를 들어, 메티오닌으로의 치환은 메티오닌으로의 네이티브(비-메티오닌) 아미노산의 대체를 지칭한다. 치환 돌연변이를 정의하는 데 사용되는 표준 약칭 명명법은 치환될 아미노산 서열 내 위치에서의 원래의 또는 네이티브 아미노산, 및 원래의 또는 네이티브 아미노산을 대체하는 아미노산을 나열한다. 예를 들어, 치환 돌연변이 M662W를 포함하는 인자 VIII 아미노산 서열은, 위치 662에 상응하는 위치에서 트립토판 잔기로의 메티오닌 잔기의 치환을 포함하는(즉, 위치 662에 트립토판 잔기를 포함함) 인자 VIII 아미노산 서열을 지칭한다.
용어 "보존적 치환"은, 아미노산이 유사한 생화학적 특성, 예컨대 크기, 전하 또는 소수성을 갖는 다른 아미노산으로 치환되는 치환 돌연변이를 지칭한다. 아미노산은 이의 측쇄의 구조에 기초하여 군(group)으로 범주화될 수 있다: 지방족(글리신, 알라닌, 발린, 류신, 이소류신); 하이드록실/황-함유(세린, 트레오닌, 시스테인, 메티오닌); 환식(프롤린); 방향족(페닐알라닌, 티로신, 트립토판); 염기성(히스티딘, 리신, 아르기닌); 산성(아스파르트산, 글루탐산); 및 산 아민(아스파라긴, 글루타민). 그러므로, "보존적 치환"은, 아미노산이 동일한 군의 다른 아미노산으로 치환되는 치환 돌연변이를 지칭한다. 대조적으로, 용어 "비-보존적 치환"은, 아미노산이 상이한 생화학적 특성을 갖는 다른 아미노산으로 치환되는 치환, 즉, 아미노산이 다른 군 내의 아미노산으로 치환되는 치환 돌연변이를 지칭한다. 예를 들어, 글루탐산으로의 아스파르트산의 치환은 "보존적 치환"인 것으로 여겨질 수 있는 한편, 발린으로의 아스파르트산의 치환은 "비-보존적" 치환인 것으로 여겨질 수 있다.
용어 "야생형" 및 "네이티브"는 본원에서 상호 교환적으로 사용되고, 천연 발생하는 것을 기재하는 것으로 의도된다. 예를 들어, "야생형 인자 VIII 아미노산 서열"은 자연상에서 발생하는 아미노산 인자 VIII 서열이다.
용어 "B 도메인" 및 "베타 도메인"은 인자 VIII의 B 도메인과 관련하여 본원에서 상호 교환적으로 사용된다. 야생형 인자 VIII의 B 도메인은 SEQ ID NO: 1의 아미노산 741-1648에 상응하는 영역으로 구성된다.
용어 "AAV 바이러스 입자" 및 "AAV 벡터"는 본원에서 상호 교환적으로 사용된다.
뉴클레오타이드 또는 아미노산 서열의 길이를 기재하는 맥락에서 사용되는 용어 "대략"은, 서열이 정의된 수 +(플러스) 또는 -(마이너스) 10%, 더 특히 + 또는 - 5%, 또는 더 특히 + 또는 - 단일 정수(single integer)의 뉴클레오타이드 또는 아미노산을 포함하거나 구성될 수 있음을 나타낸다. 예를 들어, "대략" 45개 아미노산 길이의 아미노산 서열에 대한 지칭은 41개 내지 49개 아미노산, 더 특히 43개 내지 47개 아미노산, 및 더 특히 44개 내지 46개 아미노산 길이의 아미노산 서열을 지칭할 수 있다.
본 발명의 목적을 위해, 2개 서열(예컨대 2개 폴리뉴클레오타이드 또는 2개 폴리펩타이드 서열)의 동일성 백분율을 결정하기 위해, 서열은 최적 비교 목적을 위해 정렬된다(예를 들어, 갭(gap)은 제2 서열과의 최적 정렬을 위해 제1 서열에 도입될 수 있음). 그 후에, 각각의 위치에서의 뉴클레오타이드 또는 아미노산 잔기가 비교된다. 제1 서열 내 위치가 제2 서열 내 상응하는 위치와 동일한 뉴클레오타이드 또는 아미노산에 의해 점유될 때, 뉴클레오타이드 또는 아미노산은 해당 위치에서 동일하다. 2개 서열 사이의 동일성 백분율은 서열에 의해 공유되는 동일한 위치의 수의 함수이다(즉, 동일성 % = 동일한 위치의 갯수 / 기준 서열 내 위치의 총 갯수 × 100).
전형적으로 서열 비교는 기준 서열의 길이에 걸쳐 수행된다. 예를 들어, 사용자가 주어진("시험") 서열이 SEQ ID NO: 3과 95% 동일한지의 여부를 결정하기 원한다면, SEQ ID NO: 3이 기준 서열일 것이다. 서열이 SEQ ID NO: 3(기준 서열의 일례)과 적어도 95% 동일한지의 여부를 평가하기 위해, 당업자는 SEQ ID NO: 3의 길이에 걸쳐 정렬을 수행하고, 시험 서열 내 얼마나 많은 위치가 SEQ ID NO: 3과 동일한지 식별할 것이다. 위치 중 적어도 95%가 동일하다면, 시험 서열은 SEQ ID NO: 3과 적어도 95% 동일하다. 서열이 SEQ ID NO: 3보다 더 짧다면, 갭 또는 결측(missing) 위치는 동일하지 않은 위치인 것으로 여겨져야 한다.
당업자는 2개 서열 사이의 상동성 또는 동일성을 결정하기 위해 이용 가능한 상이한 컴퓨터 프로그램을 알고 있다. 예를 들어, 2개 서열 사이에서 서열의 비교 및 동일성 백분율의 결정은 수학적 알고리즘을 사용하여 얻어질 수 있다. 일 구현예에서, 2개 아미노산 또는 핵산 서열 사이의 동일성 백분율은 Needleman 및 Wunsch(1970) 알고리즘을 사용하여 결정되며, 이는 Blosum 62 매트릭스 또는 PAM250 매트릭스, 16, 14, 12, 10, 8, 6, 또는 4의 갭 가중치(gap weight) 및 1, 2, 3, 4, 5, 또는 6의 길이 가중치(length weight)를 사용하여 Accelrys GCG 소프트웨어 패키지(http://www.accelrys.com/products/gcg/에서 입수 가능함) 내 GAP 프로그램 내로 혼입되었다.
단수형(a", "an", 및 "the")은 문맥상 분명하게 다르게 지시하지 않는 한, 복수형을 포함한다. 그러므로, 예를 들어, "아미노산"에 대한 지칭은 이러한 아미노산의 2개 이상의 경우 또는 버전을 포함한다.
위에서 또는 아래에서 본원에서 인용되는 모든 공보, 특허 및 특허 출원은 그 전체 내용이본원에 인용되어 포함된다.
기능 돌연변이의 획득
활성화된 인자 VIII 헤테로삼량체성 복합체의 각각의 성분의 해리(특히, A1 도메인 및 A3-C1-C2 도메인으로부터 A2 도메인의 해리)는 응고 캐스케이드의 활성화 후 인자 VIII 활성의 소실에 대한 주요한 기전 중 하나인 것으로 여겨진다. 이론으로 결부시키고자 하는 것은 아니지만, 본 발명의 즉각적인 아미노산 치환 돌연변이는 인자 VIII 폴리펩타이드의 활성화 후 인자 VIII 헤테로삼량체성 복합체의 각각의 성분의 해리를 방지하거나 지연시켜, FVIIIa가 무손상(intact)이어서 활성인 시간을 연장시키는 역할을 할 수 있는 것으로 여겨진다.
본 발명의 인자 VIII 폴리펩타이드는 상응하는 야생형 인자 VIII 아미노산 서열과 비교하여 하나 이상의 치환 돌연변이를 포함한다. 더 특히, 하나 이상의 치환 돌연변이는 인자 VIII 폴리펩타이드의 2개 도메인 사이의 도메인간 계면에 위치한다. 특히, 하나 이상의 치환 돌연변이는 A1/A3 도메인 계면, A2/A3 도메인 계면, 또는 A1/C2 도메인 계면으로부터 선택되는 도메인간 계면에 위치한다. 따라서, 인자 VIII 아미노산 서열은 A1, A2, A3 또는 C2 도메인에 치환 돌연변이를 포함한다. 인자 VIII의 3-차원 결정 구조가 이용 가능하고(예를 들어, PDB 기탁 번호 2RZE 또는 4BDV); 따라서, 이들 도메인 내에서 치환될 수 있는 아미노산, 더 특히 명시된 도메인간 계면에 놓인 아미노산을 식별하는 것이 일상적일 것이다. 야생형 인자 VIII과 관련하여, A1 도메인은 SEQ ID NO: 1의 위치 1-329에 상응하는 아미노산으로 구성되며; A2 도메인은 SEQ ID NO: 1의 위치 380-711에 상응하는 아미노산으로 구성되고; A3 도메인은 SEQ ID NO: 1의 위치 1694-2021에 상응하는 아미노산으로 구성되며; C1 도메인은 SEQ ID NO: 1의 위치 2021-2169에 상응하는 아미노산으로 구성되고; C2 도메인은 SEQ ID NO: 1의 위치 2174-2332에 상응하는 아미노산으로 구성된다. 마지막 6개 아미노산(SEQ ID NO: 1의 위치 2327 내지 2332에 상응함)은 C2 도메인의 부분인 것으로 여겨지지 않을 수 있다. 그러므로, 선택적으로, C2 도메인은 SEQ ID NO: 1의 위치 2174-2326에 상응하는 아미노산으로 구성된다.
특정 구현예에서, 본원에 개시된 바와 같이 A1/A3 도메인 계면, A2/A3 도메인 계면 또는 A1/C2 도메인 계면에 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도를 가질 수 있다. 인자 VIII 폴리펩타이드의 고유 활성도를 증가시키는 예시적인 치환 돌연변이는 본원에 개시되어 있다.
인자 VIII은 응고 캐스케이드에서 인자 X에 대한 보조인자이고, 일단 활성화되면 활성화된 인자 IX와 조합되어 작용하여 인자 X를 활성화시킨다. 인자 VIII은 그 자체로는 독립적으로 효소 활성을 소유하지 않는다. 그러므로, 본원에서 인자 VIII 폴리펩타이드의 활성 또는 고유 활성도라는 지칭은 인자 X의 활성을 결정하기 위한 기능적 검정에서 관찰된 활성 또는 고유 활성도를 지칭하며, 여기서 인자 VIII은 인자 IX와 조합되어 인자 X에 대한 보조인자로서 역할을 할 수 있다(즉, 인자 VIII 보조인자 활성(FVIII:C)). 유사하게는, 기준 인자 VIII 폴리펩타이드(예컨대 야생형 인자 VIII 폴리펩타이드)보다 더 높은 활성 또는 고유 활성도를 갖는 인자 VIII 폴리펩타이드라는 지칭은 기능적 검정에서 기준 인자 VIII 폴리펩타이드에 대한 인자 X의 관찰된 활성 또는 고유 활성도와 비교하여 상기 검정에서 상기 인자 VIII 폴리펩타이드에 대해 증가되는 인자 X의 관찰된 활성 또는 고유 활성도를 지칭한다.
인자 VIII 폴리펩타이드가 기준 인자 VIII 폴리펩타이드, 예컨대 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 고유 활성도를 증가시켰는지의 여부를 결정하기 위해, 인자 VIII 폴리펩타이드의 활성은 2 단계 발색 인자 Xa 검정에 의해 측정될 수 있다. 예를 들어, 적합한 발색 검정은 하기와 같다. 인자 VIII 폴리펩타이드는 인간 인자 X 폴리펩타이드 및 인자 IXa 폴리펩타이드, 트롬빈, 인지질 및 칼슘과 혼합된다. 트롬빈은 인자 VIII 폴리펩타이드를 활성화시켜, 인자 VIIIa 폴리펩타이드를 형성한다. 트롬빈-활성화된 인자 VIII 폴리펩타이드는 인자 IXa 폴리펩타이드, 인지질 및 칼슘과 효소 복합체를 형성하며, 이러한 효소 복합체는 인자 X 폴리펩타이드로부터 인자 Xa 폴리펩타이드로의 전환을 촉매화할 수 있다. 인자 Xa 폴리펩타이드의 활성은 발색 기질(예를 들어 SXa-11)의 절단을 촉매화하여, pNA를 생성할 수 있다. 생산된 pNA의 수준은 405 nm에서 발색을 결정함으로써 측정(예를 들어 흡광도에 의해 측정)될 수 있다. 인자 X 폴리펩타이드, 그리고 따라서 인자 Xa 폴리펩타이드는 과량으로 제공된다. 따라서, 제한 인자는 인자 VIIIa 폴리펩타이드이다. 그러므로, 생산된 pNA의 수준은 시료 내 인자 FVIIIa 폴리펩타이드에 의해 생산되는 인자 Xa 폴리펩타이드의 양에 비례하며, 이는 시료 내 인자 FVIIIa 폴리펩타이드의 활성에 비례한다. 시료 내 인자 FVIIIa 폴리펩타이드의 활성은 시료 내 인자 FVIII 폴리펩타이드의 보조인자 활성의 측정치(measure)이다.
예를 들어, 적합한 발색 검정은 실시예에 사용된 바와 같이 HYPHEN BioMed에 의해 제작된 BIOPHEN FVIII:C 검정(Ref: 221406)이다. 인자 VIII 폴리펩타이드의 활성은 BIOPHEN FVIII:C 검정을 사용하여 측정될 수 있다. 더 특히, 인자 VIII 폴리펩타이드의 활성은 실시예에서 아래 기재된 프로토콜에 따라 BIOPHEN FVIII:C 검정을 사용하여 측정될 수 있다.
본 출원의 목적을 위해, 용어 "고유 활성도"는, 활성이 시료 내 인자 VIII 폴리펩타이드의 양 또는 농도를 고려하도록 '정규화(normalised)'되게 하는 인자 VIII 폴리펩타이드의 단위당(예를 들어 정상 인간 혈장에서 μg당, IU당, 또는 수준의 %로서의 항원 수준당) 활성(예를 들어 응고 활성 또는 내재적인(intrinsic) 효소 활성)을 지칭한다(전형적으로, 풀링된(pooled) 건강한 인간 혈장은 0.2 μg/ml의 인자 VIII 농도를 가짐을 주목함). 이는, 시료 내 인자 VIII 폴리펩타이드의 농도를 예를 들어 표준 ELISA 검정, 예컨대 실시예 1에 기재된 검정을 사용하여 측정하고, 활성을 인자 VIII 농도로 나눔으로써 수행될 수 있다. 발색 검정은 "고유 활성도"를 측정하는 데 사용될 수 있다. 발색 검정은 시료 내 인자 VIII 폴리펩타이드의 활성을 계산하고 농도로 나눔으로써 "고유 활성도"를 측정하는 데 사용될 수 있다. 발색 검정은 본원에 기재된 발색 검정 중 임의의 하나일 수 있다.
ELISA 검정의 일례에서, 인자 VIII 폴리펩타이드에 결합하는 항체는 플레이트에 결합될 수 있을 것이다. 미지의 농도의 인자 VIII 폴리펩타이드를 포함하는 시료는 플레이트에 걸쳐 통과될 수 있을 것이다. 인자 VIII 폴리펩타이드에 결합하는 제2 검출 항체가 플레이트에 적용되고, 임의의 과량은 씻겨 나갈 수 있을 것이다. 잔존하는(즉, 씻겨 나가지 않는) 검출 항체는 인자 VIII 폴리펩타이드에 결합될 것이다. 검출 항체는 효소, 예컨대 겨자무 퍼옥사다제(horse radish peroxidase)에 연결될 수 있을 것이다. 플레이트 상의 인자 VIII 폴리펩타이드에 결합하는 검출 항체의 수준은 검출 항체의 양을 측정함으로써 측정될 수 있을 것이다. 예를 들어, 검출 항체가 겨자무 퍼옥시다제에 연결된다면, 겨자무 퍼옥시다제는 기질, 예컨대 TMB(3,3',5,5'-테트라메틸벤지딘)로부터 청색 반응 생성물의 생성을 촉매화할 수 있고, 청색 생성물의 수준은 450 nm에서 흡광도에 의해 검출될 수 있다. 청색 생성물의 수준은 세척 단계 후에 잔존한 검출 항체의 양에 비례하며, 이는 시료 내 인자 VIII 폴리펩타이드의 양에 비례한다. 대안적으로, 예를 들어 정제된 단백질을 사용할 때, 인자 VIII 폴리펩타이드의 양 또는 농도는 분광광도적으로 결정될 수 있다.
소정의 구현예에서, 인자 VIII 폴리펩타이드는 정제되고, 고유 활성도는 정제된 인자 VIII 폴리펩타이드 상에서 수행된 발색 검정에 의해 측정된다. 일부 구현예에서, 인자 VIII 폴리펩타이드의 고유 활성도는, 인자 VIII 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드를 포함하는 AAV 입자를 생산하고, 마우스에게 상기 AAV 입자를 주사하고, 상기 마우스로부터의 혈장 내 고유 활성도를 발색 검정을 사용하여 검출함으로써 측정될 수 있다. 일부 구현예에서, 인자 VIII 폴리펩타이드의 고유 활성도는, 인자 VIII 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드를 안정하게 발현하는 세포를 제공하고, 상기 세포로부터 인자 VIII 폴리펩타이드를 수확하고/하거나 인자 VIII 폴리펩타이드의 고유 활성도를 발색 검정을 사용하여 측정함으로써 측정된다.
인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드(예컨대 기준 야생형 인자 VIII 폴리펩타이드)의 고유 활성도보다 더 높은 고유 활성도를 가질 수 있다. 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드의 고유 활성도보다 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배, 적어도 5배, 또는 적어도 5.5배 더 높은 고유 활성도를 가질 수 있다. 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드의 고유 활성도보다 1.2배 내지 5.5배, 또는 1.5배 내지 5배의 더 높은 고유 활성도를 가질 수 있다. 활성의 배수 변화를 지칭할 때, 용어 "~내지~"는 명시된 값을 포함한다. 그러므로, 예를 들어 "1.2배 내지 5.5배"는 1.2의 값 및 5.5의 값을 포함한다.
추가 구현예에서, 본원에 개시된 바와 같이 A1/A3 도메인 계면, A2/A3 도메인 계면 또는 A1/C2 도메인 계면에 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다.
기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는 인자 VIII 폴리펩타이드는 시간 경과에 따라 기준 인자 VIII 폴리펩타이드보다 더 높은 비율의 이의 인자 VIII 활성을 보유한다. 본 발명의 인자 VIII 폴리펩타이드는 활성화되기 전 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있으며, 즉, 인자 VIII 폴리펩타이드는 이의 비활성 형태에서, 비활성 형태의 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다. 다시 말해, 본 발명의 비활성 인자 VIII 폴리펩타이드는 비활성 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다. 대안적으로 또는 추가로, 본 발명의 인자 VIII 폴리펩타이드는 활성화될 때의 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다. 다시 말해, 본 발명의 활성 인자 VIII 폴리펩타이드는 활성 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다.
인자 VIII 폴리펩타이드는 활성화 전 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다. 활성화 전 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는, 더 높은 비율의 인자 VIII 폴리펩타이드는 시간 경과에 따라 기준 인자 VIII 폴리펩타이드보다 활성화될 수 있도록 유지될 수 있다. 활성화 전 인자 VIII 폴리펩타이드의 안정성은 시료 내 잔여 인자 VIII 활성을 시간 경과에 따라 측정함으로써 결정될 수 있다. 비활성화된 인자 VIII 폴리펩타이드를 함유하는 시료의 분취물은 적합한 시점에서 제거될 수 있고, 인자 VIII 폴리펩타이드 활성은 분취물에서 인자 VIII 폴리펩타이드를 활성화시키고, 본원에 기재된 바와 같은 2 단계 인자 X 발색 검정을 수행함으로써 결정될 수 있다. 그 후에, 주어진 시점에서의 활성은 시료의 초기 인자 VIII 활성과(즉, 초기 시점에서 인자 VIII 활성을 결정함으로써) 비교될 수 있고, 잔여 인자 VIII 활성은 초기 인자 VIII 활성의 백분율로서 계산될 수 있다. 그러므로, 일단 활성화되면, 활성화 전 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드보다 더 높은 잔여 활성을(즉, 초기 인자 VIII 폴리펩타이드 활성의 백분율로서) 가질 것이다.
선택적으로, 시료 내 비활성 인자 VIII 폴리펩타이드의 잔여 활성은 5분, 10분, 15분, 20분, 25분, 30분, 45분 또는 60분의 경과에 걸쳐, 또는 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 18시간 또는 24시간의 경과에 걸쳐, 또는 2일, 3일, 4일, 5일, 6일 또는 7일의 경과에 걸쳐 측정될 수 있다. 시료의 분취물은 초기 시점에서 시료의 분취물을 얻는 것에 더하여 일련의 시점, 예를 들어 2개 이상, 3개 이상, 4개 이상, 5개 이상 또는 6개 이상의 시점에서 얻어질 수 있고, 각각의 분취물 내 인자 VIII 활성이 결정될 수 있다. 각각의 시점에서의 인자 VIII 활성을 초기 시점에서의 인자 VIII 활성과 비교하는 것은 잔여 인자 VIII 활성이 결정되게 한다. 선택적으로, 고유 활성도는 각각의 시점에서 결정될 수 있다.
인자 VIII 폴리펩타이드는 활성화될 때의 기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 가질 수 있다. 활성화될 때의 기준 FVIII 폴리펩타이드보다 더 높은 안정성을 갖는 인자 VIII 폴리펩타이드는 활성화 후 시간 경과에 걸쳐 기준 인자 VIII 폴리펩타이드보다 더 높은 비율의 이의 인자 VIII 활성을 보유할 수 있다. 활성화 후 인자 VIII 폴리펩타이드의 안정성은 즉, FVIIIa 활성 붕괴(decay) 검정에서 시료 내 인자 VIII 폴리펩타이드 활성을 시간 경과에 걸쳐 측정함으로써 결정될 수 있다. 인자 VIII 폴리펩타이드는 23℃에서 1분 동안 트롬빈을 사용하여 활성화되고, 히루딘(hirudin)을 사용하여 즉시 켄칭되어, 트롬빈을 비활성화시킬 수 있다. 분취물은 적합한 시점에서 제거될 수 있고, 활성은 인자 X 발색 검정을 사용하여 결정될 수 있다.
선택적으로, 시료 내 활성 인자 VIII 폴리펩타이드의 활성은 활성화 후 5분, 10분, 15분, 20분, 25분 또는 30분의 경과에 걸쳐 측정될 수 있다. 활성은 활성화 후(예를 들어 활성화 직후) 시료 내 인자 VIII의 활성을 결정하는 것에 더하여, 활성화 후 일련의 시점, 예를 들어 2개 이상, 3개 이상, 4개 이상, 5개 이상 또는 6개 이상의 시점에서 결정될 수 있다. 대표적인 예로서, 시료 내 인자 VIII의 활성은 활성화 직후 결정될 수 있고, 추가 측정은 20분의 활성화 이내에 일련의 최대 6개 시점에서 수행될 수 있다. 선택적으로, 고유 활성도는 각각의 시점에서 결정될 수 있다.
기준 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드와 비교하여 더 긴 반감기를 가질 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 활성화 전 기준 인자 VIII 폴리펩타이드보다 더 긴 반감기를 갖는다. 선택적으로, 인자 VIII 폴리펩타이드는 활성화될 때의 기준 인자 VIII보다 더 긴 반감기를 갖는다. 선택적으로, 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배인 반감기를 갖는다. 선택적으로, 인자 VIII 폴리펩타이드는 활성화될 때의 기준 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배인, 활성화될 때의 반감기를 갖는다. 선택적으로, 인자 VIII 폴리펩타이드는 활성화될 때의 기준 인자 VIII 폴리펩타이드의 반감기의 1.1배 내지 3배, 1.2배 내지 3배, 1.5배 내지 3배, 1.7 내지 3배, 1.8배 내지 3배, 2배 내지 3배, 2.2배 내지 3배, 2.5배 내지 3배, 또는 2.8배 내지 3배의 활성화될 때의 반감기를 갖는다.
선택적으로, 인자 VIII 폴리펩타이드는 액체에서(즉, 용액으로 있을 때) 더 높은 안정성을 가질 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 액체에서 더 긴 반감기를 갖는다. 선택적으로, 액체는 조건화된 배지, 예컨대 인자 VIII 폴리펩타이드를 발현하는 숙주 세포가 배양되는 조건화된 배지이다. 선택적으로, 액체는 생물학적 시료이다. 생물학적 시료는 혈액, 혈청 또는 혈장일 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 혈장에서 더 높은 안정성을 가질 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 혈장에서 더 긴 반감기를 가질 수 있다.
더 추가의 구현예에서, 본원에 개시된 바와 같이 A1/A3 도메인 계면, A2/A3 도메인 계면 또는 A1/C2 도메인 계면에 하나 이상의 아미노산의 치환을 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드는 숙주 세포에서 기준 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현될 수 있다. 예를 들어, 치환을 포함하는 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드와 비교하여 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.8배, 적어도 2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배 또는 적어도 5배 더 높게 발현될 수 있다. 선택적으로, 치환을 포함하는 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드와 비교하여 1.1배 내지 5배, 1.2배 내지 5배, 1.5배 내지 5배, 1.8배 내지 5배, 2배 내지 5배, 2.5배 내지 5배, 3배 내지 5배, 3.5배 내지 5배, 4배 내지 5배 또는 4.5배 내지 5배 더 높게 발현될 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 숙주 세포에 의해 기준 인자 VIII 폴리펩타이드보다 더 높은 수준으로 분비된다.
인자 VIII 폴리펩타이드의 발현 수준(따라서 인자 VIII 폴리펩타이드가 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현되는지의 여부)은 전형적으로, 시료 내 인자 VIII 폴리펩타이드의 수준을 측정함으로써 결정될 수 있다. 숙주 세포에서의 본 발명의 인자 VIII 폴리펩타이드의 발현 수준은 숙주 세포에서의 기준 인자 VIII 폴리펩타이드의 발현 수준과 비교될 수 있다. 이는 정량적으로 결정될 수 있다. 예를 들어, 인자 VIII 폴리펩타이드의 발현 수준은 상기 기재된 바와 같은 ELISA 검정에 의해 결정될 수 있다. 대안적으로, 인자 VIII 폴리펩타이드의 발현 수준은 반전량적으로(semi-quantitatively), 예를 들어, SDS-PAGE 전기영동에 의해 또는 웨스턴 블롯에 의해 결정될 수 있다. 소정의 구현예에서, 혈장에서의 발현은 실시예에 기재된 바와 같이 아쎄라크롬(Asserachrom) 검정에 의해 결정될 수 있다.
숙주 세포에 의해 분비되는 인자 VIII 폴리펩타이드의 발현 수준은 전형적으로, 즉, 숙주 세포에 의해 세포내에서 보유되는 인자 VIII 폴리펩타이드의 수준과 대조적으로 결정된다. 이는 예를 들어, 세포(예를 들어 숙주 세포)를 인자 VIII 폴리펩타이드를 함유하는 액체(예를 들어 생물학적 시료, 예컨대 혈액, 혈청 또는 혈장, 또는 인자 VIII 폴리펩타이드를 발현하는 숙주 세포가 배양되는 배양 배지, 예컨대 조건화된 배지)로부터 분리하고, 상기 액체 내 인자 VIII 폴리펩타이드의 발현 수준을 결정함으로써 결정될 수 있다. 세포는 예를 들어, 원심분리 또는 여과에 의해 분리될 수 있고/있거나 액체는 세포로부터 경사분리(decant)(예를 들어 피펫팅에 의해)될 수 있다. 인자 VIII 폴리펩타이드의 발현 수준은 생물학적 시료, 예컨대 혈액, 혈청 또는 혈장에서 결정될 수 있거나, 인자 VIII 폴리펩타이드를 발현하는 숙주 세포가 배양되는 배양 배지, 예컨대 조건화된 배지에서 결정될 수 있다.
숙주 세포는 인자 VIII 폴리펩타이드(또는 기준 인자 VIII 폴리펩타이드)를 발현하는 진핵생물 숙주 세포일 수 있다. 선택적으로, 숙주 세포는 인자 VIII 폴리펩타이드를 발현하는 곤충 세포일 수 있다. 전형적으로, 숙주 세포는 인자 VIII 폴리펩타이드를 발현하는 포유류 숙주 세포일 수 있다. 포유류 숙주 세포는 인간, 개, 돼지, 마우스, 햄스터, 또는 기니피그 세포를 포함한다. 더 특히, 숙주 세포는 포유류 간 세포일 수 있고, 더 특히 인간 간 세포일 수 있다. 선택적으로, 숙주 세포는 Huh7 세포일 수 있다. 선택적으로, 숙주 세포는 유기체 내의 숙주 세포일 수 있다. 선택적으로, 발현은 생체 내 발현일 수 있다. 선택적으로, 발현은 생체 내 발현일 수 있고, 혈장 내 발현이 결정될 수 있다.
본 발명의 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도 및/또는 안정성을 가질 수 있고/있거나 숙주 세포에서 더 높은 수준으로 발현될 수 있다. 선택적으로, 기준 인자 VIII 폴리펩타이드는 야생형 인자 VIII 폴리펩타이드일 수 있으며, 즉, 기준 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드일 수 있다. "기준 야생형 인자 VIII 폴리펩타이드"는 임의의 야생형 인자 FVIII 폴리펩타이드, 예컨대 SEQ ID NO: 1의 인자 VIII 폴리펩타이드일 수 있다. 선택적으로, 기준 인자 VIII 폴리펩타이드는 베타 도메인 결실(deleted) 인자 VIII 폴리펩타이드이다. 선택적으로, 기준 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5로 표시된 아미노산 서열을 갖는다. 선택적으로, 기준 인자 VIII 폴리펩타이드는 본 발명의 인자 VIII 폴리펩타이드의 인자 VIII 아미노산 서열을 포함하지만, 하나 이상의 치환 돌연변이를 포함하지 않는다.
하나 이상의 치환 돌연변이는 도메인간 계면에서 더 소수성 아미노산으로의 아미노산 치환을 포함할 수 있다. 생물물리학적 연구는 20개의 천연 발생 아미노산의 소수성, 또는 더 특히 아미노산의 상대 소수성을 확립하기 위해 수행되어 왔고, 소수성 스케일은 각각의 아미노산의 소수성(hydropathy)을 나열한다. 하나의 이러한 예는 윔리-화이트 전체-잔기 소수성 스케일이며, 이는 수성상으로부터 비-수성상(옥타놀)으로의 아미노산 이전의 자유 에너지를 계산한다. 용어 "더 소수성 아미노산"은, 윔리-화이트 소수성 스케일에 따라 수성상으로부터 옥타놀로의 전이에 대해 더 선호할 만한(더 음성의 △G) 자유 에너지 값을 갖는 아미노산을 지칭한다. 수성상으로부터 옥타놀로의 전이에 대한 자유 에너지는 아래 표 2에 제시되어 있고, 도 1에 그래프로 도시되어 있다. 가장 소수성인 아미노산으로 출발하여, 윔리-화이트 소수성 스케일은 아미노산의 소수성을 하기 순서대로 나열한다: 트립토판, 페닐알라닌, 류신, 이소류신, 티로신, 메티오닌, 발린, 시스테인, 글루탐산(비하전됨), 히스티딘(비하전됨), 프롤린, 트레오닌, 아스파르트산(비하전됨), 세린, 알라닌, 글루타민, 아스파라긴, 글리신, 아르기닌(양으로 하전됨), 히스티딘(양으로 하전됨), 리신(양으로 하전됨), 글루탐산(음으로 하전됨), 아스파르트산(음으로 하전됨).
본 발명의 치환 돌연변이는 인자 VIII 폴리펩타이드의 2개 이상의 도메인 사이의 상호작용을 안정화시킬 수 있다. 예를 들어, 도메인간 계면에서의 하나 이상의 치환 돌연변이는 인자 VIII 폴리펩타이드의 각각의 도메인 사이의 상호작용을 안정화시킬 수 있다. 특히, A1/A3 도메인간 계면에서의 하나 이상의 치환 돌연변이는 A1 도메인과 A3 도메인의 상호작용을 안정화시킬 수 있으며, A2/A3 도메인간 계면에서의 하나 이상의 치환 돌연변이는 A2 도메인과 A3 도메인의 상호작용을 안정화시킬 수 있고, A1/C2 도메인간 계면에서의 하나 이상의 치환 돌연변이는 A1 도메인과 C2 도메인의 상호작용을 안정화시킬 수 있다. 선택적으로, 본 발명의 하나 이상의 치환 돌연변이는 활성화될 때 인자 VIII 폴리펩타이드의 각각의 도메인의 상호작용을 안정화시킬 수 있다. 특히, 본 발명의 하나 이상의 치환 돌연변이는 활성화될 때 인자 VIII 폴리펩타이드의 A1 도메인과 A3 도메인, A2 도메인과 A3 도메인, 및/또는 A1 도메인과 C2 도메인(즉, 각각의 도메인)의 상호작용을 안정화시킬 수 있다.
선택적으로, 본 발명의 하나 이상의 치환 돌연변이는 활성화된 인자 VIII 헤테로삼량체성 복합체의 A1 도메인, A2 도메인, 및 A3-C1-C2 도메인의 상호작용을 안정화시킬 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 활성화된 인자 VIII 헤테로삼량체성 복합체의 A2 도메인과 A1 도메인 및 A3-C1-C2 도메인의 상호작용을 안정화시킬 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 활성화된 인자 VIII 헤테로삼량체성 복합체의 A1 도메인 및 A3-C1-C2 도메인으로부터 A2 도메인의 해리를 방지하거나 지연시킬 수 있다.
인자 VIII의 A1 도메인, A2 도메인, 및 A3-C1-C2 도메인의 상호작용은 표면 플라즈몬 공명(SPR, 또는 Biacore)에 의해 결정될 수 있다. 상이한 성분은 별개로 단리될 수 있고, 도메인 중 하나는 SPR 칩의 표면 상에 고정될 수 있으며; 고정 후, 다른 도메인이 유동 세포 내로 주입될 수 있고, 도메인의 상호작용에 대한 결합 및 해리 동역학(kon 및 koff)이 시간 경과에 걸쳐 모니터링될 수 있다. 대안적으로, 비활성 인자 VIII이 SPR 칩 상에 고정될 수 있고, 트롬빈이 유동 세포 내로 주입되어, 인자 VIII을 활성화시킬 수 있으며; 인자 VIII 헤테로삼량체성 복합체의 각각의 성분의 해리(질량 소실)(koff)를 나타내는 신호 하락이 시간 경과에 걸쳐 모니터링될 수 있다. 어떤 수단에 의해서든, 기준 인자 VIII 폴리펩타이드(예를 들어 기준 야생형 인자 VIII 폴리펩타이드)와의 비교는 도메인의 상호작용의 안정성이 결정되게 한다. FVIIIa의 안정성을 결정하기 위한 표면 플라즈몬 공명의 사용은 문헌[Gale et al. 2006. Journal of Thrombosis and Haemostasis 4, 1315-1322]에 기재되어 있다.
폴리펩타이드 내의 도메인간 상호작용은 전형적으로, 각각의 도메인 각각에서 아미노산 측쇄 사이의 상호작용에 의해 매개된다. 각각의 도메인에서 아미노산 측쇄 사이의 상호작용은 비-공유 상호작용일 수 있다. 대안적으로, 각각의 도메인 내 아미노산 측쇄는 공유 결합(예를 들어 이황화 결합)을 형성할 수 있다. 따라서, 인자 VIII 폴리펩타이드의 도메인 사이의 상호작용은, 인자 VIII 폴리펩타이드의 각각의 도메인(예를 들어 A1 및 A3, A2 및 A3 또는 A1 및 C2 도메인)의 상호작용을 안정화시키는 아미노산 치환(들)(치환 돌연변이)에 의해(즉, 기준 인자 VIII 폴리펩타이드와 비교하여) 안정화될 수 있다.
방향족 아미노산 페닐알라닌, 티로신, 히스티딘 및 트립토판의 측쇄는 파이-적층(pi-stacking) 상호작용에 의해 서로 상호작용할 수 있다. 파이-적층 상호작용에서, 방향족 측쇄 쌍은 전형적으로, 이들의 각각의 방향족 고리를 중심밖(off-centred) 평행 배향으로 정렬시킬 수 있다. 대안적으로, 방향족 측쇄 쌍은 이들의 각각의 방향족 고리를 서로에 대해 T-형상의 수직인 배향으로 정렬시킬 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는, 각각의 도메인의 아미노산 측쇄 사이의 파이-적층 상호작용을 증가시키는 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다.
소수성 아미노산 글리신, 알라닌, 발린, 이소류신, 류신, 페닐알라닌, 트립토판, 티로신 및 메티오닌의 측쇄는 전형적으로, 단백질의 소수성 코어 내에서 함께 클러스터(cluster)한다. 물에 노출되는 소수성 측쇄의 수를 최소화하는 것은 단백질 접힘(folding)의 배후에 있는 근본적인 구동력이고, 소수성 패킹(packing)은 단백질 구조를 안정화시키는 데 기여한다. 대조적으로, 하전된 그리고 극성 아미노산의 측쇄는 단백질의 물-노출 표면 상에 놓여서, 이들은 주변의 물 분자와 상호작용한다. 선택적으로, 인자 VIII 폴리펩타이드는, 각각의 도메인의 아미노산 측쇄 사이의 소수성 패킹을 증가시키는(즉, 지방족/소수성 아미노산의 측쇄가 서로 상호작용하고 물을 더 효율적으로 배제하는 더 소수성 환경을 제공하는) 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다.
선택적으로, 하나 이상의 치환 돌연변이는 소수성 아미노산으로의 극성 아미노산 또는 하전된 아미노산의 치환을 도메인간 계면에 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 글리신, 알라닌, 발린, 이소류신, 류신, 페닐알라닌, 트립토판, 티로신 또는 메티오닌으로의 극성 아미노산 또는 하전된 아미노산의 치환을 도메인간 계면에 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 소수성 아미노산의 치환을 도메인간 계면에 포함한다.
각각의 도메인 내 아미노산 측쇄는 서로에 대한 각각의 도메인의 배향으로 인해 선호하지 않는 방식으로 서로 상호작용할 수 있다. 예를 들어, 아미노산 측쇄는 서로에 대한 각각의 도메인의 배향으로 인해 에너지적으로 선호하지 않는 입체배좌를 채택하도록 강제될 수 있다(입체 충돌(steric clashing)). 대안적으로, 아미노산 측쇄는 다른 도메인 내의 유사하게 하전된 아미노산 측쇄에 근접하게 위치할 수 있다(선호하지 않는 정전기 상호작용).
선택적으로, 하나 이상의 치환 돌연변이는 각각의 도메인의 아미노산 측쇄 사이의 선호하지 않는 상호작용을 무력화할 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 각각의 도메인의 아미노산 측쇄 사이의 입체 충돌을 감소시킬 수 있다. 선택적으로, 입체 충돌을 감소시키기 위한 하나 이상의 치환 돌연변이는 더 작은 아미노산으로의 큰 소수성 아미노산의 치환을 포함할 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 이소류신, 류신, 발린, 알라닌 또는 글리신으로의 큰 소수성 아미노산의 치환을 포함할 수 있다. 선택적으로, 큰 소수성 아미노산은 방향족 아미노산이다. 선택적으로, 하나 이상의 치환 돌연변이는 각각의 도메인의 아미노산 측쇄 사이의 선호하지 않는 정전기 상호작용을 감소시킬 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 양으로 하전된 아미노산의 치환을 포함할 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 음으로 하전된 아미노산으로의 양으로 하전된 아미노산의 치환을 포함할 수 있다. 선택적으로, 음으로 하전된 아미노산은 아스파르트산 또는 글루탐산이다. 선택적으로, 하나 이상의 치환 돌연변이는 음으로 하전된 아미노산의 치환을 포함할 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 양으로 하전된 아미노산으로의 음으로 하전된 아미노산의 치환을 포함할 수 있다. 선택적으로, 양으로 하전된 아미노산은 아르기닌 또는 리신이다. 선택적으로, 하나 이상의 치환 돌연변이는 비하전된 아미노산으로의 하전된 아미노산의 치환을 포함할 수 있다. 선택적으로, 비하전된 아미노산은 극성 아미노산일 수 있다. 선택적으로, 비하전된 아미노산은 아스파라긴 또는 글루타민일 수 있다. 선택적으로, 비하전된 아미노산은 세린 또는 트레오닌일 수 있다. 선택적으로, 비하전된 아미노산은 발린, 이소류신, 류신, 알라닌 또는 글리신일 수 있다.
선택적으로, 하나 이상의 치환 돌연변이는 도메인간 계면에 하나 이상의 표면-접근 불능(surface-inaccessible) 아미노산의 치환을 포함할 수 있다. 인자 VIII의 3-차원 결정 구조는 이용 가능하고(예를 들어, PDB 기탁 번호 2RZE 또는 4BDV); 따라서, 표면-접근 불능인 도메인간 계면에서 아미노산을 식별하는 것이 일상적일 것이다. 선택적으로, 표면-접근 불능 아미노산은 활성화될 때 인자 VIII 폴리펩타이드에서 표면-접근 불능이다.
본 발명의 인자 VIII 폴리펩타이드는 A1/A3 계면, A2/A3 계면, 또는 A1/C2 계면으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함할 수 있으며, 여기서 치환되는 아미노산은 메티오닌 또는 히스티딘이다. 이들 도메인간 계면에서의 메티오닌 또는 히스티딘 잔기는 예를 들어, 인자 VIII의 3-차원 결정 구조로부터 식별될 수 있다. 선택적으로, 메티오닌 또는 히스티딘은 더 소수성 아미노산으로 치환될 수 있다. 선택적으로, 메티오닌 잔기는 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로 치환될 수 있다. 선택적으로, 히스티딘 잔기는 글루탐산, 시스테인, 발린, 메티오닌, 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로 치환될 수 있다. 선택적으로, 인자 VIII 아미노산 서열은 하나 이상의 치환 돌연변이를 포함할 수 있으며, 여기서 치환되는 아미노산은 SEQ ID NO: 1의 위치 662의 아미노산에 상응하는 메티오닌 잔기(M662), 또는 SEQ ID NO: 1의 위치 693의 아미노산에 상응하는 히스티딘 잔기(H693)이다. 선택적으로, M662는 알라닌, 시스테인, 글루탐산, 글리신 또는 세린으로 치환될 수 있다. 선택적으로, H693은 아르기닌으로 치환될 수 있다. 선택적으로, M662 또는 H693은 더 소수성 아미노산으로 치환될 수 있다. 선택적으로, M662는 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로 치환될 수 있다. 선택적으로, H693은 글루탐산, 시스테인, 발린, 메티오닌, 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로 치환될 수 있다.
SEQ ID NO: 1의 특정 아미노산"에 상응하는" 잔기를 결정하는 것은 당업자의 역량 내에 있다. 예를 들어, 당업자는 단지, 적합한 정렬 알고리즘, 예컨대 상기 기재된 Needleman 및 Wunsch의 알고리즘을 사용하여 야생형 인자 VIII 아미노산 서열과 SEQ ID NO: 1의 서열 정렬을 수행하고, 어떤 잔기가 SEQ ID NO: 1의 아미노산과 정렬되는지 결정하는 것을 필요로 할 뿐이다.
선택적으로, 하나 이상의 치환 돌연변이는 도메인간 계면에서의 아미노산을 방향족 아미노산으로 치환시키는 것을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 페닐알라닌, 티로신, 히스티딘 또는 트립토판으로의 도메인간 계면에서의 아미노산의 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 페닐알라닌, 티로신 또는 트립토판으로의 도메인간 계면에서의 메티오닌 잔기의 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 페닐알라닌, 티로신 또는 트립토판으로의 도메인간 계면에서의 히스티딘 잔기의 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 M662F, M662W 또는 M662Y 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 H693F, H693W 또는 H693Y 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 M662W 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 H693W 또는 H693Y 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 H693W 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 M662W 및 H693W 치환을 포함한다.
그러므로, 특정 구현예에서, 인자 VIII 폴리펩타이드는 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하며, 여기서 하나 이상의 치환 돌연변이는 M662W 치환을 포함한다. 추가 구현예에서, 인자 VIII 폴리펩타이드는 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하며, 여기서 하나 이상의 치환 돌연변이는 H693W 치환을 포함한다. 더 추가의 구현예에서, 인자 VIII 폴리펩타이드는 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하며, 여기서 하나 이상의 치환 돌연변이는 M662W 및 H693W 치환을 포함한다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 28, 30, 35, 36, 40 또는 41 중 임의의 하나로 표시된 바와 같은 인자 VIII 아미노산 서열, 또는 SEQ ID NO: 28, 30, 35, 36, 40 또는 41 중 임의의 하나로 표시된 바와 같은 아미노산 서열과 적어도 90% 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함할 수 있다.
선택적으로, 하나 이상의 치환 돌연변이는 덜 소수성 아미노산으로의 M662의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 M662I를 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 M662C를 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 M662K를 포함하지 않는다. 선택적으로, 인자 VIII 아미노산 서열이 SEQ ID NO: 1의 위치 1828에 상응하는 위치에 아스파르트산 잔기(D1828)를 포함한다면, 하나 이상의 치환 돌연변이는 M662K를 포함하지 않는다. 선택적으로, 인자 VIII 아미노산 서열이 SEQ ID NO: 1의 위치 1823-1834에 상응하는 위치에 서열 MAPTKDEFDCKA를 포함한다면, 하나 이상의 치환 돌연변이는 M662K를 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 A108의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 A108의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환은 A108I를 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 음으로 하전된 아미노산의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 비하전된 아미노산으로의 음으로 하전된 아미노산의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 D27, E272, E287, D302, D519, E540, E665, D666, E683, D696, D1795, E1829, E1984의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 비하전된 아미노산으로의 D27, E272, E287, D302, D519, E540, E665, D666, E683, D696, D1795, E1829, E1984의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 알라닌 또는 발린으로의 D27, E272, E287, D302, D519, E540, E665, D666, E683, D696, D1795, E1829, E1984의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 D519L, D519Q, D519T 또는 D519V를 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 D519, E665 및 E1984 중 2개 이상의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 알라닌 또는 발린으로의 D519, E665 및 E1984 중 2개 이상의 치환을 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 양으로-하전된 아미노산의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 비하전된 아미노산으로의 양으로-하전된 아미노산의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 K380, R490, K512, K523, R527, K556, R562, K570 또는 R571의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 비하전된 아미노산으로의 K380, R490, K512, K523, R527, K556, R562, K570 또는 R571의 치환을 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 S313, H317, T522, S524, R531, N538, S650, S654, N684, S695, S1791, Q1820, S1949, N1950 또는 R1966의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 알라닌으로의 S313, H317, T522, S524, R531, N538, S650, S654, N684, S695, S1791, Q1820, S1949, N1950 또는 R1966의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 Y476, Y664, Y1786 또는 Y1792의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 페닐알라닌으로의 Y476, Y664, Y1786 또는 Y1792의 치환을 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 K659의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 K659의 비-보존적 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 K659D, K659E, K659Y, K659N, K659Q, K659T, K659S, K659C, K659W, K659F, K659P, K659M, K659V, K659L, K659I, K659Y, K659G 또는 K659A를 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 E665의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 E665의 비-보존적 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 E665V, E665I, E665M, E665N 또는 E665Y를 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 K659의 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 K659Q, K659G, K659I 또는 K659F를 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 E665의 치환을 포함한다. 선택적으로, 하나 이상의 치환 돌연변이는 E665R, E665Q, E665H, E665K, E665M, E665F, E665W 또는 E665Y를 포함한다.
소정의 구현예에서, 인자 VIII 폴리펩타이드는 A1/A3 도메인 계면, A2/A3 도메인 계면 또는 A1/C2 도메인 계면으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함할 수 있으며, 여기서 하나 이상의 치환 돌연변이 중 적어도 하나는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함한다. 다시 말해, 적어도 하나 이상의 치환 돌연변이는 제1 도메인(예를 들어 A1 또는 A2 도메인) 내 시스테인 잔기의 치환, 및 제2 도메인(예를 들어 A3 또는 C2 도메인) 내 시스테인 잔기의 치환을 포함할 수 있다. 따라서, 아미노산의 쌍은 제1 아미노산(제1 도메인 내) 및 제2 아미노산(제2 도메인 내)을 포함할 수 있다. 다시 말해, 적어도 하나 이상의 치환 돌연변이는 시스테인 잔기로의 제1 아미노산(제1 도메인 내), 및 제2 아미노산(제2 도메인 내)의 치환을 포함할 수 있다. 그러므로, 인자 VIII 폴리펩타이드는, 시스테인 잔기로의 인자 VIII 폴리펩타이드의 2개의 각각의 도메인 내 코그니트(cognate) 아미노산의 쌍의 치환을 포함하는 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다.
선택적으로, 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환은 시스테인 잔기가 각각의 도메인 사이에 이황화 결합을 형성하게 한다. 이황화 결합의 형성은 질량 분광법에 의해, 특히 예를 들어 문헌[Gorman et al. 2002. Mass Spectrometry Reviews 21, 183-216]에 상술된 바와 같이 선택적으로 제한된 단백분해 후에, 이황화 결합을 함유하는 것으로 의심되는 폴리펩타이드의 단편화 패턴의 분석에 의해 결정될 수 있다. 대안적으로, 이황화 결합의 형성은 폴리펩타이드 상에서 제한된 단백분해를 수행하고, 생성된 단백질 단편을 환원 조건과 비-환원 조건 둘 다 하에, 선택적으로 N-말단 시퀀싱과 조합하여 SDS-PAGE에 의해 분석함으로써 결정될 수 있다.
선택적으로, 시스테인 잔기로 치환되는 아미노산의 쌍은 A1 및 A3 도메인에 존재할 수 있다. 선택적으로, 제1 아미노산은 SEQ ID NO: 1의 M147, S149 또는 S289에 상응할 수 있고 제2 아미노산은 SEQ ID NO: 1의 E1969, E1970 또는 N1977에 상응할 수 있다. 선택적으로, 하나 이상의 치환 돌연변이는 (i) S289C와 N1977C, (ii) M147C와 E1970C, 및 (iii) S149C와 E1969C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함한다.
선택적으로, 시스테인 잔기로 치환되는 아미노산의 쌍은 A2 및 A3 도메인에 존재할 수 있다. 선택적으로, 제1 아미노산은 SEQ ID NO: 1의 T667, T669, N684, L687, I689, S695 또는 F697에 상응하고 제2 아미노산은 SEQ ID NO: 1의 S1791, G1799, A1800, R1803, E1844, S1949, G1981, V1982, 또는 Y1979에 상응한다. 선택적으로, 하나 이상의 치환 돌연변이는 (i) T669C와 V1982C, (ii) L687C와 A1800C, (iii) I689C와 G1799C, (iv) F697C와 S1949C, (v) T667C와 G1981C, (vi) T669C와 Y1979C, (vii) N684C와 S1791C, (viii) L687C와 R1803C, 및 (ix) S695C와 E1844C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함한다.
선택적으로, 시스테인 잔기로 치환되는 아미노산의 쌍은 A1 및 C2 도메인에 존재할 수 있다. 선택적으로, 제1 아미노산은 SEQ ID NO: 1의 A108, T118 또는 V137에 상응하고 제2 아미노산은 SEQ ID NO: 1의 N2172, Q2329 또는 Y2332에 상응한다. 선택적으로, 하나 이상의 치환 돌연변이는 (i) A108C와 Q2329C, (ii) T118C와 N2172C, 및 (iii) V137C와 Y2332C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함한다.
선택적으로, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 SEQ ID NO: 1의 위치 656-667에 상응하는 아미노산(YTFKHKMVYEDT) 중 임의의 하나의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 SEQ ID NO: 1의 위치 1823-1834에 상응하는 아미노산(MAPTKDEFDCKA) 중 임의의 하나의 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 SEQ ID NO: 1의 위치 656-667에 상응하는 아미노산(YTFKHKMVYEDT) 중 임의의 하나의 치환을 포함하는 제1 치환 돌연변이 및 시스테인 잔기로의 SEQ ID NO: 1의 위치 1823-1834에 상응하는 아미노산(MAPTKDEFDCKA) 중 임의의 하나의 치환을 포함하는 제2 치환 돌연변이를 포함하지 않는다.
선택적으로, 하나 이상의 치환 돌연변이는 Y656C와 A1834C, T657C와 K1833C, K659C와 D1831C, H660C와 F1830C, K662C와 E1829C, M662C와 D1828C, V663C와 K1827C, Y664C와 T1826C, E665C와 P1825C, D666C와 A1824C, 및 T667C와 M1823C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 M662C와 D1828C, 및 Y664C와 T1826C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 R121C 및 L2302C 치환을 포함하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 M662C와 D1828C, S268C와 F673C, I312C와 P672C, S313C와 A644C, M662C와 K1827C, Y664C와 T1826C, P264C와 Q645C, R282C와 T522C, S285C와 F673C, H311C와 F673C, S314C와 A644C, S314C와 Q645C, V663C와 E1829C, N694C와 P1980C, 및 S695C와 E1844C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하지 않는다.
특정 구현예에서, 하나 이상의 치환은 (i) L687C와 A1800C; (ii) N684C와 S1791C; 및 (iii) S695C와 E1844C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 37, 38, 39, 42, 43 또는 44 중 임의의 하나로 표시된 바와 같은 인자 VIII 아미노산 서열, 또는 SEQ ID NO: 37, 38, 39, 42, 43 또는 44 중 임의의 하나로 표시된 바와 같은 아미노산 서열을 포함할 수 있다.
상술된 바와 같이, 인자 VIII의 활성화는 트롬빈에 의한 단백분해성 절단을 필요로 한다. 트롬빈 절단 후, 인자 VIII은 A1 도메인, A2 도메인, 및 A3-C1-C2 도메인으로 구성된 헤테로삼량체성 복합체를 형성한다. 활성화의 과정에서, 인자 VIII은 입체배좌 변화를 겪는다. 더 구체적으로, 활성화의 과정에서, A1 도메인 및 A3-C1-C2 도메인과 비교하여 A2 도메인의 배향은 변경된다. 그러므로, 활성화된 인자 VIII의 A2 도메인은 A1, A3, C1 및 C2 도메인에 관하여 비활성 인자 VIII과 상이한 배향에 존재한다. 따라서, A2 도메인은 활성화 과정 동안 인자 VIII의 다른 도메인에 관하여 중심축(pivot)인 것으로 나타날 수 있다. 야생형 인자 VIII의 최대 활성은 전형적으로 활성화 후 대략 2분째에 나타난다.
이론으로 결부시키고자 하는 것은 아니지만, A2 도메인에 의해 겪는 입체배좌 변화는 인자 VIII 활성화에 필요할 수 있는 것으로 여겨진다. 따라서, 비활성 인자 VIII의 배향에서 입체배좌 A2 도메인을 안정화시키는 치환 돌연변이는 인자 VIII 폴리펩타이드의 활성화를 저해할 수 있다. 소정의 구현예에서, 하나 이상의 치환 돌연변이는 인자 VIII 폴리펩타이드의 활성화를 저해하지 않는다. 선택적으로, 하나 이상의 치환 돌연변이는 기준 야생형 인자 VIII 폴리펩타이드의 활성화와 비교하여 인자 VIII 폴리펩타이드의 활성화를 저해하지 않는다. 선택적으로, A1/A3, A2/A3 또는 A1/C2 도메인 계면에 하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 느리게 활성화되지 않는다.
인자 VIII 활성화의 저해는 활성화 후 최대 인자 VIII 활성을 달성하는 데 소요된 시간을 기준 야생형 인자 VIII 폴리펩타이드와 비교함으로써 결정될 수 있다. 트롬빈은 인자 VIII 폴리펩타이드를 함유하는 시료에 첨가될 수 있고, 인자 VIII 활성화는 적합한 시점에서 시료의 분취물을 얻고 각각의 분취물에 대해 FVIII 활성을 결정함으로써 모니터링될 수 있다. 선택적으로 FVIII 활성은 활성화 후 5분, 10분, 15분 또는 20분의 경과에 걸쳐 측정될 수 있다. 활성은 일련의 시점에서, 예를 들어 활성화 후 2개 이상, 3개 이상, 4개 이상, 5개 이상 또는 6개 이상의 시점에서 결정될 수 있다. 선택적으로 인자 VIII 활성은 활성화 직전에 결정될 수 있다. 대표적인 예로서, 인자 VIII 활성은 활성화 직후 결정될 수 있고, 추가 측정은 활성화 후 30초마다 수행될 수 있다. 선택적으로, 상대 인자 VIII 활성은 활성화 직후 인자 VIII 활성과 비교하여, 주어진 시점에서 인자 VIII 활성의 배수-증가를 계산함으로써 결정될 수 있다. 선택적으로, 고유 활성도는 각각의 시점에서 결정될 수 있다.
하나 이상의 치환 돌연변이를 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드
인자 VIII 아미노산 서열은 신호 펩타이드, 예컨대 본원에 기재된 것들 중 임의의 것의 모두 또는 부분을 포함할 수 있다. 선택적으로, 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드일 수 있다. 선택적으로, 신호 펩타이드는 SEQ ID NO: 15를 포함할 수 있다. 선택적으로, 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드 이외의 신호 펩타이드일 수 있다. 선택적으로, 신호 펩타이드는 SEQ ID NO: 18 또는 20을 포함할 수 있다. 인자 VIII 폴리펩타이드는 성숙(mature) 인자 VIII 폴리펩타이드일 수 있다. "성숙 인자 VIII 폴리펩타이드"는 신호 펩타이드를 포함하지 않는 인자 VIII 폴리펩타이드이다. 신호 펩타이드는 합성 후 절단되었을 수 있다. 신호 펩타이드는 결코 존재하지 않았을 수 있다. 예를 들어, 인자 VIII 아미노산 서열은 신호 펩타이드를 결코 포함하지 않았을 수 있다.
야생형 인자 VIII 폴리펩타이드는 A1 도메인, A2 도메인, B 도메인, A3 도메인, C1 도메인 및 C2 도메인을 포함한다. 본 발명의 인자 VIII 폴리펩타이드는 A1 도메인, A2 도메인, A3 도메인, B 도메인, C1 도메인 및/또는 C2 도메인 각각의 모두 또는 부분을 포함할 수 있다. 야생형 인자 VIII 폴리펩타이드의 서열은 SEQ ID NO: 1로 표시되어 있다.
선택적으로, 인자 VIII 폴리펩타이드는 개(canine), 돼지(porcine) 또는 인간 인자 VIII이다. 특정 구현예에서, 인자 VIII 폴리펩타이드는 인간 인자 VIII이다. 인간 인자 VIII의 아미노산 서열은 SEQ ID NO: 1로 표시된다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 인자 VIII 아미노산 서열을 포함할 수 있다. 다시 말해, 인자 VIII 폴리펩타이드는 선택적으로, SEQ ID NO: 1 내의 상응하는 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 단지 하나 이상의 치환 돌연변이만큼 SEQ ID NO: 1로 표시된 아미노산 서열과 상이한 인자 VIII 아미노산을 포함할 수 있다.
인자 VIII 폴리펩타이드의 인자 VIII 아미노산 서열에 상응하는 SEQ ID NO: 1 내의 서열을 결정하는 것은 당업자의 역량 내에 있다. 예를 들어, 당업자는 단지, 적합한 정렬 알고리즘, 예컨대 상기 기재된 Needleman 및 Wunsch의 알고리즘을 사용하여 인자 VIII 아미노산 서열과 SEQ ID NO: 1의 서열 정렬을 수행하고, SEQ ID NO: 1의 어떤 영역이 인자 VIII 아미노산에 상응하는지(즉, SEQ ID NO: 1의 어떤 서열이 인자 VIII 아미노산 서열과 정렬되는지) 결정하는 것을 필요로 할 뿐이다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산을 포함하는 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 적어도 1349, 적어도 1357, 적어도 1368, 적어도 1376, 적어도 1377, 적어도 1385, 적어도 1386, 적어도 1391, 적어도 1394, 적어도 1418 또는 적어도 1421 인접(contiguous) 아미노산과 적어도 90% 동일할 수 있다. 대안적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 최대 5개, 최대 4개, 최대 3개, 또는 최대 2개 영역으로부터 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산과 적어도 90% 동일할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 적어도 1349개 아미노산을 포함하는 아미노산 서열과 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 치환 돌연변이만큼 상이한 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 적어도 1349개 아미노산을 포함하는 아미노산 서열과 단지 하나 이상의 치환 돌연변이만큼 상이한 인자 VIII 아미노산을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1로 표시된 아미노산 서열과 20개 이하, 15개 이하, 14개 이하, 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 치환 돌연변이만큼 상이한 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1로 표시된 아미노산 서열과 단지 하나 이상의 치환 돌연변이만큼 상이한 인자 VIII 아미노산을 포함할 수 있다.
인자 VIII 폴리펩타이드는 B 도메인의 일부를 포함할 수 있거나, 인자 VIII 폴리펩타이드는 B 도메인을 포함하지 않을 수 있다. 특정 구현예에 따르면, 인자 VIII 폴리펩타이드는 B 도메인을 포함하지 않는다. 따라서, 인자 VIII 폴리펩타이드는 베타 도메인 결실(BDD: beta domain deleted) 인자 VIII 폴리펩타이드일 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산을 포함하는 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개의 인접 아미노산과 적어도 90% 동일할 수 있다. 대안적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5의 최대 5개, 최대 4개, 최대 3개, 또는 최대 2개 영역으로부터의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산과 적어도 90% 동일할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산을 포함하는 아미노산 서열과 14개 이하, 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 치환 돌연변이만큼 상이한 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5의 적어도 1349개, 적어도 1357개, 적어도 1368개, 적어도 1376개, 적어도 1377개, 적어도 1385개, 적어도 1386개, 적어도 1391개, 적어도 1394개, 적어도 1418개 또는 적어도 1421개 아미노산을 포함하는 아미노산 서열과 단지 하나 이상의 치환 돌연변이만큼 상이한 인자 VIII 아미노산을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5로 표시된 아미노산 서열과 14개 이하, 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 치환 돌연변이만큼 상이한 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 3 또는 5로 표시된 아미노산 서열과 단지 하나 이상의 치환 돌연변이만큼 상이한 인자 VIII 아미노산을 포함할 수 있다.
인자 VIII 폴리펩타이드의 도메인 중 임의의 또는 모든 도메인은, 도메인의 인자 VIII 아미노산 서열이 야생형 인자 VIII 아미노산 서열과 비교될 때, 본원에 정의된 하나 이상의 치환 돌연변이에 더하여 하나 이상의 변형, 예컨대 치환, 삽입 및/또는 결실을 포함할 수 있다.
인자 VIII 폴리펩타이드는 A1 도메인의 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A1 도메인의 적어도 300개 아미노산(선택적으로 적어도 300개의 인접 아미노산)과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A1 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A1 도메인과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 329에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 329에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 329에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 329에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
인자 VIII 폴리펩타이드는 A2 도메인의 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A2 도메인의 적어도 300개 아미노산(선택적으로 적어도 300개의 인접 아미노산)과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A2 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A2 도메인과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 380 내지 711에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 380 내지 711에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 380 내지 711에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 380 내지 711에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
인자 VIII 폴리펩타이드는 A3 도메인의 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A3 도메인의 적어도 300개 아미노산(선택적으로 적어도 300개의 인접 아미노산)과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A3 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 A3 도메인과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1694 내지 2021에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1694 내지 2021에 상응하는 아미노산 중 적어도 300개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1694 내지 2021에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1694 내지 2021에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
인자 VIII 폴리펩타이드는 C1 도메인의 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C1 도메인의 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산(선택적으로 적어도 130개의 인접 아미노산)과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C1 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C1 도메인과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2021 내지 2169에 상응하는 아미노산 중 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2021 내지 2169에 상응하는 아미노산 중 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2021 내지 2169에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2021 내지 2169에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
인자 VIII 폴리펩타이드는 C2 도메인의 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산(선택적으로 적어도 130개의 인접 아미노산)과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C2 도메인의 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C2 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 C2 도메인과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2174 내지 2326에 상응하는 아미노산 중 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2174 내지 2326에 상응하는 아미노산 중 적어도 130개, 적어도 135개 또는 적어도 140개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2174 내지 2326에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 2174 내지 2326에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 완전(full) 또는 부분(partial) B 도메인을 포함할 수 있다. 인자 VIII 폴리펩타이드는 B 도메인의 적어도 820개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 B 도메인의 적어도 820개 아미노산(선택적으로 적어도 820개의 인접 아미노산)과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 B 도메인과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 B 도메인과 적어도 95%, 적어도 96%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 741 내지 1648에 상응하는 아미노산 중 적어도 800개 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 741 내지 1648에 상응하는 아미노산 중 적어도 800개 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 741 내지 1648에 상응하는 아미노산과 적어도 90% 동일한 아미노산 서열을 포함할 수 있다. 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 741 내지 1648에 상응하는 아미노산과 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 변형된 베타 도메인 관련(BDR) 영역을 포함할 수 있다. 야생형 BDR 영역은 SEQ ID NO: 1의 위치 713과 1697 사이의 영역에 상응한다. 인자 VIII 폴리펩타이드는 최대 88개의 아미노산을 포함하는 변형된 BDR 영역을 포함할 수 있다.
야생형 BDR 영역은 SEQ ID NO: 1의 위치 713과 1697 사이의 영역에 상응한다. 아미노산 위치를 지칭할 때, 용어 "~과 ~사이"는 명시된 위치를 포함하지 않는다. 그러므로, 야생형 BDR 영역은 SEQ ID NO: 1의 위치 714에 상응하는 위치에서 시작하고 SEQ ID NO: 1의 위치 1696에 상응하는 위치에서 끝난다. 야생형 BDR 영역은 인자 VIII의 베타 도메인을 포함한다. 야생형 BDR 영역은 SEQ ID NO: 1의 위치 713과 1697 사이의 영역일 수 있다. 야생형 BDR 영역은 SEQ ID NO: 1의 위치 714에서 시작할 수 있고 SEQ ID NO: 1의 위치 1696에서 끝날 수 있다. 야생형 BDR 영역은 SEQ ID NO: 1의 위치 713과 1697 사이의 영역에 상응하는 다른 야생형 인자 VIII 아미노산 서열로부터의 영역일 수 있다. 야생형 BDR 영역은 SEQ ID NO: 1의 위치 714에서 시작하고 SEQ ID NO: 1의 위치 1696에서 끝나는 영역에 상응하는 다른 야생형 인자 VIII 아미노산 서열로부터의 영역일 수 있다.
SEQ ID NO: 1의 위치 713과 1697 사이의 영역"에 상응하는" 야생형 인자 VIII 아미노산 서열의 영역을 결정하는 것은 당업자의 역량 내에 있다. 예를 들어, 당업자는 단지, 적합한 정렬 알고리즘, 예컨대 상기 기재된 Needleman 및 Wunsch의 알고리즘을 사용하여 야생형 인자 VIII 아미노산 서열과 SEQ ID NO: 1의 서열 정렬을 수행하고, 야생형 인자 VIII 아미노산 서열의 어떤 영역이 SEQ ID NO: 1의 위치 713과 1697 사이의 영역과 정렬되는지 결정하는 것을 필요로 할 뿐이다. 예를 들어, 당업자는 야생형 인자 VIII 아미노산 서열의 어떤 영역이 SEQ ID NO: 1의 위치 714 내지 1696과 정렬되는지 결정할 수 있다.
"변형된 BDR 영역"은 야생형 BDR 영역과 동일하지 않다. 변형된 BDR 영역은 야생형 BDR 영역보다 더 짧다. 당업자는, 인자 VIII 폴리펩타이드의 변형된 BDR 영역이 "야생형 BDR 영역과 비교하여 변형되는지"의 여부를 쉽게 결정할 수 있다. 예를 들어, 당업자는 단지, 적합한 정렬 알고리즘, 예컨대 상기 기재된 Needleman 및 Wunsch의 알고리즘을 사용하여 인자 VIII 아미노산 서열과 인자 VIII 폴리펩타이드의 야생형 인자 VIII 아미노산 서열의 서열 정렬을 수행하고, SEQ ID NO: 1의 위치 713과 1697 사이의 영역에 상응하는 야생형 인자 VIII 아미노산 서열의 영역(야생형 BDR 영역)과 정렬되는 인자 VIII 아미노산 서열의 영역(변형된 BDR 영역)을 결정하고, 인자 VIII 아미노산 서열 내 영역(변형된 BDR 영역)과 야생형 인자 VIII 아미노산 서열 내 영역(야생형 BDR 영역) 사이의 아미노산 서열을 비교하는 것을 필요로 할 뿐이다. 임의의 차이가 존재한다면, 해당 영역은 변형된 BDR 영역이다.
본 발명의 인자 VIII 폴리펩타이드의 변형된 BDR 영역이 최대 88개의 아미노산을 포함하기 때문에, 인자 VIII 아미노산 서열이 야생형 인자 VIII 아미노산 서열과 정렬될 때 야생형 BDR 영역과 비교하여 변형된 BDR 영역 내 인자 VIII 아미노산 서열에 하나 이상의 갭(들)이 존재할 것이다. 그러므로, 변형된 BDR 영역이 야생형 BDR 영역과 비교될 때, 본 발명의 인자 VIII 폴리펩타이드의 변형된 BDR 영역은 하나 이상의 결실(들)을 포함한다. 변형된 BDR 영역이 야생형 BDR 영역과 비교될 때, 변형된 BDR 영역은 또한, 하나 이상의 변형, 예컨대 치환 및/또는 삽입을 가질 수 있다. 변형된 BDR 영역은 야생형 BDR 영역에서 발견되는 하나 이상의 아미노산을 포함할 수 있다. 예를 들어, 변형된 BDR 영역은 야생형 BDR 영역에서 발견되는 아미노산의 하나 이상의 스트레치(stretch)를 포함할 수 있다.
변형된 BDR 영역은 "최대" 명시된 수의 아미노산을 "포함한다". 이는, 변형된 BDR 영역이 명시된 수 이하의 아미노산을 포함함을 의미한다. 인자 VIII 아미노산 서열은 추가 아미노산을 포함할 수 있지만, 변형된 BDR 영역에서는 아니다. 예를 들어, 변형된 BDR 영역이 "최대 88개의 아미노산을 포함한다"면, 변형된 BDR 영역은 88개 이하의 아미노산을 포함한다. 추가 예로서, 변형된 BDR 영역이 "최대 74개의 아미노산을 포함한다"면, 변형된 BDR 영역은 74개 이하의 아미노산을 포함한다.
"인자 VIII 폴리펩타이드"는 기능적이다. 기능적 인자 VIII 폴리펩타이드는, 트롬빈에 의해 활성화될 때, 인자 IXa, 인지질 및 칼슘과 효소 복합체를 형성하는 것이고, 상기 효소 복합체는 인자 X로부터 인자 Xa로의 전환을 촉매화할 수 있다.
인자 VIII 폴리펩타이드가 기능적인지의 여부를 결정하는 것은 당업자의 능력 내에 있다. 당업자는 단지 인자 VIII 폴리펩타이드의 고유 활성도를 결정하는 것을 필요로 한다. 폴리펩타이드의 고유 활성도가 야생형 인자 VIII 폴리펩타이드, 예컨대 SEQ ID NO: 1의 인자 VIII 폴리펩타이드의 고유 활성도의 적어도 20%라면, 이는 기능적이다. 인자 VIII 폴리펩타이드의 활성은 발색 검정, 예컨대 보조인자 활성을 측정하는 발색 검정을 사용하여 분석될 수 있다. 예를 들어, 적합한 발색 검정은 하기와 같다. 인자 VIII 폴리펩타이드는 (인간 인자 X 폴리펩타이드 및 인자 IXa 폴리펩타이드, 트롬빈, 인지질 및 칼슘과 혼합된다). 트롬빈은 인자 VIII 폴리펩타이드를 활성화시켜, 인자 VIIIa 폴리펩타이드를 형성한다. 트롬빈-활성화된 인자 VIII 폴리펩타이드는 인자 IXa 폴리펩타이드, 인지질 및 칼슘과 효소 복합체를 형성하고, 이러한 효소 복합체는 인자 X 폴리펩타이드로부터 인자 Xa 폴리펩타이드로의 전환을 촉매화할 수 있다. 인자 Xa 폴리펩타이드의 활성은 발색 기질(예를 들어 SXa-11)의 절단을 촉매화하여, pNA를 생성할 수 있다. 생산된 pNA의 수준은 405 nm에서 발색을 결정함으로써 측정(예를 들어 흡광도에 의해 측정)될 수 있다. 인자 X 폴리펩타이드, 그리고 따라서 인자 Xa 폴리펩타이드는 과량으로 제공된다. 따라서, 제한 인자는 인자 VIIIa 폴리펩타이드이다. 그러므로, 생산된 pNA의 수준은 시료 내 인자 FVIIIa 폴리펩타이드에 의해 생산되는 인자 Xa 폴리펩타이드의 양에 비례하며, 이는 시료 내 인자 FVIIIa 폴리펩타이드의 활성에 비례한다. 시료 내 인자 FVIIIa 폴리펩타이드의 활성은 시료 내 인자 FVIII 폴리펩타이드의 보조인자 활성의 측정치이다.
예를 들어, 적합한 발색 검정은 실시예에 사용된 바와 같이 HYPHEN BioMed에 의해 제작된 BIOPHEN FVIII:C 검정(Ref: 221406)이다. 인자 VIII 폴리펩타이드의 활성은 BIOPHEN FVIII:C 검정을 사용하여 측정될 수 있다.
인자 VIII 폴리펩타이드의 활성은 응고 검정을 사용하여 분석될 수 있다. 이러한 검정은 1-단계 응고 검정일 수 있다. 예를 들어, 적합한 응고 검정(1-단계 응고 검정)은 하기와 같다.
인자 VIII이 응고 캐스케이드의 일부이기 때문에, 활성을 증가시킨 인자 VIII 폴리펩타이드는 더 낮은 활성을 갖는 인자 VIII 폴리펩타이드보다 혈액 응고를 더 신속하게 촉매화할 것이다. 인자 VIII 폴리펩타이드는 혈소판 부족(poor) 혈장과 혼합되고, 37℃에서 인큐베이션된다. 그 후에, 인지질 및 접촉 활성화 경로 활성자, 예컨대 카올린 또는 SynthaSIL APTT 시약이 첨가된다. 그 후에, 칼슘이 첨가되고, 사용자는 응고가 발생하는 데 소요된 시간을 측정한다. 혈전 형성은 자기 강철 볼(magnetic steel ball) 방법에 의해 직접 평가될 수 있다. 혈전 형성은 회전형 큐벳 검정을 사용하여 측정될 수 있는데, 이 검정에서 볼 주변의 피브린 가닥의 형성이 움직임을 생성하고 자기장에서의 변화가 검출될 수 있을 때까지 강철 볼은 자기장에서 정적인 상태로 유지된다. 대안적으로, 혈전 형성은 회전형 강철 볼 검정을 사용하여 측정될 수 있는데, 이 검정에서 볼 주변의 피브린 가닥의 형성이 이 볼의 회전을 중단시킬 때까지 강철 볼이 자석의 영향 하에 회전하며, 이는 센서에 의해 검출될 수 있다. 어느 경우이든, 응고 시간이 기록될 수 있다.
환자, 예컨대 인간 환자에서, 인자 VIII 폴리펩타이드는 환자로부터 혈액 시료를 얻음으로써, 또는 환자로부터 얻은 혈액 시료 상에서 검정을 수행함으로써 측정될 수 있다.
인자 VIII 폴리펩타이드의 활성은 꼬리 클립(tail clip) 검정을 사용하여 분석될 수 있다. 적합한 꼬리 클립 검정은 유전자 요법의 맥락에서 인자 VIII 폴리펩타이드, 또는 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 마우스, 예컨대 인자 VIII가 결핍된 넉아웃 마우스에게 투여하는 단계를 수반할 수 있다. 그 후에, 마우스의 꼬리를 클립으로 고정하고, 꼬리에서의 절단부(cut)가 응고하는 데 소요된 시간을 측정한다. 출혈 기간은 투여된 인자 VIII, 예를 들어 변형된 BDR 영역을 포함하는 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드 대(vs) 야생형 인자 VIII, 또는 인자 VIII 뉴클레오타이드 서열 중 적어도 일부가 야생형이 아닌 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 인자 VIII 폴리펩타이드 대 야생형 인자 VIII의 활성의 상대 측정치를 제공한다.
변형된 BDR 영역은 최대 88개의 아미노산을 포함한다. 변형된 BDR 영역은 최대 87, 85, 80, 75, 70, 65, 60, 55, 50, 또는 45개의 아미노산을 포함할 수 있다. 바람직하게는, 변형된 BDR 영역은 최대 74개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 최대 54개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 최대 47개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 최대 45개의 아미노산을 포함할 수 있다.
변형된 BDR 영역은 적어도 20, 적어도 25, 적어도 28, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 54, 적어도 55, 적어도 57, 적어도 58, 적어도 60, 또는 적어도 65개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 적어도 28개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 적어도 30개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 적어도 54개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 적어도 57개의 아미노산을 포함할 수 있다. 변형된 BDR 영역은 적어도 58개의 아미노산을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 722 및 위치 1670 내지 2332에 상응하는 아미노산을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 722 및 위치 1670 내지 2332에 상응하는 아미노산으로 구성된 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 731 및 위치 1670 내지 2332에 상응하는 아미노산을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 731 및 위치 1670 내지 2332에 상응하는 아미노산으로 구성된 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 743 및 위치 1638 내지 2332에 상응하는 아미노산을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다('SQ' 인자 VIII 폴리펩타이드). 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 1의 위치 1 내지 743 및 위치 1638 내지 2332에 상응하는 아미노산으로 구성될 수 있다. 선택적으로, 인자 VIII 아미노산 서열은 SQ 링커 서열 SFSQNPPVLKRHQR을 포함할 수 있다.
선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 28 또는 30으로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 28 또는 30으로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열로 구성된 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 28 또는 30으로 표시된 아미노산 서열을 포함하는 인자 VIII 아미노산 서열을 포함할 수 있다. 선택적으로, 인자 VIII 폴리펩타이드는 SEQ ID NO: 28 또는 30으로 표시된 아미노산 서열로 구성된 인자 VIII 아미노산 서열을 포함할 수 있다.
인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드
본 발명은 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 제공하며, 여기서 인자 VIII 뉴클레오타이드 서열은 본 발명의 인자 VIII 폴리펩타이드를 인코딩한다.
용어 "폴리뉴클레오타이드"는 임의의 길이의 뉴클레오타이드, 예를 들어 데옥시리보뉴클레오타이드, 리보뉴클레오타이드, 또는 이의 유사체의 중합체성 사슬을 지칭한다. 예를 들어, 폴리뉴클레오타이드는 DNA(데옥시리보뉴클레오타이드) 또는 RNA(리보뉴클레오타이드)를 포함할 수 있다. 폴리뉴클레오타이드는 DNA로 구성될 수 있다. 폴리뉴클레오타이드는 mRNA일 수 있다. 폴리뉴클레오타이드가 RNA 또는 DNA를 포함할 수 있기 때문에, T(티민) 뉴클레오타이드에 대한 모든 지칭은 U(우라실)로 대체될 수 있다.
인자 VIII 뉴클레오타이드 서열은 인자 VIII 폴리펩타이드를 인코딩한다. "인코딩하는" "서열"은 인코딩되는 아미노산 서열을 인코딩하는 코돈을 포함하는 뉴클레오타이드 서열을 지칭한다. 예를 들어, 인자 VIII 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열은 인자 VIII 폴리펩타이드를 인코딩하는 코돈을 포함한다. 야생형 인자 VIII을 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 2로 제공된다. 인자 VIII 뉴클레오타이드 서열은 하나 이상의 비-코딩 뉴클레오타이드, 예컨대 인트론의 하나 이상의 영역을 포함할 수 있다. 비-코딩 뉴클레오타이드의 영역은, 인코딩되는 아미노산 서열을 인코딩하는 코돈의 서열을 개재할 수 있다. 그러므로, 인코딩되는 아미노산 서열을 인코딩하는 코돈의 서열은 서열에서 인접해 있거나 비-코딩 뉴클레오타이드의 하나 이상의 영역에 의해 분리될 수 있다. 바람직하게는 인자 VIII 뉴클레오타이드 서열은 임의의 비-코딩 뉴클레오타이드를 포함하지 않는다. 본원에서, 정지 코돈은 비-코딩 뉴클레오타이드인 것으로 여겨지지 않을 것이다.
하기 표는 각각의 아미노산을 인코딩하는 코돈을 기재한다:
상응하는 RNA 코돈은 상기 표에서 T의 자리에 U를 함유할 것이다.
인자 VIII 뉴클레오타이드 서열은 성숙 인자 VIII 폴리펩타이드를 인코딩할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 신호 펩타이드의 모두 또는 일부를 인코딩하지 않는다. 인자 VIII 뉴클레오타이드 서열은 신호 펩타이드의 모두 또는 일부, 예컨대 본원에 기재된 임의의 신호 펩타이드의 임의의 것 또는 일부를 인코딩할 수 있다.
본 발명의 인자 VIII 뉴클레오타이드 서열은 코돈-최적화될 수 있다. 상기 언급된 바와 같이, 유전자 코드는 축퇴성(degenerate)이고, 많은 아미노산은 하나 초과의 대안적인 코돈에 의해 인코딩될 수 있다. 그러나, 상이한 유기체, 조직 또는 세포의 유전자 코드는 특정 아미노산을 인코딩하는 하나의 특정 코돈을 사용하는 쪽으로 편향될 수 있다. "코돈-최적화된" 뉴클레오타이드 서열은 특정 숙주 세포 또는 유기체에서의 발현, 예를 들어 인간 간 세포에서의 발현을 위해 최적화될 수 있다. 바람직하게는, 코돈-최적화된 핵산 서열은 인자 VIII 뉴클레오타이드 서열과 비교하여 변형되는 한편, 뉴클레오타이드 서열에 의해 인코딩되는 아미노산 서열은 변형되지 않는다.
코돈 최적화된 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드는 인간 간 세포에서 기준 야생형 인자 VIII 뉴클레오타이드 서열과 비교하여 더 높은 수준으로 발현될 수 있다.
그러므로, 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 인자 VIII 폴리펩타이드는 서열이 인간 간 세포에서 발현될 때, 야생형 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드보다 더 높은 수준으로 발현될 수 있다. 예를 들어, 코돈-최적화된 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드는 인간 간 세포에서 기준 야생형 인자 VIII 뉴클레오타이드 서열과 비교하여 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.8배, 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 30배, 적어도 40배, 또는 적어도 50배 더 높게 발현될 수 있다. "기준 야생형 인자 VIII 뉴클레오타이드 서열"은 인자 VIII 폴리펩타이드(그 자체가 야생형 인자 VIII 폴리펩타이드일 수 있거나 변형된 인자 VIII 폴리펩타이드, 예컨대 변형된 BDR을 포함하는 본 발명의 인자 VIII 폴리펩타이드일 수 있음)를 인코딩하는 야생형 코돈을 사용하는 임의의 인자 VIII 뉴클레오타이드 서열, 예컨대 SEQ ID NO: 2의 인자 VIII 뉴클레오타이드 서열일 수 있다. 선택적으로, 기준 야생형 인자 VIII 뉴클레오타이드는 "등가의(equivalent)" 인자 VIII 뉴클레오타이드 서열이며, 즉, 기준 야생형 인자 VIII 뉴클레오타이드는 이것이 비교되는 인자 VIII 폴리뉴클레오타이드와 동일한 인자 VIII 폴리펩타이드를 인코딩한다.
뉴클레오타이드 서열을 "코돈-최적화되는" 것으로 기재함으로써, 모든 코돈이 최적화될 필요는 없다. 그러므로, 코돈-최적화되는 인자 VIII 뉴클레오타이드 서열의 부분은, 야생형 인자 VIII 뉴클레오타이드 서열의 상응하는 부분과 비교될 때, 야생형 코돈(들) 대신에 하나 이상의 대안적인 코돈(들)을 포함할 수 있다. 인자 VIII 뉴클레오타이드 서열이 코돈-최적화되는 부분을 포함한다면, 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드는 야생형 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드보다 더 높은 수준으로 발현될 수 있다. 코돈-최적화되는 인자 VIII 뉴클레오타이드 서열의 부분은 인간 간 세포에서 발현을 위해 코돈-최적화될 수 있다. 그러므로, 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드는, 서열이 인간 간 세포에서 발현될 때, 등가의 비-코돈-최적화된(예를 들어 야생형) 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 폴리펩타이드보다 더 높은 수준으로 발현될 수 있다. "등가의" 비-코돈 최적화된 인자 VIII 뉴클레오타이드 서열은, 인자 VIII 폴리펩타이드를 인코딩하는 데 사용되는 코돈이 야생형 인자 VIII 서열, 예컨대 SEQ ID NO: 2의 상응하는 코돈에 상응할 것이라는 점을 제외하고는, 동일하다(즉, 동일한 인자 VIII 폴리펩타이드를 인코딩하고 동일한 전사 조절 요소 등을 포함함). 전형적으로, 인자 VIII 뉴클레오타이드 서열의 코돈-최적화된 부분은 정지 코돈을 포함하지 않는다.
본 발명의 인자 VIII 뉴클레오타이드 서열은 야생형 코돈(들) 대신에 하나 이상의 대안적인 코돈(들)을 포함할 수 있으며, 여기서 "대안적인" 코돈은 야생형 코돈과 상이한 서열을 갖지만 야생형 코돈과 동일한 아미노산을 인코딩하는 코돈(즉, 축퇴성 코돈)이다. 표 3은 각각의 아미노산을 인코딩하는 코돈을 기재한다.
코돈-최적화된 뉴클레오타이드 서열은, 코돈-최적화되지 않는 상응하는 뉴클레오타이드 서열보다 적어도 하나 더 많은 "바람직한" 코돈을 포함할 수 있다. 코돈-최적화된 뉴클레오타이드 서열은, 코돈-최적화되지 않는 상응하는 뉴클레오타이드 서열보다 더 높은 백분율의 "바람직한" 코돈을 포함할 수 있다. 코돈-최적화된 뉴클레오타이드 서열은, 코돈-최적화되지 않는 상응하는 뉴클레오타이드 서열보다 적어도 하나 더 적은 "바람직하지 않은" 코돈을 포함할 수 있다. 코돈-최적화된 뉴클레오타이드 서열은 코돈-최적화되지 않는 상응하는 뉴클레오타이드 서열보다 더 낮은 백분율의 "바람직하지 않은" 코돈을 포함할 수 있다. 인간 간 세포에서 인자 VIII의 발현에 바람직한 코돈은 표 3에 밑줄표시되어 있다.
선택적으로, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 4의 적어도 4047개, 적어도 4071개, 적어도 4104개, 적어도 4128개, 적어도 4131개, 적어도 4155개, 적어도 4158개, 적어도 4173개, 적어도 4182개, 적어도 4254개 또는 적어도 4263개의 뉴클레오타이드(선택적으로 SEQ ID NO: 4의 최대 5개, 최대 4개, 최대 3개 또는 최대 2개 영역으로부터의 적어도 4047개, 적어도 4071개, 적어도 4104개, 적어도 4128개, 적어도 4131개, 적어도 4155개, 적어도 4158개, 적어도 4173개, 적어도 4182개, 적어도 4254개 또는 적어도 4263개의 인접 뉴클레오타이드, 또는 적어도 4047개, 적어도 4071개, 적어도 4104개, 적어도 4128개, 적어도 4131개, 적어도 4155개, 적어도 4158개, 적어도 4173개, 적어도 4182개, 적어도 4254개 또는 적어도 4263개의 뉴클레오타이드)를 포함하는 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 4의 적어도 4047개, 적어도 4071개, 적어도 4104개, 적어도 4128개, 적어도 4131개, 적어도 4155개, 적어도 4158개, 적어도 4173개, 적어도 4182개, 적어도 4254개 또는 적어도 4263개의 뉴클레오타이드를 포함하는 뉴클레오타이드 서열과 40개 이하, 35개 이하, 30개 이하, 25개 이하, 20개 이하, 15개 이하, 14개 이하, 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 뉴클레오타이드만큼 상이한 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 4의 적어도 4047개, 적어도 4071개, 적어도 4104개, 적어도 4128개, 적어도 4131개, 적어도 4155개, 적어도 4158개, 적어도 4173개, 적어도 4182개, 적어도 4254개 또는 적어도 4263개의 뉴클레오타이드를 포함하는 뉴클레오타이드 서열과 단지 하나 이상의 치환 돌연변이를 인코딩하는 대안적인 코돈만큼 상이한 뉴클레오타이드 서열을 포함할 수 있다.
선택적으로, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 6으로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 6으로 표시된 뉴클레오타이드와 43개 이하, 40개 이하, 35개 이하, 30개 이하, 25개 이하, 20개 이하, 15개 이하, 14개 이하, 13개 이하, 12개 이하, 11개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 1개의 뉴클레오타이드만큼 상이한 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 6으로 표시된 뉴클레오타이드 서열과 단지 하나 이상의 치환 돌연변이를 인코딩하는 대안적인 코돈만큼 상이한 뉴클레오타이드 서열을 포함할 수 있다.
선택적으로, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 29로 표시된 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 29로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열로 구성될 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 29로 표시된 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 29로 표시된 뉴클레오타이드 서열로 구성될 수 있다.
선택적으로, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31의 적어도 4047개 뉴클레오타이드를 포함하는 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열로 구성될 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드 서열을 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드 서열로 구성될 수 있다.
폴리뉴클레오타이드를 포함하는 재조합 AAV 작제물
본 발명은 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함하는 재조합 AAV 작제물을 제공하며, 여기서 인자 VIII 뉴클레오타이드 서열은 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드를 인코딩한다. 폴리뉴클레오타이드는 본 발명의 임의의 폴리뉴클레오타이드일 수 있다. 인자 VIII 뉴클레오타이드 서열은 본 발명의 임의의 인자 VIII 뉴클레오타이드 서열일 수 있다. 인자 VIII 폴리펩타이드는 본 발명의 임의의 인자 VIII 폴리펩타이드일 수 있다.
재조합 AAV 작제물은 4900개 미만, 4850개 미만, 4800개 미만, 또는 4750개 미만의 뉴클레오타이드 길이일 수 있다. 재조합 AAV 작제물은 4700 내지 4900개, 4700 내지 4850개, 4700 내지 4800개, 4700 내지 4750개, 또는 대략 4713개 뉴클레오타이드 길이일 수 있다. 재조합 AAV 작제물은 대략 4845개 뉴클레오타이드 길이일 수 있다.
재조합 AAV 작제물은 4850 내지 4900개, 또는 대략 4845개 뉴클레오타이드 길이일 수 있고, 선택적으로 4318개 미만의 뉴클레오타이드 길이의 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 4318 내지 4046개, 4318 내지 4070개, 4264 내지 4127개, 4210 내지 4151개, 또는 대략 4182개 뉴클레오타이드 길이일 수 있다.
재조합 AAV 작제물은 4700 내지 4850개, 4700 내지 4800개, 4700 내지 4750개 또는 대략 4713개 뉴클레오타이드 길이일 수 있고, 선택적으로 4318개 미만의 뉴클레오타이드 길이의 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함할 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 4318 내지 4046개, 4264 내지 4070개, 4264 내지 4103개, 4255 내지 4127개, 4246 내지 4130개, 4237 내지 4154개, 4228 내지 4157개, 4219 내지 4166개, 4210 내지 4169개, 4201 내지 4172개, 4192 내지 4175개 또는 대략 4182개 뉴클레오타이드 길이일 수 있다. 선택적으로, 인자 VIII 뉴클레오타이드 서열은 대략 4182개 뉴클레오타이드 길이일 수 있다.
선택적으로, 재조합 AAV 작제물은 대략 4713개 뉴클레오타이드 길이일 수 있고, 인자 VIII 뉴클레오타이드 서열은 4228 내지 4157개, 4219 내지 4166개, 4210 내지 4169개, 4201 내지 4172개, 4192 내지 4175개 또는 대략 4131개, 대략 4134개, 대략 4155개, 대략 4158개, 대략 4161개, 대략 4167개, 대략 4173개 또는 대략 4182개 뉴클레오타이드 길이일 수 있다. 선택적으로, 재조합 AAV 작제물은 대략 4713개 뉴클레오타이드 길이일 수 있고, 인자 VIII 뉴클레오타이드 서열은 4131개, 4134개, 4155개, 4158개, 4161개, 4167개, 4173개 또는 4182개 뉴클레오타이드 길이일 수 있다. 선택적으로 재조합 AAV 작제물은 4713개 뉴클레오타이드 길이일 수 있고, 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 27일 수 있다.
일부 경우, 재조합 AAV 작제물의 맥락에서 상기 단락에서의 인자 VIII 뉴클레오타이드 서열의 길이에 대한 지칭은 '정지' 코돈을 포함하지 않는다 - 정지 코돈을 포함하는 인자 VIII 뉴클레오타이드 서열은 상기 언급된 뉴클레오타이드 서열보다 3개 뉴클레오타이드 더 길 것이다. 일부 구현예에서, 인자 VIII 뉴클레오타이드 서열은 정지 코돈을 포함할 수 있다.
재조합 AAV 작제물은 전사 조절 요소(TRE) 및/또는 polyA 서열에 작동 가능하게 연결된 인자 VIII 뉴클레오타이드 서열을 포함한다.
재조합 AAV 작제물은 전사 조절 요소(TRE)를 추가로 포함할 수 있다. 전사 조절 요소는 간-특이적 프로모터를 포함할 수 있다. 전사 조절 요소는 270개 미만의 뉴클레오타이드 길이일 수 있다. TRE는 선택적으로 SEQ ID NO: 13으로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 서열을 포함하거나 이로 구성될 수 있다. 본 발명자들은 놀랍게도, 기지의 HLP2 TRE로부터의 실질적인 수의 뉴클레오타이드가 TRE의 효능에 유의하게 영향을 미치지 않으면서 결실되거나 변형될 수 있음을 결정하였다. 특히, 본 발명자들은 놀랍게도, 짧은 전사 조절 요소 FRE 72가 상당히 더 짧은 길이임에도 불구하고 HLP2 TRE에 필적하는 효능(즉, 비교에 의해 적어도 50% 또는 더 양호한 활성)을 가짐을 발견하였다. 선택적으로, 전사 조절 요소는 200개 뉴클레오타이드 더 짧으며, 선택적으로 150개 뉴클레오타이드 더 짧고, 선택적으로 125개 뉴클레오타이드 더 짧다. 선택적으로, 전사 조절 요소는 적어도 85개 뉴클레오타이드 길이, 선택적으로 적어도 100개 뉴클레오타이드 길이, 선택적으로 적어도 110개 뉴클레오타이드 길이이다. 선택적으로, 전사 조절 요소는 SEQ ID NO: 14로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 서열을 포함하거나 이로 구성될 수 있다.
재조합 AAV 작제물은 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드일 수 있다. 신호 펩타이드는 SEQ ID NO: 15로 표시된 야생형 FVIII 신호 펩타이드를 포함할 수 있다. 선택적으로, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 16 또는 17과 적어도 90%, 적어도 92%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일하다. 선택적으로, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 16 또는 17을 포함한다.
선택적으로, 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드가 아니다. 신호 펩타이드는 SEQ ID NO: 18 또는 20의 서열과 적어도 90%, 적어도 92%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 서열을 포함할 수 있다. 신호 펩타이드는 SEQ ID NO: 18과 적어도 90%, 적어도 92%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 서열을 포함할 수 있다. 신호 펩타이드는 SEQ ID NO: 20과 적어도 90%, 적어도 92%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일한 서열을 포함할 수 있다. 신호 펩타이드는 SEQ ID NO: 18을 포함할 수 있다. 신호 펩타이드는 SEQ ID NO: 20을 포함할 수 있다.
바람직하게는, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 57개 미만의 뉴클레오타이드 길이이다. 더 바람직하게는, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 대략 54개 뉴클레오타이드 길이이다. 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 대략 54개 뉴클레오타이드 길이이고 SEQ ID NO: 18의 서열을 인코딩할 수 있다. 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 대략 54개 뉴클레오타이드 길이이고 SEQ ID NO: 20의 서열을 인코딩할 수 있다. 선택적으로, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 코돈 최적화될 수 있다. SEQ ID NO: 18로 표시된 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 19의 서열을 갖는다. SEQ ID NO: 20으로 표시된 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 21의 서열을 갖는다. 선택적으로, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 19 또는 21과 적어도 90%, 적어도 92%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 동일하다. 선택적으로, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 19 또는 21을 포함한다.
재조합 AAV 작제물은 polyA 뉴클레오타이드 서열을 추가로 포함할 수 있다. polyA 뉴클레오타이드 서열은 합성일 수 있다. polyA 뉴클레오타이드 서열은 50개 미만의 뉴클레오타이드 길이일 수 있다. polyA 뉴클레오타이드 서열은 16 내지 50개 뉴클레오타이드 길이일 수 있다. polyA 뉴클레오타이드 서열은 대략 49개 뉴클레오타이드 길이일 수 있다. polyA 뉴클레오타이드 서열은 SEQ ID NO: 22의 뉴클레오타이드 서열을 포함할 수 있다.
재조합 AAV 작제물은 1 또는 2개의 ITR(들)을 추가로 포함할 수 있다. 이러한 또는 각각의 ITR은 야생형 ITR일 수 있다. 선택적으로, 재조합 AAV 작제물은 AAV1, AAV2, AAV4 및/또는 AAV6으로부터 유래되는 ITR 서열을 포함한다. 이러한 또는 각각의 ITR은 AAV2 ITR일 수 있다. 이러한 또는 각각의 ITR의 뉴클레오타이드 서열은 157개 미만, 또는 154개 미만의 뉴클레오타이드 길이일 수 있다. 이러한 또는 각각의 ITR의 뉴클레오타이드 서열은 대략 145개 뉴클레오타이드 길이일 수 있다. 5' ITR의 뉴클레오타이드 서열은 SEQ ID NO: 23의 뉴클레오타이드 서열을 포함할 수 있다. 3' ITR의 뉴클레오타이드 서열은 SEQ ID NO: 24의 뉴클레오타이드 서열을 포함할 수 있다.
재조합 AAV 작제물은 단일-가닥일 수 있다. 재조합 AAV 작제물은 AAV 게놈일 수 있다.
인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 27의 서열을 포함할 수 있고, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 19를 포함할 수 있다. 재조합 AAV 작제물은 간-특이적 프로모터인 전사 조절 요소를 포함할 수 있고, 간-특이적 프로모터는 SEQ ID NO: 13의 뉴클레오타이드 서열을 포함할 수 있다. 재조합 AAV 작제물은 2개의 ITR 및 polyA 뉴클레오타이드 서열을 포함할 수 있으며, 여기서 5' ITR의 뉴클레오타이드 서열은 SEQ ID NO: 23이며, 3' ITR의 서열은 SEQ ID NO: 24이고, polyA 뉴클레오타이드 서열은 SEQ ID NO: 22의 뉴클레오타이드 서열을 포함한다. AAV 작제물은 서열 SEQ ID NO: 27을 가질 수 있다.
작제물을 포함하는 바이러스 입자
본 발명은 또한, 본 발명의 재조합 AAV 작제물을 포함하는 AAV 바이러스 입자를 제공한다.
나아가, 본 발명은 본 발명의 폴리뉴클레오타이드를 포함하는 재조합 게놈을 포함하는 바이러스 입자를 제공한다. 본 발명의 목적을 위해, 용어 "바이러스 입자"는 비리온의 모두 또는 일부를 지칭한다. 예를 들어, 바이러스 입자는 재조합 게놈을 포함하고, 캡시드를 추가로 포함할 수 있다. 바이러스 입자는 유전자 요법 벡터일 수 있다. 본원에서, 용어 "바이러스 입자" 및 "벡터"는 상호 교환적으로 사용된다. 본 출원의 목적을 위해, "유전자 요법" 벡터는 유전자 요법에 사용될 수 있는 바이러스 입자, 즉, 투여 후 숙주 세포에서 이식유전자, 예컨대 인자 IX 뉴클레오타이드 서열을 발현하기 위해 모든 필요한 기능적 요소를 포함하는 바이러스 입자이다.
적합한 바이러스 입자는 파보바이러스(parvovirus), 레트로바이러스, 렌티바이러스 또는 단순 포진 바이러스를 포함한다. 파보바이러스는 아데노-관련 바이러스(AAV: adeno-associated virus)일 수 있다. 바이러스 입자는 바람직하게는 재조합 아데노-관련 바이러스(AAV) 벡터 또는 렌티바이러스 벡터이다. 더 바람직하게는, 바이러스 입자는 AAV 바이러스 입자이다. 용어 AAV 및 rAAV는 본원에서 상호 교환적으로 사용된다.
모든 기지의 AAV 혈청형의 게놈 구조화는 매우 유사하다. AAV의 게놈은 약 5,000개 미만의 뉴클레오타이드 길이의 선형, 단일-가닥 DNA 분자이다. 역 말단 반복부(ITR: inverted terminal repeat)는 비-구조적 복제(Rep) 단백질 및 구조적(VP) 단백질에 대한 독특한 코딩 뉴클레오타이드 서열을 플랭킹(flank)한다. VP 단백질(VP1, VP2 및 VP3)은 캡시드를 형성한다. 말단 145개 nt는 자가-상보적이고, T-형상의 헤어핀을 형성하는 에너지적으로 안정한 분자내 이중체(duplex)가 형성될 수 있도록 구조화된다. 이들 헤어핀 구조는 바이러스 DNA 복제를 위한 기원(origin)으로서 작용하여, 세포성 DNA 폴리머라제(polymerase) 복합체에 대한 프라이머로서 역할을 한다. 포유류 세포에서 야생형(wt) AAV 감염 후, Rep 유전자(즉, Rep78 단백질 및 Rep52 단백질을 인코딩함)는 P5 프로모터 및 P19 프로모터로부터 각각 발현되고, Rep 단백질은 둘 다 바이러스 게놈의 복제에서 기능을 갖는다. Rep ORF에서의 스플라이싱 사건은 실제 4개의 Rep 단백질(즉, Rep78, Rep68, Rep52 및 Rep40)의 발현을 이끈다. 그러나, 포유류 세포에서 Rep78 단백질 및 Rep52 단백질을 인코딩하는 스플라이싱되지 않은(unspliced) mRNA는 AAV 벡터 생성에 충분한 것으로 나타났다. 또한 곤충 세포에서, Rep78 단백질 및 Rep52 단백질은 AAV 벡터 생성에 충분하다.
AAV 벡터의 생성을 위해 본 발명에 사용될 수 있는 AAV 서열은 임의의 AAV 혈청형의 게놈으로부터 유래될 수 있다. 일반적으로, AAV 혈청형은 아미노산 및 핵산 수준에서 유의한 상동성의 게놈 서열을 가지며, 유전적 기능의 동일한 세트를 제공하고, 본질적으로 물리적으로 그리고 기능적으로 등가인 비리온을 생성하며, 실제로 동일한 기전에 의해 복제 및 조립한다. 다양한 AAV 혈청형의 게놈 서열 및 게놈 유사성의 개요에 대해, 예를 들어 GenBank 기탁 번호 U89790; GenBank 기탁 번호 J01901; GenBank 기탁 번호 AF043303; GenBank 기탁 번호 AF085716; Chiorini et al., 1997; Srivastava et al., 1983; Chiorini et al., 1999; Rutledge et al., 1998; 및 Wu et al., 2000을 참조한다. AAV 혈청형 1, 2, 3, 3B, 4, 5, 6, 7, 8, 9, 10, 11 또는 12는 본 발명에 사용될 수 있다. AAV 혈청형으로부터의 서열은 유전자 요법 벡터의 생성에 사용되고 있을 때 돌연변이화되거나 조작될 수 있다.
선택적으로, AAV 벡터는 AAV1, AAV2, AAV4 및/또는 AAV6으로부터 유래되는 ITR 서열을 포함한다. 바람직하게는 ITR 서열은 AAV2 ITR 서열이다. 본원에서, 용어 AAVx/y는 AAVx(여기서 x는 AAV 혈청형 수임)로부터의 일부 성분 및 AAVy(여기서 y는 동일한 또는 상이한 혈청형의 수임)로부터의 일부 성분을 포함하는 바이러스 입자를 지칭한다. 예를 들어, AAV2/8 벡터는 AAV2 균주로부터의 ITR 및 AAV8 균주로부터의 캡시드를 포함하는 바이러스 게놈의 일부를 포함할 수 있다.
일 구현예에서, 바이러스 입자는 캡시드를 포함하는 AAV 바이러스 입자이다. AAV 캡시드는 일반적으로, 3개의 단백질인 VP1, VP2 및 VP3으로부터 형성된다. VP1의 아미노산 서열은 VP2의 서열을 포함한다. VP2의 부분을 형성하지 않는 VP1의 일부는 VP1독특 또는 VP1U로 지칭된다. VP2의 아미노산 서열은 VP3의 서열을 포함한다. VP3의 부분을 형성하지 않는 VP2의 일부는 VP2독특 또는 VP2U로 지칭된다. 바이러스 입자는 캡시드를 포함할 수 있다. 캡시드는
(i) SEQ ID NO: 25와 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드;
(ii) SEQ ID NO: 26과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8%, 또는 100% 동일한 서열을 포함하는 캡시드;
(iii) 간-회귀성(liver-tropic) 캡시드; 및
(iv) AAV5 캡시드
로 이루어진 군으로부터 선택될 수 있다.
캡시드는
(i) SEQ ID NO: 47과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드;
(ii) SEQ ID NO: 48과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드; 및
(iii) AAV6 캡시드
로 이루어진 군으로부터 선택될 수 있다.
본 발명의 바이러스 입자는, 바이러스 ITR 및 바이러스 캡시드가 상이한 파보바이러스, 예컨대 상이한 AAV 혈청형으로부터의 것인 "하이브리드" 입자일 수 있다. 바람직하게는, 바이러스 ITR 및 캡시드는 AAV의 상이한 혈청형으로부터의 것이며, 이러한 경우 이러한 바이러스 입자는 트랜스캡시드화(transcapsidated) 또는 위형화(pseudotyped)라고 알려져 있다. 마찬가지로, 파보바이러스는 "키메라" 캡시드(예를 들어, 상이한 파보바이러스, 바람직하게는 상이한 AAV 혈청형으로부터의 서열을 함유함) 또는 "표적화된" 캡시드(예를 들어, 직접 회귀성(directed tropism))를 가질 수 있다.
조성물, 방법 및 용도
본 발명의 추가 양태에서, 본 발명의 폴리뉴클레오타이드 또는 작제물/바이러스 입자 및 약학적으로 허용 가능한 부형제를 포함하는 조성물이 제공된다.
약학적으로 허용 가능한 부형제는 담체, 희석제 및/또는 다른 의학적 제제, 약학적 제제 또는 아쥬반트(adjuvant) 등을 포함할 수 있다. 선택적으로, 약학적으로 허용 가능한 부형제는 식염수를 포함한다. 선택적으로, 약학적으로 허용 가능한 부형제는 인간 혈청 알부민을 포함한다.
나아가, 본 발명은 치료 방법에 사용하기 위한 본 발명의 폴리뉴클레오타이드, 작제물/바이러스 입자 또는 조성물을 제공한다. 선택적으로 치료 방법은 유효량의 본 발명의 폴리뉴클레오타이드 또는 작제물/바이러스 입자를 환자에게 투여하는 단계를 포함한다.
나아가, 본 발명은 치료 방법에 사용하기 위한 약제의 제조에 있어서 본 발명의 폴리뉴클레오타이드, 작제물/바이러스 입자 또는 조성물의 용도를 제공한다. 선택적으로 치료 방법은 유효량의 본 발명의 폴리뉴클레오타이드 또는 작제물/바이러스 입자를 환자에게 투여하는 단계를 포함한다.
선택적으로 치료 방법은 유전자 요법이다. "유전자 요법"은, 본 발명의 작제물/바이러스 입자가 투여되는 숙주에서 이식유전자(예컨대 인자 VIII 뉴클레오타이드 서열)를 발현할 수 있는 본 발명의 작제물/바이러스 입자를 투여하는 단계를 수반한다.
선택적으로, 치료 방법은 응고병증(coagulopathy), 예컨대 혈우병(예를 들어 A형 혈우병 또는 B형 혈우병) 또는 폰 빌레브란트 질환을 치료하는 방법이다. 바람직하게는, 응고병증은 증가된 출혈 및/또는 감소된 응고를 특징으로 한다. 선택적으로, 치료 방법은 혈우병, 예를 들어 A형 혈우병을 치료하는 방법이다. 일부 구현예에서, 환자는 A형 혈우병을 앓고 있는 환자이다. 선택적으로 환자는 인자 VIII에 대한 항체 또는 저해제를 갖는다. 선택적으로, 폴리뉴클레오타이드 및/또는 작제물/바이러스 입자는 정맥내로 투여된다. 선택적으로, 폴리뉴클레오타이드 및/또는 작제물/바이러스 입자는 환자에게 단지 1회 투여(즉, 단회 용량)되기 위한 것이다.
선택적으로, 본 발명의 방법은 환자가 유전자 요법 벡터의 투여에 의해 부분적으로 또는 완전히 치료되었는지의 여부를 결정하는(예를 들어 환자가 A형 혈우병의 증상에 대해 부분적으로 또는 완전히 치료되었는지 결정하는) 단계를 추가로 포함할 수 있다. A형 혈우병을 부분적으로 또는 완전히 치료한다는 것은 A형 혈우병을 앓고 있는 환자의 응고를 개선하고, 비제어된 출혈 사건의 위험을 감소시키는 것을 지칭할 수 있다. A형 혈우병을 부분적으로 또는 완전히 치료한다는 것은 예를 들어 관절에서 비제어된 출혈 사건 또는 내출혈(internal bleeding)의 횟수 및/또는 빈도를 감소시키는 것을 지칭할 수 있다. 부분적으로 또는 완전히 치료되는 환자는 매해 더 적은 수의 비제어된 출혈 사건을 경험할 수 있다. A형 혈우병이 상기 방법으로 "치료될" 때, 이는, 혈우병의 하나 이상의 증상이 개선됨을 의미한다. 이는, 혈우병의 증상이 완전히 치유되어 이들 증상이 환자에 더 이상 존재하지 않음을 의미하는 것은 아니지만, 일부 방법에서 이러한 경우가 있을 수 있다. 치료 방법은 A형 혈우병의 증상 중 하나 이상이 치료 전보다 덜 심각해지는 것을 이끌 수 있다. A형 혈우병을 부분적으로 또는 완전히 치료하는 것은 환자의 혈장에 존재하는 FVIII의 양 또는 활성을 증가시키는 것을 지칭할 수 있다. 선택적으로, 투여-전 상황과 비교하여, 치료 방법은 환자의 혈액 중 순환형 인자 VIII의 양/농도의 증가, 및/또는 환자의 주어진 부피의 혈액 내에서 검출 가능한 인자 VIII 활성의 전체 수준, 및/또는 환자의 혈액 중 인자 VIII의 고유 활성도(인자 VIII 단백질의 양(amount)당 활성)의 증가를 이끈다. 혈우병을 부분적으로 치료하는 것은 중증(< 1%의 정상적인 혈액 응고 인자 활성) 또는 중등도(< 2%의 정상적인 혈액 응고 인자 활성) 혈우병 환자를 경증(5% ~ 40%의 정상적인 혈액 응고 인자 활성) 혈우병 환자로 전환시키는 것을 지칭할 수 있다. 혈우병을 완전히 치료하는 것은 중증, 중등도 또는 경증 혈우병 환자의 혈액 응고 인자 활성을 정상적인 범위(50% ~ 150%의 정상적인 혈액 응고 인자 활성) 내로 증가시키는 것을 지칭할 수 있다.
부분적으로 또는 완전히 치료되는 환자는 더 낮은 용량의 인자 VIII가 투여되는 것을 필요로 할 수 있다. 선택적으로, 부분적으로 또는 완전히 치료되는 환자는 FVIII의 지속(on-going) 투여를 필요로 하지 않을 수 있다. 선택적으로, 방법은, 혈우병에 대해 부분적으로 또는 완전히 치료된 적이 있는 환자가 인자 VIII을 이용한 지속 치료를 더 이상 필요로 하지 않거나 지속 치료를 감소된 수준으로 필요하는지의 여부를 평가하고, 예를 들어 투여될 인자 VIII의 용량 또는 용량 빈도를 감소시키거나 인자 VIII의 투여를 중단시키기 위해 환자의 치료 계획을 적절하게 조정하는 단계를 추가로 포함할 수 있다.
"치료적 유효량"은 대상체에서 요망되는 치료 결과를 달성하기에, 예컨대 기능적 인자 VIII의 수준을 상승시키기 위해(따라서 A형 혈우병의 증상을 개선하기에 충분한 수준에서 기능적 인자 VIII 생성을 이끌기 위해) 필요한 투약량에서 그리고 기간 동안 효과적인 양을 지칭한다.
선택적으로, 작제물/바이러스 입자는 환자 체중 kg당 1 × 1011개 미만, 1 × 1012개 미만, 5 × 1012개 미만, 2 × 1012개 미만, 1.5 × 1012개 미만, 3 × 1012개 미만, 1 × 1013개 미만, 2 × 1013개 미만, 또는 3 × 1013개 미만의 작제물 게놈의 용량으로 투여된다. 선택적으로, 폴리뉴클레오타이드, 바이러스 입자 또는 조성물은 환자 체중 kg당 적어도 4.5 × 1011개, 또는 4.5 × 1011개 내지 1 × 1012개의 작제물 게놈의 용량(vg/kg)으로 투여된다. 선택적으로, 폴리뉴클레오타이드, 바이러스 입자 또는 조성물은 5 × 1011 vg/kg 미만의 용량으로 투여된다. 선택적으로, 폴리뉴클레오타이드, 바이러스 입자 또는 조성물은 4.5 × 1011 vg/kg 내지 5 × 1011 vg/kg, 또는 4.5 × 1011 vg/kg 내지 4.9 × 1011 vg/kg의 용량으로 투여된다. 선택적으로, 투여되는 폴리뉴클레오타이드 또는 바이러스 입자는 포유류 세포로부터 생성되고/되거나, 포유류 바이러스 작제물 생성 세포의 사용으로부터 비롯되고 곤충 바이러스 작제물 생성 세포(예를 들어 바큘로바이러스(baculovirus) 시스템)에서 생성되는 작제물과 구별되는 특징을 소유한다.
선택적으로, 주어진 용량의 작제물/바이러스 입자의 투여 - 작제물 게놈의 수의 측면에서 정량화됨 - 는 작제물 게놈을 적정하기 위해 qPCR을 사용하여 달성된다.
qPCR을 수행하는 방법은 당업자에게 알려져 있다. 실시간 PCR 사이클러 및 DNA-결합 염료, 예컨대 SYBR 그린(ThermoFisher Scientific)을 사용하여, 초기(nascent) 이중-가닥 앰플리콘의 증폭은 실시간으로 검출될 수 있다. 그 후에, 기지의 양의 qPCR 주형 유전 물질(예를 들어 프로모터 영역)은 일련으로 희석되어, 표준 곡선을 생성하고, 시료 작제물 게놈 역가는 표준 곡선으로부터 내삽될 수 있다.
실시예
실시예 1 - 일반적인 방법 및 재료
FVIII 작제물
FVIII-SQ 폴리펩타이드는 SEQ ID NO: 1의 아미노산 1-743 및 1638-2332에 상응하는 아미노산을 포함한다(문헌[Lind et al. 1995. Eur J Biochem 232, 19-27](SEQ ID NO: 3).
내부-절단된(internally-truncated) 인간 FVIII 폴리펩타이드(FVIII-96-106)는 SEQ ID NO: 1의 아미노산 732-1669에 상응하는 아미노산의 결실을 포함하고, SEQ ID NO: 1의 아미노산 1-731 및 1670-2332에 상응하는 아미노산(SEQ ID NO: 7)을 포함한다.
AAV 벡터의 생산
AAV Rep 및 Cap 기능; 아데노바이러스 헬퍼 기능; 및 AAV2 ITR에 의해 플랭킹된 FVIII 발현 카세트를 함유하는 재조합 게놈을 인코딩하는 플라스미드로 HEK293T 세포를 삼중(triple) 플라스미드 형질주입함으로써 AAV 입자를 생성하였다. 형질주입-후 72시간째에 세포 펠렛 및 현탁액을 수확하고, 수지, 예컨대 POROS Capture Select 및 AVB Sepharose를 사용하여 친화도 크로마토그래피에 의해 AAV 입자를 정제하였다. 그 후에, AAV를 PBS 내로 밤새 투석시키고, 4℃에서 저장하고, qPCR에 의해 적정하였다.
FVIII 발색 활성 검정
Biophen FVIII:C 발색 검정(Hyphen BioMed, ref 221406)은 FVIII의 보조인자 활성(FVIII:C)을 측정한다.
트롬빈 활성화를 통해, FVIII:C 폴리펩타이드는 인간 인자 IXa, 인지질 및 칼슘과 복합체를 형성한다. 이들 조건 하에, 이 검정에서 특정 농도에서 그리고 과량으로 제공되는 인자 X는 인자 Xa(활성화됨)로 전환된다. 생성된 이러한 인자 Xa는 제한 인자인 FVIII:C에 정비례한다. 인자 Xa는 발색 기질인 Sxa-11에 의해 직접 측정된다. 인자 Xa는 발색 기질을 절단하고 pNA를 방출시킨다. pNA의 생성은, FVIII:C 활성과 직접적으로 관련이 있는 인자 Xa 활성에 비례한다. 방출되는 pNA의 수준은 405 nm에서 발색을 측정함으로써 결정될 수 있으며, 이는 시료 내 인자 VIII:C에 의해 생산되는 인자 Xa 폴리펩타이드의 양에 비례하며, 이는 시료 내 FVIII:C의 활성에 비례한다.
검정은 제조업체의 설명에 따라 수행된다. 간략하게는, 37℃에서 예비인큐베이션된 마이크로플레이트 웰에, 50 μl의 보정자(calibrator) 혈장, 희석된(시약 R4에서) 시험 혈장 또는 세포 상층액/용해물 또는 대조군을 첨가하고, 50 μl의 각각의 시약 R1 및 R2를 첨가하고, 이를 6 mL의 증류수로 재구성하고 37℃까지 예열시킨다. 혼합 후, 이들 성분은 150 μl 반응물을 형성하며, 이 반응물을 37℃에서 5분 동안 인큐베이션되게 한다. 후속적으로, 반응물에 시약 R3을 보충하고, 이 자체를 6 mL의 증류수에 재현탁시키고 37℃까지 예열시키고, 200 μL 믹스(mix)를 37℃에서 추가 5분 동안 인큐베이션되게 한다. 50 μl의 20% 아세트산 또는 시트르산(20 g/l)을 첨가함으로써 반응을 중단시킨 후, 생성된 250 μl 혼합물의 흡광도를 405 nm에서 측정한다.
시약:
R1 - 인간 인자 X, 피브린 중합 저해제의 존재 하에 동결건조됨.
R2 - 활성화 시약 - 동결건조된, 인간 트롬빈, 칼슘 및 합성 인지질을 함유하는 일정하고 최적화된 농도에서의 인자 IXa(인간).
R3 - SXa-11 - 트롬빈 저해제와 함께 동결건조된, 인자 Xa에 특이적인 발색 기질.
R4 - Tris-BSA 완충액. 1% BSA, PEG, FVIII:C 안정화제 및 소듐 아자이드(0.9 g/L)를 함유함.
발색 활성 검정으로부터의 판독물에 관하여, "%FVIII 활성"("%FVIII:C"로도 지칭됨)은 "정상 %"이며, 이는 예를 들어, HuH-7 세포에서 FVIII 발현 카세트를 발현하는 맥락에서 100% FVIII 활성을 갖는 인간 혈장 시료와 비교하여, HuH-7 세포에서 FVIII 발현 카세트의 발현 후 상층액에서 검출되는 FVIII 활성이, 100% FVIII 활성을 갖는 상기 인간 혈장 시료에서 검출되는 명시된 %의 FVIII 활성임을 의미한다.
FVIII 샌드위치 ELISA 항원 검정
Asserachrom VIII:Ag 키트(Stago Diagnostica, ref 00280)는 효소-연결 면역흡착 검정(ELISA)에 의한 혈장 중 FVIII의 정량화를 위한 항원성 검정이다. 검정된 시료에서 FVIII은, 플라스틱 마이크로플레이트 웰의 벽을 예비-코팅시키는 마우스-단일클론 항-인간 VIII:Ag 항체에 의해 포획된다. 충분한 인큐베이션 및 비-특이적 결합을 감소시키기 위한 세척 후, 퍼옥시다제에 커플링된 마우스 항-인간 FVIII 항체는 포획된 FVIII의 잔여 유리(free) 항원 결정기에 결합한다. 그 후에, 결합된 퍼옥시다제는 TMB 기질에 의해 드러난다. TMB에 의해 유도되는 발색은 강산의 첨가에 의해 중단된다. 발색의 강도는, 450 nm에서 흡광도를 측정함으로써 결정되는, 검정된 시료 내 FVIII 농도에 정비례한다.
이러한 검정으로부터의 판독물은 "정상 %"로서 표현될 수 있으며, 이는 예를 들어, 마우스에서 FVIII 작제물을 발현하는 맥락에서 100% FVIII 활성을 갖는 인간 혈장 시료와 비교하여, 마우스 혈장 시료에서 검출되는 FVIII 분자(엄격하게는 에피토프)의 수가, 100% FVIII 활성을 갖는 상기 인간 혈장 시료에서 검출되는 명시된 %의 FVIII 분자/에피토프의 수임을 의미한다.
상기 기재된 활성 검정과 항원 검정 둘 다에서, FVIII(활성 수준 또는 항원 수준)은, WHO 국제 표준(NIBSC 코드 07/316)에 대해 보정된, 기지의 FVIII 활성 또는 항원(적절하다면)의 동결건조된 인간 혈장 시료를 포함하거나 제조업체에 의해 권고대로 사용하여 마우스, 또는 인간 세포 상층액, 시료에서 정량화된다.
실시예 2 - FVIII 치환 돌연변이 변이체의 상대 고유 활성도의
시험관 내
평가
인 실리코(in silico) 모델링을 사용하여, 비-표면-노출된 도메인간 표면 상에서 단일 아미노산 치환, 및 시스테인 치환의 쌍을 예측하였고, 이는 FVIII의 안정성을 증가시킬 것이다. 그러나, 안정성에 미치는 임의의 영향은 활성에 대한 유익한 효과와 본질적으로 동등하지 않고, 일부 경우 증가된 안정성은 유해 효과, 예를 들어 안정성을 증가시키지만 필요한 FVIII 도메인 재배열을 활성 형태로 가능하게 하지 않는 치환을 가질 것이다. 수많은 이러한 치환 변이체를 아래 기재된 바와 같이 시험관 내에서 시험하였다.
하나 이상의 이러한 치환을 포함하는 FVIII-SQ 변이체를 인코딩하는 코돈-최적화된 뉴클레오타이드 서열을 유전자-합성하고, 상업적으로 입수 가능한 발현 벡터 pcDNA5-FRT(Invitrogen) 내로 클로닝하였다. 플라스미드 DNA를 96 Deepwell 플레이트에 제조업체의 프로토콜에 따라 expi293 현탁 세포 내로 형질주입하고, 습윤화된 8% CO2 인큐베이터에서 37℃에서 400 rpm에서 5일 동안 인큐베이션하였다. 세포 배양물을 100 × g에서 4℃에서 5분 동안 원심분리하고, 상층액을 실시예 1에 기재된 바와 같이 발색 검정에서의 즉시 시험 및 항원 정량화를 위해 0.2 μl 필터를 통해 여과하였다.
블랭크 차감 후, 발색 검정으로부터의 FVIII 활성 판독물을 FVIII 항원 정량화(ELISA) 판독물로 나누어서, 고유 활성도(SA) 값을 수득하였다.
도 2a는, 임의의 치환 돌연변이가 결여된 FVIII-SQ('95') 대조군과 비교하여, 각각의 변이체에 대한 많은 대안적인 치환된 잔기를 포함한 몇몇 상이한 단일 아미노산 치환 변이체에 대한 SA의 배수-변화를 도시한다. 하기 표는 각각의 번호매겨진 작제물에 상응하는 치환의 정체성(identity)을 보여준다. 변이체 65(H693W)는 95와 비교하여 SA의 상승을 나타낸다.
다른 실험에서, 치환 M662W('26'이라고 함)는 '95'와 비교하여 SA의 두드러진 증가를 실증하였다. 위치 M662에 대해, 모든 대안적인 치환의 SA를 스크리닝하기로 결정되었다. 그 결과를 도 2b에 도시하고, 이는 또한 M662W를 H693W와 조합하는 이중 치환을 포함한다(도 2a로부터 65). 또한, 치환의 정체성에 대해 아래 표를 참조한다. 위치 M662에서 C 및 E로의 치환은 95와 비교하여 SA에서 어느 정도의 증가를 제공하는 것으로 보인다. SA의 가장 큰 증가는 M662W+H693W 조합에 대해 관찰되었다.
실시예 3 - 이황화 브릿지를 형성하는 것으로 예측되는 추가의 FVIII 치환 돌연변이 변이체의 상대 고유 활성도의
시험관 내
평가
실시예 2에서의 인 실리코(in silico) 예측 작업에 기초하여, 많은 시스테인 치환 쌍을 실시예 2에 기재된 방법을 사용하여 시험하였다.
결과 - 마찬가지로 FVIII-SQ('95')(SEQ ID NO: 3)와 비교하여 고유 활성도의 배수-변화로서 표현됨 - 를 도 3에 도시한다. 아래 표는 도 3에 도시된 작제물 번호에 상응하는 치환쌍을 나타낸다. 몇몇 C-C 치환 변이체는 대조군과 비교하여 고유 활성도의 몇배 증가를 보여준다.
실시예 4 - 특정 유망한 치환 변이체의 확인용
시험관 내
시험
도 4는, 실시예 2 및 3의 시험된 치환 변이체의 하위세트에 대해, FVIII-SQ('95') 대조군과 비교하여 SA에서의 배수-증가를 확인시켜 준다. 치환을 2개의 FVIII '백그라운드'에서 평가하였고, 제1 치환은 상기 실시예에서와 같이 FVIII-SQ였다:
·
FVIII-SQ-M662W('26')
·
FVIII-SQ-H693W('65')
·
FVIII-SQ-M662W-H693W('26-65')
·
FVIII-SQ-L687C-A1800C('12SS').
제2 FVIII 백그라운드는, 이것이 B 도메인을 포괄하고 이의 어느 한쪽 측면(side) 상에서 연장되는 더 광범위한 내부 결실을 함유한다는 점에서 FVIII-SQ와 상이하다. 결실된 영역은 아미노산 위치 732-1669에 상응하고, 변이체 단백질은 FVIII-(96-106)으로 지칭된다.
·
FVIII-(96-106)-M662W('26-96-106')
·
FVIII-(96-106)-H693W('65-96-106')
·
FVIII-(96-106)-M662W-H693W('26-65-96-106')
·
FVIII-(96-106)-L687C-A1800C('12SS-96-106')
도 4가 도시하는 바와 같이, 시험된 작제물의 각각의 상기 하위세트는 FVIII-SQ 대조군(95)과 비교하여 고유 활성도에서 대략 2배 이상의 증가를 보여주었다.
실시예 5 - 안정화 치환 돌연변이를 함유하는 내부적으로-결실된 FVIII 이식유전자 작제물의
생체 내
평가
이 연구에서, AAV8 벡터를 하기 작제물로부터 만들었다:
·
FRE72-SP5-FVIIICo19(26-96-106)-SpA(SEQ ID NO: 27)
·
FRE72-SP5- FVIIICo19-SQ-SpA(SEQ ID NO: 32)
상기 작제물은 FRE72 프로모터, 신호 펩타이드 5, 및 합성 polyA를 함유한다. 이들은, 하나는 FVIII-SQ를 인코딩하는 한편 다른 것은 "96-106" 내부 결실, 뿐만 아니라 치환 돌연변이 "26"(= M662W)을 갖는 더 짧은 변이체를 인코딩한다는 점에서 상이하다.
·
비교인자 FVIIIco-SQ
상기 작제물은 네이티브 FVIII 신호 펩타이드, SpA, 및 간-특이적 프로모터와 함께 코돈-최적화된 FVIII-SQ-인코딩 서열을 포함한다. 작제물은 SEQ ID NO: 34의 서열을 갖는다.
AAV8-비교인자 FVIIIco-SQ을 별개의 실험에서 AAV8-FRE72-SP5-FVIIICo19(26-96-106)-SpA 및 AAV8-FRE72-SP5-FVIIICo19-SQ-SpA와 각각 비교하였다.
6주령 내지 8주령 C7BL/6 인자 VIII-넉아웃(FVIII-KO) 마우스에게 2 × 1012 vg/kg의 각각의 상기 벡터 중 하나를 정맥내로 주사하였다. 이 연구를 위한 모든 AAV8 벡터를 동시에 qPCR 방법에 의해 적정하였다.
주사 후 6주째에, 100 μl 내지 200 μl의 혈액을, 시트레이트 상에서 비-헤파린처리된 청색 모세관을 이용한 안와 천공(retro-orbital puncture)에 의해 각각의 마우스로부터 수집하였다(1 : 10 희석). 혈장을 4000 rpm에서 20분 동안 원심분리에 의해 제조하였다.
주사된 동물 및 미접촉 동물로부터의 혈장을 FVIII 활성 및 인간 FVIII 항원 수준(실시예 1에 기재된 바와 같은 검정)에 대해 분석하고, 항원 수준에 대한 FVIII 활성의 비(즉, 고유 활성도)를 계산하였다(도 5).
본 발명의 번호매겨진 양태
1.
인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서, 여기서 FVIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도를 갖는, 인자 VIII 폴리펩타이드.
2.
인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서, 여기서 인자 VIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖는, 인자 VIII 폴리펩타이드.
3.
인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서, 여기서 인자 VIII 아미노산 서열은
a.
A1/A3 도메인 계면;
b.
A2/A3 도메인 계면; 또는
c.
A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인간 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i)
하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii)
하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
인자 VIII 폴리펩타이드는 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현되는, 인자 VIII 폴리펩타이드.
4.
인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서, 여기서 인자 VIII 아미노산 서열은
a.
SEQ ID NO: 1의 M662 또는 H693에 상응하는 아미노산의 치환; 또는
b.
시스테인 잔기로의 제1 아미노산 및 제2 아미노산을 포함하는 아미노산의 쌍의 치환
으로 이루어진 군으로부터 선택되는 하나 이상의 치환 돌연변이를 포함하고,
1.
제1 아미노산은 SEQ ID NO: 1의 M147, S149 또는 S289에 상응하고 제2 아미노산은 SEQ ID NO: 1의 E1969, E1970 또는 N1977에 상응하거나;
2.
제1 아미노산은 SEQ ID NO: 1의 T667, T669, N684, L687, I689, S695 또는 F697에 상응하고 제2 아미노산은 SEQ ID NO: 1의 S1791, G1799, A1800, R1803, E1844, S1949, G1981, V1982, 또는 Y1979에 상응하거나;
3.
제1 아미노산은 SEQ ID NO: 1의 A108, T118 또는 V137에 상응하고 제2 아미노산은 SEQ ID NO: 1의 N2172, Q2329 또는 Y2332에 상응하는, 인자 VIII 폴리펩타이드.
5.
양태 2 내지 4 중 어느 한 양태에 있어서, 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 높은 고유 활성도를 갖는, 인자 VIII 폴리펩타이드.
6.
양태 1 또는 5에 있어서, 인자 VIII 폴리펩타이드는 기준 인자 VIII 폴리펩타이드의 고유 활성도보다 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배, 적어도 5배, 또는 적어도 5.5배 더 높은 고유 활성도를 갖는, 인자 VIII 폴리펩타이드.
7.
양태 1 또는 3 내지 5 중 어느 한 양태에 있어서, 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 높은 안정성을 갖는, 인자 VIII 폴리펩타이드.
8.
양태 2 또는 7에 있어서, 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 긴 반감기를 갖고, 선택적으로 인자 VIII 폴리펩타이드는 활성화될 때의 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 긴 반감기를 갖는, 인자 VIII 폴리펩타이드.
9.
양태 8에 있어서, 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배의 더 긴 반감기를 갖고/갖거나 인자 VIII 폴리펩타이드는 활성화될 때의 기준 야생형 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배의 활성화될 때의 반감기를 갖는, 인자 VIII 폴리펩타이드.
10.
양태 8 또는 9에 있어서, 더 긴 반감기는 혈장에서의 더 긴 반감기인, 인자 VIII 폴리펩타이드.
11.
양태 1, 2 또는 4 내지 6 중 어느 한 양태에 있어서, 인자 VIII 폴리펩타이드는 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현되는, 인자 VIII 폴리펩타이드.
12.
양태 11에 있어서, 발현되는 인자 VIII 폴리펩타이드의 수준은 숙주 세포에 의해 분비되는 FVIII 폴리펩타이드의 수준인, 인자 VIII 폴리펩타이드.
13.
양태 11 또는 12에 있어서, 숙주 세포는 인간 간 세포인, 인자 VIII 폴리펩타이드.
14.
양태 13에 있어서, 인간 간 세포는 Huh7 세포인, 인자 VIII 폴리펩타이드.
15.
양태 11에 있어서, 발현되는 인자 VIII 폴리펩타이드의 수준은 생체 내 발현인, 인자 VIII 폴리펩타이드.
16.
양태 1 내지 15 중 어느 한 양태에 있어서, 인자 VIII 폴리펩타이드는 숙주 세포에서, 인자 VIII 폴리펩타이드의 인자 VIII 아미노산 서열을 포함하지만 하나 이상의 치환 돌연변이를 포함하지 않는 기준 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도 및/또는 더 높은 안정성을 갖고/갖거나 더 높은 수준으로 발현되는, 인자 VIII 폴리펩타이드.
17.
양태 16에 있어서, 기준 인자 VIII 폴리펩타이드는 SEQ ID NO: 1, 3 또는 5의 인자 VIII 폴리펩타이드인, 인자 VIII 폴리펩타이드.
18.
양태 1 내지 17 중 어느 한 양태에 있어서, 도메인간 계면에서의 하나 이상의 치환 돌연변이는 활성화될 때 인자 VIII 폴리펩타이드의 각각의 도메인의 상호작용을 안정화시키는, 인자 VIII 폴리펩타이드.
19.
양태 18에 있어서, 하나 이상의 산 치환 돌연변이 중 적어도 하나는 각각의 도메인의 아미노산 측쇄 사이에서 파이-적층 상호작용을 증가시키는, 인자 VIII 폴리펩타이드.
20.
양태 18 또는 19에 있어서, 하나 이상의 치환 돌연변이 중 적어도 하나는 각각의 도메인의 아미노산 측쇄 사이에서 소수성 패킹을 증가시키는, 인자 VIII 폴리펩타이드.
21.
양태 18 내지 20 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이 중 적어도 하나는 각각의 도메인의 아미노산 측쇄 사이에서 입체 충돌(steric clashing) 및/또는 선호하지 않는 정전기 상호작용을 감소시키는, 인자 VIII 폴리펩타이드.
22.
양태 1 내지 3 또는 5 내지 21 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 도메인간 계면에 하나 이상의 표면-접근 불능 아미노산의 치환을 포함하는, 인자 VIII 폴리펩타이드.
23.
양태 1 내지 3 또는 5 내지 22 중 어느 한 양태에 있어서, 더 소수성 아미노산으로 치환되는 아미노산은 메티오닌 또는 히스티딘인, 인자 VIII 폴리펩타이드.
24.
양태 1 내지 3 또는 5 내지 23 중 어느 한 양태에 있어서, 더 소수성 아미노산으로 치환되는 아미노산은 SEQ ID NO: 1의 위치 662의 아미노산에 상응하는 메티오닌 또는 SEQ ID NO: 1의 위치 693의 아미노산에 상응하는 히스티딘인, 인자 VIII 폴리펩타이드.
25.
양태 1 내지 24 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 M662C 치환을 포함하지 않는, 인자 VIII 폴리펩타이드.
26.
양태 1 내지 25 중 어느 한 양태에 있어서,
a.
하나 이상의 치환 돌연변이는 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로의 메티오닌의 치환을 포함하고/하거나;
b.
하나 이상의 치환 돌연변이는 글루타메이트, 시스테인, 발린, 메티오닌, 티로신, 이소류신, 류신, 페닐알라닌 또는 트립토판으로의 히스티딘의 치환을 포함하는, 인자 VIII 폴리펩타이드.
27.
양태 1 내지 26 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 방향족 아미노산으로의 아미노산의 치환을 포함하는, 인자 VIII 폴리펩타이드.
28.
양태 1 내지 27 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 M662W 치환을 포함하는, 인자 VIII 폴리펩타이드.
29.
양태 1 내지 28 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 H693W 치환을 포함하는, 인자 VIII 폴리펩타이드.
30.
양태 1 내지 29 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 M662W 및 H693W 치환을 포함하는, 인자 VIII 폴리펩타이드.
31.
양태 1 내지 30 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 시스테인 잔기는 각각의 도메인 사이에 이황화 결합을 형성하는, 인자 VIII 폴리펩타이드.
32.
양태 1 내지 31 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 아미노산의 쌍은 A1 및 A3 도메인에 존재하는, 인자 VIII 폴리펩타이드.
33.
양태 1 내지 32 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하며, 아미노산의 쌍은 제1 아미노산 및 제2 아미노산을 포함하고, 제1 아미노산은 SEQ ID NO: 1의 M147, S149 또는 S289에 상응하며 제2 아미노산은 SEQ ID NO: 1의 E1969, E1970 또는 N1977에 상응하는, 인자 VIII 폴리펩타이드.
34.
양태 1 내지 33 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 하나 이상의 치환 돌연변이는 (i) S289C와 N1977C, (ii) M147C와 E1970C, 및 (iii) S149C와 E1969C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하는, 인자 VIII 폴리펩타이드.
35.
양태 1 내지 31 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 아미노산의 쌍은 A2 및 A3 도메인에 존재하는, 인자 VIII 폴리펩타이드.
36.
양태 1 내지 31 또는 35 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하며, 아미노산의 쌍은 제1 아미노산 및 제2 아미노산을 포함하고, 제1 아미노산은 SEQ ID NO: 1의 T667, T669, N684, L687, I689, S695 또는 F697에 상응하며 제2 아미노산은 SEQ ID NO: 1의 S1791, G1799, A1800, R1803, E1844, S1949, G1981, V1982, 또는 Y1979에 상응하는, 인자 VIII 폴리펩타이드.
37.
양태 1 내지 31, 35 또는 36 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 하나 이상의 치환 돌연변이는 (i) T669C와 V1982C, (ii) L687C와 A1800C, (iii) I689C와 G1799C, (iv) F697C와 S1949C, (v) T667C와 G1981C, (vi) T669C와 Y1979C, (vii) N684C와 S1791C, (viii) L687C와 R1803C, 및 (ix) S695C와 E1844C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하는, 인자 VIII 폴리펩타이드.
38.
양태 1 내지 31 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 아미노산의 쌍은 A1 및 C2 도메인에 존재하는, 인자 VIII 폴리펩타이드.
39.
양태 1 내지 31 또는 38 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하며, 아미노산의 쌍은 제1 아미노산 및 제2 아미노산을 포함하고, 제1 아미노산은 SEQ ID NO: 1의 A108, T118 또는 V137에 상응하며 제2 아미노산은 SEQ ID NO: 1의 N2172, Q2329 또는 Y2332에 상응하는, 인자 VIII 폴리펩타이드.
40.
양태 1 내지 31, 38 또는 39 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고, 하나 이상의 치환 돌연변이는 (i) A108C와 Q2329C, (ii) T118C와 N2172C, 및 (iii) V137C와 Y2332C로 이루어진 목록으로부터 선택되는 치환 돌연변이의 쌍을 포함하는, 인자 VIII 폴리펩타이드.
41.
양태 1 내지 40 중 어느 한 양태에 있어서, 하나 이상의 치환 돌연변이는 인자 VIII 폴리펩타이드의 활성화를 저해하지 않는, 인자 VIII 폴리펩타이드.
42.
양태 1 내지 41 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열은 SEQ ID NO: 1, 3 또는 5로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열, 또는 SEQ ID NO: 1, 3 또는 5의 적어도 1349개 아미노산을 포함하는 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함하는, 인자 VIII 폴리펩타이드.
43.
양태 1 내지 42 중 어느 한 양태에 있어서, 인자 VIII 폴리펩타이드는 베타 도메인 결실(BDD) 인자 VIII 폴리펩타이드인, 인자 VIII 폴리펩타이드.
44.
양태 1 내지 43 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열은 SEQ ID NO: 1의 위치 1 내지 722 및 1670 내지 2332에 상응하는 아미노산을 포함하는, 인자 VIII 폴리펩타이드.
45.
양태 44에 있어서, 인자 VIII 아미노산 서열은 SEQ ID NO: 1의 위치 1 내지 731 및 1670 내지 2332에 상응하는 아미노산을 포함하는, 인자 VIII 폴리펩타이드.
46.
양태 1 내지 43 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열은 SEQ ID NO: 1로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한, 인자 VIII 폴리펩타이드.
47.
양태 1 내지 46 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열은 SEQ ID NO: 28로 표시된 아미노산 서열, 또는 SEQ ID NO: 28로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함하는, 인자 VIII 폴리펩타이드.
48.
인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드로서, 인자 VIII 뉴클레오타이드 서열은 양태 1 내지 47 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드를 인코딩하는, 폴리뉴클레오타이드.
49.
양태 48에 있어서, 인자 VIII 뉴클레오타이드 서열은 코돈-최적화되는, 폴리뉴클레오타이드.
50.
양태 48 또는 49에 있어서, 인자 VIII 뉴클레오타이드 서열은 인간 간 세포에서의 발현을 위해 코돈-최적화되는, 폴리뉴클레오타이드.
51.
양태 50에 있어서, 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 인자 VIII 폴리펩타이드는 인간 간 세포에서 기준 야생형 인자 VIII 뉴클레오타이드 서열과 비교하여 더 높은 수준으로 발현되는, 폴리뉴클레오타이드.
52.
양태 50 또는 51에 있어서, 인자 VIII 뉴클레오타이드 서열에 의해 인코딩되는 인자 VIII 폴리펩타이드는 인간 간 세포에서 기준 야생형 인자 VIII 뉴클레오타이드 서열과 비교하여 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.8배, 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 30배, 적어도 40배, 또는 적어도 50배 더 높게 발현되는, 폴리뉴클레오타이드.
53.
양태 51 또는 52에 있어서, 기준 야생형 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 2의 인자 VIII 뉴클레오타이드 서열인, 폴리뉴클레오타이드.
54.
양태 49 내지 53 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열, 또는 SEQ ID NO: 31의 적어도 4047개 뉴클레오타이드를 포함하는 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드.
55.
양태 49 내지 54 중 어느 한 양태에 있어서, 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 29로 표시된 뉴클레오타이드 서열 또는 SEQ ID NO: 29로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드.
56.
양태 49 내지 55 중 어느 한 양태에 따른 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함하는 재조합 AAV 작제물.
57.
양태 56에 있어서, 4900개 미만의 뉴클레오타이드 길이인, 재조합 AAV 작제물.
58.
양태 57에 있어서, 4700 내지 4900개, 4700 내지 4850개, 4700 내지 4800개, 4700 내지 4750개 또는 대략 4713개 뉴클레오타이드 길이인, 재조합 AAV 작제물.
59.
양태 56 내지 58 중 어느 한 양태에 있어서, 재조합 AAV 작제물은 단일-가닥인, 재조합 AAV 작제물.
60.
양태 56 내지 59 중 어느 한 양태에 있어서, 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드는 전사 조절 요소 및/또는 polyA 서열에 작동 가능하게 연결되는, 재조합 AAV 작제물.
61.
양태 60에 있어서, 전사 조절 요소는 SEQ ID NO: 13 또는 14로 표시된 서열을 갖는, 재조합 AAV 작제물.
62.
양태 60 또는 61에 있어서, polyA 서열은 SEQ ID NO: 22로 표시된 서열을 갖는, 재조합 AAV 작제물.
63.
양태 56 내지 62 중 어느 한 양태에 있어서, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 재조합 AAV 작제물.
64.
양태 63에 있어서, 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드인, 재조합 AAV 작제물.
65.
양태 64에 있어서, 신호 펩타이드는 SEQ ID NO: 15를 포함하거나, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 16 또는 SEQ ID NO: 17을 포함하는, 재조합 AAV 작제물.
66.
양태 63에 있어서, 신호 펩타이드는 야생형 인자 VIII 신호 펩타이드가 아닌, 재조합 AAV 작제물.
67.
양태 66에 있어서, 신호 펩타이드는 SEQ ID NO: 18 또는 20을 포함하거나, 신호 펩타이드를 인코딩하는 뉴클레오타이드 서열은 SEQ ID NO: 19 또는 21을 포함하는, 재조합 AAV 작제물.
68.
양태 56 내지 67 중 어느 한 양태에 있어서, 1 또는 2개의 ITR(들)을 추가로 포함하는, 재조합 AAV 작제물.
69.
양태 68에 있어서, 이러한 또는 각각의 ITR의 뉴클레오타이드 서열은 157개 미만, 154개 미만, 또는 대략 145개 뉴클레오타이드 길이인, 재조합 AAV 작제물.
70.
양태 68 또는 69에 있어서, 이러한 또는 각각의 ITR은 야생형 ITR이고/이거나 이러한 또는 각각의 ITR은 AAV2 ITR인, 재조합 AAV 작제물.
71.
양태 68 내지 70 중 어느 한 양태에 있어서, 이러한 또는 각각의 ITR의 뉴클레오타이드 서열은 SEQ ID NO: 23 또는 24의 뉴클레오타이드 서열을 포함하는, 재조합 AAV 작제물.
72.
양태 56 내지 71 중 어느 한 양태에 있어서, AAV 작제물은 AAV 게놈인, 재조합 AAV 작제물.
73.
양태 56 내지 72 중 어느 한 양태에 있어서, AAV 작제물은 SEQ ID NO: 27로 표시된 서열을 포함하거나 이로 구성되는, 재조합 AAV 작제물.
74.
양태 56 내지 73 중 어느 한 양태에 따른 재조합 AAV 작제물을 포함하는 AAV 바이러스 입자.
75.
양태 74에 있어서, 바이러스 입자는 캡시드를 포함하는, AAV 바이러스 입자.
76.
양태 75에 있어서, 캡시드는
(i) SEQ ID NO: 25와 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드;
(ii) SEQ ID NO: 26과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8%, 또는 100% 동일한 서열을 포함하는 캡시드;
(iii) 간-회귀성 캡시드; 및
(iv) AAV5 캡시드
로 이루어진 군으로부터 선택되는, AAV 바이러스 입자.
77.
양태 75에 있어서, 캡시드는
(i) SEQ ID NO: 47과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드;
(ii) SEQ ID NO: 48과 적어도 96%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.8% 또는 100% 동일한 서열을 포함하는 캡시드; 및
(iii) AAV6 캡시드
로 이루어진 군으로부터 선택되는, AAV 바이러스 캡시드.
77.
양태 1 내지 76 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, 또는 AAV 바이러스 입자, 및 약학적으로 허용 가능한 부형제를 포함하는 조성물.
78.
치료 방법에 사용하기 위한, 양태 1 내지 77 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물.
79.
양태 78에 있어서, 치료 방법은 유효량의 양태 1 내지 77 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자를 환자에게 투여하는 단계를 포함하는, 사용하기 위한 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물.
80.
유효량의 양태 1 내지 77 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자 또는 조성물을 환자에게 투여하는 단계를 포함하는 치료 방법.
81.
치료 방법에 사용하기 위한 약제의 제조에 있어서, 양태 1 내지 77 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자 또는 조성물의 용도.
82.
양태 80에 있어서, 치료 방법은 유효량의 양태 1 내지 77 중 어느 한 양태에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자 또는 조성물을 환자에게 투여하는 단계를 포함하는, 용도.
83.
양태 78 내지 82 중 어느 한 양태에 있어서, 치료 방법은 혈우병을 치료하는 방법인, 사용하기 위한 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 AAV 바이러스 입자 또는 조성물, 방법 또는 용도.
84.
양태 78 내지 83 중 어느 한 양태에 있어서, 치료 방법은 A형 혈우병을 치료하는 방법인, 사용하기 위한 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 AAV 바이러스 입자 또는 조성물, 방법 또는 용도.
SEQUENCE LISTING
<110> Freeline Therapeutics Limited
<120> Factor VIII polypeptide
<130> N416596WO
<150> 1915955.7
<151> 2019-11-01
<150> 1915956.5
<151> 2019-11-01
<150> 1917925.8
<151> 2019-12-06
<150> 2006250.1
<151> 2020-04-28
<150> 1915953.2
<151> 2019-11-01
<150> 1917926.6
<151> 2019-12-06
<150> 1917927.4
<151> 2019-12-06
<160> 48
<170> PatentIn version 3.5
<210> 1
<211> 2332
<212> PRT
<213> Homo sapiens
<400> 1
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 2
<211> 6996
<212> DNA
<213> Homo sapiens
<400> 2
gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60
ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120
aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180
atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240
tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300
gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360
agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420
ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480
catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540
gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600
gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660
gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720
tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780
ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840
catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900
atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960
gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020
gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080
gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140
acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200
gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260
aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320
gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380
ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440
actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500
tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560
ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620
agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680
caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740
gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800
gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860
gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920
agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980
aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040
tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100
ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220
agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280
attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340
aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400
catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460
tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520
ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580
gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640
acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700
acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760
ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820
gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880
ggaaaaaatg tatcgtcaac agagagtggt aggttattta aagggaaaag agctcatgga 2940
cctgctttgt tgactaaaga taatgcctta ttcaaagtta gcatctcttt gttaaagaca 3000
aacaaaactt ccaataattc agcaactaat agaaagactc acattgatgg cccatcatta 3060
ttaattgaga atagtccatc agtctggcaa aatatattag aaagtgacac tgagtttaaa 3120
aaagtgacac ctttgattca tgacagaatg cttatggaca aaaatgctac agctttgagg 3180
ctaaatcata tgtcaaataa aactacttca tcaaaaaaca tggaaatggt ccaacagaaa 3240
aaagagggcc ccattccacc agatgcacaa aatccagata tgtcgttctt taagatgcta 3300
ttcttgccag aatcagcaag gtggatacaa aggactcatg gaaagaactc tctgaactct 3360
gggcaaggcc ccagtccaaa gcaattagta tccttaggac cagaaaaatc tgtggaaggt 3420
cagaatttct tgtctgagaa aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac 3480
gtaggactca aagagatggt ttttccaagc agcagaaacc tatttcttac taacttggat 3540
aatttacatg aaaataatac acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag 3600
aaggaaacat taatccaaga gaatgtagtt ttgcctcaga tacatacagt gactggcact 3660
aagaatttca tgaagaacct tttcttactg agcactaggc aaaatgtaga aggttcatat 3720
gacggggcat atgctccagt acttcaagat tttaggtcat taaatgattc aacaaataga 3780
acaaagaaac acacagctca tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg 3840
ggaaatcaaa ccaagcaaat tgtagagaaa tatgcatgca ccacaaggat atctcctaat 3900
acaagccagc agaattttgt cacgcaacgt agtaagagag ctttgaaaca attcagactc 3960
ccactagaag aaacagaact tgaaaaaagg ataattgtgg atgacacctc aacccagtgg 4020
tccaaaaaca tgaaacattt gaccccgagc accctcacac agatagacta caatgagaag 4080
gagaaagggg ccattactca gtctccctta tcagattgcc ttacgaggag tcatagcatc 4140
cctcaagcaa atagatctcc attacccatt gcaaaggtat catcatttcc atctattaga 4200
cctatatatc tgaccagggt cctattccaa gacaactctt ctcatcttcc agcagcatct 4260
tatagaaaga aagattctgg ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa 4320
aataaccttt ctttagccat tctaaccttg gagatgactg gtgatcaaag agaggttggc 4380
tccctgggga caagtgccac aaattcagtc acatacaaga aagttgagaa cactgttctc 4440
ccgaaaccag acttgcccaa aacatctggc aaagttgaat tgcttccaaa agttcacatt 4500
tatcagaagg acctattccc tacggaaact agcaatgggt ctcctggcca tctggatctc 4560
gtggaaggga gccttcttca gggaacagag ggagcgatta agtggaatga agcaaacaga 4620
cctggaaaag ttccctttct gagagtagca acagaaagct ctgcaaagac tccctccaag 4680
ctattggatc ctcttgcttg ggataaccac tatggtactc agataccaaa agaagagtgg 4740
aaatcccaag agaagtcacc agaaaaaaca gcttttaaga aaaaggatac cattttgtcc 4800
ctgaacgctt gtgaaagcaa tcatgcaata gcagcaataa atgagggaca aaataagccc 4860
gaaatagaag tcacctgggc aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca 4920
ccagtcttga aacgccatca acgggaaata actcgtacta ctcttcagtc agatcaagag 4980
gaaattgact atgatgatac catatcagtt gaaatgaaga aggaagattt tgacatttat 5040
gatgaggatg aaaatcagag cccccgcagc tttcaaaaga aaacacgaca ctattttatt 5100
gctgcagtgg agaggctctg ggattatggg atgagtagct ccccacatgt tctaagaaac 5160
agggctcaga gtggcagtgt ccctcagttc aagaaagttg ttttccagga atttactgat 5220
ggctccttta ctcagccctt ataccgtgga gaactaaatg aacatttggg actcctgggg 5280
ccatatataa gagcagaagt tgaagataat atcatggtaa ctttcagaaa tcaggcctct 5340
cgtccctatt ccttctattc tagccttatt tcttatgagg aagatcagag gcaaggagca 5400
gaacctagaa aaaactttgt caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa 5460
catcatatgg cacccactaa agatgagttt gactgcaaag cctgggctta tttctctgat 5520
gttgacctgg aaaaagatgt gcactcaggc ctgattggac cccttctggt ctgccacact 5580
aacacactga accctgctca tgggagacaa gtgacagtac aggaatttgc tctgtttttc 5640
accatctttg atgagaccaa aagctggtac ttcactgaaa atatggaaag aaactgcagg 5700
gctccctgca atatccagat ggaagatccc acttttaaag agaattatcg cttccatgca 5760
atcaatggct acataatgga tacactacct ggcttagtaa tggctcagga tcaaaggatt 5820
cgatggtatc tgctcagcat gggcagcaat gaaaacatcc attctattca tttcagtgga 5880
catgtgttca ctgtacgaaa aaaagaggag tataaaatgg cactgtacaa tctctatcca 5940
ggtgtttttg agacagtgga aatgttacca tccaaagctg gaatttggcg ggtggaatgc 6000
cttattggcg agcatctaca tgctgggatg agcacacttt ttctggtgta cagcaataag 6060
tgtcagactc ccctgggaat ggcttctgga cacattagag attttcagat tacagcttca 6120
ggacaatatg gacagtgggc cccaaagctg gccagacttc attattccgg atcaatcaat 6180
gcctggagca ccaaggagcc cttttcttgg atcaaggtgg atctgttggc accaatgatt 6240
attcacggca tcaagaccca gggtgcccgt cagaagttct ccagcctcta catctctcag 6300
tttatcatca tgtatagtct tgatgggaag aagtggcaga cttatcgagg aaattccact 6360
ggaaccttaa tggtcttctt tggcaatgtg gattcatctg ggataaaaca caatattttt 6420
aaccctccaa ttattgctcg atacatccgt ttgcacccaa ctcattatag cattcgcagc 6480
actcttcgca tggagttgat gggctgtgat ttaaatagtt gcagcatgcc attgggaatg 6540
gagagtaaag caatatcaga tgcacagatt actgcttcat cctactttac caatatgttt 6600
gccacctggt ctccttcaaa agctcgactt cacctccaag ggaggagtaa tgcctggaga 6660
cctcaggtga ataatccaaa agagtggctg caagtggact tccagaagac aatgaaagtc 6720
acaggagtaa ctactcaggg agtaaaatct ctgcttacca gcatgtatgt gaaggagttc 6780
ctcatctcca gcagtcaaga tggccatcag tggactctct tttttcagaa tggcaaagta 6840
aaggtttttc agggaaatca agactccttc acacctgtgg tgaactctct agacccaccg 6900
ttactgactc gctaccttcg aattcacccc cagagttggg tgcaccagat tgccctgagg 6960
atggaggttc tgggctgcga ggcacaggac ctctac 6996
<210> 3
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII SQ amino acid sequence
<400> 3
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 4
<211> 4314
<212> DNA
<213> Artificial sequence
<220>
<223> Codop19 nucleotide sequence encoding FVIII SQ nucleotide sequence
<400> 4
gctactagaa gatattatct tggggcagtg gagctgagct gggactacat gcagtctgac 60
ctgggagaac tgcctgtgga tgccagattt ccccctcgag tgcccaagag cttccccttt 120
aacacctcag tggtgtacaa gaagaccctg tttgtggagt ttacagacca tctcttcaac 180
attgctaagc ccagacctcc ctggatgggc ctgctgggcc ctaccatcca agctgaagtg 240
tatgacactg ttgtgatcac actcaagaac atggcctccc atcctgtgtc cctgcatgca 300
gtgggagtct cctactggaa ggcctcagaa ggagcagagt atgatgacca gaccagccag 360
agagagaagg aggatgacaa ggtgtttcct ggagggagcc acacctatgt gtggcaggtg 420
ctgaaggaga atggacctat ggccagtgac cctctgtgtc ttacctattc ctacctgtca 480
catgtggatc tggtgaagga cctgaacagt ggcctgattg gggctctgct ggtttgcaga 540
gaaggcagct tggccaagga gaagacccaa accctgcaca agttcatcct gctgtttgct 600
gtgtttgatg aggggaaatc atggcactca gagaccaaga acagcctcat gcaggatagg 660
gatgctgcca gtgccagggc ttggcccaag atgcacactg tgaatggcta tgtgaataga 720
agcctgcctg ggctgatagg ctgtcacaga aaatctgtgt actggcatgt gattggcatg 780
ggcaccacac ctgaggtgca ctccattttc ctggagggcc acaccttcct tgtgagaaac 840
cacagacaag cttccctgga gatcagccca atcacctttc tgactgctca aaccctcctg 900
atggatctgg gccagttcct gctgttctgt catatctcct cacaccagca tgatggaatg 960
gaagcttatg tcaaggtgga ctcctgccca gaggaaccac agctcagaat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg acagactctg aaatggatgt ggtcagattt 1080
gatgatgaca acagcccttc attcatccaa atcagatctg tggccaagaa gcatcccaag 1140
acctgggtgc actacatagc tgctgaggag gaggactggg actatgcccc tctggtcctg 1200
gcccctgatg acagaagcta taaaagccag tacctgaata atggccccca gagaattggc 1260
agaaagtaca agaaagtcag attcatggct tacactgatg agaccttcaa aaccagggaa 1320
gccatccagc atgagtcagg catcctgggc cccctgctgt atggggaggt tggagatacc 1380
ctgctgatta tcttcaaaaa ccaggcaagc aggccctaca atatctaccc tcatggcatc 1440
actgatgtca ggccactgta ttccagaaga ctgcctaagg gggtgaagca cctgaaggac 1500
ttcccaatcc tgccagggga gattttcaaa tacaagtgga cagtgactgt ggaggatgga 1560
ccaaccaagt cagatcctag atgtctgacc agatactact ccagctttgt gaacatggag 1620
agagacctgg cctctggcct gattggccct ctgctgatct gctataaaga gtcagtggac 1680
cagagaggca accagatcat gagtgacaaa agaaatgtga tcttgttctc agtgtttgat 1740
gagaatagat cttggtacct cacagaaaac atccagaggt tcctgcccaa tccagctggg 1800
gtgcagctgg aagatccaga attccaggcc agcaacatca tgcatagcat caatggttat 1860
gtctttgaca gcctgcagct gtcagtgtgt ctgcatgaag ttgcttactg gtatattctg 1920
tccattggag cccagacaga cttcctgtct gtcttcttct ctggctacac ctttaaacac 1980
aagatggtgt atgaggacac cctgaccctg ttccctttct ctggggaaac agtgttcatg 2040
tccatggaaa accctggact gtggatcctg ggctgccata acagtgactt cagaaacaga 2100
ggcatgacag ccctgctcaa ggtgtccagc tgtgataaga acacaggaga ctactatgag 2160
gatagctatg aggacatcag tgcttacctg ctgagcaaga ataatgccat tgaacccagg 2220
tcattttccc aaaatccccc tgtgctgaaa aggcaccaga gggagatcac gcgtaccacc 2280
ctgcagagtg accaggagga aattgattat gatgacacca tctctgtgga aatgaaaaag 2340
gaggattttg acatctatga tgaggatgag aaccagagcc ctagaagctt ccagaaaaag 2400
actagacact acttcattgc tgcagtggag agactctggg attatggcat gagctccagc 2460
ccccatgtgc tgagaaatag agctcagagt ggcagtgtgc cacagttcaa gaaggtggtg 2520
tttcaggagt tcactgatgg ctccttcaca caaccacttt acagaggaga actgaatgag 2580
cacctgggcc tcctgggccc ctacatcagg gctgaagtgg aggataacat tatggtcaca 2640
tttaggaatc aggcttccag accctactcc ttttattcct cactcatttc ctatgaggag 2700
gaccagaggc agggagctga gcccagaaaa aattttgtga aacccaatga aaccaagacc 2760
tacttctgga aggtgcagca ccatatggcc cctaccaagg atgaatttga ctgcaaggct 2820
tgggcttact tttctgatgt ggaccttgag aaagatgtgc attcaggcct cattgggcca 2880
ctgctggtgt gccacaccaa tacactgaac cctgctcatg ggagacaggt cacagtgcag 2940
gagtttgcac tcttctttac catctttgat gagaccaagt cctggtattt cactgagaac 3000
atggagagga actgcagggc cccttgtaac atccagatgg aggatcccac cttcaaggaa 3060
aactacagat tccatgccat caatggctac atcatggaca ccctgccagg cctggtgatg 3120
gcccaggacc agaggatcag gtggtacctc ctgtctatgg gcagcaatga aaatatccac 3180
agcattcact tctctggaca tgtgtttact gtgaggaaga aggaggaata caagatggct 3240
ctgtacaacc tctaccctgg ggtgtttgaa acagtggaga tgctgccctc caaggctggc 3300
atctggagag tggaatgtct gattggggag catctgcatg ctggcatgag cacactgttc 3360
ctggtgtatt ccaacaagtg ccagacccca ctgggcatgg cctcaggaca tatcagggac 3420
ttccagatca ctgctagtgg acaatatgga cagtgggcac ccaagctggc cagactgcac 3480
tactcaggct ccatcaatgc ctggagtacc aaggagccct tcagctggat caaggtggac 3540
ctgctggccc ccatgattat acatggcatc aagacccagg gagctagaca gaagttcagc 3600
tccctgtaca tctcccaatt catcatcatg tactctctgg atggcaagaa atggcagacc 3660
tacagaggca atagcactgg caccctgatg gtgttttttg gaaatgttga ctcttctggc 3720
atcaagcaca acatcttcaa cccccccatc attgccagat atatcaggct ccaccccacc 3780
cactactcca taaggagcac cctgagaatg gagctgatgg gctgtgacct gaattcctgc 3840
tccatgcccc tgggcatgga atccaaggca atctctgatg cacagatcac agcctcctcc 3900
tacttcacca acatgtttgc aacctggagc ccctccaagg ccagactgca cctgcagggc 3960
aggtccaatg cttggagacc acaagtgaac aacccaaagg agtggctgca ggtggacttc 4020
cagaagacca tgaaagtgac tggagtgacc acccagggag tgaaatccct gctcactagc 4080
atgtatgtga aggaattcct gatcagtagc tctcaagatg gccaccagtg gaccctgttc 4140
ttccagaatg gcaaggtgaa ggtgtttcag ggcaaccagg attccttcac ccctgtggtg 4200
aatagcctgg atcccccact gctgaccaga tacctgagaa tccaccccca gtcctgggtt 4260
caccagattg ccctgagaat ggaggtgctg ggctgtgagg cccaggacct gtac 4314
<210> 5
<211> 1424
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII RE amino acid sequence
<400> 5
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu
740 745 750
Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp
755 760 765
Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln
770 775 780
Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp
785 790 795 800
Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
805 810 815
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp
820 825 830
Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu
835 840 845
Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met
850 855 860
Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
865 870 875 880
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys
885 890 895
Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln
900 905 910
His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala
915 920 925
Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile
930 935 940
Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
945 950 955 960
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp
965 970 975
Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg
980 985 990
Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr
995 1000 1005
Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly
1010 1015 1020
Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
1025 1030 1035
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1040 1045 1050
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1055 1060 1065
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1070 1075 1080
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1085 1090 1095
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1100 1105 1110
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1115 1120 1125
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1130 1135 1140
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1145 1150 1155
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1160 1165 1170
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1175 1180 1185
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1190 1195 1200
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1205 1210 1215
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1220 1225 1230
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1235 1240 1245
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1250 1255 1260
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1265 1270 1275
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1280 1285 1290
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1295 1300 1305
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1310 1315 1320
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1325 1330 1335
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1340 1345 1350
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1355 1360 1365
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1370 1375 1380
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1385 1390 1395
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1400 1405 1410
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1415 1420
<210> 6
<211> 4182
<212> DNA
<213> Artificial sequence
<220>
<223> Codop19 nucleotide sequence encoding FVIII polypeptide 96-106
<400> 6
gctactagaa gatattatct tggggcagtg gagctgagct gggactacat gcagtctgac 60
ctgggagaac tgcctgtgga tgccagattt ccccctcgag tgcccaagag cttccccttt 120
aacacctcag tggtgtacaa gaagaccctg tttgtggagt ttacagacca tctcttcaac 180
attgctaagc ccagacctcc ctggatgggc ctgctgggcc ctaccatcca agctgaagtg 240
tatgacactg ttgtgatcac actcaagaac atggcctccc atcctgtgtc cctgcatgca 300
gtgggagtct cctactggaa ggcctcagaa ggagcagagt atgatgacca gaccagccag 360
agagagaagg aggatgacaa ggtgtttcct ggagggagcc acacctatgt gtggcaggtg 420
ctgaaggaga atggacctat ggccagtgac cctctgtgtc ttacctattc ctacctgtca 480
catgtggatc tggtgaagga cctgaacagt ggcctgattg gggctctgct ggtttgcaga 540
gaaggcagct tggccaagga gaagacccaa accctgcaca agttcatcct gctgtttgct 600
gtgtttgatg aggggaaatc atggcactca gagaccaaga acagcctcat gcaggatagg 660
gatgctgcca gtgccagggc ttggcccaag atgcacactg tgaatggcta tgtgaataga 720
agcctgcctg ggctgatagg ctgtcacaga aaatctgtgt actggcatgt gattggcatg 780
ggcaccacac ctgaggtgca ctccattttc ctggagggcc acaccttcct tgtgagaaac 840
cacagacaag cttccctgga gatcagccca atcacctttc tgactgctca aaccctcctg 900
atggatctgg gccagttcct gctgttctgt catatctcct cacaccagca tgatggaatg 960
gaagcttatg tcaaggtgga ctcctgccca gaggaaccac agctcagaat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg acagactctg aaatggatgt ggtcagattt 1080
gatgatgaca acagcccttc attcatccaa atcagatctg tggccaagaa gcatcccaag 1140
acctgggtgc actacatagc tgctgaggag gaggactggg actatgcccc tctggtcctg 1200
gcccctgatg acagaagcta taaaagccag tacctgaata atggccccca gagaattggc 1260
agaaagtaca agaaagtcag attcatggct tacactgatg agaccttcaa aaccagggaa 1320
gccatccagc atgagtcagg catcctgggc cccctgctgt atggggaggt tggagatacc 1380
ctgctgatta tcttcaaaaa ccaggcaagc aggccctaca atatctaccc tcatggcatc 1440
actgatgtca ggccactgta ttccagaaga ctgcctaagg gggtgaagca cctgaaggac 1500
ttcccaatcc tgccagggga gattttcaaa tacaagtgga cagtgactgt ggaggatgga 1560
ccaaccaagt cagatcctag atgtctgacc agatactact ccagctttgt gaacatggag 1620
agagacctgg cctctggcct gattggccct ctgctgatct gctataaaga gtcagtggac 1680
cagagaggca accagatcat gagtgacaaa agaaatgtga tcttgttctc agtgtttgat 1740
gagaatagat cttggtacct cacagaaaac atccagaggt tcctgcccaa tccagctggg 1800
gtgcagctgg aagatccaga attccaggcc agcaacatca tgcatagcat caatggttat 1860
gtctttgaca gcctgcagct gtcagtgtgt ctgcatgaag ttgcttactg gtatattctg 1920
tccattggag cccagacaga cttcctgtct gtcttcttct ctggctacac ctttaaacac 1980
aagatggtgt atgaggacac cctgaccctg ttccctttct ctggggaaac agtgttcatg 2040
tccatggaaa accctggact gtggatcctg ggctgccata acagtgactt cagaaacaga 2100
ggcatgacag ccctgctcaa ggtgtccagc tgtgataaga acacaggaga ctactatgag 2160
gatagctatg aggacatcag tgcttacctg ctggtggaaa tgaaaaagga ggattttgac 2220
atctatgatg aggatgagaa ccagagccct agaagcttcc agaaaaagac tagacactac 2280
ttcattgctg cagtggagag actctgggat tatggcatga gctccagccc ccatgtgctg 2340
agaaatagag ctcagagtgg cagtgtgcca cagttcaaga aggtggtgtt tcaggagttc 2400
actgatggct ccttcacaca accactttac agaggagaac tgaatgagca cctgggcctc 2460
ctgggcccct acatcagggc tgaagtggag gataacatta tggtcacatt taggaatcag 2520
gcttccagac cctactcctt ttattcctca ctcatttcct atgaggagga ccagaggcag 2580
ggagctgagc ccagaaaaaa ttttgtgaaa cccaatgaaa ccaagaccta cttctggaag 2640
gtgcagcacc atatggcccc taccaaggat gaatttgact gcaaggcttg ggcttacttt 2700
tctgatgtgg accttgagaa agatgtgcat tcaggcctca ttgggccact gctggtgtgc 2760
cacaccaata cactgaaccc tgctcatggg agacaggtca cagtgcagga gtttgcactc 2820
ttctttacca tctttgatga gaccaagtcc tggtatttca ctgagaacat ggagaggaac 2880
tgcagggccc cttgtaacat ccagatggag gatcccacct tcaaggaaaa ctacagattc 2940
catgccatca atggctacat catggacacc ctgccaggcc tggtgatggc ccaggaccag 3000
aggatcaggt ggtacctcct gtctatgggc agcaatgaaa atatccacag cattcacttc 3060
tctggacatg tgtttactgt gaggaagaag gaggaataca agatggctct gtacaacctc 3120
taccctgggg tgtttgaaac agtggagatg ctgccctcca aggctggcat ctggagagtg 3180
gaatgtctga ttggggagca tctgcatgct ggcatgagca cactgttcct ggtgtattcc 3240
aacaagtgcc agaccccact gggcatggcc tcaggacata tcagggactt ccagatcact 3300
gctagtggac aatatggaca gtgggcaccc aagctggcca gactgcacta ctcaggctcc 3360
atcaatgcct ggagtaccaa ggagcccttc agctggatca aggtggacct gctggccccc 3420
atgattatac atggcatcaa gacccaggga gctagacaga agttcagctc cctgtacatc 3480
tcccaattca tcatcatgta ctctctggat ggcaagaaat ggcagaccta cagaggcaat 3540
agcactggca ccctgatggt gttttttgga aatgttgact cttctggcat caagcacaac 3600
atcttcaacc cccccatcat tgccagatat atcaggctcc accccaccca ctactccata 3660
aggagcaccc tgagaatgga gctgatgggc tgtgacctga attcctgctc catgcccctg 3720
ggcatggaat ccaaggcaat ctctgatgca cagatcacag cctcctccta cttcaccaac 3780
atgtttgcaa cctggagccc ctccaaggcc agactgcacc tgcagggcag gtccaatgct 3840
tggagaccac aagtgaacaa cccaaaggag tggctgcagg tggacttcca gaagaccatg 3900
aaagtgactg gagtgaccac ccagggagtg aaatccctgc tcactagcat gtatgtgaag 3960
gaattcctga tcagtagctc tcaagatggc caccagtgga ccctgttctt ccagaatggc 4020
aaggtgaagg tgtttcaggg caaccaggat tccttcaccc ctgtggtgaa tagcctggat 4080
cccccactgc tgaccagata cctgagaatc cacccccagt cctgggttca ccagattgcc 4140
ctgagaatgg aggtgctggg ctgtgaggcc caggacctgt ac 4182
<210> 7
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 96-106 amino acid sequence
<400> 7
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 8
<211> 1386
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 99-106 amino acid sequence
<400> 8
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
740 745 750
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser
755 760 765
Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe
770 775 780
Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro
785 790 795 800
Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr
805 810 815
Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
820 825 830
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu
835 840 845
Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn
850 855 860
Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr
865 870 875 880
Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp
885 890 895
Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys
900 905 910
His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
915 920 925
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr
930 935 940
Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln
945 950 955 960
Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn
965 970 975
Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
980 985 990
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His
995 1000 1005
Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu
1010 1015 1020
Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu
1025 1030 1035
Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu
1040 1045 1050
Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe
1055 1060 1065
Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser
1070 1075 1080
Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly
1085 1090 1095
Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile
1100 1105 1110
Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp
1115 1120 1125
Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala
1130 1135 1140
Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met
1145 1150 1155
Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser
1160 1165 1170
Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly
1175 1180 1185
Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile
1190 1195 1200
Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met
1205 1210 1215
Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly
1220 1225 1230
Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser
1235 1240 1245
Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg
1250 1255 1260
Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn
1265 1270 1275
Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys
1280 1285 1290
Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser
1295 1300 1305
Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His
1310 1315 1320
Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln
1325 1330 1335
Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro
1340 1345 1350
Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val
1355 1360 1365
His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln
1370 1375 1380
Asp Leu Tyr
1385
<210> 9
<211> 1385
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 96-109 amino acid sequence
<400> 9
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
725 730 735
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe
740 745 750
Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro
755 760 765
His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys
770 775 780
Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu
785 790 795 800
Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile
805 810 815
Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln Ala
820 825 830
Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp
835 840 845
Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu
850 855 860
Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys
865 870 875 880
Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu
885 890 895
Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
900 905 910
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu
915 920 925
Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe
930 935 940
Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met
945 950 955 960
Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
965 970 975
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg
980 985 990
Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser
995 1000 1005
Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu
1010 1015 1020
Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr
1025 1030 1035
Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys
1040 1045 1050
Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu
1055 1060 1065
Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly
1070 1075 1080
His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln
1085 1090 1095
Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn
1100 1105 1110
Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu
1115 1120 1125
Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg
1130 1135 1140
Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr
1145 1150 1155
Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr
1160 1165 1170
Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile
1175 1180 1185
Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg
1190 1195 1200
Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu
1205 1210 1215
Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met
1220 1225 1230
Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr
1235 1240 1245
Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu
1250 1255 1260
His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn
1265 1270 1275
Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val
1280 1285 1290
Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met
1295 1300 1305
Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln
1310 1315 1320
Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly
1325 1330 1335
Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro
1340 1345 1350
Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
1355 1360 1365
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp
1370 1375 1380
Leu Tyr
1385
<210> 10
<211> 1377
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 99-109 amino acid sequence
<400> 10
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Arg Ser Phe
725 730 735
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
740 745 750
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
755 760 765
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
770 775 780
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
785 790 795 800
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
805 810 815
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
820 825 830
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
835 840 845
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
850 855 860
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
865 870 875 880
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
885 890 895
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
900 905 910
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
915 920 925
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys
930 935 940
Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
945 950 955 960
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly
965 970 975
Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
980 985 990
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
995 1000 1005
Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu
1010 1015 1020
Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala
1025 1030 1035
Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala
1040 1045 1050
Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr
1055 1060 1065
Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr
1070 1075 1080
Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu
1085 1090 1095
His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe
1100 1105 1110
Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly
1115 1120 1125
Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile
1130 1135 1140
Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln
1145 1150 1155
Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly
1160 1165 1170
Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro
1175 1180 1185
Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1190 1195 1200
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser
1205 1210 1215
Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala
1220 1225 1230
Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1235 1240 1245
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala
1250 1255 1260
Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp
1265 1270 1275
Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val
1280 1285 1290
Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser
1295 1300 1305
Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly
1310 1315 1320
Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val
1325 1330 1335
Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile
1340 1345 1350
His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val
1355 1360 1365
Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1370 1375
<210> 11
<211> 1391
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 96-107 amino acid sequence
<400> 11
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Val Glu Met Lys Lys Glu Asp Phe
725 730 735
Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys
740 745 750
Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
755 760 765
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly
770 775 780
Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly
785 790 795 800
Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly
805 810 815
Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
820 825 830
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu
835 840 845
Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn
850 855 860
Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His
865 870 875 880
His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr
885 890 895
Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
900 905 910
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg
915 920 925
Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu
930 935 940
Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala
945 950 955 960
Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
965 970 975
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val
980 985 990
Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
995 1000 1005
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1010 1015 1020
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1025 1030 1035
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
1040 1045 1050
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
1055 1060 1065
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
1070 1075 1080
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
1085 1090 1095
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
1100 1105 1110
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
1115 1120 1125
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
1130 1135 1140
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
1145 1150 1155
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
1160 1165 1170
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
1175 1180 1185
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
1190 1195 1200
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
1205 1210 1215
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
1220 1225 1230
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
1235 1240 1245
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
1250 1255 1260
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
1265 1270 1275
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
1280 1285 1290
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
1295 1300 1305
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
1310 1315 1320
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
1325 1330 1335
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
1340 1345 1350
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
1355 1360 1365
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
1370 1375 1380
Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 12
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII polypeptide 107-117 amino acid sequence
<400> 12
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Thr Ile Ser Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 13
<211> 119
<212> DNA
<213> Artificial sequence
<220>
<223> FRE72 transcription regulatory element
<400> 13
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60
attcaccagc agcctccccc tcagcttcag gcaccaccac tgacctggga cagtgaatc 119
<210> 14
<211> 335
<212> DNA
<213> Artificial sequence
<220>
<223> HLP2 transcription regulatory element
<400> 14
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120
acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300
cttcaggcac caccactgac ctgggacagt gaatc 335
<210> 15
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of native FVIII signal peptide
<400> 15
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser
<210> 16
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Wild-type nucleotide sequence encoding native FVIII signal
peptide
<400> 16
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt 57
<210> 17
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimised nucleotide sequence encoding native FVIII signal
peptide
<400> 17
atgcagattg agctctccac ctgcttcttc ctctgcctct tgagattctg tttctct 57
<210> 18
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of SP5
<400> 18
Met Lys Leu Leu Ala Ala Thr Val Leu Leu Leu Thr Ile Cys Ser Leu
1 5 10 15
Glu Gly
<210> 19
<211> 54
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding SP5
<400> 19
atgaagctgc tcgcagcaac tgtgctactc ctcaccatct gcagccttga agga 54
<210> 20
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of SP10
<400> 20
Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Leu Gly Ser Gly
1 5 10 15
Arg Ala
<210> 21
<211> 54
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding SP10
<400> 21
atgaagtggg tgtgggcgct cttgctgttg gcggcgctgg gcagcggccg cgcg 54
<210> 22
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> PolyA sequence (SpA; 49 bp)
<400> 22
aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49
<210> 23
<211> 145
<212> DNA
<213> Artificial sequence
<220>
<223> AAV2 5' ITR sequence
<400> 23
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 24
<211> 145
<212> DNA
<213> Artificial sequence
<220>
<223> AAV2 3' ITR sequence
<400> 24
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 25
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of AAV capsid
<400> 25
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 26
<211> 724
<212> PRT
<213> adeno-associated virus 5
<400> 26
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 27
<211> 4713
<212> DNA
<213> Artificial sequence
<220>
<223> FVIII AAV construct 26-96-106
<400> 27
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttaat taacccagcc agtggactta gcccctgttt 180
gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc ccctcagctt 240
caggcaccac cactgacctg ggacagtgaa tcgcgccacc atgaagctgc tcgcagcaac 300
tgtgctactc ctcaccatct gcagccttga aggagctact agaagatatt atcttggggc 360
agtggagctg agctgggact acatgcagtc tgacctggga gaactgcctg tggatgccag 420
atttccccct cgagtgccca agagcttccc ctttaacacc tcagtggtgt acaagaagac 480
cctgtttgtg gagtttacag accatctctt caacattgct aagcccagac ctccctggat 540
gggcctgctg ggccctacca tccaagctga agtgtatgac actgttgtga tcacactcaa 600
gaacatggcc tcccatcctg tgtccctgca tgcagtggga gtctcctact ggaaggcctc 660
agaaggagca gagtatgatg accagaccag ccagagagag aaggaggatg acaaggtgtt 720
tcctggaggg agccacacct atgtgtggca ggtgctgaag gagaatggac ctatggccag 780
tgaccctctg tgtcttacct attcctacct gtcacatgtg gatctggtga aggacctgaa 840
cagtggcctg attggggctc tgctggtttg cagagaaggc agcttggcca aggagaagac 900
ccaaaccctg cacaagttca tcctgctgtt tgctgtgttt gatgagggga aatcatggca 960
ctcagagacc aagaacagcc tcatgcagga tagggatgct gccagtgcca gggcttggcc 1020
caagatgcac actgtgaatg gctatgtgaa tagaagcctg cctgggctga taggctgtca 1080
cagaaaatct gtgtactggc atgtgattgg catgggcacc acacctgagg tgcactccat 1140
tttcctggag ggccacacct tccttgtgag aaaccacaga caagcttccc tggagatcag 1200
cccaatcacc tttctgactg ctcaaaccct cctgatggat ctgggccagt tcctgctgtt 1260
ctgtcatatc tcctcacacc agcatgatgg aatggaagct tatgtcaagg tggactcctg 1320
cccagaggaa ccacagctca gaatgaagaa caatgaggag gctgaggact atgatgatga 1380
cctgacagac tctgaaatgg atgtggtcag atttgatgat gacaacagcc cttcattcat 1440
ccaaatcaga tctgtggcca agaagcatcc caagacctgg gtgcactaca tagctgctga 1500
ggaggaggac tgggactatg cccctctggt cctggcccct gatgacagaa gctataaaag 1560
ccagtacctg aataatggcc cccagagaat tggcagaaag tacaagaaag tcagattcat 1620
ggcttacact gatgagacct tcaaaaccag ggaagccatc cagcatgagt caggcatcct 1680
gggccccctg ctgtatgggg aggttggaga taccctgctg attatcttca aaaaccaggc 1740
aagcaggccc tacaatatct accctcatgg catcactgat gtcaggccac tgtattccag 1800
aagactgcct aagggggtga agcacctgaa ggacttccca atcctgccag gggagatttt 1860
caaatacaag tggacagtga ctgtggagga tggaccaacc aagtcagatc ctagatgtct 1920
gaccagatac tactccagct ttgtgaacat ggagagagac ctggcctctg gcctgattgg 1980
ccctctgctg atctgctata aagagtcagt ggaccagaga ggcaaccaga tcatgagtga 2040
caaaagaaat gtgatcttgt tctcagtgtt tgatgagaat agatcttggt acctcacaga 2100
aaacatccag aggttcctgc ccaatccagc tggggtgcag ctggaagatc cagaattcca 2160
ggccagcaac atcatgcata gcatcaatgg ttatgtcttt gacagcctgc agctgtcagt 2220
gtgtctgcat gaagttgctt actggtatat tctgtccatt ggagcccaga cagacttcct 2280
gtctgtcttc ttctctggct acacctttaa acacaagtgg gtgtatgagg acaccctgac 2340
cctgttccct ttctctgggg aaacagtgtt catgtccatg gaaaaccctg gactgtggat 2400
cctgggctgc cataacagtg acttcagaaa cagaggcatg acagccctgc tcaaggtgtc 2460
cagctgtgat aagaacacag gagactacta tgaggatagc tatgaggaca tcagtgctta 2520
cctgctggtg gaaatgaaaa aggaggattt tgacatctat gatgaggatg agaaccagag 2580
ccctagaagc ttccagaaaa agactagaca ctacttcatt gctgcagtgg agagactctg 2640
ggattatggc atgagctcca gcccccatgt gctgagaaat agagctcaga gtggcagtgt 2700
gccacagttc aagaaggtgg tgtttcagga gttcactgat ggctccttca cacaaccact 2760
ttacagagga gaactgaatg agcacctggg cctcctgggc ccctacatca gggctgaagt 2820
ggaggataac attatggtca catttaggaa tcaggcttcc agaccctact ccttttattc 2880
ctcactcatt tcctatgagg aggaccagag gcagggagct gagcccagaa aaaattttgt 2940
gaaacccaat gaaaccaaga cctacttctg gaaggtgcag caccatatgg cccctaccaa 3000
ggatgaattt gactgcaagg cttgggctta cttttctgat gtggaccttg agaaagatgt 3060
gcattcaggc ctcattgggc cactgctggt gtgccacacc aatacactga accctgctca 3120
tgggagacag gtcacagtgc aggagtttgc actcttcttt accatctttg atgagaccaa 3180
gtcctggtat ttcactgaga acatggagag gaactgcagg gccccttgta acatccagat 3240
ggaggatccc accttcaagg aaaactacag attccatgcc atcaatggct acatcatgga 3300
caccctgcca ggcctggtga tggcccagga ccagaggatc aggtggtacc tcctgtctat 3360
gggcagcaat gaaaatatcc acagcattca cttctctgga catgtgttta ctgtgaggaa 3420
gaaggaggaa tacaagatgg ctctgtacaa cctctaccct ggggtgtttg aaacagtgga 3480
gatgctgccc tccaaggctg gcatctggag agtggaatgt ctgattgggg agcatctgca 3540
tgctggcatg agcacactgt tcctggtgta ttccaacaag tgccagaccc cactgggcat 3600
ggcctcagga catatcaggg acttccagat cactgctagt ggacaatatg gacagtgggc 3660
acccaagctg gccagactgc actactcagg ctccatcaat gcctggagta ccaaggagcc 3720
cttcagctgg atcaaggtgg acctgctggc ccccatgatt atacatggca tcaagaccca 3780
gggagctaga cagaagttca gctccctgta catctcccaa ttcatcatca tgtactctct 3840
ggatggcaag aaatggcaga cctacagagg caatagcact ggcaccctga tggtgttttt 3900
tggaaatgtt gactcttctg gcatcaagca caacatcttc aaccccccca tcattgccag 3960
atatatcagg ctccacccca cccactactc cataaggagc accctgagaa tggagctgat 4020
gggctgtgac ctgaattcct gctccatgcc cctgggcatg gaatccaagg caatctctga 4080
tgcacagatc acagcctcct cctacttcac caacatgttt gcaacctgga gcccctccaa 4140
ggccagactg cacctgcagg gcaggtccaa tgcttggaga ccacaagtga acaacccaaa 4200
ggagtggctg caggtggact tccagaagac catgaaagtg actggagtga ccacccaggg 4260
agtgaaatcc ctgctcacta gcatgtatgt gaaggaattc ctgatcagta gctctcaaga 4320
tggccaccag tggaccctgt tcttccagaa tggcaaggtg aaggtgtttc agggcaacca 4380
ggattccttc acccctgtgg tgaatagcct ggatccccca ctgctgacca gatacctgag 4440
aatccacccc cagtcctggg ttcaccagat tgccctgaga atggaggtgc tgggctgtga 4500
ggcccaggac ctgtactgaa ataaaagatc tttattttca ttagatctgt gtgttggttt 4560
tttgtgtgag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 4620
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 4680
gagcgagcga gcgcgcagag agggagtggc caa 4713
<210> 28
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 26-96-106 amino acid sequence
<400> 28
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Trp Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 29
<211> 4182
<212> DNA
<213> Artificial sequence
<220>
<223> Codop19 nucleotide sequence encoding 26-96-106
<400> 29
gctactagaa gatattatct tggggcagtg gagctgagct gggactacat gcagtctgac 60
ctgggagaac tgcctgtgga tgccagattt ccccctcgag tgcccaagag cttccccttt 120
aacacctcag tggtgtacaa gaagaccctg tttgtggagt ttacagacca tctcttcaac 180
attgctaagc ccagacctcc ctggatgggc ctgctgggcc ctaccatcca agctgaagtg 240
tatgacactg ttgtgatcac actcaagaac atggcctccc atcctgtgtc cctgcatgca 300
gtgggagtct cctactggaa ggcctcagaa ggagcagagt atgatgacca gaccagccag 360
agagagaagg aggatgacaa ggtgtttcct ggagggagcc acacctatgt gtggcaggtg 420
ctgaaggaga atggacctat ggccagtgac cctctgtgtc ttacctattc ctacctgtca 480
catgtggatc tggtgaagga cctgaacagt ggcctgattg gggctctgct ggtttgcaga 540
gaaggcagct tggccaagga gaagacccaa accctgcaca agttcatcct gctgtttgct 600
gtgtttgatg aggggaaatc atggcactca gagaccaaga acagcctcat gcaggatagg 660
gatgctgcca gtgccagggc ttggcccaag atgcacactg tgaatggcta tgtgaataga 720
agcctgcctg ggctgatagg ctgtcacaga aaatctgtgt actggcatgt gattggcatg 780
ggcaccacac ctgaggtgca ctccattttc ctggagggcc acaccttcct tgtgagaaac 840
cacagacaag cttccctgga gatcagccca atcacctttc tgactgctca aaccctcctg 900
atggatctgg gccagttcct gctgttctgt catatctcct cacaccagca tgatggaatg 960
gaagcttatg tcaaggtgga ctcctgccca gaggaaccac agctcagaat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg acagactctg aaatggatgt ggtcagattt 1080
gatgatgaca acagcccttc attcatccaa atcagatctg tggccaagaa gcatcccaag 1140
acctgggtgc actacatagc tgctgaggag gaggactggg actatgcccc tctggtcctg 1200
gcccctgatg acagaagcta taaaagccag tacctgaata atggccccca gagaattggc 1260
agaaagtaca agaaagtcag attcatggct tacactgatg agaccttcaa aaccagggaa 1320
gccatccagc atgagtcagg catcctgggc cccctgctgt atggggaggt tggagatacc 1380
ctgctgatta tcttcaaaaa ccaggcaagc aggccctaca atatctaccc tcatggcatc 1440
actgatgtca ggccactgta ttccagaaga ctgcctaagg gggtgaagca cctgaaggac 1500
ttcccaatcc tgccagggga gattttcaaa tacaagtgga cagtgactgt ggaggatgga 1560
ccaaccaagt cagatcctag atgtctgacc agatactact ccagctttgt gaacatggag 1620
agagacctgg cctctggcct gattggccct ctgctgatct gctataaaga gtcagtggac 1680
cagagaggca accagatcat gagtgacaaa agaaatgtga tcttgttctc agtgtttgat 1740
gagaatagat cttggtacct cacagaaaac atccagaggt tcctgcccaa tccagctggg 1800
gtgcagctgg aagatccaga attccaggcc agcaacatca tgcatagcat caatggttat 1860
gtctttgaca gcctgcagct gtcagtgtgt ctgcatgaag ttgcttactg gtatattctg 1920
tccattggag cccagacaga cttcctgtct gtcttcttct ctggctacac ctttaaacac 1980
aagtgggtgt atgaggacac cctgaccctg ttccctttct ctggggaaac agtgttcatg 2040
tccatggaaa accctggact gtggatcctg ggctgccata acagtgactt cagaaacaga 2100
ggcatgacag ccctgctcaa ggtgtccagc tgtgataaga acacaggaga ctactatgag 2160
gatagctatg aggacatcag tgcttacctg ctggtggaaa tgaaaaagga ggattttgac 2220
atctatgatg aggatgagaa ccagagccct agaagcttcc agaaaaagac tagacactac 2280
ttcattgctg cagtggagag actctgggat tatggcatga gctccagccc ccatgtgctg 2340
agaaatagag ctcagagtgg cagtgtgcca cagttcaaga aggtggtgtt tcaggagttc 2400
actgatggct ccttcacaca accactttac agaggagaac tgaatgagca cctgggcctc 2460
ctgggcccct acatcagggc tgaagtggag gataacatta tggtcacatt taggaatcag 2520
gcttccagac cctactcctt ttattcctca ctcatttcct atgaggagga ccagaggcag 2580
ggagctgagc ccagaaaaaa ttttgtgaaa cccaatgaaa ccaagaccta cttctggaag 2640
gtgcagcacc atatggcccc taccaaggat gaatttgact gcaaggcttg ggcttacttt 2700
tctgatgtgg accttgagaa agatgtgcat tcaggcctca ttgggccact gctggtgtgc 2760
cacaccaata cactgaaccc tgctcatggg agacaggtca cagtgcagga gtttgcactc 2820
ttctttacca tctttgatga gaccaagtcc tggtatttca ctgagaacat ggagaggaac 2880
tgcagggccc cttgtaacat ccagatggag gatcccacct tcaaggaaaa ctacagattc 2940
catgccatca atggctacat catggacacc ctgccaggcc tggtgatggc ccaggaccag 3000
aggatcaggt ggtacctcct gtctatgggc agcaatgaaa atatccacag cattcacttc 3060
tctggacatg tgtttactgt gaggaagaag gaggaataca agatggctct gtacaacctc 3120
taccctgggg tgtttgaaac agtggagatg ctgccctcca aggctggcat ctggagagtg 3180
gaatgtctga ttggggagca tctgcatgct ggcatgagca cactgttcct ggtgtattcc 3240
aacaagtgcc agaccccact gggcatggcc tcaggacata tcagggactt ccagatcact 3300
gctagtggac aatatggaca gtgggcaccc aagctggcca gactgcacta ctcaggctcc 3360
atcaatgcct ggagtaccaa ggagcccttc agctggatca aggtggacct gctggccccc 3420
atgattatac atggcatcaa gacccaggga gctagacaga agttcagctc cctgtacatc 3480
tcccaattca tcatcatgta ctctctggat ggcaagaaat ggcagaccta cagaggcaat 3540
agcactggca ccctgatggt gttttttgga aatgttgact cttctggcat caagcacaac 3600
atcttcaacc cccccatcat tgccagatat atcaggctcc accccaccca ctactccata 3660
aggagcaccc tgagaatgga gctgatgggc tgtgacctga attcctgctc catgcccctg 3720
ggcatggaat ccaaggcaat ctctgatgca cagatcacag cctcctccta cttcaccaac 3780
atgtttgcaa cctggagccc ctccaaggcc agactgcacc tgcagggcag gtccaatgct 3840
tggagaccac aagtgaacaa cccaaaggag tggctgcagg tggacttcca gaagaccatg 3900
aaagtgactg gagtgaccac ccagggagtg aaatccctgc tcactagcat gtatgtgaag 3960
gaattcctga tcagtagctc tcaagatggc caccagtgga ccctgttctt ccagaatggc 4020
aaggtgaagg tgtttcaggg caaccaggat tccttcaccc ctgtggtgaa tagcctggat 4080
cccccactgc tgaccagata cctgagaatc cacccccagt cctgggttca ccagattgcc 4140
ctgagaatgg aggtgctggg ctgtgaggcc caggacctgt ac 4182
<210> 30
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 26-SQ amino acid sequence
<400> 30
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Trp Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 31
<211> 4314
<212> DNA
<213> Artificial sequence
<220>
<223> Codop19 nucleotide sequence encoding FVIII polypeptide 26 SQ
<400> 31
gctactagaa gatattatct tggggcagtg gagctgagct gggactacat gcagtctgac 60
ctgggagaac tgcctgtgga tgccagattt ccccctcgag tgcccaagag cttccccttt 120
aacacctcag tggtgtacaa gaagaccctg tttgtggagt ttacagacca tctcttcaac 180
attgctaagc ccagacctcc ctggatgggc ctgctgggcc ctaccatcca agctgaagtg 240
tatgacactg ttgtgatcac actcaagaac atggcctccc atcctgtgtc cctgcatgca 300
gtgggagtct cctactggaa ggcctcagaa ggagcagagt atgatgacca gaccagccag 360
agagagaagg aggatgacaa ggtgtttcct ggagggagcc acacctatgt gtggcaggtg 420
ctgaaggaga atggacctat ggccagtgac cctctgtgtc ttacctattc ctacctgtca 480
catgtggatc tggtgaagga cctgaacagt ggcctgattg gggctctgct ggtttgcaga 540
gaaggcagct tggccaagga gaagacccaa accctgcaca agttcatcct gctgtttgct 600
gtgtttgatg aggggaaatc atggcactca gagaccaaga acagcctcat gcaggatagg 660
gatgctgcca gtgccagggc ttggcccaag atgcacactg tgaatggcta tgtgaataga 720
agcctgcctg ggctgatagg ctgtcacaga aaatctgtgt actggcatgt gattggcatg 780
ggcaccacac ctgaggtgca ctccattttc ctggagggcc acaccttcct tgtgagaaac 840
cacagacaag cttccctgga gatcagccca atcacctttc tgactgctca aaccctcctg 900
atggatctgg gccagttcct gctgttctgt catatctcct cacaccagca tgatggaatg 960
gaagcttatg tcaaggtgga ctcctgccca gaggaaccac agctcagaat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg acagactctg aaatggatgt ggtcagattt 1080
gatgatgaca acagcccttc attcatccaa atcagatctg tggccaagaa gcatcccaag 1140
acctgggtgc actacatagc tgctgaggag gaggactggg actatgcccc tctggtcctg 1200
gcccctgatg acagaagcta taaaagccag tacctgaata atggccccca gagaattggc 1260
agaaagtaca agaaagtcag attcatggct tacactgatg agaccttcaa aaccagggaa 1320
gccatccagc atgagtcagg catcctgggc cccctgctgt atggggaggt tggagatacc 1380
ctgctgatta tcttcaaaaa ccaggcaagc aggccctaca atatctaccc tcatggcatc 1440
actgatgtca ggccactgta ttccagaaga ctgcctaagg gggtgaagca cctgaaggac 1500
ttcccaatcc tgccagggga gattttcaaa tacaagtgga cagtgactgt ggaggatgga 1560
ccaaccaagt cagatcctag atgtctgacc agatactact ccagctttgt gaacatggag 1620
agagacctgg cctctggcct gattggccct ctgctgatct gctataaaga gtcagtggac 1680
cagagaggca accagatcat gagtgacaaa agaaatgtga tcttgttctc agtgtttgat 1740
gagaatagat cttggtacct cacagaaaac atccagaggt tcctgcccaa tccagctggg 1800
gtgcagctgg aagatccaga attccaggcc agcaacatca tgcatagcat caatggttat 1860
gtctttgaca gcctgcagct gtcagtgtgt ctgcatgaag ttgcttactg gtatattctg 1920
tccattggag cccagacaga cttcctgtct gtcttcttct ctggctacac ctttaaacac 1980
aagtgggtgt atgaggacac cctgaccctg ttccctttct ctggggaaac agtgttcatg 2040
tccatggaaa accctggact gtggatcctg ggctgccata acagtgactt cagaaacaga 2100
ggcatgacag ccctgctcaa ggtgtccagc tgtgataaga acacaggaga ctactatgag 2160
gatagctatg aggacatcag tgcttacctg ctgagcaaga ataatgccat tgaacccagg 2220
tcattttccc aaaatccccc tgtgctgaaa aggcaccaga gggagatcac gcgtaccacc 2280
ctgcagagtg accaggagga aattgattat gatgacacca tctctgtgga aatgaaaaag 2340
gaggattttg acatctatga tgaggatgag aaccagagcc ctagaagctt ccagaaaaag 2400
actagacact acttcattgc tgcagtggag agactctggg attatggcat gagctccagc 2460
ccccatgtgc tgagaaatag agctcagagt ggcagtgtgc cacagttcaa gaaggtggtg 2520
tttcaggagt tcactgatgg ctccttcaca caaccacttt acagaggaga actgaatgag 2580
cacctgggcc tcctgggccc ctacatcagg gctgaagtgg aggataacat tatggtcaca 2640
tttaggaatc aggcttccag accctactcc ttttattcct cactcatttc ctatgaggag 2700
gaccagaggc agggagctga gcccagaaaa aattttgtga aacccaatga aaccaagacc 2760
tacttctgga aggtgcagca ccatatggcc cctaccaagg atgaatttga ctgcaaggct 2820
tgggcttact tttctgatgt ggaccttgag aaagatgtgc attcaggcct cattgggcca 2880
ctgctggtgt gccacaccaa tacactgaac cctgctcatg ggagacaggt cacagtgcag 2940
gagtttgcac tcttctttac catctttgat gagaccaagt cctggtattt cactgagaac 3000
atggagagga actgcagggc cccttgtaac atccagatgg aggatcccac cttcaaggaa 3060
aactacagat tccatgccat caatggctac atcatggaca ccctgccagg cctggtgatg 3120
gcccaggacc agaggatcag gtggtacctc ctgtctatgg gcagcaatga aaatatccac 3180
agcattcact tctctggaca tgtgtttact gtgaggaaga aggaggaata caagatggct 3240
ctgtacaacc tctaccctgg ggtgtttgaa acagtggaga tgctgccctc caaggctggc 3300
atctggagag tggaatgtct gattggggag catctgcatg ctggcatgag cacactgttc 3360
ctggtgtatt ccaacaagtg ccagacccca ctgggcatgg cctcaggaca tatcagggac 3420
ttccagatca ctgctagtgg acaatatgga cagtgggcac ccaagctggc cagactgcac 3480
tactcaggct ccatcaatgc ctggagtacc aaggagccct tcagctggat caaggtggac 3540
ctgctggccc ccatgattat acatggcatc aagacccagg gagctagaca gaagttcagc 3600
tccctgtaca tctcccaatt catcatcatg tactctctgg atggcaagaa atggcagacc 3660
tacagaggca atagcactgg caccctgatg gtgttttttg gaaatgttga ctcttctggc 3720
atcaagcaca acatcttcaa cccccccatc attgccagat atatcaggct ccaccccacc 3780
cactactcca taaggagcac cctgagaatg gagctgatgg gctgtgacct gaattcctgc 3840
tccatgcccc tgggcatgga atccaaggca atctctgatg cacagatcac agcctcctcc 3900
tacttcacca acatgtttgc aacctggagc ccctccaagg ccagactgca cctgcagggc 3960
aggtccaatg cttggagacc acaagtgaac aacccaaagg agtggctgca ggtggacttc 4020
cagaagacca tgaaagtgac tggagtgacc acccagggag tgaaatccct gctcactagc 4080
atgtatgtga aggaattcct gatcagtagc tctcaagatg gccaccagtg gaccctgttc 4140
ttccagaatg gcaaggtgaa ggtgtttcag ggcaaccagg attccttcac ccctgtggtg 4200
aatagcctgg atcccccact gctgaccaga tacctgagaa tccaccccca gtcctgggtt 4260
caccagattg ccctgagaat ggaggtgctg ggctgtgagg cccaggacct gtac 4314
<210> 32
<211> 4845
<212> DNA
<213> Artificial sequence
<220>
<223> FVIII AAV construct SQ
<400> 32
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttaat taacccagcc agtggactta gcccctgttt 180
gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc ccctcagctt 240
caggcaccac cactgacctg ggacagtgaa tcgcgccacc atgaagctgc tcgcagcaac 300
tgtgctactc ctcaccatct gcagccttga aggagctact agaagatatt atcttggggc 360
agtggagctg agctgggact acatgcagtc tgacctggga gaactgcctg tggatgccag 420
atttccccct cgagtgccca agagcttccc ctttaacacc tcagtggtgt acaagaagac 480
cctgtttgtg gagtttacag accatctctt caacattgct aagcccagac ctccctggat 540
gggcctgctg ggccctacca tccaagctga agtgtatgac actgttgtga tcacactcaa 600
gaacatggcc tcccatcctg tgtccctgca tgcagtggga gtctcctact ggaaggcctc 660
agaaggagca gagtatgatg accagaccag ccagagagag aaggaggatg acaaggtgtt 720
tcctggaggg agccacacct atgtgtggca ggtgctgaag gagaatggac ctatggccag 780
tgaccctctg tgtcttacct attcctacct gtcacatgtg gatctggtga aggacctgaa 840
cagtggcctg attggggctc tgctggtttg cagagaaggc agcttggcca aggagaagac 900
ccaaaccctg cacaagttca tcctgctgtt tgctgtgttt gatgagggga aatcatggca 960
ctcagagacc aagaacagcc tcatgcagga tagggatgct gccagtgcca gggcttggcc 1020
caagatgcac actgtgaatg gctatgtgaa tagaagcctg cctgggctga taggctgtca 1080
cagaaaatct gtgtactggc atgtgattgg catgggcacc acacctgagg tgcactccat 1140
tttcctggag ggccacacct tccttgtgag aaaccacaga caagcttccc tggagatcag 1200
cccaatcacc tttctgactg ctcaaaccct cctgatggat ctgggccagt tcctgctgtt 1260
ctgtcatatc tcctcacacc agcatgatgg aatggaagct tatgtcaagg tggactcctg 1320
cccagaggaa ccacagctca gaatgaagaa caatgaggag gctgaggact atgatgatga 1380
cctgacagac tctgaaatgg atgtggtcag atttgatgat gacaacagcc cttcattcat 1440
ccaaatcaga tctgtggcca agaagcatcc caagacctgg gtgcactaca tagctgctga 1500
ggaggaggac tgggactatg cccctctggt cctggcccct gatgacagaa gctataaaag 1560
ccagtacctg aataatggcc cccagagaat tggcagaaag tacaagaaag tcagattcat 1620
ggcttacact gatgagacct tcaaaaccag ggaagccatc cagcatgagt caggcatcct 1680
gggccccctg ctgtatgggg aggttggaga taccctgctg attatcttca aaaaccaggc 1740
aagcaggccc tacaatatct accctcatgg catcactgat gtcaggccac tgtattccag 1800
aagactgcct aagggggtga agcacctgaa ggacttccca atcctgccag gggagatttt 1860
caaatacaag tggacagtga ctgtggagga tggaccaacc aagtcagatc ctagatgtct 1920
gaccagatac tactccagct ttgtgaacat ggagagagac ctggcctctg gcctgattgg 1980
ccctctgctg atctgctata aagagtcagt ggaccagaga ggcaaccaga tcatgagtga 2040
caaaagaaat gtgatcttgt tctcagtgtt tgatgagaat agatcttggt acctcacaga 2100
aaacatccag aggttcctgc ccaatccagc tggggtgcag ctggaagatc cagaattcca 2160
ggccagcaac atcatgcata gcatcaatgg ttatgtcttt gacagcctgc agctgtcagt 2220
gtgtctgcat gaagttgctt actggtatat tctgtccatt ggagcccaga cagacttcct 2280
gtctgtcttc ttctctggct acacctttaa acacaagatg gtgtatgagg acaccctgac 2340
cctgttccct ttctctgggg aaacagtgtt catgtccatg gaaaaccctg gactgtggat 2400
cctgggctgc cataacagtg acttcagaaa cagaggcatg acagccctgc tcaaggtgtc 2460
cagctgtgat aagaacacag gagactacta tgaggatagc tatgaggaca tcagtgctta 2520
cctgctgagc aagaataatg ccattgaacc caggtcattt tcccaaaatc cccctgtgct 2580
gaaaaggcac cagagggaga tcacgcgtac caccctgcag agtgaccagg aggaaattga 2640
ttatgatgac accatctctg tggaaatgaa aaaggaggat tttgacatct atgatgagga 2700
tgagaaccag agccctagaa gcttccagaa aaagactaga cactacttca ttgctgcagt 2760
ggagagactc tgggattatg gcatgagctc cagcccccat gtgctgagaa atagagctca 2820
gagtggcagt gtgccacagt tcaagaaggt ggtgtttcag gagttcactg atggctcctt 2880
cacacaacca ctttacagag gagaactgaa tgagcacctg ggcctcctgg gcccctacat 2940
cagggctgaa gtggaggata acattatggt cacatttagg aatcaggctt ccagacccta 3000
ctccttttat tcctcactca tttcctatga ggaggaccag aggcagggag ctgagcccag 3060
aaaaaatttt gtgaaaccca atgaaaccaa gacctacttc tggaaggtgc agcaccatat 3120
ggcccctacc aaggatgaat ttgactgcaa ggcttgggct tacttttctg atgtggacct 3180
tgagaaagat gtgcattcag gcctcattgg gccactgctg gtgtgccaca ccaatacact 3240
gaaccctgct catgggagac aggtcacagt gcaggagttt gcactcttct ttaccatctt 3300
tgatgagacc aagtcctggt atttcactga gaacatggag aggaactgca gggccccttg 3360
taacatccag atggaggatc ccaccttcaa ggaaaactac agattccatg ccatcaatgg 3420
ctacatcatg gacaccctgc caggcctggt gatggcccag gaccagagga tcaggtggta 3480
cctcctgtct atgggcagca atgaaaatat ccacagcatt cacttctctg gacatgtgtt 3540
tactgtgagg aagaaggagg aatacaagat ggctctgtac aacctctacc ctggggtgtt 3600
tgaaacagtg gagatgctgc cctccaaggc tggcatctgg agagtggaat gtctgattgg 3660
ggagcatctg catgctggca tgagcacact gttcctggtg tattccaaca agtgccagac 3720
cccactgggc atggcctcag gacatatcag ggacttccag atcactgcta gtggacaata 3780
tggacagtgg gcacccaagc tggccagact gcactactca ggctccatca atgcctggag 3840
taccaaggag cccttcagct ggatcaaggt ggacctgctg gcccccatga ttatacatgg 3900
catcaagacc cagggagcta gacagaagtt cagctccctg tacatctccc aattcatcat 3960
catgtactct ctggatggca agaaatggca gacctacaga ggcaatagca ctggcaccct 4020
gatggtgttt tttggaaatg ttgactcttc tggcatcaag cacaacatct tcaacccccc 4080
catcattgcc agatatatca ggctccaccc cacccactac tccataagga gcaccctgag 4140
aatggagctg atgggctgtg acctgaattc ctgctccatg cccctgggca tggaatccaa 4200
ggcaatctct gatgcacaga tcacagcctc ctcctacttc accaacatgt ttgcaacctg 4260
gagcccctcc aaggccagac tgcacctgca gggcaggtcc aatgcttgga gaccacaagt 4320
gaacaaccca aaggagtggc tgcaggtgga cttccagaag accatgaaag tgactggagt 4380
gaccacccag ggagtgaaat ccctgctcac tagcatgtat gtgaaggaat tcctgatcag 4440
tagctctcaa gatggccacc agtggaccct gttcttccag aatggcaagg tgaaggtgtt 4500
tcagggcaac caggattcct tcacccctgt ggtgaatagc ctggatcccc cactgctgac 4560
cagatacctg agaatccacc cccagtcctg ggttcaccag attgccctga gaatggaggt 4620
gctgggctgt gaggcccagg acctgtactg aaataaaaga tctttatttt cattagatct 4680
gtgtgttggt tttttgtgtg aggaacccct agtgatggag ttggccactc cctctctgcg 4740
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4800
ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaa 4845
<210> 33
<211> 4845
<212> DNA
<213> Artificial sequence
<220>
<223> FVIII AAV construct 26-SQ
<400> 33
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttaat taacccagcc agtggactta gcccctgttt 180
gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc ccctcagctt 240
caggcaccac cactgacctg ggacagtgaa tcgcgccacc atgaagctgc tcgcagcaac 300
tgtgctactc ctcaccatct gcagccttga aggagctact agaagatatt atcttggggc 360
agtggagctg agctgggact acatgcagtc tgacctggga gaactgcctg tggatgccag 420
atttccccct cgagtgccca agagcttccc ctttaacacc tcagtggtgt acaagaagac 480
cctgtttgtg gagtttacag accatctctt caacattgct aagcccagac ctccctggat 540
gggcctgctg ggccctacca tccaagctga agtgtatgac actgttgtga tcacactcaa 600
gaacatggcc tcccatcctg tgtccctgca tgcagtggga gtctcctact ggaaggcctc 660
agaaggagca gagtatgatg accagaccag ccagagagag aaggaggatg acaaggtgtt 720
tcctggaggg agccacacct atgtgtggca ggtgctgaag gagaatggac ctatggccag 780
tgaccctctg tgtcttacct attcctacct gtcacatgtg gatctggtga aggacctgaa 840
cagtggcctg attggggctc tgctggtttg cagagaaggc agcttggcca aggagaagac 900
ccaaaccctg cacaagttca tcctgctgtt tgctgtgttt gatgagggga aatcatggca 960
ctcagagacc aagaacagcc tcatgcagga tagggatgct gccagtgcca gggcttggcc 1020
caagatgcac actgtgaatg gctatgtgaa tagaagcctg cctgggctga taggctgtca 1080
cagaaaatct gtgtactggc atgtgattgg catgggcacc acacctgagg tgcactccat 1140
tttcctggag ggccacacct tccttgtgag aaaccacaga caagcttccc tggagatcag 1200
cccaatcacc tttctgactg ctcaaaccct cctgatggat ctgggccagt tcctgctgtt 1260
ctgtcatatc tcctcacacc agcatgatgg aatggaagct tatgtcaagg tggactcctg 1320
cccagaggaa ccacagctca gaatgaagaa caatgaggag gctgaggact atgatgatga 1380
cctgacagac tctgaaatgg atgtggtcag atttgatgat gacaacagcc cttcattcat 1440
ccaaatcaga tctgtggcca agaagcatcc caagacctgg gtgcactaca tagctgctga 1500
ggaggaggac tgggactatg cccctctggt cctggcccct gatgacagaa gctataaaag 1560
ccagtacctg aataatggcc cccagagaat tggcagaaag tacaagaaag tcagattcat 1620
ggcttacact gatgagacct tcaaaaccag ggaagccatc cagcatgagt caggcatcct 1680
gggccccctg ctgtatgggg aggttggaga taccctgctg attatcttca aaaaccaggc 1740
aagcaggccc tacaatatct accctcatgg catcactgat gtcaggccac tgtattccag 1800
aagactgcct aagggggtga agcacctgaa ggacttccca atcctgccag gggagatttt 1860
caaatacaag tggacagtga ctgtggagga tggaccaacc aagtcagatc ctagatgtct 1920
gaccagatac tactccagct ttgtgaacat ggagagagac ctggcctctg gcctgattgg 1980
ccctctgctg atctgctata aagagtcagt ggaccagaga ggcaaccaga tcatgagtga 2040
caaaagaaat gtgatcttgt tctcagtgtt tgatgagaat agatcttggt acctcacaga 2100
aaacatccag aggttcctgc ccaatccagc tggggtgcag ctggaagatc cagaattcca 2160
ggccagcaac atcatgcata gcatcaatgg ttatgtcttt gacagcctgc agctgtcagt 2220
gtgtctgcat gaagttgctt actggtatat tctgtccatt ggagcccaga cagacttcct 2280
gtctgtcttc ttctctggct acacctttaa acacaagtgg gtgtatgagg acaccctgac 2340
cctgttccct ttctctgggg aaacagtgtt ctggtccatg gaaaaccctg gactgtggat 2400
cctgggctgc cataacagtg acttcagaaa cagaggcatg acagccctgc tcaaggtgtc 2460
cagctgtgat aagaacacag gagactacta tgaggatagc tatgaggaca tcagtgctta 2520
cctgctgagc aagaataatg ccattgaacc caggtcattt tcccaaaatc cccctgtgct 2580
gaaaaggcac cagagggaga tcacgcgtac caccctgcag agtgaccagg aggaaattga 2640
ttatgatgac accatctctg tggaaatgaa aaaggaggat tttgacatct atgatgagga 2700
tgagaaccag agccctagaa gcttccagaa aaagactaga cactacttca ttgctgcagt 2760
ggagagactc tgggattatg gcatgagctc cagcccccat gtgctgagaa atagagctca 2820
gagtggcagt gtgccacagt tcaagaaggt ggtgtttcag gagttcactg atggctcctt 2880
cacacaacca ctttacagag gagaactgaa tgagcacctg ggcctcctgg gcccctacat 2940
cagggctgaa gtggaggata acattatggt cacatttagg aatcaggctt ccagacccta 3000
ctccttttat tcctcactca tttcctatga ggaggaccag aggcagggag ctgagcccag 3060
aaaaaatttt gtgaaaccca atgaaaccaa gacctacttc tggaaggtgc agcaccatat 3120
ggcccctacc aaggatgaat ttgactgcaa ggcttgggct tacttttctg atgtggacct 3180
tgagaaagat gtgcattcag gcctcattgg gccactgctg gtgtgccaca ccaatacact 3240
gaaccctgct catgggagac aggtcacagt gcaggagttt gcactcttct ttaccatctt 3300
tgatgagacc aagtcctggt atttcactga gaacatggag aggaactgca gggccccttg 3360
taacatccag atggaggatc ccaccttcaa ggaaaactac agattccatg ccatcaatgg 3420
ctacatcatg gacaccctgc caggcctggt gatggcccag gaccagagga tcaggtggta 3480
cctcctgtct atgggcagca atgaaaatat ccacagcatt cacttctctg gacatgtgtt 3540
tactgtgagg aagaaggagg aatacaagat ggctctgtac aacctctacc ctggggtgtt 3600
tgaaacagtg gagatgctgc cctccaaggc tggcatctgg agagtggaat gtctgattgg 3660
ggagcatctg catgctggca tgagcacact gttcctggtg tattccaaca agtgccagac 3720
cccactgggc atggcctcag gacatatcag ggacttccag atcactgcta gtggacaata 3780
tggacagtgg gcacccaagc tggccagact gcactactca ggctccatca atgcctggag 3840
taccaaggag cccttcagct ggatcaaggt ggacctgctg gcccccatga ttatacatgg 3900
catcaagacc cagggagcta gacagaagtt cagctccctg tacatctccc aattcatcat 3960
catgtactct ctggatggca agaaatggca gacctacaga ggcaatagca ctggcaccct 4020
gatggtgttt tttggaaatg ttgactcttc tggcatcaag cacaacatct tcaacccccc 4080
catcattgcc agatatatca ggctccaccc cacccactac tccataagga gcaccctgag 4140
aatggagctg atgggctgtg acctgaattc ctgctccatg cccctgggca tggaatccaa 4200
ggcaatctct gatgcacaga tcacagcctc ctcctacttc accaacatgt ttgcaacctg 4260
gagcccctcc aaggccagac tgcacctgca gggcaggtcc aatgcttgga gaccacaagt 4320
gaacaaccca aaggagtggc tgcaggtgga cttccagaag accatgaaag tgactggagt 4380
gaccacccag ggagtgaaat ccctgctcac tagcatgtat gtgaaggaat tcctgatcag 4440
tagctctcaa gatggccacc agtggaccct gttcttccag aatggcaagg tgaaggtgtt 4500
tcagggcaac caggattcct tcacccctgt ggtgaatagc ctggatcccc cactgctgac 4560
cagatacctg agaatccacc cccagtcctg ggttcaccag attgccctga gaatggaggt 4620
gctgggctgt gaggcccagg acctgtactg aaataaaaga tctttatttt cattagatct 4680
gtgtgttggt tttttgtgtg aggaacccct agtgatggag ttggccactc cctctctgcg 4740
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4800
ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaa 4845
<210> 34
<211> 4970
<212> DNA
<213> Artificial sequence
<220>
<223> FVIII AAV construct (SEQ ID NO:1 from WO 2017/053677)
<400> 34
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgtttg ctgcttgcaa tgtttgccca ttttagggtg 180
gacacaggac gctgtggttt ctgagccagg gggcgactca gatcccagcc agtggactta 240
gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc 300
cccgttgccc ctctggatcc actgcttaaa tacggacgag gacagggccc tgtctcctca 360
gcttcaggca ccaccactga cctgggacag tgaatcgcca ccatgcagat tgagctgagc 420
acctgcttct tcctgtgcct gctgaggttc tgcttctctg ccaccaggag atactacctg 480
ggggctgtgg agctgagctg ggactacatg cagtctgacc tgggggagct gcctgtggat 540
gccaggttcc cccccagagt gcccaagagc ttccccttca acacctctgt ggtgtacaag 600
aagaccctgt ttgtggagtt cactgaccac ctgttcaaca ttgccaagcc caggcccccc 660
tggatgggcc tgctgggccc caccatccag gctgaggtgt atgacactgt ggtgatcacc 720
ctgaagaaca tggccagcca ccctgtgagc ctgcatgctg tgggggtgag ctactggaag 780
gcctctgagg gggctgagta tgatgaccag accagccaga gggagaagga ggatgacaag 840
gtgttccctg ggggcagcca cacctatgtg tggcaggtgc tgaaggagaa tggccccatg 900
gcctctgacc ccctgtgcct gacctacagc tacctgagcc atgtggacct ggtgaaggac 960
ctgaactctg gcctgattgg ggccctgctg gtgtgcaggg agggcagcct ggccaaggag 1020
aagacccaga ccctgcacaa gttcatcctg ctgtttgctg tgtttgatga gggcaagagc 1080
tggcactctg aaaccaagaa cagcctgatg caggacaggg atgctgcctc tgccagggcc 1140
tggcccaaga tgcacactgt gaatggctat gtgaacagga gcctgcctgg cctgattggc 1200
tgccacagga agtctgtgta ctggcatgtg attggcatgg gcaccacccc tgaggtgcac 1260
agcatcttcc tggagggcca caccttcctg gtcaggaacc acaggcaggc cagcctggag 1320
atcagcccca tcaccttcct gactgcccag accctgctga tggacctggg ccagttcctg 1380
ctgttctgcc acatcagcag ccaccagcat gatggcatgg aggcctatgt gaaggtggac 1440
agctgccctg aggagcccca gctgaggatg aagaacaatg aggaggctga ggactatgat 1500
gatgacctga ctgactctga gatggatgtg gtgaggtttg atgatgacaa cagccccagc 1560
ttcatccaga tcaggtctgt ggccaagaag caccccaaga cctgggtgca ctacattgct 1620
gctgaggagg aggactggga ctatgccccc ctggtgctgg cccctgatga caggagctac 1680
aagagccagt acctgaacaa tggcccccag aggattggca ggaagtacaa gaaggtcagg 1740
ttcatggcct acactgatga aaccttcaag accagggagg ccatccagca tgagtctggc 1800
atcctgggcc ccctgctgta tggggaggtg ggggacaccc tgctgatcat cttcaagaac 1860
caggccagca ggccctacaa catctacccc catggcatca ctgatgtgag gcccctgtac 1920
agcaggaggc tgcccaaggg ggtgaagcac ctgaaggact tccccatcct gcctggggag 1980
atcttcaagt acaagtggac tgtgactgtg gaggatggcc ccaccaagtc tgaccccagg 2040
tgcctgacca gatactacag cagctttgtg aacatggaga gggacctggc ctctggcctg 2100
attggccccc tgctgatctg ctacaaggag tctgtggacc agaggggcaa ccagatcatg 2160
tctgacaaga ggaatgtgat cctgttctct gtgtttgatg agaacaggag ctggtacctg 2220
actgagaaca tccagaggtt cctgcccaac cctgctgggg tgcagctgga ggaccctgag 2280
ttccaggcca gcaacatcat gcacagcatc aatggctatg tgtttgacag cctgcagctg 2340
tctgtgtgcc tgcatgaggt ggcctactgg tacatcctga gcattggggc ccagactgac 2400
ttcctgtctg tgttcttctc tggctacacc ttcaagcaca agatggtgta tgaggacacc 2460
ctgaccctgt tccccttctc tggggagact gtgttcatga gcatggagaa ccctggcctg 2520
tggattctgg gctgccacaa ctctgacttc aggaacaggg gcatgactgc cctgctgaaa 2580
gtctccagct gtgacaagaa cactggggac tactatgagg acagctatga ggacatctct 2640
gcctacctgc tgagcaagaa caatgccatt gagcccagga gcttcagcca gaacccccca 2700
gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag 2760
attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac 2820
gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct 2880
gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg 2940
gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc 3000
agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc 3060
tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg 3120
ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag 3180
cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac 3240
cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg 3300
gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac 3360
accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc 3420
atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc 3480
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc 3540
aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg 3600
tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat 3660
gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg 3720
gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg 3780
attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc 3840
cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc 3900
cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc 3960
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc 4020
catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc 4080
atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc 4140
accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac 4200
ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc 4260
ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag 4320
agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc 4380
acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc 4440
caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact 4500
ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg 4560
atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag 4620
gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg 4680
ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg 4740
gaggtgctgg gctgtgaggc ccaggacctg tactgaaata aaagatcttt attttcatta 4800
gatctgtgtg ttggtttttt gtgtgaggaa cccctagtga tggagttggc cactccctct 4860
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4920
gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 4970
<210> 35
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 65-96-106 amino acid sequence
<400> 35
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys Trp Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 36
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 26-65-96-106 amino acid sequence
<400> 36
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Trp Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys Trp Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 37
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 12SS-96-106 amino acid sequence
<400> 37
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Cys Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Cys Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 38
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 28SS-96-106 amino acid sequence
<400> 38
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Cys Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Cys Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 39
<211> 1394
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 31SS-96-106 amino acid sequence
<400> 39
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Cys Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Val Glu Met Lys Lys
725 730 735
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
740 745 750
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
755 760 765
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
770 775 780
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
785 790 795 800
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
805 810 815
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
820 825 830
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
835 840 845
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
850 855 860
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
865 870 875 880
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
885 890 895
Trp Ala Tyr Phe Ser Asp Val Asp Leu Cys Lys Asp Val His Ser Gly
900 905 910
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
915 920 925
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
930 935 940
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
945 950 955 960
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu
965 970 975
Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
980 985 990
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser
995 1000 1005
Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His
1010 1015 1020
Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr
1025 1030 1035
Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser
1040 1045 1050
Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu
1055 1060 1065
His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys
1070 1075 1080
Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln
1085 1090 1095
Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala
1100 1105 1110
Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu
1115 1120 1125
Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile
1130 1135 1140
His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu
1145 1150 1155
Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys
1160 1165 1170
Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1175 1180 1185
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn
1190 1195 1200
Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr
1205 1210 1215
Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1220 1225 1230
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser
1235 1240 1245
Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala
1250 1255 1260
Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser
1265 1270 1275
Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln
1280 1285 1290
Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln
1295 1300 1305
Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu
1310 1315 1320
Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln
1325 1330 1335
Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr
1340 1345 1350
Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu
1355 1360 1365
Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met
1370 1375 1380
Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1385 1390
<210> 40
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 65-SQ amino acid sequence
<400> 40
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys Trp Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 41
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 26-65-SQ amino acid sequence
<400> 41
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Trp Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys Trp Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 42
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 12SS-SQ amino acid sequence
<400> 42
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Cys Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Cys Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 43
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 28SS-SQ amino acid sequence
<400> 43
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Cys Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Cys Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 44
<211> 1438
<212> PRT
<213> Artificial sequence
<220>
<223> FVIII 31SS-SQ amino acid sequence
<400> 44
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Cys Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Cys Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 45
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acids 656-667 of SEQ ID NO:1
<400> 45
Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr
1 5 10
<210> 46
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acids 1823-1834 of SEQ ID NO:1
<400> 46
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
1 5 10
<210> 47
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of LK03 capsid
<400> 47
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 48
<211> 736
<212> PRT
<213> adeno-associated virus 6
<400> 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
Claims (25)
- 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서,
상기 인자 FVIII 아미노산 서열은 하나 이상의 치환 돌연변이를 포함하며, 상기 하나 이상의 치환 돌연변이는 SEQ ID NO: 1의 M662에 상응하는 아미노산의 치환을 포함하고, 상기 하나 이상의 치환 돌연변이는 M662C 치환을 포함하지 않는, 인자 VIII 폴리펩타이드. - 제1항에 있어서,
(i) 상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 높은 고유 활성도(specific activity)를 갖고/갖거나;
(ii) 상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 높은 안정성을 갖고/갖거나;
(iii) 상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 긴 반감기를 가지며, 선택적으로 상기 인자 VIII 폴리펩타이드는 활성화될 때의 기준 야생형 인자 VIII 폴리펩타이드와 비교하여 더 긴 반감기를 갖고/갖거나;
(iv) 상기 인자 VIII 폴리펩타이드는 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현되는,
인자 VIII 폴리펩타이드. - 제2항에 있어서,
상기 인자 VIII 폴리펩타이드는 상기 기준 인자 VIII 폴리펩타이드의 고유 활성도보다 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배, 적어도 5배, 또는 적어도 5.5배 더 높은 고유 활성도를 갖는, 인자 VIII 폴리펩타이드. - 제2항 또는 제3항에 있어서,
상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배의 더 긴 반감기를 갖고/갖거나 인자 VIII 폴리펩타이드는 활성화될 때의 상기 기준 야생형 인자 VIII 폴리펩타이드의 반감기의 적어도 1.1배, 적어도 1.2배, 적어도 1.5배, 적어도 1.7배, 적어도 1.8배, 적어도 2배, 적어도 2.2배, 적어도 2.5배, 적어도 2.8배 또는 적어도 3배의 활성화될 때의 반감기를 갖고, 선택적으로, 상기 더 긴 반감기는 혈장에서의 더 긴 반감기인, 인자 VIII 폴리펩타이드. - 제2항 내지 제4항 중 어느 한 항에 있어서,
(i) 발현되는 인자 VIII 폴리펩타이드의 수준은 숙주 세포에 의해 분비되는 FVIII 폴리펩타이드의 수준이며, 선택적으로 상기 숙주 세포는 인간 간 세포이고, 선택적으로 상기 인간 간 세포는 Huh7 세포이고/이거나;
(ii) 발현되는 인자 VIII 폴리펩타이드의 수준은 생체 내 발현인, 인자 VIII 폴리펩타이드. - 제2항 내지 제5항 중 어느 한 항에 있어서,
상기 인자 VIII 폴리펩타이드는 숙주 세포에서, 상기 인자 VIII 폴리펩타이드의 인자 VIII 아미노산 서열을 포함하지만 하나 이상의 치환 돌연변이를 포함하지 않는 기준 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도 및/또는 더 높은 안정성을 갖고/갖거나 더 높은 수준으로 발현되고, 선택적으로 상기 기준 인자 VIII 폴리펩타이드는 SEQ ID NO: 1, 3 또는 5의 인자 VIII 폴리펩타이드인, 인자 VIII 폴리펩타이드. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 하나 이상의 치환 돌연변이는 트립토판, 티로신, 이소류신, 류신 또는 페닐알라닌으로의 메티오닌의 치환을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제7항 중 어느 한 항에 있어서,
상기 하나 이상의 치환 돌연변이는 방향족 아미노산으로의 SEQ ID NO: 1의 M662에 상응하는 아미노산의 치환을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 하나 이상의 치환 돌연변이는 M662W 치환을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제9항 중 어느 한 항에 있어서,
상기 하나 이상의 치환 돌연변이는 M662W 및 H693W 치환을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제10항 중 어느 한 항에 있어서,
상기 하나 이상의 치환 돌연변이는 상기 인자 VIII 폴리펩타이드의 활성화를 저해하지 않는, 인자 VIII 폴리펩타이드. - 제1항 내지 제11항 중 어느 한 항에 있어서,
상기 인자 VIII 아미노산 서열은 SEQ ID NO: 1, 3 또는 5로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열, 또는 SEQ ID NO: 1, 3 또는 5의 적어도 1349개 아미노산을 포함하는 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제12항 중 어느 한 항에 있어서,
상기 인자 VIII 폴리펩타이드는 베타 도메인 결실(BDD: beta domain deleted) 인자 VIII 폴리펩타이드인, 인자 VIII 폴리펩타이드. - 제1항 내지 제13항 중 어느 한 항에 있어서,
상기 인자 VIII 아미노산 서열은 SEQ ID NO: 1의 위치 1 내지 731 및 1670 내지 2332에 상응하는 아미노산을 포함하는, 인자 VIII 폴리펩타이드. - 제1항 내지 제14항 중 어느 한 항에 있어서,
상기 인자 VIII 아미노산 서열은 SEQ ID NO: 28로 표시된 아미노산 서열, 또는 SEQ ID NO: 28로 표시된 아미노산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 포함하는, 인자 VIII 폴리펩타이드. - 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서,
상기 인자 VIII 아미노산 서열은
a. A1/A3 도메인 계면(interface);
b. A2/A3 도메인 계면; 또는
c. A1/C2 도메인 계면
으로 이루어진 군으로부터 선택되는 도메인 간(inter-domain) 계면에 하나 이상의 치환 돌연변이를 포함하고,
(i) 상기 하나 이상의 치환 돌연변이는 더 소수성 아미노산으로의 아미노산의 치환을 포함하거나;
(ii) 상기 하나 이상의 치환 돌연변이는 시스테인 잔기로의 각각의 도메인 내 아미노산 쌍의 치환을 포함하고;
(A) 상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 고유 활성도를 갖고/갖거나;
(B) 상기 인자 VIII 폴리펩타이드는 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 안정성을 갖고/갖거나;
(C) 상기 인자 VIII 폴리펩타이드는 숙주 세포에서 기준 야생형 인자 VIII 폴리펩타이드보다 더 높은 수준으로 발현되는, 인자 VIII 폴리펩타이드. - 인자 VIII 아미노산 서열을 포함하는 인자 VIII 폴리펩타이드로서,
상기 인자 VIII 아미노산 서열은
a. SEQ ID NO: 1의 M662 또는 H693에 상응하는 아미노산의 치환; 또는
b. 시스테인 잔기로의 제1 아미노산 및 제2 아미노산을 포함하는 아미노산의 쌍의 치환
으로 이루어진 군으로부터 선택되는 하나 이상의 치환 돌연변이를 포함하고,
i. 상기 제1 아미노산은 SEQ ID NO: 1의 M147, S149 또는 S289에 상응하고 상기 제2 아미노산은 SEQ ID NO: 1의 E1969, E1970 또는 N1977에 상응하거나;
ii. 상기 제1 아미노산은 SEQ ID NO: 1의 T667, T669, N684, L687, I689, S695 또는 F697에 상응하고 상기 제2 아미노산은 SEQ ID NO: 1의 S1791, G1799, A1800, R1803, E1844, S1949, G1981, V1982, 또는 Y1979에 상응하거나;
iii. 상기 제1 아미노산은 SEQ ID NO: 1의 A108, T118 또는 V137에 상응하고 상기 제2 아미노산은 SEQ ID NO: 1의 N2172, Q2329 또는 Y2332에 상응하는, 인자 VIII 폴리펩타이드. - 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드로서,
상기 인자 VIII 뉴클레오타이드 서열은 제1항 내지 제17항 중 어느 한 항에 따른 인자 VIII 폴리펩타이드를 인코딩하는, 폴리뉴클레오타이드. - 제18항에 있어서,
상기 인자 VIII 아미노산 서열을 인코딩하는 인자 VIII 뉴클레오타이드 서열은 SEQ ID NO: 31로 표시된 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열, 또는 SEQ ID NO: 31 또는 SEQ ID NO: 29의 적어도 4047개 뉴클레오타이드를 포함하는 뉴클레오타이드 서열과 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드. - 제18항 또는 제19항에 따른 인자 VIII 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함하는, 재조합 AAV 작제물.
- 제20항에 따른 재조합 AAV 작제물을 포함하는, AAV 바이러스 입자.
- 제1항 내지 제21항 중 어느 한 항에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 또는 AAV 바이러스 입자, 및 약학적으로 허용 가능한 부형제를 포함하는, 조성물.
- 치료 방법에 사용하기 위한, 제1항 내지 제22항 중 어느 한 항에 따른 인자 FVIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물.
- A형 혈우병의 치료 방법에 사용하기 위한, 제1항 내지 제22항 중 어느 한 항에 따른 인자 FVIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물로서, 상기 방법은 유효량의 제1항 내지 제22항 중 어느 한 항에 따른 인자 FVIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물을 환자에게 투여하는 단계를 포함하는, 사용하기 위한 인자 FVIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물, AAV 바이러스 입자 또는 조성물.
- A형 혈우병의 치료 방법으로서,
상기 방법은 유효량의 제1항 내지 제22항 중 어느 한 항에 따른 인자 VIII 폴리펩타이드, 폴리뉴클레오타이드, 재조합 AAV 작제물 AAV, AAV 바이러스 입자 또는 조성물을 환자에게 투여하는 단계를 포함하는, 방법.
Applications Claiming Priority (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1915953.2 | 2019-11-01 | ||
GBGB1915953.2A GB201915953D0 (en) | 2019-11-01 | 2019-11-01 | Transcription regulatory elements |
GB1915956.5 | 2019-11-01 | ||
GBGB1915956.5A GB201915956D0 (en) | 2019-11-01 | 2019-11-01 | Factor viii construct |
GBGB1915955.7A GB201915955D0 (en) | 2019-11-01 | 2019-11-01 | Factor VIII construct |
GB1915955.7 | 2019-11-01 | ||
GB1917926.6 | 2019-12-06 | ||
GB1917927.4 | 2019-12-06 | ||
GBGB1917926.6A GB201917926D0 (en) | 2019-12-06 | 2019-12-06 | Transcription regulatory elements |
GB1917925.8 | 2019-12-06 | ||
GBGB1917925.8A GB201917925D0 (en) | 2019-12-06 | 2019-12-06 | Factor VIII conctruct |
GBGB1917927.4A GB201917927D0 (en) | 2019-12-06 | 2019-12-06 | Factor VIII polypeptide |
GBGB2006250.1A GB202006250D0 (en) | 2020-04-28 | 2020-04-28 | Factor V111 construct |
GB2006250.1 | 2020-04-28 | ||
PCT/GB2020/052760 WO2021084275A1 (en) | 2019-11-01 | 2020-10-30 | Factor viii polypeptide |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220092583A true KR20220092583A (ko) | 2022-07-01 |
Family
ID=73131781
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227018508A KR20220092583A (ko) | 2019-11-01 | 2020-10-30 | 인자 viii 폴리펩타이드 |
KR1020227018499A KR20220093177A (ko) | 2019-11-01 | 2020-10-30 | 전사 조절 요소 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227018499A KR20220093177A (ko) | 2019-11-01 | 2020-10-30 | 전사 조절 요소 |
Country Status (9)
Country | Link |
---|---|
US (3) | US20220396610A1 (ko) |
EP (3) | EP4051705A2 (ko) |
JP (2) | JP2023501263A (ko) |
KR (2) | KR20220092583A (ko) |
CN (3) | CN114929735A (ko) |
AU (1) | AU2020375883A1 (ko) |
CA (1) | CA3158995A1 (ko) |
IL (1) | IL292627A (ko) |
WO (3) | WO2021084276A2 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202009741D0 (en) | 2020-06-25 | 2020-08-12 | Freeline Therapeutics Ltd | Polynucleotide |
GB202109231D0 (en) | 2021-06-25 | 2021-08-11 | Freeline Therapeutics Ltd | Promoter |
WO2023036054A2 (en) * | 2021-09-08 | 2023-03-16 | Inspirar Limited | Composition and method for treating hemophilia |
GB202205514D0 (en) | 2022-04-13 | 2022-05-25 | Freeline Therapeutics Ltd | Mechanical lysis |
WO2023211315A1 (en) * | 2022-04-28 | 2023-11-02 | Joint Stock Company "Biocad" | Isolated nucleic acid that encodes fusion protein based on fviii-bdd and on heterologous signal peptide |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999003496A1 (en) | 1997-07-21 | 1999-01-28 | The University Of North Carolina At Chapel Hill | Factor ix antihemophilic factor with increased clotting activity |
KR101190593B1 (ko) * | 2008-02-14 | 2013-03-08 | 재단법인 목암생명공학연구소 | 유전자 치료용 코딩 서열의 발현에 적합한 발현 벡터 |
EP2313502A4 (en) * | 2008-07-14 | 2012-04-04 | Uchicago Argonne Llc | METHODS FOR SYSTEMATICALLY CONTROLLING THE STABILITY OF A PROTEIN |
GB0911870D0 (en) * | 2009-07-08 | 2009-08-19 | Ucl Business Plc | Optimised coding sequence and promoter |
JP2013532176A (ja) * | 2010-07-15 | 2013-08-15 | ノヴォ ノルディスク アー/エス | 安定化させた第viii因子バリアント |
US8637448B2 (en) * | 2010-09-14 | 2014-01-28 | University Of Rochester | Recombinant factor VIII having enhanced stability following mutation at the A1-C2 domain interface |
ES2813698T3 (es) * | 2013-09-12 | 2021-03-24 | Biomarin Pharm Inc | Vectores de AAV que comprenden un gen que codifica el factor VIII |
GB201420139D0 (en) * | 2014-11-12 | 2014-12-24 | Ucl Business Plc | Factor IX gene therapy |
US20180030096A1 (en) * | 2015-02-03 | 2018-02-01 | University Of Florida Research Foundation, Inc. | Recombinant aav1, aav5, and aav6 capsid mutants and uses thereof |
EP3270944B1 (en) * | 2015-03-17 | 2019-10-23 | Vrije Universiteit Brussel | Optimized liver-specific expression systems for fviii and fix |
GB201508025D0 (en) | 2015-05-11 | 2015-06-24 | Ucl Business Plc | Fabry disease gene therapy |
TWI756185B (zh) * | 2015-09-24 | 2022-03-01 | 美商拜奧馬林製藥公司 | 腺相關病毒因子viii載體、相關病毒粒子及包含其之治療調配物 |
PE20231949A1 (es) * | 2015-10-30 | 2023-12-05 | Spark Therapeutics Inc | VARIANTES DEL FACTOR VIII REDUCIDO CON CpG, COMPOSICIONES Y METODOS Y USOS PARA EL TRATAMIENTO DE TRASTORNOS DE LA HEMOSTASIA |
SG10202106307UA (en) * | 2015-11-13 | 2021-07-29 | Takeda Pharmaceuticals Co | Viral vectors encoding recombinant fviii variants with increased expression for gene therapy of hemophilia a |
RU2762257C2 (ru) * | 2016-04-15 | 2021-12-17 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Генная терапия для лечения гемофилии a |
MX2019005693A (es) * | 2016-11-16 | 2019-08-14 | Bayer Healthcare Llc | Factor viii direccionado a los globulos rojos y metodo para su uso. |
US20200237930A1 (en) * | 2017-08-01 | 2020-07-30 | Spark Therapeutics, Inc. | Factor viii (fviii) gene therapy methods |
CA3088180A1 (en) * | 2018-01-12 | 2019-07-18 | Crispr Therapeutics Ag | Compositions and methods for gene editing by targeting transferrin |
IL296544A (en) | 2019-04-12 | 2022-11-01 | Freeline Therapeutics Ltd | Plasmid system |
-
2020
- 2020-10-30 CA CA3158995A patent/CA3158995A1/en active Pending
- 2020-10-30 EP EP20801385.4A patent/EP4051705A2/en not_active Withdrawn
- 2020-10-30 JP JP2022525555A patent/JP2023501263A/ja active Pending
- 2020-10-30 EP EP20801384.7A patent/EP4051704A2/en not_active Withdrawn
- 2020-10-30 WO PCT/GB2020/052761 patent/WO2021084276A2/en unknown
- 2020-10-30 WO PCT/GB2020/052760 patent/WO2021084275A1/en unknown
- 2020-10-30 US US17/772,806 patent/US20220396610A1/en active Pending
- 2020-10-30 US US17/772,816 patent/US20220396611A1/en active Pending
- 2020-10-30 CN CN202080091367.2A patent/CN114929735A/zh active Pending
- 2020-10-30 EP EP20801383.9A patent/EP4051703A1/en not_active Withdrawn
- 2020-10-30 KR KR1020227018508A patent/KR20220092583A/ko unknown
- 2020-10-30 US US17/772,763 patent/US20220387558A1/en active Pending
- 2020-10-30 WO PCT/GB2020/052762 patent/WO2021084277A2/en active Application Filing
- 2020-10-30 CN CN202080086201.1A patent/CN114829389A/zh active Pending
- 2020-10-30 JP JP2022525553A patent/JP2023501262A/ja active Pending
- 2020-10-30 AU AU2020375883A patent/AU2020375883A1/en not_active Abandoned
- 2020-10-30 CN CN202080091364.9A patent/CN114901686A/zh active Pending
- 2020-10-30 KR KR1020227018499A patent/KR20220093177A/ko unknown
-
2022
- 2022-04-28 IL IL292627A patent/IL292627A/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2021084277A2 (en) | 2021-05-06 |
EP4051704A2 (en) | 2022-09-07 |
EP4051703A1 (en) | 2022-09-07 |
WO2021084277A3 (en) | 2021-07-22 |
US20220387558A1 (en) | 2022-12-08 |
US20220396610A1 (en) | 2022-12-15 |
WO2021084276A2 (en) | 2021-05-06 |
CN114901686A (zh) | 2022-08-12 |
CA3158995A1 (en) | 2021-05-06 |
EP4051705A2 (en) | 2022-09-07 |
WO2021084275A1 (en) | 2021-05-06 |
KR20220093177A (ko) | 2022-07-05 |
US20220396611A1 (en) | 2022-12-15 |
AU2020375883A1 (en) | 2022-05-19 |
CN114829389A (zh) | 2022-07-29 |
JP2023501262A (ja) | 2023-01-18 |
JP2023501263A (ja) | 2023-01-18 |
IL292627A (en) | 2022-07-01 |
WO2021084276A3 (en) | 2021-07-22 |
CN114929735A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7069258B2 (ja) | 組換えfviii変異型をコードする血友病a遺伝子治療用高発現ウイルスベクター | |
KR20220092583A (ko) | 인자 viii 폴리펩타이드 | |
KR102665348B1 (ko) | 지혈 장애의 치료를 위한 변이체 인자 viii의 패키징 및 발현을 위한 개선된 발현 카세트 | |
JP6961171B2 (ja) | 血友病bの遺伝子治療のための、発現の増加を伴う組換えfixをコードするウイルスベクター | |
US20220144919A1 (en) | Mutant factor viii compositions and methods | |
WO2008127654A2 (en) | Methods and compositions for intra-articular coagulation proteins | |
TW201723180A (zh) | 用於a型血友病基因治療之編碼表現增加之重組fviii變異體之病毒載體 | |
KR20210049129A (ko) | 인자 ix를 코딩하는 뉴클레오타이드 | |
CA2462966A1 (en) | Factor viii c2 domain variants | |
JP2021530524A (ja) | 発現が増強された組換えfviii変異体をコードするウイルスベクターを使用する血友病aの遺伝子療法 | |
US20210093735A1 (en) | Methods and compositions for treatment of hemophilia | |
JP2022531664A (ja) | 一本鎖第viii因子分子 | |
US11795207B2 (en) | Modified plasma clotting factor VIII and method of use thereof | |
WO2011011841A1 (en) | Human blood coagulation factor ix recombinant protein, composition, use of a factor ix recombinant protein, use of a composition, method of obtaining human blood coagulation factor ix recombinant protein and use of the factor ix recombinant protein | |
US20210395714A1 (en) | Modified factor ix polypeptides | |
WO2022211791A1 (en) | Modified plasma clotting factor viii and method of use thereof | |
EA047630B1 (ru) | Вирусные векторы, кодирующие рекомбинантные варианты fviii с повышенной экспрессией для генной терапии гемофилии а |