KR20080031024A - 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 - Google Patents

폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 Download PDF

Info

Publication number
KR20080031024A
KR20080031024A KR1020087001691A KR20087001691A KR20080031024A KR 20080031024 A KR20080031024 A KR 20080031024A KR 1020087001691 A KR1020087001691 A KR 1020087001691A KR 20087001691 A KR20087001691 A KR 20087001691A KR 20080031024 A KR20080031024 A KR 20080031024A
Authority
KR
South Korea
Prior art keywords
protein
nucleic acid
sequence
polypeptide
cleavage site
Prior art date
Application number
KR1020087001691A
Other languages
English (en)
Inventor
제럴드 알 카슨
웬디 지온
조헨 게 살펠트
지지에 구
딘 에이 레기어
윤 쿤스
Original Assignee
아보트 러보러터리즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아보트 러보러터리즈 filed Critical 아보트 러보러터리즈
Publication of KR20080031024A publication Critical patent/KR20080031024A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

재조합 숙주 세포 내에서 프로세싱되는 1차 해독 산물을 사용하여 단백질을 발현시키기 위한 유용한 작제물 및 방법이 공개된다. 단일 개방 판독 프레임(sORF)을 포함하는 작제물은 다중 폴리펩티드의 발현을 포함하는 단백질 발현을 위하여 기술된다. 1차 해독 산물(프로단백질 또는 폴리단백질)은, 관심대상의 다수의 단백질 서브유닛 사이에 프레임내 삽입된, 인테인 또는 헤지호그 계열 자가프로세싱 도메인과 같은 폴리펩티드, 또는 이의 변이체를 함유한다. 1차 산물은 또한, 2개 이상의 다중 단백질 서브유닛을 분리시키는, 다른 단백질분해 절단 또는 프로테아제 인식 부위와 같은 절단 서열, 또는 시그날 펩티다제에 대한 인식 서열을 함유하는 시그날 펩티드를 함유할 수 있다. 삽입된 자가프로세싱 폴리펩티드 또는 절단 부위의 서열을 조작하여, 별도의 다중 단백질 서브유닛의 발현 효율성을 향상시킬 수 있다. 면역글로불린과 같은 단백질의 효율적인 발현, 분비 및/또는 다량체 어셈블리를 수행하는 독립적인 양상이 또한 공개된다. 폴리단백질이 면역글로불린 중쇄 및 경쇄 단편 또는 항원을 인식할 수 있는 단편을 함유하는 경우, 한가지 양태에서, 선택가능한 화학량론 비는 중쇄 단편 당 2 카피 이상의 경쇄 단편이고, 적당하게 폴딩되고 어셈블리된 기능성 항체가 생성된다. 면역글로불린 경쇄 유래의 것을 포함하는 변형된 시그날 펩티드가 기술된다.
단일 개방 판독 프레임, 프로단백질, 폴리단백질, 인테인, 시그날 펩티드, 자가프로세싱

Description

폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF 작제물 포함 다중 유전자 발현 및 방법{Multiple gene expression including sORF constructs and methods with polyproteins, pro-proteins, and proteolysis}
관련 출원에 대한 상호 참조
본 출원은 그 전문이 본원에 참조로서 인용된 2005년 7월 21일자 미국 가출원 제60/701855호의 이익을 주장한다.
연방정부 후원 연구 또는 개발에 관한 내역
해당사항 없음
서열 목록, 표, 또는 컴퓨터 프로그램 목록 컴팩트 디스크 첨부물에 대한 참조
해당사항 없음 (서열 목록이 제공되지만 컴팩트 디스크 첨부물로서 제공되지 않음)
본 발명의 분야는 분자 생물학이고, 특히 일반적으로 재조합 단백질 발현 분 야, 및 구체적으로 재조합 폴리단백질 또는 프리단백질(pre-protein)의 발현 및 프로세싱 (예: 해독후 프로세싱)에 관한 것이다.
진단 도구 및 치료 양식으로서 항체는 최근 몇 년 동안 용도가 증가하고 있다. FDA 승인을 받은 최초의 모노클로날 항체인 OKT3[판매원: Johnson and Johnson]은 신장 이식 거부반응 환자의 치료용으로 승인되었다. 전이성 유방암 환자 치료용 사람화 모노클로날 항체인 허셉틴(Herceptin; Genentech Inc. (South San Francisco, CA)의 등록상표)은 1998년에 승인되었다. 많은 항체-기반 치료법은 다양한 임상 개발 단계에서 장래성을 보이고 있다. 항체 기술의 광범위한 임상 적용에 있어 한가지 한계는, 통상적으로 다량의 항체가 치료학적 효능을 위하여 필요하다는 것과 충분한 생산과 관련된 비용이 상당하다는 것이다. 중국 햄스터 난소 (CHO) 세포 및 NS0 골수종 세포는 항체 및 다른 생물치료제(biotherapeutics)와 같은 글리코실화된 사람 단백질의 상업적 규모의 생산을 위하여 가장 일반적으로 사용되는 포유동물 세포주이다[참조: Humphreys and Glover 2001. Curr. Opin. Drug Discov. Devel. 4:172-85]. 포유동물 세포주 생산 수율은 통상적으로 배치 발효기(batch fermentor)에서 5 내지 7일 배양하는 경우 50 내지 250mg/L, 또는 페드-배치(fed batch) 발효기에서 7 내지 12일 동안 300 내지 600mg/L의 범위이다. 비글리코실화 면역글로불린 단백질은 효모 또는 이.콜라이(E. coli)에서 성공적으로 생산할 수 있지만[참조: Humphreys DP, et al., 2000, Protein Expr Purif. 20(2):252-64], 세균 발현 시스템에서 가장 성공적인 것은 항체 단편의 경우이다[참조: Humphreys, D.P. 2003. Curr. Opin. Drug Discov. Devel. 2003 6:188-96].
다중 유전자 단편 또는 유전자의 발현 분야에서 중요한 발전은 인테인(intein)의 발견이었다[참조: Hirata, R et al., 1990, J. Biol. Chem. 265:6726-6733; Kane, PM et al., 1990, Science 250:, 651-657; Xu, M-Q and Perler, FB, 1996, EMBO Journal 15(19):5146-5153]. 인테인은 유전자 인트론의 단백질 등가물이라고 생각되며 단백질 스플라이싱을 촉진한다. 스넬 케이(Snell K.)에 의해 미국특허 제US 7026526호에 언급된 바와 같이, 단백질 스플라이싱은 전구체 단백질의 내부 영역(인테인)을 잘라내고 단백질의 플랭킹(flanking) 영역 (엑스테인(extein))을 연결하여 성숙한 단백질을 형성하는 과정이다. 이 과정은 원핵생물 및 진핵생물로부터 많은 단백질에서 관찰되었다[참조: Perler, F. B., Xu, M. Q., Paulus, H. Current Opinion in Chemical Biology 1997, 1, 292-299; Perler, F. B. Nucleic Acids Research 1999, 27, 346-347]. 인테인 단위는 단백질 스플라이싱을 촉매하는데 필요한 필수 구성요소를 함유하고 종종 인테인 이동성에 관여하는 엔도뉴클레아제 도메인을 함유한다[참조: Perler, F. B., et al., Nucleic Acids Research 1994, 22, 1127-1127].
인테인-기반 시스템의 주요 초점은 정제 기술 및 유전자 단편의 발현으로부터의 새로운 융합 단백질의 생성에 있었지만, 미국특허 제US 7026526호에는, 다중 유전자 산물을 분리된 단백질로서 발현하여 식물에서 중첩 형질을 달성하는 변형된 인테인을 갖는 DNA 작제물이 보고되어 있다. 하지만, 이러한 시스템이 기능성 다량체 단백질로 어셈블리되는 개개의 단백질, 세포외로 분비되는 단백질, 포유동물 단백질, 또는 진핵생물 숙주 세포에서 생산되는 단백질의 발현에 성공적으로 사용 될 수 있다는 증거가 아직 부족하다. 면역글로불린은 이러한 범주에 모두 속한다는 것을 주목할 만하다.
미국특허 제US 7026526호의 변형된 인테인 접근법을 다른 유전자 또는 목적으로 확장시키는데 있어 어려움을 심화시키는 것은, 관련된 인테인 시스템에 대한 목적하는 엑스테인 유전자 단편의 기여의 잠재적인 중요성의 인식이다. 폴러스(Paulus)는 "사실, 단백질 스플라이싱이 전적으로 인테인에 의해 촉매되더라도, 엑스테인 서열에 의해 현저하게 영향을 받을 수 있다"라고 보고한다. 이 영향은, 인테인 서열이 외래 암호화 서열 사이에 프레임내(in-frame) 삽입된, 키메릭(chimeric) 단백질 스플라이싱 시스템의 발현이 종종 상당한 부반응 (예: 상류 또는 하류 스플라이스 접합점에서의 절단)으로 이어진다는 사실로서 밝혀진다[참조: Xu M-Q, et al., 1993, Cell 75:1371-77; 및 Shingledecker K, et al., 1998, Gene 207:187-95]. 이것은 부반응 없이 단백질 스플라이싱에 최적인 구조를 추정하는 인테인의 능력은 특이적인 엑스테인과 관련하여 진화되었다는 것을 시사한다[참조: Paulus H, 2000, Protein splicing and related forms of protein autoprocessing, Annu. Rev. Biochem. 69:447-96]. 또다른 논평자는 다음과 같이 말한다: "합리적인 설계를 사용하여 바람직한 특성 및 활성을 단백질에 도입시키는 것이 가능하더라도, 조작된 산물을 효율적이고 실용적으로 만드는데 필요한 미묘한 변화는 종종 우리의 예측 능력을 넘어선다[참조: Shao, Z. and Arnold, F.H. 1996. Curr. Opin. Struct. Biol. 6, 513-518]. ...그럼에도 불구하고, 인테인의 바로 측면에 위치하는 영역은 스플라이싱의 효율에 영향을 주는 것으로 밝혀졌고[참조: Chong, S. et al., 1998, Nucleic Acids Res. 26, 5109-5115; Southworth, M.W. et al., 199, Biotechniques 27, 110-114], 일부 단백질 숙주는 인테인 활성에 적합하지 않을 수 있다. 높은 발현 및 산물 순도가 중요한 고려사항이지만, 최종 산물이 불활성이면 이들은 의미가 없다."[참조: Amitai G and Pietrokovski, 1999, Nature Biotechnology 17:854-855].
그러므로, 재연결 없이 절단되는 것이 바람직한 결과인 변형된 인테인 시스템에서, 주어진 인테인 서열에 대한 외래 엑스테인의 존재는 정확한 절단의 실제로 효율적인 조합, 재연결의 부재, 및 부반응의 부재에 영향을 줄 수 있다. 분명히, 최종 산물로서 기능적 활성을 보유하는 특정 단백질 (예: 면역글로불린 및 다른 생물치료제)의 재조합 생산을 위한 변형된 인테인 접근법의 적용은 혁신을 위한 실질적인 도전을 대표한다.
본 발명에서 이 도전은 인테인-기반 시스템을 위해서만 시작된 것이 아니라 헤지호그(hedgehog) 도메인에 관한 유용한 적용을 위한 선구적인 의미에서 탐구되었다. 헤지호그 계열의 단백질은 척추동물 배아의 패턴형성에 필수적인 세포간 시그날전달 분자이다[참조: Mann, R.K. and Beachy, P.A. (2000) Biochim. Biophys. Acta. 1529, 188-202; Beachy, PA, (1997) Cold Spring Harb Symp Quant Biol 62: 191-204]. 천연 헤지호그 전구체 단백질은 단백질 스플라이싱과 유사한 자가프로세싱 반응에 의해 C-말단(Hh-C) 및 N-말단 단편(Hh-N)으로 절단된다. 헤지호그 시스템은, 다수의 분리된 단백질 단편의 발현에 적당한 변형된 버전을 포함하는 시스템의 창의적인 개발을 위한 미검사된 기회를 제시한다.
단일 벡터를 사용하여 재조합 DNA 기술을 통해 전체 길이 항체/면역글로불린 분자를 발현시키려는 이전의 시도는 제한적으로 성공하였고, 통상적으로 항체/면역글로불린 분자의 중쇄 및 경쇄가 상당히 상이한 수준으로 발현되었으며, 보다 특히, 제2의 유전자가 낮은 수준으로 발현되었다. 다른 요소는, 적절하게 어셈블리된 다량체 항체 또는 이의 기능성 단편의 최적 생산을 위하여, 다른 쇄와 비교하여 하나의 쇄의 상대적으로 높은 발현 수준을 요구할 수 있다. 따라서 한가지 문제는, 어셈블리된 다량체 항체의 수율을 전체적으로 낮추는 세포 내에서의 중쇄 및 경쇄의 발현의 차선의(suboptimal) 화학량론(stoichiometry)이다. 팡(Fang) 등은 단일 벡터로부터 충분히 생물학적으로 기능성인 항체를 높은 수준으로 발현시키기 위해서는 중쇄와 경쇄의 등몰량 발현이 필요하다는 것을 지적하였다[참조: Fang et al., 2005, Nature Biotechnology 23:584-590; 미국 특허원 제2004/0265955A1호]. 또한, 독립적으로 다수의 폴리펩티드를 발현하는 벡터 시스템에 의존하는 통상적인 발현 시스템은 프로모터 상호작용(예: 프로모터 간섭)과 같은 요인에 의해 상당히 영향을 받는다. 이러한 상호작용은 유전자의 효율적인 발현 및/또는 발현된 쇄의 어셈블리를 손상시키거나, 하나 이상의 벡터의 사용을 요구할 수 있다[참조: 미국 특허 제6331415호, Cabilly et al.]. 다수의 벡터의 요구는, 일반적으로 추가적인 조작이 필요하다는 것 이외에 하나 이상의 개개의 벡터의 손실과 같은 잠재적인 문제로 인해 불리하다.
단일 벡터로부터 2개 이상의 암호화 서열을 발현시키는 능력을 제한하는 다른 요인에는 벡터 자체의 패키징(packaging) 능력이 포함된다. 예를 들면, 적당한 벡터/암호화 서열을 고려하는데 있어서, 고려되는 요인에는 벡터의 패키징 능력 (예: 아데노-관련 바이러스(AAV)의 경우 대략 4,500bp); 벡터-형질감염된 세포 또는 기관에 의한 재조합 단백질의 시험관내/생체내 발현의 지속기간 (예: 아데노바이러스 벡터의 경우 단기간 발현); 바이러스 벡터를 사용하는 경우 벡터에 의한 효율적인 감염을 지원하는 세포 유형; 및 유전자 산물(들)의 목적하는 발현 수준이 포함된다. 2개 이상의 유전자 산물의 제어 발현을 위한 필요조건과 함께 아데노바이러스 및 AAV와 같은 바이러스 벡터의 패키징 한계는, 면역글로불린 또는 이의 단편과 같은 특정 유전자의 발현을 위한 벡터 작제 및 시스템에 대한 선택을 제한한다.
단일 벡터로부터 2개 이상의 단백질 또는 폴리펩티드 서열을 발현시키는 추가적인 접근법에서, 2개 이상의 프로모터 또는 단일 프로모터 및 관심 대상의 암호화 서열 사이의 내부 리보좀 진입 부위(IRES)를 사용하여 개개의 암호화 서열이 발현되게 한다. 단일 벡터 내에 2개의 프로모터를 사용하면 프로모터 간섭으로 인해 단백질 발현이 감소될 수 있다. 2개의 암호화 서열이 IRES 서열에 의해 분리된 경우, 두번째 암호화 서열의 해독적 발현은 종종 첫번째의 것보다 상당히 약하다[참조: Furler et al. 2001. Gene Therapy 8:864-873]. 미국 특허원 제2004/0241821호에는, 이종성(heterologous) 암호화 서열을 바이러스 폴리단백질 암호화 서열의 하류에 통합시키고, 이로부터 IRES에 의해 분리시킨 플라비바이러스(flavivirus) 벡터가 기술되어 있다. 단편이 프로테아제 인식 부위에 의해 분리된 융합 단백질을 포함하는, 재조합 유전자 발현을 위한 핵-고정된(nuclear-anchored) 벡터 전략 은 미국 특허원 제2005/0026137호에 기술되어 있다.
단일 개방 판독 프레임(sORF; Single Open Reading Frame) 내에 폴리단백질의 형태로 단백질이 연결되어 있는 것은 피코르나바이러스과(picornaviridae)를 포함하는 많은 천연 바이러스의 복제에서 관찰되는 전략이다. 해독시, 바이러스-암호화된 프로테이나제가 폴리단백질의 신속한 분자내 (cis) 절단을 매개하여, 분리된 성숙한 단백질 산물을 생성한다. 구제역 바이러스(FMDV)는 피코르나바이러스과에 속하는 그룹으로서, 대략 225 kD의 폴리단백질을 암호화하는 단일의 긴 개방 판독 프레임을 발현한다. 전체 길이 해독 산물은 캡시드 단백질 전구체(P1-2A)와 폴리단백질 2BC 및 P3의 복제 도메인 사이에 존재하는 2A 영역의 C-말단에서 신속한 분자내 (cis) 절단이 일어나고, 이 절단은 2A 영역 그 자체에 의해 리보좀 스터터(stutter) 메커니즘을 통해 매개된다[참조: Ryan et al. 1991. J. Gen. Virol. 72:2727-2732; Vakharia et al. 1987. J. Virol. 61:3199-3207]. FMDV 2A 영역에 의한 절단 활성의 발현을 위한 필수 아미노산 잔기가 확인되었다. 2A 및 유사한 도메인 역시 피코르나바이러스 계열의 아프토바이러스과(aphthoviridae) 및 카르디오바이러스과(cardioviridae)로부터 특성규명되었다[참조: Donnelly et al. 1997. J. Gen. Virol. 78:13-21].
단백질분해 프로세싱 기술을 사용하기 위한 또다른 시도에서, 재조합 인슐린 생산의 초기 기술에는, 예를 들면, EP055945 (Genentech) 및 EP037723 (The Regents of the University of California)이 포함된다. 하지만, 이러한 노력을 면역글로불린과 같은 훨씬 크고 복잡한 기능성 단백질의 재조합 발현을 이용하는 것과 관련하여 적용할 수 있는 것은 대단한 도약이다. 기능성 항체 분자의 예에는 4개 이상의 쇄 (예: 2개의 면역글로불린 중쇄 및 2개의 경쇄)의 어셈블리를 요구하는 이종다량체(heteromultimer)가 포함될 수 있다.
재조합 단백질을 생성하기 위한 대안적이고/이거나 개선된 발현 시스템에 대한 필요성이 남아있다. 현재 이용가능한 기술에 비해 이점을 제공하는 전체 길이 면역글로불린 및 이의 항원-결합 단편의 효율적이고/이거나 정확한 발현의 분야에 특정 필요성이 반영되어 있다. 본 발명은 인테인, 헤지호그 자가프로세싱 단편, 자가촉매성 바이러스 프로테아제, 및 이의 변형물과 같은 다양한 전략을 각각 사용하여 단일 벡터 작제물을 제공함으로써 상기 필요성을 해결한다. 독립적으로, 효율적인 다량체 (예: 면역글로불린) 어셈블리의 필요성은 서브유닛 (예: 중쇄 및 경쇄 또는 이의 단편)의 화학량론 관계를 조절하여 해결한다. 일부 양태에서, sORF 내의 작제물은 효소, 면역글로불린, 사이토카인, 케모카인, 수용체, 호르몬, 이중 하이브리드 시스템(two hybrid system)의 구성요소, 또는 관심대상의 다른 다중-서브유닛 단백질과 같은 산업적 또는 생물학적 기능성 폴리펩티드의 발현을 위한 자가 프로세싱 펩티드 구성요소를 암호화한다.
발명의 요약
본 발명은 재조합 폴리단백질 및 프리단백질의 재조합 발현 및 프로세싱 (예: 해독후 프로세싱)을 위한 발현 카세트, 벡터, 재조합 숙주 세포 및 방법을 제공한다.
한가지 양태에서, 본 발명은 sORF 삽입체를 포함하는 하나 이상의 재조합 단백질 산물을 생성하기 위한 발현 벡터를 제공하고; 상기 sORF 삽입체는 제1의 폴리펩티드를 암호화하는 제1의 핵산 서열, 제1의 단백질 절단 부위를 암호화하는 개재(intervening) 핵산 서열, 및 제2의 폴리펩티드를 암호화하는 제2의 핵산 서열을 포함하고; 이때 상기 제1의 단백질 절단 부위를 암호화하는 상기 개재 핵산 서열은 상기 제1의 핵산 서열과 상기 제2의 핵산 서열 사이에 작동가능하게(operably) 위치하고; 이때 상기 발현 벡터는 상기 제1의 단백질 절단 부위에서 절단가능한 sORF 폴리펩티드를 발현할 수 있다. 한가지 양태에서, 제1의 단백질 절단 부위는 자가 프로세싱 절단 부위를 포함한다. 한가지 양태에서, 자가 프로세싱 절단 부위는 인테인 단편 또는 변형된 인테인 단편을 포함하고, 이때 변형된 (또는 비변형) 인테인 단편은 절단이 일어나게 하지만 발현된 제1의 폴리펩티드를 발현된 제2의 폴리펩티드에 완전히 연결시키지 않는다. 한가지 양태에서, 자가 프로세싱 절단 부위는 헤지호그 단편 또는 변형된 헤지호그 단편을 포함하고, 이때 변형된 (또는 비변형) 헤지호그 단편은 발현된 제1의 폴리펩티드 및 발현된 제2의 폴리펩티드의 절단이 일어나게 한다. 한가지 양태에서, 다수의 분리된 단백질 (예: 제1의 폴리펩티드, 제2의 폴리펩티드, 제3의 폴리펩티드 등)이 발현된다. 한가지 양태에서, 제1의 폴리펩티드 및 제2의 폴리펩티드는 다량체 어셈블리가 가능하다. 한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 세포외 분비가 가능하다. 한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 포유동물 기원이다. 한가지 양태에서, 어셈블리된 항체를 생성하는 벡터 및 방법이 제공된다.
일부 양태에서, 본 발명은 다수의 분리된 단백질의 재조합 발현을 위한 작제물 및 방법을 제공한다. 특정 양태에서, 단백질은 세포외 분비가 가능하다. 특정 양태에서, 단백질은 포유동물 기원이다. 특정 양태에서, 단백질은 다량체 어셈블리가 가능하다. 특정 양태에서, 단백질은 면역글로불린이다.
한가지 양태에서, 드로소필라(drosophila), 마우스, 사람 및 다른 종 유래의 인테인, 헤지호그의 C-말단 자가프로세싱 도메인을 포함하는, 프로테아제 인식 부위, 절단가능한 시그날 펩티드 또는 자가프로세싱 폴리펩티드 서열이 포함된다[참조: Dassa et al. Trends in Genetics, Vol. 20 No. 11 Nov, 2004, 538-542; Ibrahim et al, Biochimica et Biophysics Acta 1760 (2006) 347-355]. 일부 예에서 자가프로세싱 폴리펩티드 서열은 단백질분해 프로세싱과 관련하여 단백질분해 부위로 지칭될 수 있다는 점을 주의하여야 한다. 워트호그(warthog), 그라운드호그(groundhog) 및, 카에노하브디티스 엘레간스(Caenorhabditis elegans)와 같은 선충 유래의 다른 호그 함유 유전자의 C-말단 자가프로세싱 도메인[참조: Snell EA et al, Proc. R. Soc. B (2006) 273, 401-407; Aspock et al, Genome Research, 1999, 9:909-923]; 및 입금편모충류(choanoflagellate) 유래의 호그렛(Hoglet)-C 자가프로세싱 도메인[참조: Aspock et al, Genome Research, 1999, 9:909-923]이 사용된다. 재조합 프리단백질 서열 속의 야생형, 절두된(truncated), 또는 달리 변형된 형태의, 클로스트리디움 써모셀룸(Clostridium thermocellum)과 같은 세균으로부터 유래한 것과 같은 A-형 세균 인테인-유사 (BIL) 도메인, 및 로도박터 스 페로이데스(Rhodobacter sphaeroides)와 같은 세균 유래의 B-형 BIL 도메인[참조: Dassa et al, Journal of Biological Chemistry, Vol. 279, No. 31, July 30, 32001-32007]은, 프로단백질의 효율적인 발현 및 절단을 가능하게 하여 생활성(bioactive) 부분이 방출되게 하거나 폴리단백질 내에 발현된 목적하는 단백질이 방출되게 한다. 상기 양태는 프로단백질의 천연 단백질분해 프로세싱 효소의 공동-발현(co-expression)에 대한 필요성을 제거한다. 대안으로, 특정 인식 부위에 대한 프로테아제 동족(cognate)을 프리단백질 서열과 함께, 이 사이에 있는 프로테아제 인식 부위와 함께 동일한 시공간에 발현시켜, 프로테아제가 단백질분해 작용을 통해 방출될 수 있게 하고 나서 프리단백질의 전구체 부분이 이 후의 단백질분해 절단에 의해 방출되게 하고, 프리단백질의 활성 부분이 방출되게 할 수 있다. 추가적인 양태에서, 2A 자가가수분해 프로세싱 펩티드 서열을 성숙한 (생활성) 부분과 전구체 단백질 사이에 프리단백질 내로 조작하여, 발현 후 조작된 재조합 단백질의 자가 프로세싱이 일어나게 할 수 있다.
본 발명의 또다른 양태에서, 본 발명은 하나 이상의 중쇄 영역 및 하나 이상의 경쇄 영역을 포함하는 폴리단백질을 재조합에 의해 발현시켜, 재조합 면역글로불린 분자를 효율적으로 발현시키는 방법을 제공하고, 이때 상기 영역은 하나 이상의 프로테아제 인식 부위, 시그날 펩티드, 절단을 매개하지만 폴리펩티드의 연결은 매개하지 않는 인테인 서열, 헤지호그 서열, 다른 인테인-유사 또는 헤지호그-유사 자가프로세싱 서열 또는 이의 변이체에 의해 분리되거나 또는 해독되는 동안에 플랭킹 펩티드를 분리시키는 2A 펩티드와 같은 서열에 의해 분리된다. 추가적인 양 태에서, 프로테아제는 폴리단백질의 일부로서 발현되어, 프로테아제 인식 부위에 의해 폴리단백질의 나머지로부터 분리될 수 있고, 이때 각각의 프로테아제 인식 부위는 동시에 발현되는 프로테아제에 대한 동족이다. 이어서, 단백질분해 또는 시그날 펩티다제 작용은 프로테아제 및 다른 개개의 단백질을 1차 해독 산물로부터 방출시킨다. 폴리단백질 내의 단백질 서브유닛을 분리시키는 상기 방법을 또한 함께 사용하여 목적하는 절단 및 단백질 발현 결과를 달성할 수 있다.
면역글로불린 발현의 양태의 경우에서, 경쇄 암호화 영역의 복제는, 경쇄 암호화 영역이 발현 카세트 및/또는 발현 벡터에 1:1 비로 중쇄 암호화 영역과 함께 존재하는 상황에서, 개선된 어셈블리 및/또는 완전한 면역글로불린 단백질의 발현이 일어나게 한다. 본 발명과 관련하여, 중쇄 및 경쇄 단백질은 천연 중쇄 및 경쇄의 기능성 단편일 수 있다 (당업계에 익히 공지된 바와 같이, 기능성 단편은 이의 상대 항체 쇄에 결합하는 능력을 보유하고, 동족 항체에 결합하는 능력도 보유한다). 따라서 본 발명은 중쇄 구성요소에 대한 경쇄 구성요소의 암호화 영역 비가 1:1이거나 1:1 보다 큰 작제물 및 방법을 제공한다. 예를 들면, 한가지 양태에서 L:H 비는 2:1이거나 2:1 보다 크고; 다른 양태에서 비는 3:1, 3:2, 4:1이거나 4:1 보다 크다.
본 발명의 바람직한 양상에서, 경쇄 면역글로불린 암호화 서열, 또는 이의 구성요소 단편은 폴리단백질 암호화 서열 내에서 복제되고, 중쇄 및 경쇄 면역글로불린 암호화 서열은 약 2개의 경쇄 대 약 1개의 중쇄의 몰 비로 존재하고, 1:1 경쇄:중쇄 이상의 비로 발현된다. 경쇄 및 중쇄 서열은 프로테아제 절단 부위, 시그 날 (또는 리더) 펩티드, 인테인 또는 자가프로세싱 부위에 의해 폴리단백질에서 연결된다.
프로테아제(엔도프로테아제) 및 시그날 펩티다제 및 이들의 인식 부위의 아미노산 서열은 폴리단백질 해독 산물 내에서 생물학적 활성 단백질의 구성요소를 분리시키는데 유용하고, 이들의 인식 서열에는, 푸린(furin), RXR/K-R (서열번호 1); IPNV의 VP4, S/TXA-S/AG (서열번호 2); 담배 식각 바이러스(TEV; Tobacco Etch Virus) 프로테아제, EXXYXQ-G (서열번호 3); 라이노바이러스(rhinovirus)의 3C 프로테아제, LEVLFQ-GP (서열번호 4); PC5/6 프로테아제; PACE 프로테아제, LPC/PC7 프로테아제; 엔테로키나제, DDDDK-X (서열번호 5); 인자 Xa 프로테아제, IE/DGR-X (서열번호 6); 트롬빈, LVPR-GS (서열번호 7); 게네나제 I, PGAAH-Y (서열번호 8); 및 MMP 프로테아제; 터닙 모자이크 포티바이러스(turnip mosaic potyvirus)의 핵 포함 단백질 a (N1a); 뎅기(Dengue) 4형 (DEN4) 플라비바이러스의 NS2B/NS3, 황열 바이러스(YFV; Yellow Fever Virus)의 NS3 프로테아제; 콜리플라워 모자이크 바이러스(cauliflower mosaic virus)의 ORF V; 및 KEX 2 프로테아제, MYKR-EAD (서열번호)가 포함되지만, 이에 제한되는 것은 아니다. 또다른 내부 절단 부위 선택은 CB2이다. 절단이 일어나는 인식 서열 내의 위치는 하이픈으로 표시한다.
한가지 양태에서, 사용되는 시그날 서열은 야생형이거나, 돌연변이되거나, 무작위로 돌연변이되고, 당업계에서 이해되는 기술을 사용하여 스크리닝을 통해 선별된다.
위에서 제시된 본 발명의 범위 내에는 또한, 특정 폴리단백질 또는 프리단백 질 (프로단백질, 폴리단백질) 암호화 서열이 전사 조절 서열에 작동가능하게 연결된 발현 카세트, 발현 벡터, 및 발현 벡터 또는 발현 카세트를 함유하는 재조합 숙주 세포가 있다.
본 발명은 단일 프로모터의 전사 조절 하에 있는 중쇄 및 경쇄 암호화 서열의 발현에 기반을 둔 전체 길이 면역글로불린 또는 이의 단편의 발현을 위한 시스템을 제공하고, 이때 중쇄 및 경쇄의 분리는 인테인 또는 변형된 인테인 (이는 방출된 단백질 분자를 절단하지만 연결시키지 않거나, 항체 또는 다른 플랭킹 단백질 서열이 변형되어 단백질의 연결을 방해할 수 있다)에 의해, 또는 드로소필라, 마우스, 및 다른 종 유래의 헤지호그의 C-말단 자가프로세싱 도메인에 의해, 또는 워트호그, 그라운드호그, 및 카에노하브디티스 엘레간스와 같은 선충 유래의 다른 호그 함유 유전자의 C-말단 자가프로세싱 도메인에 의해 매개된다. 입금편모충류 유래의 호그렛-C 자가프로세싱 도메인, 또는 클로스트리디움 써모셀룸과 같은 세균으로부터 유래한 것과 같은 A-형 세균 인테인-유사 (BIL) 도메인에 의해, 또는 로도박터 스페로이데스와 같은 세균 유래의 B-형 BIL 도메인에 의해 매개된다. 본 발명에서 유용한 인테인에는, 사카로마이세스 세레비지아(Saccharomyces cerevisiae) VMA, 피로코쿠스(Pyrococcus), 시네코시스티스(Synechocystis), 및 당업계에 공지된 다른 인테인이 포함되지만, 이에 제한되는 것은 아니다. 중쇄 및 경쇄의 분리는 또한 자가프로세싱 절단 부위 (예: 2A 또는 2A-유사 서열)에 의해 매개될 수 있다.
한가지 양상에서, 본 발명은 재조합 면역글로불린의 발현을 위한 벡터를 제 공하는데, 이 벡터는 면역글로불린 분자의 제1의 쇄 또는 이의 단편에 대한 암호화 서열에 작동가능하게 연결된 프로모터, 자가프로세싱 절단 부위를 암호화하는 서열 및 면역글로불린 분자의 제2의 쇄 또는 이의 단편에 대한 암호화 서열을 포함하고, 이때 자가프로세싱 절단 부위를 암호화하는 서열은 면역글로불린 분자의 제1의 쇄에 대한 암호화 서열과 면역글로불린 분자의 제2의 쇄에 대한 암호화 서열 사이에 삽입된다. 면역글로불린 분자의 제1의 또는 제2의 쇄는 중쇄 또는 경쇄일 수 있고, 재조합 면역글로불린을 암호화하는 서열은 전체 길이 암호화 서열 또는 이의 단편일 수 있다. 경쇄에 상응하는 제2의 영역은 인접한 영역으로부터 프로테아제 인식 부위, 시그날 펩티드 또는 자가 프로세싱 부위 (예: 2A 부위)에 의해 분리된다. 2 카피의 L 쇄 서열 및 하나의 H 쇄 서열 (또는 다수의 카피의 각각의 서열)이 있을 수 있고, 단 각각의 항체 쇄 구성요소가 적당한 프로세싱 부위 또는 이와 관련된 서열을 갖고 있어서 정확하게 프로세싱된 항체 쇄가 생산된다.
벡터는 전체 길이 폴리펩티드, 예를 들면 면역글로불린 분자 또는 이의 단편을 발현시킬 수 있는 임의의 재조합 벡터, 예를 들면, 그 중에서도, 플라스미드 벡터, 특히 포유동물 세포에서의 유전자 발현에 적당한 플라스미드 벡터, 곤충 세포에서의 발현을 위한 베큘로바이러스(baculovirus) 벡터, 아데노-관련 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 가능한 아데노바이러스 벡터, 복제 결함 아데노바이러스 벡터 및 독성유전자 부재(gutless) 아데노바이러스 벡터, 헤르페스 바이러스 벡터 또는 비-바이러스성 벡터(플라스미드)일 수 있다.
자가프로세싱 절단 부위에는 2A 펩티드 서열, 예를 들면, 구제역 바이러스(FMDV) 유래의 2A 서열이 포함된다. 추가적인 바람직한 양상에서, 벡터는 면역글로불린 분자의 제1의 쇄 또는 이의 단편에 대한 암호화 서열과 면역글로불린 분자의 제2의 쇄 또는 이의 단편에 대한 암호화 서열 사이에 (즉, 2A 절단 부위와 같은 자가프로세싱 절단 부위에 대한 서열 근처에) 그리고 또한 제2의 경쇄 서열 근처에 위치한, 추가적인 단백질분해 절단 부위를 암호화하는 서열을 포함한다. 한가지 대표적인 접근법에서, 추가적인 단백질분해 절단 부위는 컨센서스(consensus) 서열 RXK/R-R (서열번호 1)을 갖는 푸린 절단 부위이다. 자가프로세싱 펩티드를 사용한 재조합 면역글로불린 발현을 위한 벡터는 임의의 많은 프로모터를 포함할 수 있고, 이때 프로모터는 구성적(constitutive)이거나, 조절성 또는 유도성이거나, 세포 종류 특이적이거나, 조직 특이적이거나, 종 특이적이다. 벡터는 면역글로불린 쇄, 프리단백질 등의 하나 이상의 암호화 서열에 대한 시그날 서열을 암호화하는 서열을 추가로 포함할 수 있다.
본 발명은 면역글로불린(즉, 항체)의 중쇄 및 경쇄를 암호화하는 서열; 자가프로세싱 절단 부위를 암호화하는 서열을 포함하고; 추가적인 단백질분해 절단 부위를 암호화하는 서열, 및 임의로 자가프로세싱 부위 또는 프로테아제 인식 서열에 의해 암호화 서열(들)의 나머지로부터 유사하게 분리된 프로테아제 암호화 영역을 추가로 포함할 수 있는, 벡터로 감염된 숙주 세포 또는 숙주 세포의 안정한 클론을 추가로 제공한다. 전체 길이 재조합 면역글로불린 또는 이의 단편을 생성하는데 있어 이러한 세포 또는 클론의 용도는 또한 본 발명의 범위 내에 포함된다. 적당 한 숙주 세포에는 곤충 배양 세포 (예: 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포), 미생물, 예를 들면, 세균, 효모 세포 (예: 사카로마이세스 세레비지아 또는 피치아 파스토리스 (Pichia pastoris)), 진균 (예: 트리코데르마 레에세이(Trichoderma reesei), 아스페르길루스(Aspergillus), 오레오바시둠 (Aureobasidum) 및 페니실리움(Penicillium) 종), 뿐만 아니라 포유동물 세포, 예를 들어, 중국 햄스터 난소 세포 (예: CHO-K1, ATCC CCL 61; CHO DG44, 참조: Chasin et al. 1986, Som. Cell. Molec. Genet. 12:555), 아기 햄스터 신장 세포 (BHK-21, BHK-570, ATCC CRL 8544, ATCC CRL 10314), COS 세포, 마우스 배아 세포 (NIH-3T3, ATCC CRL 1658), 베로(Vero) 세포 (아프리카 녹색 원숭이 신장 세포, ATCC CRL 1587로서 입수가능함), 개 신장 세포 (예: MDCK, ATCC CCL 34), 래트 뇌하수체 세포 (GH1, ATCC CCL 34), 특정 사람 세포주 (예: 사람 배아 신장 세포 (예: HEK293, ATCC CRL 1573))가 포함되지만, 이에 제한되는 것은 아니며, 돼지, 마우스, 래트, 양, 염소, 소를 포함하는 비제한적인, 다양한 유전자전이된(transgenic) 동물 시스템 역시 사용될 수 있다. 난백(egg white)에서의 발현을 위한 닭 시스템 및 유전자전이된 양, 염소 및 소 시스템은, 그 중에서도, 밀크에서의 발현용으로 공지되어 있다. 식물 세포 또한 숙주 세포로서 적당하다.
관련된 양상에서, 본 발명은 이러한 세포 또는 클론에 의해 생산되는 재조합 면역글로불린 분자 또는 이의 단편 (이때 면역글로불린은 자가 프로세싱 절단 부위, 시그날 펩티드, 인테인, C-말단 자가프로세싱 호그 함유 유전자, 세균 인테인-유사 (BIL) 도메인, 또는 프로테아제 인식 서열로부터 유래한 아미노산을 포함한 다), 및 이를 생산하는 방법을 제공한다. 인테인을 사용하는 경우, 이는 바람직하게는 변형된 인테인이어서, 2개의 항체 쇄가 함께 스플라이싱되지 않아 단일 폴리펩티드 쇄를 형성하거나, 항체 폴리펩티드의 말단이 스플라이싱되어 이들이 인테인에 의해 함께 스플라이싱 될 수 없다. 인테인은 프레임내 융합체로서 N-엑스테인과 C-엑스테인 사이에, 예를 들면, 면역글로불린 중쇄와 면역글로불린 경쇄 사이에 위치하고, 단 폴리단백질 1차 해독 산물의 인테인 및/또는 접합점(junction) 근처의 아미노산 서열이 절단을 일으켜 엑스테인이 방출되지만, 이러한 엑스테인 단백질의 연결은 일어나지 않는다.
본 발명은 제1의 발현된 단백질 부분 및 제2의 단백질 부분 사이에 위치한 헤지호그 단백질 프로세싱 도메인을 사용하는 해독후 단백질 프로세싱 전략을 추가로 제공한다. 임의로 헤지호그 단백질 프로세싱 도메인(Hh-C)은 절두되어 콜레스테롤 전달 부분이 결실되어 단백질 절단만 일어날 수 있다. Hh-C의 완전한 절단이 일어나지 않는 경우, 제2의 단백질 부분의 N-말단에서 시그날 펩티드 도메인의 포함은 Hh-C/제1의 단백질 부분으로부터의 성숙한 제2의 단백질의 단백질분해 분리를 가능하게 할 수 있다. 본 발명의 이 양상의 범위 내에는 또한, 폴리단백질이 단일 메시지로부터의 해독에 의해 생산되도록, 제1의 발현된 단백질 부분 암호화 서열과 제2의 단백질 부분 암호화 서열 사이에 위치한 헤지호그 단백질 프로세싱 도메인을 포함하는 폴리단백질을 암호화하는 서열을 포함하는 비천연 재조합 DNA 분자가 있다.
본 발명의 추가적인 양상은 새로이 합성된 푸린 단백질을 소포체의 내강으로 표적화하는 펩티드 영역의 부가를 특징으로 하는 변형된 푸린이다. 본원에서 제시한 바와 같은, 인테인 또는 변형된 인테인 전략 또한 포함된다.
본 발명의 또다른 양상은 이중 하이브리드 및 삼중 하이브리드 (및 변이체) 기술에 대한 폴리단백질/자가 프로세싱, 인테인 프로세싱, 시그날 펩티드 절단 또는 단백질분해 절단 접근법에의 적용이다. 제1 및 제2의 또는 제1, 제2 및 제3의 단백질은 폴리단백질로서 단일 전사체로부터 적당한 숙주 세포에서 발현되고, 이러한 단백질에 대한 암호화 서열은 자가 프로세싱 부위 (예: 2A), 인테인, 시그날 펩티드에 의해 또는 프로테아제 인식 부위에 의해 분리된다. 이 전략은, 통상적으로 수행되는 바와 같이 하나 이상의 벡터로 공동-형질감염시키거나 단일 전사체로부터 각각의 단백질을 발현시킬 필요성을 제거하고, 본 발명을 사용하는 결과로 경제성, 효율성 및 단백질 발현이 개선되고, 잠재적 결합 쌍은 서로 아주 근접하게 위치하여 결합 파트너가 서로 결합하는 가능성을 향상시키는 것으로 생각된다. 특정 양태에서, 폴리단백질은 베이트 단백질(bait protein), 및 자가 프로세싱, 인테인, 시그날 펩티드 또는 프로테아제 인식 서열 및 삽입된 cDNA 서열을 포함하고, 이는 관심대상의 베이트 단백질과 상호작용하는 하나 이상의 잠재적 프레이 단백질(prey protein)에 해당한다. 이 클로닝 및 발현 전략은 도 8 및 9에 도식적으로 제시되어 있다.
한가지 양태에서, 본 발명은 세포 내에서 다수의 유전자 산물을 발현시키기 위한 DNA 작제물을 제공하는데, 이는 작제물의 5' 말단에 단일 프로모터를 포함하고, 분리된 단백질을 암호화하는 2개 이상의 엑스테인 서열을 포함하는 인테인 함 유 단위를 포함하고, 발현될 마지막 엑스테인 서열을 제외하고는, 각각의 엑스테인 서열의 카복시 말단 암호화 부분에 융합된 하나 이상의 인테인 서열을 포함하고, 마지막 엑스테인 단백질 암호화 서열 뒤에 폴리아데닐화 시그날을 포함하는 3' 종결 서열을 포함하며; 이때 인테인 함유 단위는 엑스테인 암호화된 단백질의 측면에 위치하는 하나 이상의 인테인을 함유하는 전구체 단백질로서 발현되고; 이때 하나 이상의 인테인은 엑스테인의 절단을 촉매할 수 있고; 바람직하게는, 이때 하나 이상의 아미노산 잔기가 인테인 함유 단위에서 치환되거나 부가되어, 절단된 엑스테인이 인테인에 의해 연결되지 않는다. 특정 양태에서, 작제물이 구성되고, 이때 단백질로서 발현시, 2개 이상의 엑스테인 서열이 다량체 어셈블리에서 결합할 수 있다. 한가지 양태에서, 2개 이상의 엑스테인 서열은 면역글로불린 또는 다른 항원 인식 분자를 암호화할 수 있다. 한가지 양태에서, 단백질로서 발현시, 하나 이상의 엑스테인 서열은 세포외 분비가 가능하다. 한가지 양태에서, 하나 이상의 엑스테인 서열은 포유동물 유전자이다.
일부 양태에서, 본 발명은 발현된 면역글로불린 단편이 재연결/융합되지 않음으로써, 다수의 서브유닛으로부터 어셈블리된 항체가 생산되게 하는, 변형된 또는 비변형 인테인을 사용하는, 면역글로불린 발현을 위한 작제물 및 방법을 제공한다. 특정 양태에서, 변형된 인테인은 C-엑스테인의 첫번째 위치에 위치한 아미노산 잔기에 변화를 포함한다. 특정 양태에서, 인테인 단편 내에서 마지막에서 두번째 아미노산에 변화가 있다.
일부 양태에서, 본 발명은 임의의 유전자 또는 유전자의 조합의 발현을 위한 작제물 및 방법을 제공한다. 특정 양태에서, C-엑스테인이 변형된다. 추가적인 특정 양태에서, C-엑스테인은 시그날 서열을 사용하여 변형된다. 또다른 특정 양태에서, 말단 C-엑스테인 구성요소가 부재한다.
일부 양태에서, 본 발명은 면역글로불린의 제2의 쇄(중쇄 또는 경쇄), 및 사용되는 경우, 인테인 또는 헤지호그 자가프로세싱 도메인 뒤에 위치하는 제3의 쇄에 대한 변형된 시그날 펩티드를 사용하는 항체 유전자의 발현을 위한 작제물 및 방법을 제공한다. 한가지 양태에서, 단편의 순서는 다음과 같다: 제1의 쇄 - 제1의 인테인 또는 헤지호그 - 제1의 변형된 시그날 펩티드 - 제2의 쇄 - 제2의 변형된 시그날 펩티드 - 제3의 쇄 (2-쇄의 경우, 예를 들면, 제3의 쇄 또는 '제2의 변형된 시그날 펩티드 - 제3의 쇄' 단편은 생략된다). 또다른 양태에서, 제2의 인테인 또는 헤지호그 단편이 제2의 쇄 다음에 포함된다. 특정 양태에서, 이러한 변형된 시그날 펩티드의 사용은 항체 분비를 증가시킨다. 한가지 양태에서, 사용되는 시그날 펩티드를 변형시켜 소수성을 감소시킨다. 한가지 양태에서, 시그날 펩티드는 변형되지 않는다.
일부 양태에서, sORF 벡터가 일시적 발현을 위하여 제공된다. 다른 양태에서, sORF 벡터가 안정한 발현 시스템에서 제공된다. 한가지 양태에서, 안정한 숙주 세포는 당업계에서 이해되는 바와 같이, 예를 들면, 형질감염 및 다른 기술에 의해 생성된다.
종양 괴사 인자 α(알파)에 대해 특이적인 항체의 발현을 위하여 많은 대표적인 작제물을 본원에서 구체적으로 공개하지만, 다른 단백질을 암호화하는 서열을 치환시켜 동일한 전략을 사용하여 작제물을 쉽게 제조할 수 있다는 것을 이해하여야 한다. 특정 예에는 다른 면역글로불린 및 생물치료제 분자가 포함된다. 추가적인 특정 예에는 E/L 셀렉틴(selectin), 인터루킨-12, 인터루킨-18 또는 에리트로포이에틴(erythropoietin) 수용체에 특이적인 항체, 또는 아미노산 서열 및/또는 암호화 서열이 당업계에서 사용가능한 목적하는 특이성을 갖는 임의의 다른 항체가 포함된다.
한가지 양태에서, 본 발명은 sORF 삽입체를 포함하는 하나 이상의 재조합 단백질 산물을 생성하기 위한 발현 벡터를 제공하고; 상기 sORF 삽입체는 제1의 폴리펩티드를 암호화하는 제1의 핵산 서열, 제1의 단백질 절단 부위를 암호화하는 제1의 개재 핵산 서열, 및 제2의 폴리펩티드를 암호화하는 제2의 핵산 서열을 포함하며; 이때 상기 제1의 단백질 절단 부위를 암호화하는 상기 개재 핵산 서열은 상기 제1의 핵산 서열과 상기 제2의 핵산 서열 사이에 작동가능하게 위치하고; 이때 상기 발현 벡터는 상기 제1의 단백질 절단 부위에서 절단가능한 sORF 폴리펩티드를 발현할 수 있다. 한가지 양태에서, 상기 제1의 단백질 절단 부위는 자가프로세싱 절단 부위를 포함한다.
한가지 양태에서, 자가프로세싱 절단 부위는 인테인 단편 또는 변형된 인테인 단편을 포함하고, 이때 변형된 인테인 단편은 절단이 일어나게 하지만 상기 제1의 폴리펩티드를 상기 제2의 폴리펩티드에 완전하게 연결시키지 않는다. 한가지 양태에서, 자가프로세싱 절단 부위는 헤지호그 단편 또는 변형된 헤지호그 단편을 포함하고, 이때 변형된 헤지호그 단편은 상기 제2의 폴리펩티드로부터 상기 제1의 폴리펩티드가 절단되게 한다. 한가지 양태에서, 제1의 폴리펩티드 및 제2의 폴리펩티드는 다량체 어셈블리가 가능하다. 한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 세포외 분비가 가능하다. 한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 포유동물 기원이다.
한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 면역글로불린 중쇄 또는 이의 기능성 단편을 포함한다. 한가지 양태에서, 하나 이상의 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 면역글로불린 경쇄 또는 이의 기능성 단편을 포함한다. 한가지 양태에서, 상기 제1의 폴리펩티드는 면역글로불린 중쇄 또는 이의 기능성 단편을 포함하고, 상기 제2의 폴리펩티드는 면역글로불린 경쇄 또는 이의 기능성 단편을 포함하며; 이때 상기 제1 및 제2의 폴리펩티드는 임의의 순서로 있다. 한가지 양태에서, 상기 제1의 폴리펩티드 및 제2의 폴리펩티드는 함께 다량체 어셈블리에서 결합되어 기능성 항체 또는 다른 항원 인식 분자를 형성할 수 있다.
한가지 양태에서, 상기 제1의 폴리펩티드는 상기 제2의 폴리펩티드의 상류에 있다. 한가지 양태에서, 상기 제2의 폴리펩티드는 상기 제1의 폴리펩티드의 상류에 있다.
한가지 양태에서, 발현 벡터는 제3의 폴리펩티드를 암호화하는 제3의 핵산 서열을 추가로 포함하고, 이때 상기 제3의 핵산 서열은 상기 제2의 핵산 서열 뒤에 작동가능하게 위치하며, 이때 상기 제3의 서열은 독립적으로 상기 제1 또는 제2의 핵산 서열과 동일하거나 상이할 수 있다. 한가지 양태에서, 2개 이상의 상기 제1, 제2 및 제3의 폴리펩티드는 함께 다량체 어셈블리에서 결합할 수 있다.
한가지 양태에서, 발현 벡터는 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하고, 이때 상기 제2의 개재 핵산 서열은 상기 제1 및 상기 제2의 핵산 서열 뒤에 작동가능하게 위치하며; 이때 상기 제2의 개재 서열은 상기 제1의 개재 핵산 서열과 동일하거나 상이할 수 있다. 한가지 양태에서, 발현 벡터는 제3의 폴리펩티드를 암호화하는 제3의 핵산 서열, 및 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하고; 이때 제2의 개재 핵산 서열 및 제3의 핵산 서열은, 이 순서로, 상기 제2의 핵산 서열 뒤에 작동가능하게 위치한다. 한가지 양태에서, 상기 제3의 핵산 서열은 면역글로불린 중쇄, 경쇄, 또는 각각 이의 기능성 단편을 암호화한다. 한가지 양태에서, 상기 제3의 핵산 서열은 면역글로불린 경쇄 또는 이의 기능성 단편을 암호화한다. 한가지 양태에서, 상기 제3의 핵산 서열은 면역글로불린 중쇄 또는 이의 기능성 단편을 암호화한다.
발현 벡터의 한가지 양태에서, 제1의 단백질 절단 부위를 암호화하는 상기 제1의 개재 핵산 서열은 시그날 펩티드 절단 부위를 암호화하는 시그날 펩티드 핵산 또는 변형된 시그날 펩티드 절단 부위 서열을 포함한다. 한가지 양태에서, 발현 벡터는, 상기 제1의 핵산 서열 또는 상기 제2의 핵산 서열 앞에 작동가능하게 위치한, 시그날 펩티드 절단 부위를 암호화하는 시그날 펩티드 핵산 서열을 추가로 포함한다.
한가지 양태에서, 발현 벡터는 각각 독립적으로 시그날 펩티드 절단 부위를 암호화하는, 2개의 시그날 펩티드 핵산 서열을 추가로 포함하고, 이때 하나의 시그날 펩티드 핵산 서열은 상기 제1의 폴리펩티드를 암호화하는 상기 제1의 핵산 앞에 작동가능하게 위치하고, 또다른 시그날 펩티드 핵산 서열은 상기 제2의 폴리펩티드를 암호화하는 상기 제2의 핵산 앞에 작동가능하게 위치한다. 일부 양태에서, 2개의 시그날 펩티드 서열은 동일하거나 상이하다.
한가지 양태에서, 시그날 펩티드 핵산 서열은 면역글로불린 경쇄 시그날 펩티드 절단 부위 또는 변형된 면역글로불린 경쇄 시그날 펩티드 절단 부위를 암호화한다. 한가지 양태에서, 시그날 펩티드 핵산 서열은 변형된 또는 비변형 면역글로불린 경쇄 시그날 펩티드 절단 부위를 암호화하고, 이때 상기 변형된 부위는 절단을 달성할 수 있고 상기 제1의 폴리펩티드, 상기 제2의 폴리펩티드 및 상기 제1 및 제2의 폴리펩티드의 어셈블리된 분자 중 하나 이상의 분비를 증가시킬 수 있으며, 이때 상기 시그날 펩티드 부위의 존재 하에서의 분비 수준은 상기 시그날 펩티드 부위의 부재 하에서의 분비 수준보다 약 10% 내지 약 100배 더 높다.
한가지 양태에서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열은 피로코쿠스 호리코시이(Pyrococcus horikoshii) Pho Pol I 서열, 사카로마이세스 세레비지아(Saccharomyces cerevisiae) VMA 서열, 시네코시스티스(Synechocystis) PCC6803 균주 DnaE 서열, 마이코박테리움 제노피(Mycobacterium xenopi) GyrA 서열, 피로코쿠스(Pyrococcus) 종 GB-D DNA 폴리머라제, A형 세균 인테인-유사 (BIL) 도메인, 및 B형 BIL로 이루어진 그룹으로부터 선택되는 인테인 또는 변형된 인테인 서열을 포함한다.
한가지 양태에서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열은 헤지호그 계열 일원의 C-말단 자가프로세싱 도메인을 포함하고, 이때 헤지호그 계열 일원은 드로소필라, 마우스, 사람, 또는 다른 곤충 또는 동물 종 유래이다. 한가지 양태에서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열은 워트호그, 그라운드호그, 또는 선충 기원의 다른 호그 함유 유전자 유래의 C-말단 자가프로세싱 도메인, 또는 입금편모충류 유래의 호그렛 도메인을 포함한다.
한가지 양태에서, 제1 및 상기 제2의 폴리펩티드는, 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1, 인터루킨-12, 인터루킨-13, 인터루킨-18, 인터루킨-23, CXCL-13, GLP-1R, 및 아밀로이드 베타로 이루어진 그룹으로부터 선택되는 항원에 결합하도록 지시된 항원 특이성을 갖는, 기능성 항체 또는 다른 항원 인식 분자를 포함한다. 한가지 양태에서, 제1 및 제2의 폴리펩티드는, D2E7, ABT-007, ABT-325, EL246 또는 ABT-874의 항체 유래의 면역글로불린 쇄의 쌍을 포함한다. 한가지 양태에서, 제1 및 제2의 폴리펩티드는, D2E7, ABT-007, ABT-325, EL246, ABT-874, 또는 다른 항체의 유사한 단편 유래의 면역글로불린 중쇄 또는 면역글로불린 경쇄 단편으로부터 각각 독립적으로 선택된다.
한가지 양태에서, 벡터는 상기 sORF 삽입체에 대한 프로모터 조절 요소를 추가로 포함한다. 한가지 양태에서, 상기 프로모터 조절 요소는 유도성이거나 구성적(constitutive)이다. 한가지 양태에서, 상기 프로모터 조절 요소는 조직 특이적이다. 한가지 양태에서, 상기 프로모터는 아데노바이러스 주요 후기 프로모터(major late promoter)를 포함한다.
한가지 양태에서, 벡터는 상기 제1의 단백질 절단 부위를 절단시킬 수 있는 프로테아제를 암호화하는 핵산을 추가로 포함한다. 한가지 양태에서, 프로테아제를 암호화하는 상기 핵산은 상기 sORF 삽입체 내에 작동가능하게 위치하고; 상기 발현 벡터는, 프로테아제를 암호화하는 상기 핵산과 상기 제1의 핵산 및 상기 제2의 핵산 중 하나 이상 사이에 위치한, 제2의 절단 부위를 암호화하는 추가적인 핵산을 추가로 포함한다.
한가지 양태에서, 본 발명은 본원에서 기술된 벡터를 포함하는 숙주 세포를 제공한다. 한가지 양태에서, 숙주 세포는 원핵생물 세포이다. 한가지 양태에서, 상기 숙주 세포는 에스케리키아 콜라이(Escherichia coli)이다. 한가지 양태에서, 상기 숙주 세포는 진핵생물 세포이다. 한가지 양태에서, 진핵생물 세포는 원생생물 세포, 동물 세포, 식물 세포 및 진균 세포로 이루어진 그룹으로부터 선택된다. 한가지 양태에서, 상기 진핵생물 세포는 포유동물 세포, 조류 세포 및 곤충 세포로 이루어진 그룹으로부터 선택되는 동물세포이다. 바람직한 양태에서, 상기 숙주 세포는 CHO 세포 또는 디하이드로폴레이트 리덕타제에 결함이 있는 CHO 세포이다. 한가지 양태에서, 상기 숙주 세포는 COS 세포이다. 한가지 양태에서, 상기 숙주 세포는 효모 세포이다. 한가지 양태에서, 상기 효모 세포는 사카로마이세스 세레비지아이다. 한가지 양태에서, 상기 숙주 세포는 곤충 스포도프테라 프루기페르다(Spodoptera frugiperda) Sf9 세포이다. 한가지 양태에서, 상기 숙주 세포는 사람 배아 신장 세포이다.
한가지 양태에서, 본 발명은 숙주 세포를 배양 배지 중에서 벡터 단백질이 발현되게 하는데 충분한 조건 하에서 배양함을 포함하여, 재조합 폴리단백질 또는 다수의 단백질을 생산하는 방법을 제공한다. 한가지 양태에서, 상기 방법은 상기 벡터 단백질을 회수하고/하거나 정제함을 추가로 포함한다. 한가지 양태에서, 상기 다수의 단백질은 다량체 어셈블리가 가능하다. 한가지 양태에서, 재조합 폴리단백질 또는 다수의 단백질은 생물학적으로 기능성인 단백질이고/이거나 치료학적 단백질이다.
한가지 양태에서, 본 발명은 청구범위 제38항에 따른 숙주 세포를 배양 배지에서 면역글로불린 단백질 또는 이의 기능성 단편, 어셈블리된 항체, 또는 다른 항원 인식 분자를 생산하는데 충분한 조건 하에서 배양함을 포함하여, 면역글로불린 단백질 또는 이의 기능성 단편, 어셈블리된 항체, 또는 다른 항원 인식 분자를 생산하는 방법을 제공한다.
한가지 양태에서, 본 발명은 본원의 방법에 따라 생산된 단백질 또는 폴리단백질을 제공한다. 한가지 양태에서, 본 발명은 본원의 방법에 따라 생산된 어셈블리된 면역글로불린; 어셈블리된 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편을 제공한다. 한가지 양태에서, 면역글로불린; 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편은 종양 괴사 인자-α, 에리트로포이에틴 수용체, 인터루킨-18, EL/셀렉틴 또는 인터루킨-12에 대한 특이적 항원 결합을 달성하거나 이에 기여할 수 있는 능력을 갖는다. 한가지 양태에서, 면역글로불린은 D2E7이거나 이때 기능성 단편은 D2E7의 단편이다.
한가지 양태에서, 본 발명은 단백질 및 약제학적으로 허용되는 담체를 포함 하는 약제학적 조성물 또는 약제를 제공한다. 약제학적 제형을 위한 부형제 또는 담체는 당업계에서 이해되는 바와 같이 선택된다.
한가지 양태에서, 본 발명은 발현 벡터를 제공하는데, 이때 제1의 단백질 절단 부위는 세포 프로테아제 절단 부위 또는 바이러스 프로테아제 절단 부위를 포함한다. 한가지 양태에서, 상기 제1의 단백질 절단 부위는, 푸린; IPNV의 VP4; 담배 식각 바이러스(TEV) 프로테아제; 라이노바이러스의 3C 프로테아제; PC5/6 프로테아제; PACE 프로테아제; LPC/PC7 프로테아제; 엔테로키나제; 인자 Xa 프로테아제; 트롬빈; 게네나제 I; MMP 프로테아제; 터닙 모자이크 포티바이러스의 핵 포함 단백질 a (N1a); 뎅기(Dengue) 4형 플라비바이러스의 NS2B/NS3, 황열 바이러스의 NS3 프로테아제; 콜리플라워 모자이크 바이러스의 ORF V; KEX2 프로테아제; CB2; 또는 2A에 의해 인식되는 부위를 포함한다. 한가지 양태에서, 상기 제1의 단백질 절단 부위는 바이러스성 내부적으로 절단가능한 시그날 펩티드 절단 부위이다. 한가지 양태에서, 상기 바이러스성 내부적으로 절단가능한 시그날 펩티드 절단 부위는 C형 인플루엔자 바이러스, C형 간염 바이러스, 한타바이러스, 플라비바이러스 또는 루벨라 바이러스 유래의 부위를 포함한다.
한가지 양태에서, 본 발명은 이중 하이브리드 시스템의 단백질의 발현을 위한 방법을 제공하는데, 이때 상기 이중 하이브리드 시스템은 베이트 단백질 및 후보 프레이 단백질을 포함하고, 상기 방법은 자가프로세싱 절단 서열, 시그날 펩티드 서열 또는 프로테아제 절단 부위에 의해 분리된, 베이트 단백질 부분 및 후보 프레이 단백질 부분을 포함하는 폴리단백질을 암호화하는 발현 벡터가 도입된 숙주 세포를 수득하는 단계; 및 상기 폴리단백질의 발현 및 상기 폴리단백질의 자가 프로세싱 또는 프로테아제 절단을 가능하게 하는 조건 하에서 숙주 세포를 배양하는 단계를 포함한다. 한가지 양태에서, 폴리단백질은 삼중 하이브리드 시스템의 절단가능한 구성요소를 추가로 포함한다.
한가지 양태에서, 발현 벡터는 2A 서열을 함유하지 않는다. 한가지 양태에서, 발현 벡터가 제공되고, 이때 상기 제1의 단백질 절단 부위는 FMDV 2A 서열; 다른 피코르나바이러스과, 곤충 바이러스, C형 로타바이러스, 트리파노솜(trypanosome), 또는 써마토가 마리티마(Thermatoga maritima) 유래의 2A-유사 도메인을 포함한다.
한가지 양태에서, 본 발명은 폴리단백질에 대한 암호화 서열을 포함하는 재조합 단백질을 발현시키기 위한 발현 벡터를 제공하는데, 이때 폴리단백질은 적어도 제1 및 제2의 단백질 단편을 포함하고, 이때 상기 단백질 단편은 이 사이의 단백질 절단 부위에 의해 분리되며, 이때 단백질 절단 부위는 자가 프로세싱 펩티드 절단 서열, 시그날 펩티드 절단 서열 또는 프로테아제 절단 서열을 포함하고; 이때 상기 암호화 서열은 숙주 세포에서 발현가능하고 숙주 세포 내에서 절단된다.
한가지 양태에서, 본 발명은 개재 핵산 서열이 추가적으로 태그(tag)를 암호화하는 발현 벡터를 제공한다.
본 발명의 다른 양상, 특징 및 장점은, 첨부된 도면과 함께 공개 목적으로 제공된, 다음의 본 발명의 설명으로부터 명백하다.
일반적으로 본원에서 사용된 용어 및 어구는 당업계에서 인정된 의미를 갖 고, 이는 표준 텍스트에 대한 참조, 저널 참조문헌 및 당업자에게 공지된 배경에 의해 찾을 수 있다. 본원에서 제공된 정의는 본 발명과 관련하여 이들의 구체적인 용도를 명확하게 하려는 의도이다.
임의의 특정 이론에 구속되기를 바라지 않으며, 본 발명과 관련된 기본 원리 또는 메커니즘의 확신 또는 이해에 관한 논의가 본원에서 있을 수 있다. 임의의 설명 또는 가설의 궁극적인 정확함에 관계없이, 본 발명의 양태는 그럼에도 불구하고 효과가 있고 유용할 수 있다는 점이 인식된다.
도 1은 바람직한 안정한 sORF 발현 벡터 작제물을 설명한다.
도 2는 제2의 단백질 절단 부위(이는 자가프로세싱 부위일 수 있음)를 암호화하는 추가적인 (제2의) 개재 핵산 및 제3의 폴리펩티드를 암호화하는 제3의 핵산 서열을 추가로 포함하는, 바람직한 안정한 sORF 발현 벡터 작제물을 설명한다. 이러한 벡터는 2개 이상의 폴리펩티드를 발현할 수 있다.
도 3은 바람직한 일시적 sORF 발현 벡터 작제물 (예: pTT3-HC-Ssp-GA-int-LC-0aa)을 설명한다.
도 4는 이중 하이브리드 시스템을 위한 2A 단편이 있는 발현 벡터를 설명한다. 벡터 발현 카세트는 베이트 단백질을 우선 GAL4::베이트::2A 펩티드 융합체로서 해독하도록 구성되고, 이는 2A 펩티드의 해독 후에 자가 프로세싱된다. 제2의 개방 판독 프레임(ORF)은 NF카파B::라이브러리 융합 단백질이다.
도 5는 도 4의 플라스미드(2A 절단 부위가 있는 이중 하이브리드 시스템)의 발현 영역의 펼쳐진 선형 도면이다.
도 6은 면역글로불린 발현을 위한 인테인-기반 sORF 벡터를 설명한다.
도 7은 항체와 같이 어셈블리하는 다량체 분자의 발현을 위한 선별된 포인트 돌연변이가 있는 다수의 sORF 작제물을 설명한다.
도 8은 변경된 시그날 펩티드, 예를 들면, 변형된 면역글로불린 경쇄 시그날 펩티드가 있는 sORF 작제물을 설명한다.
도 9는 헤지호그 자가프로세싱을 사용하는 sORF 작제물을 설명한다.
본 발명은 다음의 설명 및 비제한적 실시예에 의해 보다 더 이해될 수 있다.
본 발명은 효소, 호르몬(예: 인슐린), 사이토카인, 케모카인, 수용체, 항체, 또는 다른 분자와 같이 구조적 또는 생물학적으로 활성인 단백질의 발현을 위한 시스템, 예를 들면, 작제물 및 방법을 제공한다. 바람직하게는, 단백질은 인터루킨, 전체 길이 면역글로불린, 이의 단편, 당업계에서 이해되는 다른 항원 인식 분자, 또는 다른 생물치료제 분자와 같은 면역조절 단백질이다. 이러한 시스템의 개관은, 재조합 생산이 단일 프로모터의 전사적 조절 하에 있는 중쇄 및 경쇄 암호화 서열의 발현에 기반하는, 면역글로불린 분자의 구체적인 상황 내에 있고, 이때 단일 해독 산물(폴리단백질)이 분리된 중쇄 및 경쇄로 전환되는 것은, 해독 동안에 리보좀에서 플랭킹 펩티드를 분리시키는 인테인, 호그 함유 자가프로세싱 도메인, 2A 또는 2A-유사 서열에 의해 매개되거나, 또는 성숙한 생물학적 활성 단백질의 2개의 쇄 사이에 위치한 하나 이상의 프로테아제 인식 서열에서의 단백질분해 프로세싱의 결과이다.
개재 부위는 (인테인 단편, 호그 도메인, 2A 또는 2A-유사, 또는 프로테아제 인식 부위; 및 각각에 대한 이의 변형물과 관련된 것이든지 아니든지) 절단 부위로서 지칭될 수 있다. 다수의 3개 이상의 단백질 단편이 발현되는 경우에서, 이러한 절단 부위는 다수의 단편 중 적어도 어느 2개 사이에 위치할 수 있거나, 절단 부위는 각각의 단편 뒤에 위치할 수 있고, 임의로 그리고 바람직하게는 마지막 단편 뒤에는 위치하지 않는다. 다수의 절단 부위가 사용되는 경우, 각각은 서로 동일하거나 독립적일 수 있다.
한가지 양상에서, 본 발명은 재조합 면역글로불린의 발현을 위한 벡터를 제공하는데, 이는 면역글로불린 분자의 제1의 쇄 또는 이의 단편에 대한 암호화 서열, 자가프로세싱 또는 다른 단백질분해 절단 부위를 암호화하는 서열 및 면역글로불린 분자의 제2의 쇄 또는 이의 단편에 대한 암호화 서열에 작동가능하게 연결된 프로모터를 포함하며, 이때 자가프로세싱 또는 다른 단백질분해 절단 부위를 암호화하는 서열은, 면역글로불린 분자의 제1의 쇄에 대한 암호화 서열과 면역글로불린 분자의 제2의 쇄에 대한 암호화 서열 사이에 삽입되고, 제3의 영역은 자가프로세싱 또는 다른 단백질분해 절단 부위에 의해 폴리단백질의 나머지로부터 또한 분리된 면역글로불린 경쇄를 암호화한다.
한가지 양태에서, 면역글로불린 폴리단백질 분자의 제1 또는 제2의 쇄는 중쇄 또는 경쇄일 수 있다. 재조합 면역글로불린 단편을 암호화하는 서열은 전체 길이 암호화 서열 또는 이의 단편일 수 있다. 특정 양태에서, 제2의 경쇄 암호화 서열은 본 발명의 실시에서 프로세싱될 폴리단백질을 암호화하는 서열의 일부이어야 한다, 즉, 모두 합쳐 2개의 경쇄 및 하나의 중쇄를 임의의 순서로 포함하는 3개의 단편이 있다. 특정 양태에서, 작제물은 이러한 구성요소 및 이 순서로 구성된다: a) IgH-IgL; b) IgL-IgH; c) IgH-IgL-IgL; d) IgL-IgH-IgL; e)IgL-IgL-IgH; f) IgH-IgH-IgL; g) IgH-IgL-IgH; 및/또는 h) IgL-IgH-IgH. 한가지 양태에서, 하이픈은 절단 부위 서열이 위치한 위치를 표시할 수 있다.
대안으로, 면역글로불린 중쇄 및 경쇄 암호화 서열은 이 사이의 인테인 암호화 서열에 프레임내 융합되고, 인테인은 변형되어 스플라이싱 활성 또는 중쇄 및 경쇄의 말단이 없어, 스플라이싱이 바람직하게는 일어나지 않거나 스플라이싱이 낮은 효율로 일어나도록 설계되어, 스플라이싱되지 않은 항체 분자가 우세하게 된다. 또한, (엔도뉴클레아제 영역이 이전에 존재했던 경우) 변형된 인테인이 추가로 변형되어 엔도뉴클레아제 영역이 없을 수 있고, 단 부위 특이적 단백질분해 절단 활성이 남아 있어 경쇄 및 중쇄 항체 폴리펩티드가 1차 해독 산물의 개재 인테인 부분으로부터 유리된다. 경쇄 또는 중쇄 항체 폴리펩티드 중 어느 하나는 N-엑스테인일 수 있고, 둘 중 어느 하나는 C-엑스테인 일 수 있다.
벡터는 전체 길이 폴리단백질을 발현할 수 있는 임의의 재조합 벡터, 예를 들면, 아데노-관련 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 가능한 아데노바이러스 벡터, 복제 결함 아데노바이러스 벡터 및 독성유전자 부재(gutless) 아데노바이러스 벡터, 헤르페스 바이러스 벡터 또는 비-바이러스성 벡터(플라스미드) 또는 당업계에 공지된 임의의 다른 벡터일 수 있고, 면역글로불린 또는 다른 단백질(들)이 발현되는 숙주 세포에 적당한 벡터를 선택할 수 있다. 베큘로바이러스 벡터는 곤충 세포에서의 유전자 발현용으로 사용가능하다. 많은 벡터가 당업계에 공지되어 있고, 시판되거나 당업계에 쉽게 접근가능하다.
절단 부위
바람직한 자가프로세싱 절단 부위에는 인테인 서열; 변형된 인테인; 헤지호그 서열; 다른 호그 계열 서열; 2A 서열, 예를 들면, 구제역 바이러스(FMDV) 유래의 2A 서열; 및 각각에 대한 이의 변형물이 포함된다.
인식 서열이 2A 서열을 치환할 수 있는 프로테아제에는, 상기한 바와 같이, 푸린, 트랜스 골지 네트워크 보다는 소포체로 표적화된 변형된 푸린, IPNV의 VP4; TEV 프로테아제; 핵 위치결정(localization) 시그날에 결함이 있는 TEV 프로테아제 (TEV Nls-), 라이노바이러스의 3C 프로테아제, PC5/6 프로테아제, PACE 프로테아제, LPC/PC7 프로테아제, 엔테로키나제, Xa 프로테아제, 트롬빈, 게네나제 I 및 MMP 프로테아제가 포함되지만, 이에 제한되는 것은 아니다. 본 발명의 실시에서 유용한 다른 엔도프로테아제는, 터닙 모자이크 포티바이러스의 핵 포함 단백질 a(N1a)[참조: Kim et al. 1996. Virology 221:245-249]; 뎅기(Dengue) 4형 (DEN4) 플라비바이러스의 NS2B/NS3[참조: Falgout et al. 1993. J. Virol. 67:2034-2042; Lai et al. 1994. Arch. Virol. Suppl. 9:359-368], 황열 바이러스(YFV)의 NS3 프로테아제[참조: Chambers et al. 1991. J. Virol. 65:6042-6050]; 콜리플라워 모자이크 바이러스의 ORF V[참조: Torruella et al. 1989. EMBO Journal 8:2819-2825]; 인테인, 예를 들면, Psp-GBD Pol 인테인[참조: Xu, M.Q. 1996. EMBO 15:5146-5153], 내부적으로 절단가능한 시그날 펩티드, 예를 들면, C형 인플루엔자 바이러스의 내부적으로 절단가능한 시그날 펩티드[참조: Pekosz A. 1992. Proc. Natl. Acad. Sci. USA 95:3233-13238]; 및 KEX2 프로테아제, MYKR-EAD (서열번호 9); ER로 표적화된 KEX2 및 변형된 KEX2[참조: Chaudhuri et al. 1992. Eur. J. Biochem. 210:811-822]를 포함하는 비제한적인, 프로테아제이다. 유일하게 ER로 지시된 변형된 KEX2는 각각 표 7A 및 7B에 주어진 암호화 서열 및 아미노산 서열을 갖는다; 이는 KEX2-sol-KDEL이라고 한다. 사카로마이세스 세레비지아 유래의 KEX2의 1차 아미노산 서열은 변형되어 막 결합 도메인이 제거되고 단백질의 C 말단에 ER 표적화 서열 KDEL이 부가되었다. 적당한 절단 인식 부위를 함유하는 폴리단백질을 절단하는데 유용한 다른 사람 프로테아제에는 미국 특허원 제2005/0112565호에 제시된 것이 포함된다. 드로소필라 멜라노가스터(Drosophila melanogaster) 유래의 소닉 헤지호그(sonic hedgehog) 단백질, 특히 이의 프로세싱 도메인은 또한 폴리단백질 1차 해독 산물로부터 단백질을 유리시키는 역할을 할 수 있다.
본 발명의 범위 내에는 변형된 푸린 프로테아제가 있고, 이는 천연 푸린 프로테아제와 같이, 트랜스 골지 네트워크(TGN) 보다는 소포체(ER)로 표적화된다. 문헌[참조: Vorhees et al. 1995. EMBO Journal 14:4961-4975]에는 프로테아제의 TGN으로의 표적화[참조: Nakayama et al. 1997. Biochem. Journal 327:625-635]에 관련된 푸린의 EEDE (서열번호 10) 부분 (아미노산 775번 내지 778번)이 기술되어 있다. 문헌[참조: Zerangue et al. 2001. Proc. Natl. Acad. Sci. USA 98:2431-2436]에는 단백질의 C-말단에 있는 KKXX를 포함하는, ER 트래피킹(trafficking) 시그날이 보고되어 있다. 따라서 변형된 푸린이 개발되어, TGN 및 이후의 구획 대신에 또는 이에 추가하여 푸린 절단 활성을 ER 구획으로 표적화하는데 사용된다.
추가적인 양상에서, 벡터는 면역글로불린 분자의 제1의 쇄 또는 이의 단편에 대한 암호화서열과 면역글로불린 분자의 제2 및/또는 제3의 쇄 (예: 제1 또는 제2의 쇄의 복제본) 또는 이의 단편에 대한 암호화서열 사이에 (즉, 2A 절단 부위일 수 있는, 절단 부위에 대한 서열 근처에) 위치한, 추가적인 절단 부위를 암호화하는 서열을 포함한다. 한가지 대표적인 접근법에서, 추가적인 단백질분해 절단 부위는 컨센서스(consensus) 서열 RXK(R)R (서열번호 1)을 갖는 푸린 절단 부위이다.
프로모터를 포함하는 조절 서열; 숙주 세포
재조합 면역글로불린 또는 다른 단백질 발현을 위한 벡터는 당업계에 공지된 임의의 많은 프로모터를 포함할 수 있고, 이때 프로모터는 구성적이거나, 조절성 또는 유도성이거나, 세포 종류 특이적이거나, 조직 특이적이거나, 종 특이적이다. 추가의 구체적인 예에는, 예를 들면, 테트라사이클린-반응성 프로모터[참조: Gossen M, Bujard H, Proc Natl Acad Sci U S A. 1992, 15;89(12):5547-51]가 포함된다. 벡터는 키메릭(chimeric) 유전자가 발현될 숙주 세포에 맞게 개조된 레플리콘(replicon)이고, 이는 바람직하게는 또한 세균 세포에서, 유리하게는, 분자 생물학적 조작에 편리한 세포인 에스케리키아 콜라이에서도 기능성인 레플리콘을 포함한다.
유전자 발현용 숙주 세포는 동물 세포, 특히 포유동물 세포일 수 있지만, 이에 제한되는 것은 아니고, 또한 미생물 세포 (세균, 효모, 진균, 그러나 바람직하게는 진핵생물) 또는 식물 세포일 수 있다. 특히 적당한 숙주 세포에는 곤충 배양 세포 (예: 스포도프테라 프루기페르다 세포), 효모 세포 (예: 사카로마이세스 세레비지아 또는 피치아 파스토리스), 진균 (예: 트리코데르마 레에세이, 아스페르길루스, 오레오바시둠 및 페니실리움 종), 뿐만 아니라 포유동물 세포 (예: CHO (중국 햄스터 난소) 세포, BHK (아기 햄스터 신장) 세포, COS 세포, 293 세포, 3T3 (마우스) 세포, 베로(Vero) 세포 (아프리카 녹색 원숭이 세포)가 포함되고, 돼지, 마우스, 래트, 양, 염소, 소를 포함하는 비제한적인, 다양한 유전자전이된(transgenic) 동물 시스템 역시 사용될 수 있다. 난백(egg white)에서의 발현을 위한 닭 시스템 및 유전자전이된 양, 염소 및 소 시스템은, 그 중에서도, 밀크에서의 발현용으로 공지되어 있다. 베큘로바이러스, 특히 AcNPV, 벡터는 본 발명의 단일 ORF 항체 발현 및 절단, 예를 들면, 곤충 세포주에서 폴리헤드린 프로모터 또는 다른 강력한 프로모터의 조절 제어 하에서의 sORF의 발현을 위하여 사용될 수 있고; 이러한 벡터 및 세포주는 당업계에 익히 공지되어 있고 시판된다. 포유동물 세포에서 사용되는 프로모터는 구성적 프로모터 (예를 들어, 헤르페스 바이러스 TK 프로모터[참조: McKnight, Cell 31:355, 1982]; SV40 초기 프로모터[참조: Benoist et al. Nature 290:304, 1981], 라우스 육종 바이러스(Rous sarcoma virus) 프로모터[참조: Gorman et al. Proc. Natl. Acad. Sci. USA 79:6777, 1982]; 사이토메갈로바이러스 프로모터[참조: Foecking et al. Gene 45:101, 1980]; 마우스 유방 종양 바이러스 프로모터[참조: Etcheverry in Protein Engineering: Principles and Practice, Cleland et al., eds, pp.162-181, Wiley & Sons, 1996])이거나 조절 프로모터일 수 있다 (예를 들면, 메탈로티오네인 프로모터[참조: Hamer et al. J. Molec. Appl. Genet. 1:273, 1982]). 벡터는 특정 포유동물 세포를 감염시키는 바이러스, 특히 레트로바이러스, 백시니아(vaccinia) 및 아데노바이러스를 기반으로 할 수 있며, 이들의 유도체는 당업계에 공지되어 있고 시판된다. 프로모터에는 사이토메갈로바이러스, 아데노바이러스 후기, 및 백시니아 7.5K 프로모터가 포함되지만, 이에 제한되는 것은 아니다. 효모 및 진균 벡터[참조: Van den Handel, C. et al. (1991) In: Bennett, J.W. and Lasure, L.L. (eds.), More Gene Manipulations in Fungi, Academy Press, Inc., New York, 397-428] 및 프로모터는 또한 익히 공지되어 있고 광범위하게 이용가능하다. 에놀라제는 익히 공지된 구성적 효모 프로모터이고, 알코올 데하이드로게나제는 익히 공지된 조절 프로모터이다.
특정 프로모터, 전사 종결 서열 및 조직 특이적 서열을 암호화하는 서열과 같은 다른 임의의 서열의 선택은, 발현이 이루어지기 원하는 세포의 유형에 따라 주로 결정될 것이다. 세포는 세균, 효모, 진균, 포유동물, 곤충, 닭 또는 다른 동물 세포일 수 있다.
시그날 서열
벡터 내에 통합된, 절단되거나, 단백질분해적으로 프로세싱되거나 자가 프로세싱될 단백질의 암호화 서열은, 하나 이상의 시그날 서열을 암호화하는 하나 이상의 서열을 추가로 포함할 수 있다. 이러한 암호화된 시그날 서열은 폴리단백질 내의 하나 이상의 성숙한 단편과 결합될 수 있다. 예를 들면, 면역글로불린 중쇄 리더(leader) 서열을 암호화하는 서열은, 폴리단백질 암호화 서열의 나머지와 작동가능하게 프레임내 연결된, 중쇄에 대한 암호화 서열보다 앞서 위치할 수 있다. 유사하게, 경쇄 리더 펩티드 암호화 서열 또는 다른 리더 펩티드 암호화 서열은 면역글로불린 경쇄 암호화 서열 중 하나 또는 둘다와 프레임내 결합될 수 있고, 리더 서열 쇄는, 적당한 판독 프레임이 유지되면서, 자가프로세싱 부위 (예: 2A)로부터 인접한 쇄에 의해 또는 프로테아제 인식 서열을 암호화하는 서열에 의해 분리될 수 있다.
면역글로불린 중쇄 경쇄의 화학량론
본원의 많은 양태에서, 면역글로불린/항체 경쇄(IgL) 및 중쇄(IgH)는 약 1:1 비 (IgL:IgH)로 숙주 세포 내에 벡터 수준으로 또는 발현되는 세포내 수준으로 존재한다. 본원 등의 재조합 접근법은 중쇄 및 경쇄의 등몰량 발현에 의존했지만[참조: 미국 특허원 제2005/0003482A1호 또는 국제공개공보 제WO2004/113493호], 다른 양태에서 본 발명은, 1차 해독 산물이 폴리단백질인 경우, 경쇄 및 중쇄 암호화 서열이 2:1의 비로 있고 쇄의 자가프로세싱 또는 단백질분해 프로세싱과 동시에 발현되는 방법 및 발현 카세트 및 벡터를 제공한다. 일부 양태에서, 비는 1:1 이상, 예를 들면, 약 2:1 또는 2:1 이상이다. 특정 양태에서, 경쇄 암호화 서열은 1:1 (IgL:IgH) 이상의 비로 사용된다. 특정 양태에서, IgL:IgH의 비는 2:1이다.
본 발명은, 면역글로불린(즉, 항체)의 중쇄 및 하나 또는 2개 이상의 경쇄를 암호화하는 서열; 절단 부위 (예: 자가프로세싱, 프로테아제 인식 부위 또는 이 사이의 시그날 펩티드)를 암호화하는 서열을 포함하고; 추가적인 단백질분해 절단 부위를 암호화하는 서열(들)을 추가로 포함할 수 있는 벡터로 형질전환되거나 감염된 숙주 세포 또는 숙주 세포의 적당한 클론을 추가로 제공한다. 다수의 서브유닛을 포함하는 전체 길이 재조합 면역글로불린 또는 이의 단편 또는 다른 생물학적 활성 단백질 (예: 2쇄 또는 다중쇄 분자 또는 자연에서 프로단백질로서 생산되고 절단되거나 프로세싱되어 전구체-유래 단백질 및 활성 부분을 방출하는 것)을 생성하는데 있어서 이러한 세포 또는 클론의 용도는, 또한 본 발명의 범위 내에 포함된다. 비제한적 실시예에는 인슐린, 인터루킨-18, 인터루킨-1, 골 형태형성 단백질(bone morphogenic protein) 4, 골 형태형성 단백질 2, 임의의 다른 2쇄 골 형태형성 단백질, 신경 성장 인자, 레닌, 키모트립신, 형질전환 성장 인자 β, 및 인터루킨 1β가 포함된다.
관련된 양상에서, 본 발명은 이러한 세포 또는 클론에 의해 생산되는 재조합 면역글로불린 분자 또는 이의 단편 또는 다른 단백질 (이때 면역글로불린은 자가 프로세싱 절단 부위 (예: 인테인 또는 헤지호그 도메인), 절단 부위 또는 시그날 펩티드 절단 부위로부터 유래한 아미노산을 포함한다), 및 이를 생산하는 방법, 벡터 및 숙주 세포를 제공한다. 일부 양태에서, 본 발명은 본원에서 기술된 하나 이상의 작제물을 함유하는 숙주 세포를 제공한다.
본 발명은 면역글로불린 분자 또는 이의 단편의 발현을 위한 단일 벡터 작제물, 및 이의 시험관내 또는 생체내 사용을 위한 방법을 제공한다. 벡터는 제1과 제2 그리고 제2와 제3의 면역글로불린 암호화 서열 사이에 자가프로세싱 또는 다른 프로세싱 인식 서열을 갖고 있어, 단일 프로모터 및 전사체를 사용하여 기능성 항체 분자가 발현되게 한다. 대표적인 벡터 작제물은 개방 판독 프레임 사이에 자가프로세싱 절단 부위를 암호화하는 서열을 포함하고, 절단 후 자가프로세싱 절단 부위를 포함하는 아미노산의 제거를 위하여 자가프로세싱 절단 부위 근처에 추가적인 단백질분해 절단 부위를 추가로 포함할 수 있다. 벡터 작제물은 시험관내 및 생체내의 전체 길이 생물학적 활성 면역글로불린 또는 이의 단편의 향상된 생산과 관련된 방법에 있어서 유용성이 있다. 2개 이상의 상이한 쇄를 갖는 다른 생물학적 활성 단백질은, 둘 중 하나의 쇄의 암호화 서열이 다른 쇄의 암호화 서열에 대해 1 이상의 비로 존재할 필요가 없을 수 있다는 것이 이해되지만, 동일한 전략을 사용하여 제조할 수 있다.
특정 조성물 및 방법이 본원에서 예시되어 있지만, 임의의 많은 대안적 조성물 및 방법이 본 발명을 실시하는 용도에 적용가능하고 적당하다는 것을 이해하여야 한다. 본 발명의 폴리단백질 발현 카세트 및 벡터, 숙주 세포 및 방법의 평가는 당업계의 표준 절차를 사용하여 수행할 수 있다는 것을 또한 이해할 것이다. 본 발명의 실시는, 달리 명시되지 않으면, 세포 생물학, 분자 생물학 (예: 재조합 기술), 미생물학, 생화학 및 면역학의 통상적인 기술을 사용할 것이고, 이는 당업자의 범위 내에 있다. 이러한 기술은 각각 명확히 본원에 참조로서 인용된 문헌[참조: Molecular Cloning: A Laboratory Manual, second edition (Sambrook et al., 1989); Oligonucleotide Synthesis (M. J. Gait, ed., 1984); Animal Cell Culture (R. I. Freshney, ed., 1987); Methods in Enzymology (Academic Press, Inc.); Handbook of Experimental Immunology (D. M. Weir & C. C. Blackwell, eds.); Gene Transfer Vectors for Mammalian Cells (J. M. Miller & M. P. Calos, eds., 1987); Current Protocols in Molecular Biology (F. M. Ausubel et al., eds., 1993); PCR: The Polymerase Chain Reaction, (Mullis et al., eds., 1994); 및 Current Protocols in Immunology (J. E. Coligan et al., eds., 1991)]에 충분히 설명되어 있다.
달리 명시되지 않으면, 본원에서 사용된 모든 용어는 당업자가 인식하는 바와 동일한 의미를 갖고, 본 발명의 실시는 미생물학의 통상적인 기술 및 재조합 DNA 기술을 사용할 것이며, 이는 당업자의 지식 내에 있다.
단백질과 관련하여 본원에서 일반적으로 사용되는 "변형된"이라는 용어는, 하나 이상의 아미노산 잔기가 참조 분자에서 치환되거나, 결실되거나, 부가된 단편을 말한다. 유사하게, 핵산과 관련하여 상기 용어는, 하나 이상의 핵산 서브유닛이 참조 분자에서 치환되거나, 결실되거나, 부가된 단편을 말한다.
본원에서 사용되는 "인테인"이라는 용어는 통상적으로 자신의 제거를 촉진하고, 엑스테인으로서 공지된 플랭킹 단편을 연결시키는, 단백질의 내부 단편을 말한다. 인테인의 많은 예는 다양한 유형의 유기체에서 인식되었고, 일부 경우에서 구조적 및/또는 기능적 특성을 공유한다. 본 발명은, 존재하는 것으로 인식되고 추가로 인정되거나 발견된 인테인, 및 이의 변이체를 광범위하게 사용할 수 있다[참조: Gogarten JP et al., 2002, Annu Rev Microbiol. 2002;56:263-87; Perler, F. B. (2002), InBase, the Intein Database. Nucleic Acids Res. 30, 383-384 (또한 New England Biolabs, Inc., Ipswich, Ma의 웹사이트에서 인터넷을 통해; http://www.neb.com/neb/inteins.html; Amital G, et al., Mol Microbiol. 2003, 47(1):61-73; Gorbalenya AE, Nucleic Acids Res. 1998; 26(7): 1741-1748. 비정규(non-canonical) 인테인). 단백질에서 인테인 함유 단위 또는 인테인 스플라이싱 단위는, 구조 양상이 절단, 연결 등의 반응에 기여할 수 있는 플랭킹 엑스테인의 부분을 포함하는 것으로 이해할 수 있다. 상기 용어는, "변형된 인테인" 구성요소가 있는 인테인-기반 시스템을 말하는 범주로서 이해할 수도 있다.
본원에서 사용되는 "변형된 인테인"이라는 용어는, 하나 이상의 아미노산 잔기가 인테인 스플라이싱 단위에 치환되거나, 결실되거나, 부가되어, 절단되거나 삭제된 엑스테인이 인테인에 의해 완전하게 연결되지 않는, 합성 인테인 또는 천연 인테인을 말할 수 있다.
본원에서 사용되는 "헤지호그"라는 용어는, 자가가수분해 기능을 달성하는 구조를 갖는 막이 있는 유전자 계열 (및 상응하는 단백질 단편)을 말한다. 계열 일원에는, 예를 들면, 드로소필라, 마우스, 사람, 및 다른 종 유래의 유사체가 포함된다. 또한, "헤지호그 단편"이라는 용어는, 이러한 계열 일원만 포함하는 것이 아니라, 광범위하게, 워트호그, 그라운드호그, 또는 카에노하브디티스 엘레간스와 같은 선충 유래의 다른 호그 함유 유전자의 자가프로세싱 도메인, 및 입금편모충류 유래의 호그렛-C 자가프로세싱 도메인에 관한 것으로도 의도된다[참조: Perler FB. Protein splicing of inteis and hedgehog autoproteolysis: structure, function, and evolution, Cell. 1998, 92(1):1-4; Koonin, EV et al., (1995) A protein splice-junction motif in hedgehog family proteins. Trends Biochem Sci. 20(4): 141-2; Hall TM et al., (1997) Crystal structure of a Hedgehog autoprocessing domain: homology between Hedgehog and self-splicing proteins. Cell 91(1):85-97; Snell EA et al, Proc. R. Soc. B (2006) 273, 401-407; Aspock et al, Genome Research, 1999, 9:909-923]. 헤지호그 단편의 특정 예로는 드로소필라 멜라노가스터 유래의 소닉 헤지호그 단백질이 있다. 상기 용어는, "변형된 헤지호그" 구성요소가 있는 헤지호그-기반 시스템을 말하는 범주로서 이해할 수도 있다.
"변형된 헤지호그" 단편이라는 용어는, 하나 이상의 아미노산 잔기가 헤지호그 스플라이싱 단위에 치환되거나, 결실되거나, 부가되어, 절단된 단편이 완전하게 연결되지 않는, 합성 헤지호그 단편 또는 천연 헤지호그 단편을 말할 수 있다.
본원에서 사용되는 "벡터"라는 용어는, 하나 이상의 이종(heterologous) 또는 재조합 DNA 서열을 함유하고, 상이한 숙주 세포 간의 전달을 위하여 설계된, DNA 또는 RNA 분자 (예: 플라스미드), 바이러스 또는 다른 운반체를 말한다. "발현 벡터" 및 "유전자 치료 벡터"라는 용어는 세포에서 이종 DNA 단편을 통합시키고 발현시키는데 효과적인 임의의 벡터를 말한다. 클로닝 또는 발현 벡터는 추가적인 요소를 포함할 수 있고, 예를 들면, 발현 벡터가 2개의 복제 시스템을 갖고 있어서, 2개의 유기체에서 (예: 발현의 경우 사람 세포에서 그리고 클로닝 및 증폭의 경우 원핵생물 숙주에서) 이를 유지할 수 있다. 핵산을 세포 내로 도입시켜 단백질 또는 폴리펩티드 발현이 일어나게 하는데 효과적인 임의의 적당한 벡터를 사용할 수 있다 (예: 바이러스 벡터 또는 비-바이러스 플라스미드 벡터). 발현에 효과적인 임의의 세포 (예: 곤충 세포 및 효모 또는 포유동물 세포와 같은 진핵생물 세포)는 본 발명을 실시하는데 유용하다.
"이종 DNA" 및 "이종 RNA"라는 용어는 이들이 존재하는 세포 또는 게놈 또는 벡터의 일부에 대해 내인성(endogenous)(고유)이 아닌 뉴클레오타이드를 말한다. 일반적으로 이종 DNA 또는 RNA는 형질도입, 감염, 형질감염, 형질전환, 전기천공, 생탄도법(biolistic) 형질전환 등에 의해 세포에 부가된다. 이러한 뉴클레오타이드는 일반적으로 하나 이상의 암호화 서열을 포함하지만, 암호화 서열이 발현될 필요는 없다. "이종 DNA"라는 용어는 "이종 암호화 서열" 또는 "전이유전자(transgene)"를 말할 수 있다.
본원에서 사용되는 "단백질" 및 "폴리펩티드"라는 용어는 상호교환가능하게 사용되어, 통상적으로 본 발명의 자가 프로세싱 절단 부위 함유 벡터를 사용하여 발현되는 관심대상의 "단백질" 및 "폴리펩티드"를 말할 수 있다. 이러한 "단백질" 및 "폴리펩티드"는, 아래에 추가로 기술한 바와 같이, 연구, 진단 또는 치료 목적으로 유용한 임의의 단백질 또는 폴리펩티드일 수 있다. 본원에서 사용되는 폴리단백질은 프로세싱이 예정되어 2개 이상의 폴리펩티드 산물을 생성하는 단백질이다.
본원에서 사용되는 "다량체"라는 용어는, 어셈블리되어 기능 단백질을 형성하는, 2개 이상의 폴리펩티드 쇄 (종종 "서브유닛"으로 지칭됨)를 포함하는 단백질을 말한다. 다량체는 2개 (이량체), 3개 (삼량체), 4개 (사량체), 또는 그 이상 (예: 오량체 등)의 펩티드 쇄로 구성될 수 있다. 다량체는 자가 어셈블리로부터 형성되거나, 어셈블리를 보조하는 촉매와 같은 구성요소를 필요로 할 수 있다. 다량체는 오직 동일한 펩티드 쇄로 구성되거나 (동종 다량체(homo-multimer)), 2개 이상의 상이한 폴리펩티드 쇄로 구성될 수 있다 (이종 다량체(hetero-multimer)). 이러한 다량체는 구조적 또는 화학적으로 기능성이다. 효소, 호르몬, 항체, 사이토카인, 케모카인 및 수용체를 포함하는 비제한적인, 많은 다량체가 당업계에 공지되어 있고 사용된다. 이와 같이, 다량체는 생물학적 (예: 약제학적) 및 산업적 (예: 생물처리(bioprocessing)/생물생산(bioproduction)) 유용성을 둘다 가질 수 있다.
본원에서 사용되는 "태그"라는 용어는, 벡터 삽입체의 하나 이상의 발현 산물의 검출 및/또는 정제를 할 수 있게 기능을 할 수 있는, 발현 벡터 내로 통합될 수 있는 펩티드를 말한다. 이러한 태그는 당업계에 익히 공지되어 있고, 표지된 아비딘 (예: 광학 또는 비색(colorimetric) 방법으로 검출될 수 있는 형광 마커 또는 효소 활성을 함유하는 스트렙타비딘)에 의해 검출될 수 있는, 비오티닐 잔기의 폴리펩티드에 대한 방사성 표지된 아미노산 또는 부착물을 포함할 수 있다. FLAG, 글루타티온-S-트랜스퍼라제, 말토스 결합 단백질, 셀룰로스 결합 도메인, 티오레독신, NusA, 미스틴(mistin), 키틴 결합 도메인, 큐티나제(cutinase), AGT, GFP 등과 같은 친화성 태그는, 단백질 발현 및 정제 시스템에서와 같이 광범위하게 사용된다. 폴리펩티드용 태그의 추가적인 비제한적 예에는, 다음이 포함되지만, 이에 제한되는 것은 아니다: 히스티딘 태그, 방사성 동위원소 또는 방사성 핵종(radionuclide) (예: 3H, 14C, 35S, 90Y, 99Tc, 111In, 125I, 131I, 177Lu, 166Ho 또는 153Sm); 형광 태그 (예: FITC, 로다민(rhodamine), 란타나이드 인광체(lanthanide phosphor)), 효소 태그 (예: 양고추냉이 퍼옥시다제(horseradish peroxidase), 루시퍼라제, 알칼리성 포스파타제); 화학발광 태그; 비오티닐 그룹; 2차 리포터에 의해 인식되는 미리 결정된 폴리펩티드 에피토프 (예: 루신 지퍼 쌍 서열, 2차 항체에 대한 결합 부위, 금속 결합 도메인, 에피토프 태그); 및 가돌리늄(gadolinium) 킬레이트와 같은 자성제(magnetic agent).
본 발명의 바이러스성 유전자 치료 벡터에 관해 본원에서 사용되는 "복제 결함"이라는 용어는, 독립적으로 더 이상 복제할 수 없고 자신의 게놈을 패키징할 수 없는 바이러스 벡터를 의미한다. 예를 들면, 피험체의 세포를 rAAV 비리온(virion)으로 감염시키는 경우, 이종 유전자가 감염된 세포에서 발현되지만, 감염된 세포에 AAV rep 및 cap 유전자와 부속 기능 유전자가 없다는 사실로 인해, rAAV가 복제할 수 없다.
본원에서 사용되는 "레트로바이러스 전달 벡터"라는 용어는, 전이유전자(transgene)를 암호화하는 뉴클레오타이드 서열을 포함하고, 벡터의 패키징을 위해 필요한 뉴클레오타이드 서열을 추가로 포함하는 발현 벡터를 말한다. 바람직하게는, 레트로바이러스 전달 벡터는 또한 세포에서 전이유전자를 발현하는데 필요한 서열을 포함한다.
본원에서 사용되는 "패키징 시스템"이라는 용어는, 재조합 바이러스를 패키징하는데 관련된 바이러스 단백질을 암호화하는 유전자를 포함하는 일련의 바이러스 작제물을 말한다. 통상적으로, 패키징 시스템의 작제물은 궁극적으로 패키징 세포 내로 통합된다.
본원에서 사용되는 "제2 세대" 렌티바이러스 벡터 시스템은, 부속 유전자, vif, vpr, vpu 및 nef가 결실되거나 불활성화된 것과 같이, 기능성 부속 유전자가 없는 렌티바이러스 패키징 시스템을 말한다[참조: Zufferey et al. 1997. Nat. Biotechnol. 15:871-875].
본원에서 사용되는 "제3 세대" 렌티바이러스 벡터 시스템은, 제2 세대 벡터 시스템의 특징을 갖고, tat 유전자가 결실되거나 불활성화된 것과 같이, 기능성 tat 유전자가 추가로 부재하는 렌티바이러스 패키징 시스템을 말한다. 통상적으로, rev를 암호화하는 유전자는 별도의 발현 작제물 상에 제공된다[참조: Dull et al. 1998. J. Virol. 72:8463-8471].
바이러스 또는 바이러스 벡터에 관해 본원에서 사용되는 "위형화된(pseudotyped)"은, 천연 바이러스 외피(envelope) 단백질이 이종(heterologous) 또는 기능적으로 변형된 바이러스 외피 단백질로 대체된 것을 말한다.
재조합 DNA 작제물 또는 벡터에 관해 본원에서 사용되는 "작동가능하게 연결된"이라는 용어는, 재조합 DNA 작제물 또는 벡터의 뉴클레오타이드 구성요소가 일반적으로 서로 공유결합되어 있는 것을 의미한다. 일반적으로, "작동가능하게 연결된" DNA 서열은 인접해 있고, 분비되는 리더의 경우에는, 인접해 있고 동일한 판독 프레임에 있다. 하지만, 인핸서(enhancer)는 발현이 상향조절되는 서열과 인접해 있을 필요가 없다. 상기 용어는 '작동가능하게 위치한'과 일관된다.
인핸서 서열은 프로모터-의존성 유전자 발현에 영향을 주고, 천연 유전자의 5' 또는 3' 영역에 위치할 수 있다. "인핸서"는 인접한 유전자의 전사를 촉진하거나 억제하는 시스(cis)-작용 요소이다. 전자를 억제하는 인핸서는 "사일런서(silencer)"라고도 한다. 인핸서는 양쪽 배향으로, 암호화 서열로부터 그리고 전사되는 영역의 하류 위치로부터 최대 수 킬로염기쌍(kb)의 거리에 걸쳐 기능을 할 수 있다(즉, 암호화 서열과 관련될 수 있다). 또한, 기질 부착 영역(matrix attachment region)과 같은 인설레이터(insulator) 또는 크로마틴 개방 서열[참조: Chung, Cell, 1993, Aug 13;74(3):505-14, Frisch et al, Genome Research, 2001, 12:349-354, Kim et al, J. Biotech 107, 2004, 95-105]을 사용하여 안정하게 통합된 유전자 카세트의 전사를 향상시킬 수 있다.
본원에서 사용되는 "유전자" 또는 "암호화 서열"이라는 용어는, 적당한 조절 서열에 작동가능하게 연결된 경우, 시험관내 또는 생체내에서 폴리펩티드로 전사되고(DNA) 해독되는(mRNA) 핵산 서열을 의미한다. 유전자는, 암호화 영역의 전후에 있는 영역, 예를 들면, 5' 비해독 (5' UTR) 또는 "리더" 서열 및 3' UTR 또는 "트레일러(trailer)" 서열, 뿐만 아니라 개개의 암호화 단편(엑손) 사이의 개재 서열(인트론)을 포함하거나 포함하지 않을 수 있다.
"프로모터"는 RNA 폴리머라제의 결합을 지시하여 RNA 합성을 촉진시키는 DNA 서열, 즉, 전사를 지시하는데 충분한 최소 서열이다. 프로모터 및 상응하는 단백질 또는 폴리펩티드 발현은 세포 유형 특이적이거나, 조직 특이적이거나, 종 특이적일 수 있다. 본 발명의 핵산 작제물 또는 벡터에는 또한, 프로모터 서열과 인접해 있거나 인접해 있지 않을 수 있는 인핸서 서열이 포함된다.
본원에서 광범위하게 사용되는 "전사 조절 서열" 또는 발현 제어 서열에는, 종종 영양적 또는 환경적 시그날에 반응하여, 연결된 암호화 서열의 전사를 조정하거나 조절하는 프로모터 서열 및 물리적으로 결합된 서열이 포함된다. 이러한 연결된 서열은, 조직 또는 세포 특이적 발현, 환경적 시그날에 대한 반응, 전사를 증가시키거나 감소시키는 단백질의 결합 등을 결정할 수 있다. "조절가능한 프로모터"는 활성이 시스 또는 트랜스 작용 인자에 의해 영향을 받는 임의의 프로모터 (예: 외부 시그날 또는 약제에 의해 활성화되는 유도가능한 프로모터)이다.
"구성적(constitutive) 프로모터"는, 대부분의 시간에 많은 또는 모든 조직/세포 유형에서 RNA 생산을 지시하는 임의의 프로모터, 예를 들면, 포유동물 세포에서 클로닝된 DNA의 구성적 발현을 촉진시키는 사람 CMV 즉시 초기(immediate early) 인핸서/프로모터 영역이다.
"전사 조절 단백질", "전사 조절 인자" 및 "전사 인자"라는 용어는 본원에서 상호교환가능하게 사용되고, DNA 반응 요소에 결합하여 관련된 유전자(들)의 발현을 전사적으로 조절하는 핵 단백질을 말한다. 전사 조절 단백질은 일반적으로 DNA 반응 요소에 직접 결합하지만, 일부 경우에 DNA에 대한 결합은, DNA 반응 요소에 결합하거나 결합되어 있는 또다른 단백질에 결합하는 방식으로 간접적일 수 있다.
본원에서 사용되는 "내부 리보좀 진입 부위(internal ribosome entry site)" 또는 "IRES"는, 시스트론(cistron)(단백질 암호화 영역)의 ATG와 같은 개시 코돈으로의 직접적 내부 리보좀 진입을 촉진시켜, 유전자의 캡-비의존적(cap-independent) 해독을 유도하는 요소를 말한다[참조: Jackson R. J. et al. 1990. Trends Biochem Sci 15:477-83; 및 Jackson R. J. and Kaminski, A. 1995. RNA 1:985-1000]. 본원에서 기술된 예는 임의의 IRES 요소의 용도에 관련되고, 이는 시스트론의 개시 코돈으로의 직접적 내부 리보좀 진입을 촉진시킬 수 있다. 본원에서 사용되는 "IRES의 해독 조절 하에서"는 해독이 IRES와 관련되어 캡-비의존적 방식으로 진행되는 것을 의미한다. 예를 들면, 중쇄 및 2개의 경쇄 암호화 서열은, 2개의 쇄를 서로 분리시키는 단백질분해 또는 자가프로세싱을 필요로 하지 않고서, 개개의 암호화 서열을 분리시키는 IRES를 통해 해독될 수 있다.
"자가프로세싱 절단 부위" 또는 "자가프로세싱 절단 서열"은, 해독후(post-translational) 또는 동시 해독적(co-translational) 프로세싱 절단 부위 서열로 본원에서 정의한다. 이러한 "자가프로세싱 절단" 부위 또는 서열은, 2A 부위, 서열 또는 도메인 또는 2A-유사 부위, 서열 또는 도메인으로 본원에서 예시한, DNA 또는 아미노산 서열을 말한다. 본원에서 사용되는 "자가프로세싱 펩티드"는, 자가프로세싱 절단 부위를 암호화하는 DNA 서열의 펩티드 발현 산물, 또는 해독시, 자가프로세싱 절단 부위를 포함하는 단백질 또는 폴리펩티드의 신속한 분자내 (시스) 절단을 매개하여 분리된 성숙한 단백질 또는 폴리펩티드 산물을 형성하는 서열의 펩티드 발현 산물로 본원에서 정의한다.
본원에서 사용되는 "추가적인 단백질분해 절단 부위"라는 용어는, 2A 또는 2A 유사 서열과 같은 자가프로세싱 절단 부위 근처에 본 발명의 발현 작제물 속에 통합되어, 자가 프로세싱 절단 서열에 의한 절단 후 남아있는 추가적인 아미노산을 제거하는 수단을 제공하는 서열을 말한다. 대표적인 "추가적인 단백질분해 절단 부위"는 본원에서 기술되고, 이에는 컨센서스 서열 RXK/R-R을 갖는 푸린 절단 부위가 포함되지만, 이에 제한되는 것은 아니다. 이러한 푸린 절단 부위는, 단백질 분비 경로 내의 푸린 및 다른 세린 프로테아제와 같은 내인성 서브틸리신-유사 프로테아제에 의해 절단될 수 있다.
본원에서 사용되는 "면역글로불린" 및 "항체"라는 용어는, 관심대상의 항원 결정기에 결합할 수 있는, 온전한(intact) 분자 뿐만 아니라 이의 단편 (예: Fa, F(ab')2, 및 Fv)을 말한다. 이러한 "면역글로불린" 및 "항체"는, 분자량이 대략 23,000 달톤인 2개의 동일한 경쇄 폴리펩티드, 및 분자량이 53,000 내지 70,000인 2개의 동일한 중쇄로 구성된다. 4개의 쇄는 "Y" 배열로 디설파이드 결합에 의해 연결된다. 중쇄는 감마(IgG), 뮤(IgM), 알파(IgA), 델타(IgD) 또는 엡실론(IgE)으로 분류되고 면역글로불린의 계열 지정의 기초가 되며, 이는 주어진 항체의 효과기(effector) 기능을 결정한다. 경쇄는 카파 또는 람다로 분류된다. 본원에서 "면역글로불린 또는 이의 단편"을 언급하는 경우, 이러한 "이의 단편"은 면역학적으로 기능성인 면역글로불린 단편, 특히 온전한 면역글로불린의 결합 친화도의 적어도 10%의 결합 친화도로 동족(cognate) 리간드에 결합하는 단편이라는 것을 이해할 것이다.
항체의 Fab 단편은 항체 분자의 일가 항원 결합 단편이다. Fv 단편은 2개의 쇄로 발현되는 경쇄의 가변 영역 및 중쇄의 가변 영역을 함유하는 유전자 조작된 단편이다.
"사람화 항체(humanized antibody)"라는 용어는, 항체의 본래의 결합 활성을 여전히 보유하면서, 하나 이상의 아미노산이 비항원 결합 영역에서 치환되어 사람 항체에 보다 가깝게 닮은 항체 분자를 말한다[참조: 미국특허 제6,602,503호].
본원에서 사용되는 "항원 결정기"라는 용어는 특정 항체와 접촉하는 분자의 단편(즉, 에피토프)을 말한다. 단백질 또는 펩티드, 또는 단백질 또는 당단백질의 당펩티드의 많은 영역은, 단백질 상의 주어진 영역 또는 3차원 구조에 특이적으로 결합하는 항체의 생산을 유도할 수 있다. 이러한 영역 또는 구조를 항원 결정기 또는 에피토프라고 한다. 항원 결정기는 항체에 결합하기 위하여 온전한 항원 (즉, 면역 반응을 유도하는데 사용되는 면역원)과 경쟁할 수 있다.
본 발명의 재조합 단백질 또는 폴리펩티드를 말하는 경우, "단편"이라는 용어는, 상응하는 전체 길이 단백질 또는 폴리펩티드의 아미노산 서열의 일부와 동일하지만, 모두 동일하지는 않은, 아미노산 서열을 갖는 펩티드 또는 폴리펩티드를 의미하고, 이는 상응하는 전체 길이 단백질 또는 폴리펩티드의 하나 이상의 기능 또는 활성을 보유한다. 단편은 바람직하게는 전체 길이 단백질 또는 폴리펩티드의 적어도 20 내지 100개의 연속 아미노산 잔기를 포함한다.
본원에서 사용되는 "투여한다" 또는 "도입한다"라는 용어는, 단백질(예: 면역글로불린)을 이를 필요로 하는 사람 또는 동물에게 당업계에 공지된 임의의 경로로 전달하는 것을 의미한다. 약제학적 담체 및 제형 또는 조성물은 또한 당업계에 익히 공지되어 있다. 투여 경로에는 정맥내, 근육내, 피내, 피하, 경피, 점막, 종양내 또는 점막 투여가 포함될 수 있다. 대안으로, 이러한 용어는 재조합 단백질 발현을 위한 벡터를 세포 또는 배양물 중의 세포 및/또는 피험체의 세포 또는 기관으로 전달하는 것을 말할 수 있다. 이러한 투여 또는 도입은 생체내, 시험관내 또는 생체외에서 일어날 수 있다. 재조합 단백질 또는 폴리펩티드 발현을 위한 벡터는, 물리적인 방법 (예: 인산칼슘 형질감염, 전기천공, 미세주사 또는 리포펙션(lipofection))에 의한 세포 내로의 이종 DNA의 삽입을 통상적으로 의미하는 형질감염에 의해; 감염체(infectious agent), 즉 바이러스에 의한 도입을 통상적으로 의미하는 감염에 의해; 또는 바이러스체(viral agent) (예: 박테리오파지)에 의한 하나의 미생물로부터 다른 미생물로의 바이러스 또는 유전 물질의 전달을 사용한 세포의 안정한 감염을 통상적으로 의미하는 형질도입에 의해, 세포 내로 도입될 수 있다.
"형질전환"은 통상적으로, 이종 DNA를 포함하는 세균, 또는 종양유전자(oncogene)를 발현하여 연속 성장 방식으로 전환된 세포, 예를 들면, 종양 세포를 말하는데 사용된다. 세포를 "형질전환"시키는데 사용되는 벡터는 플라스미드, 바이러스 또는 다른 운반체일 수 있다.
통상적으로, 세포 내로 이종 DNA(즉, 벡터)를 투여, 도입 또는 삽입하기 위하여 사용되는 방법에 따라, 세포를 "형질도입시킨다", "감염시킨다", "형질감염시킨다" 또는 "형질전환시킨다"라고 말한다. "형질도입", "형질감염" 및 "형질전환"이라는 용어는 이종 DNA의 도입 방법에 상관없이 본원에서 상호교환가능하게 사용될 수 있다.
본원에서 사용되는 "안정하게 형질전환된", "안정하게 형질감염된" 및 "유전자전이된(transgenic)"이라는 용어는 게놈 내로 통합된 비천연(이종) 핵산 서열을 갖는 세포를 말한다. 안정한 형질감염은, 게놈 내로 통합되거나 에피좀 요소로서 안정하게 복제하는 형질감염된 DNA를 함유하는 딸세포(daughter cell)의 집단을 포함하는 세포주 또는 클론의 확립에 의해 증명된다. 일부 경우에서, "형질감염"은 안정하지 않다, 즉, 일시적이다. 일시적 형질감염의 경우에서, 외인성 또는 이종 DNA가 발현되지만, 도입된 서열이 게놈 내로 통합되어 있지 않거나 숙주 세포가 복제를 할 수 없다.
본원에서 사용되는 "생체외 투여"는, 일차 세포를 피험체로부터 채취하고, 벡터를 세포에 투여하여 재조합 세포를 생산, 형질도입, 감염 또는 형질감염시키고, 재조합 세포를 동일하거나 상이한 피험체에게 재투여하는 과정을 말한다.
"다중시스트론(multicistronic) 전사체"는 하나 이상의 단백질 암호화 영역, 또는 시스트론을 함유하는 mRNA 분자를 말한다. 2개의 암호화 영역을 포함하는 mRNA는 "이중시스트론(bicistronic) 전사체"라고 한다. "5'-근위(proximal)" 암호화 영역 또는 시스트론은, 해독 개시 코돈(일반적으로 AUG)이 다중시스트론 mRNA 분자의 5' 말단에 가장 가까운 암호화 영역이다. "5'-원위(distal)" 암호화 영역 또는 시스트론은, 해독 개시 코돈(일반적으로 AUG)이 mRNA의 5' 말단에 가장 가까운 개시 코돈이 아닌 암호화 영역이다.
"5'-원위" 및 "하류"라는 용어는 같은 의미로 사용되고, mRNA 분자의 5' 말단에 인접하지 않은 암호화 영역을 말한다
본원에서 사용되는 "공동 전사되는(co-transcribed)"은 2개 (또는 이상)의 개방 판독 프레임 또는 암호화 영역 또는 폴리뉴클레오타이드가 프로모터를 포함하는 단일 전사 제어 또는 조절 요소의 전사적 제어 하에 있는 것을 의미한다.
본원에서 사용되는 "숙주 세포"라는 용어는 벡터로 형질도입, 감염, 형질감염 또는 형질전환된 세포를 말한다. 벡터는 플라스미드, 바이러스 입자, 파지 등일 수 있다. 온도, pH 등과 같은 배양 조건은, 발현을 위하여 선택된 숙주 세포와 함께 이전에 사용된 조건이고, 당업자에게 명백할 것이다. "숙주 세포"라는 용어는 본래의 형질도입, 감염, 형질감염 또는 형질전환된 세포 및 이의 자손(progeny)을 말한다는 것이 인식될 것이다.
본원에서 사용되는 "생물학적 활성" 및 "생물학적으로 활성인"이라는 용어는, 배양물 중의 세포주에서 또는 무세포 시스템 (예: ELISA 플레이트에서의 리간드-수용체 검정)에서 특정 단백질에 귀속된 활성을 말한다. "면역글로불린", "항체" 또는 이의 단편의 "생물학적 활성"은, 항원 결정기에 결합하여 면역학적 기능을 촉진시키는 능력을 말한다. 호르몬 또는 인터루킨의 "생물학적 활성"은 당업계에 공지된 바와 같다.
본원에서 사용되는 "종양" 및 "암"이라는 용어는 정상적인 성장 및/또는 발생에 대한 제어의 적어도 부분적 상실을 나타내는 세포를 말한다. 예를 들면, 종종 종양 또는 암 세포는 일반적으로 접촉 억제(contact inhibition)를 상실하며, 침습성(invasive)이고/이거나 전이하는 능력을 가질 수 있다.
항체는 중쇄 및 경쇄의 이종이량체(heterodimer)인 면역글로불린 단백질이다. 통상적인 항체는 2개의 중쇄 및 2개의 경쇄 (또는 이의 기능성 단편)가 함께 결합되어 있는 다량체이다. 항체는, 종종 동종형(isotype)에 따라, 이량체, 삼량체, 사량체, 오량체 등으로 존재하여, 더 높은 중합체 구조 차수(polymeric order of structure)를 가질 수 있다. 이들은 포유동물 배양 발현 시스템에서 단일 벡터 또는 2개의 벡터로부터 전체 길이 형태로 발현되기가 극도로 어려운 것으로 증명되었다. 다수의 방법이 항체의 생산을 위하여 현재 사용된다: "폴리클로날" 항체를 생산하기 위한 동물의 생체내 면역화, 모노클로날 항체를 생산하기 위한 B-세포 하이브리도마(hybridoma)의 시험관내 세포 배양[참조: 본원에 참조로서 인용된, Kohler, et al. 1988. Eur. J. Immunol. 6:511; Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, 1988] 및 재조합 DNA 기술 [예를 들면, 본원에 참조로서 인용된 문헌(참조: Cabilly et al., 미국 특허 제6331415호)에 기술되어 있음].
면역글로불린 폴리펩티드의 기본적인 분자 구조는, 분자량이 대략 23,000 달톤인 2개의 동일한 경쇄, 및 분자량이 53,000 내지 70,000인 2개의 동일한 중쇄를 포함하고, 4개의 쇄는 "Y" 배열로 디설파이드 결합에 의해 연결되어 있는 것으로 익히 공지되어 있다. 아미노산 서열은 Y의 상단에 있는 N-말단에서 각 쇄의 기저에 있는 C-말단으로 이어진다. N-말단에는 항원 결합의 특이성을 제공하는 (길이가 대략 100 아미노산인) 가변 영역이 있다.
본 발명은, 천연 서열을 갖는 전체 길이 항체 및 항체 단편 (즉, 항원에 의한 자극에 반응하여 생산되는 서열), 중쇄 및 경쇄의 항원 결합 가변 영역을 안정하게 폴딩된 단일 폴리펩티드 쇄로 결합시키는 단일 쇄 항체; 일가 항체 (제2의 중쇄의 Fc 영역에 결합된 중쇄/경쇄 이량체를 포함함); 면역글로불린 분자의 전체 "Y" 영역을 포함하는 "Fab 단편", 즉, "Y", 경쇄 또는 중쇄 단독, 또는 이의 일부의 분지(branch) (즉, 일반적으로 Fab'로 공지된, 하나의 중쇄와 하나의 경쇄의 집합체); 2개 이상의 상이한 항원에 대해 특이성을 갖는 "하이브리드 면역글로불린" (예: 미국특허 제6,623,940호에 기술된 쿼드로마(quadroma) 또는 이중특이적(bispecific) 항체); 중쇄 및 경쇄가 상이한 종으로부터 유래된 쇄 또는 특이성을 모방하는 "복합(composite) 면역글로불린"; 및 중쇄 및 경쇄의 각각의 아미노산 서열의 일부가 하나 이상의 종으로부터 유래하는 (즉, 가변 영역은 쥐 항체와 같은 하나의 기원으로부터 유래하는 반면에, 불변 영역은 사람 항체와 같은 또다른 기원으로부터 유래하는) "키메릭 항체"를 포함하는 비제한적인, 모든 유형의 면역글로불린을 생산하는 개선된 방법에 관한 것이다.
본 발명의 조성물 및 방법은 면역글로불린 또는 이의 단편의 생산에 있어서 유용성이 있고, 이때 중쇄 또는 경쇄는 "포유동물", "키메릭" 쇄이거나 효능을 향상시키는 방식으로 변형된다. 변형된 항체에는, 비변형 형태의 동일한 생물학적 활성을 보유하는 아미노산 및 핵산 서열 변이체, 및 변형되어 활성이 달라진, 즉, 보체 고정, 막과의 상호작용, 및 다른 효과기 기능을 향상시키는 불변 영역이 변화하거나, 항원 결합 특성을 향상시키는 가변 영역이 변화된 것이 포함된다. 본 발명의 조성물 및 방법에는 촉매성 면역글로불린 또는 이의 단편이 추가로 포함될 수 있다.
"변이체" 면역글로불린 암호화 폴리뉴클레오타이드 서열은, 참조 폴리펩티드 서열로부터 하나 이상의 아미노산이 변경된 "변이체" 면역글로불린 아미노산 서열을 암호화할 수 있다. 후술되는 이 동일한 논의는 관심대상의 다른 생물학적 활성 단백질 서열 (및 이들의 암호화 서열)에 적용가능하다. 변이체 폴리뉴클레오타이드 서열은 "보존적" 치환을 함유하는 변이체 아미노산 서열을 암호화할 수 있고, 이때 치환되는 아미노산은 치환하는 아미노산과 유사한 구조적 또는 화학적 성질을 갖는다. 관심대상의 단백질의 변이체는 천연 서열의 아미노산 서열과 실질적으로 동일한 (적어도 약 80 내지 99 (및 이 사이의 모든 정수) % 동일한) 아미노산 서열로 형성될 수 있고, 이는 기능적으로 동등한, 3차원 구조를 형성하며 천연 단백질의 생물학적 기능을 보유한다는 것을 이해하여야 한다. 단백질의 기능에 영향을 주지 않으면서 단백질 서열에서 특정 아미노산이 치환될 수 있다는 것은 생물학 분야에서 익히 공지되어 있다. 일반적으로, 보존적 아미노산 치환 또는 유사한 아미노산의 치환은 단백질 기능에 영향을 주지 않으면서 허용된다. 유사한 아미노산은 크기 및/또는 전하 특성이 유사한 아미노산일 수 있고, 예를 들면, 아스파르테이트와 글루타메이트 및 이소류신과 발린은 유사한 아미노산의 두 쌍이다. 의도된 경우를 제외하고 천연 2차 및 3차 구조 형태가 붕괴되지 않는 경우, 한 아미노산을 또다른 아미노산으로 치환하는 것이 허용된다. 아미노산 쌍 사이의 유사성은 많은 방법으로 당업계에서 평가되었다. 예를 들면, 본원에 참조로서 인용된 문헌[참조: Dayhoff et al., in Atlas of Protein Sequence and Structure, 1978. Volume 5, Supplement 3, Chapter 22, pages 345-352]은 아미노산 유사성의 척도로서 사용될 수 있는 아미노산 치환에 관한 빈도 표를 제공한다. 문헌[참조: Dayhoff et al.]의 빈도 표는 다양한 진화적으로 상이한 기원으로부터 유래한 동일한 기능을 갖는 단백질에 대한 아미노산 서열의 비교를 기반으로 한다.
공개된 뉴클레오타이드 (및 아미노산) 서열의 치환 돌연변이, 삽입, 및 결실 변이체는 당업계에 익히 공지된 방법으로 쉽게 제조할 수 있다. 이러한 변이체는, 변이체가 구체적으로 예시된 본 발명의 서열과 실질적인 서열 동일성을 갖고 목적하는 기능성이 보존되는 한, 구체적으로 예시된 서열과 동일한 방법으로 사용될 수 있다.
본원에서 사용되는, 실질적인 서열 동일성은, 변이체가 유래된 폴리뉴클레오타이드 또는 단백질과 동일한 능력으로 변이체 폴리뉴클레오타이드 또는 단백질이 기능을 하게 하는데 충분한 상동성(또는 동일성)을 말한다. 바람직하게는, 상기 서열 동일성은 70% 또는 80% 이상이고, 보다 바람직하게는, 상기 동일성은 85% 이상이거나, 상기 동일성은 90% 이상이고/이거나 대안으로, 상기 동일성은 95% 이상이고, 70과 100% 사이의 모든 정수이다. 기능이 동등하거나, 서열의 기능이 향상되거나 방법론적 장점이 제공되도록 설계된 치환 돌연변이, 삽입 및 결실 돌연변이를 제조하는 것은 당업자의 기술 내에 있다. 임의의 천연 단백질에서 판독할 수 있거나 적격인 선행 기술 항목에서 판독하는 양태/변이체는, 청구된 본 발명의 범위 내에 있는 것으로 의도되지 않는다. 본 발명의 폴리뉴클레오타이드 서열이 절두되고/절두되거나 돌연변이되어 생성된 특정 단편 및/또는 본래의 전체 길이 서열의 돌연변이체가 전체 길이 서열의 목적하는 특성을 보유할 수 있다는 것은 당업계에서 익히 공지되어 있다. 큰 핵산 분자로부터 단편을 생성하는데 적당한 광범위한 제한 효소는 익히 공지되어 있다. 또한, Bal31 엑소뉴클레아제가 DNA의 시간-제어된 한정된 분해를 위하여 편리하게 사용될 수 있다는 것은 익히 공지되어 있다[참조: 본원에 참조로서 인용된, Maniatis et al. 1982. Molecular Cloning : A Laboratory Manual, Cold Spring Harbor Laboratory, New York, pages 135-139, 및 Wei et al. 1983. J. Biol . Chem. 258:13006-13512]. Bal31 엑소뉴클레아제를 사용하여 (통상적으로 "염기 삭제(erase-a-base)" 절차라고 함), 당업자는 대상 핵산의 한쪽 또는 양쪽 말단으로부터 뉴클레오타이드를 제거하여 대상 뉴클레오타이드 서열과 기능적으로 동등한 다양한 단편을 생성할 수 있다. 당업자는, 상기 방법으로, 본래의 암호화 서열 전체의 위치로부터 제어된, 다양한 길이의 수백 개의 단편을 생성한다. 당업자는 생성된 단편을 이들의 특징에 대해 일상적으로 검사 또는 스크리닝할 수 있고, 본원에서 제시한 단편의 유용성을 결정할 수 있다. 전체 길이 서열의 돌연변이 서열, 또는 이의 단편은 부위 지시된 돌연변이유발로 쉽게 생산할 수 있다는 것은 또한 익히 공지되어 있다[참조: 본원에 참조로서 인용된, Larionov, O.A. and Nikiforov, V.G. 1982. Genetika 18:349-59; Shortle et al. (1981) Annu . Rev . Genet. 15:265-94]. 당업자는 결실형, 삽입형 또는 치환형 돌연변이를 일상적으로 생산할 수 있고, 전체 길이 야생형 서열 또는 이의 단편의 목적하는 특성을 갖는, 예를 들면, 호르몬, 사이토카인, 항원-결합 또는 다른 생물학적 활성을 보유하는, 이러한 생성된 돌연변이를 확인할 수 있다.
또한, 대안으로, 변이체 폴리뉴클레오타이드 서열은 "비보존적" 치환을 함유하는 변이체 아미노산 서열을 암호화할 수 있고, 이때 치환되는 아미노산은 치환하는 아미노산과 상이한 구조적 또는 화학적 특성을 갖는다. 변이체 면역글로불린 암호화 폴리뉴클레오타이드는 아미노산 삽입 또는 결실, 또는 둘다를 함유하는 변이체 아미노산 서열을 암호화할 수도 있다. 또한, 변이체 면역글로불린 암호화 폴리뉴클레오타이드는, 유전 암호의 축퇴(degeneracy)로 인해, 참조 폴리뉴클레오타이드 서열과 동일한 폴리펩티드를 암호화할 수 있지만, 참조 뉴클레오타이드 서열로부터 하나 이상의 염기가 달라진 폴리뉴클레오타이드 서열을 갖는다.
본 발명의 재조합 면역글로불린을 말하는 경우, "단편"이라는 용어는 상응하는 전체 길이 면역글로불린 단백질의 아미노산 서열의 일부와 동일하지만, 모두 동일하지는 않는, 아미노산 서열을 갖는 폴리펩티드를 의미하고, 이는 상응하는 전체 길이 단백질과 본질적으로 동일한 생물학적 기능 또는 활성을 보유하거나, 상응하는 전체 길이 단백질의 하나 이상의 기능 또는 활성을 보유한다. 단편은 바람직하게는 전체 길이 면역글로불린의 적어도 20 내지 100개의 연속 아미노산 잔기를 포함하고, 바람직하게는, 전체 길이 항체와 같이 동일한 항원에 결합하는 능력을 보유한다.
본원에서 사용되는 "서열 동일성"이라는 용어는, 서열 정렬 프로그램을 사용하여 정렬된 경우, 2개 이상의 정렬된 서열에서 핵산 또는 아미노산 서열 동일성을 말한다. "% 상동성"이라는 용어는 본원의 "% 동일성"이라는 용어와 본원에서 상호교환가능하게 사용되고, 서열 정렬 프로그램을 사용하여 정렬된 경우, 2개 이상의 정렬된 서열 간의 핵산 또는 아미노산 서열 동일성의 수준을 말한다. 예를 들면, 본원에서 사용되는 80% 상동성은 정의된 알고리듬에 의해 결정된 80% 서열 동일성과 같은 의미이고, 따라서 주어진 서열의 동족체는 주어진 서열의 길이에 걸쳐 80% 이상의 서열 동일성을 갖는다.
비교를 위한 서열의 최적 정렬은, 예를 들면, 문헌[참조: Smith and Waterman. 1981. Adv. Appl. Math. 2:482]의 국소 상동성 알고리듬에 의해, 문헌[참조: Needleman and Wunsch. 1970. J Mol. Biol. 48:443]의 상동성 정렬 알고리듬에 의해, 문헌[참조: Pearson and Lipman. 1988. Proc. Natl. Acad. Sci. USA 85:2444]의 유사성 방법 검색에 의해, 이러한 알고리듬의 컴퓨터화된 실행 (Wisconsin Genetics 소프트웨어 패키지(Genetics Computer Group, Madison, Wis.)의 GAP, BESTFIT, FASTA 및 TFASTA)에 의해, National Center for Biotechnology Information 웹사이트(참조: nlm.nih.gov/)를 통해 공개적으로 이용가능한 소프트웨어를 사용한, BLAST 알고리듬[참조: Altschul et al. 1990. J Mol. Biol. 215:403-410]에 의해, 또는 육안 검사[참조: Ausubel et al., infra]에 의해 수행할 수 있다. 본 발명의 목적상, 비교를 위한 서열의 최적 정렬은 가장 바람직하게는 문헌[참조: Smith and Waterman. 1981. Adv. Appl. Math. 2:482, 및 Altschul et al. 1990 및 Altschul et al. 1997]의 국소 상동성 알고리듬에 의해 수행한다.
2개 이상의 핵산 또는 단백질 서열과 관련하여 "동일한" 또는 백분율 "동일성"이라는 용어는, 최대 상응성을 위하여 비교 및 정렬된 경우, 본원에서 기술된 서열 비교 알고리듬 (예: Smith-Waterman 알고리듬), 당업계에 공지된 알고리듬 (예: BLAST) 중 하나를 사용하여, 또는 육안 검사에 의해 측정되는, 동일하거나, 또는 특정 백분율의 동일한 아미노산 잔기 또는 뉴클레오타이드를 갖는, 2개 이상의 서열 또는 서브서열(subsequence)을 말한다.
본 발명에 따라, 자가프로세싱 절단 폴리펩티드, 및 천연 서열에 대해 80, 85, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% (및 80과 100 사이의 모든 정수) 이상의 서열 동일성을 갖는 폴리펩티드 그 자체를 암호화하는 서열 변이체 또한 포함된다. 적어도 5, 적어도 10, 또는 적어도 15 단위의 연속적인 쇄를 나타내는 폴리펩티드의 아미노산 단편; 및 기술된 동일성 조건에 따라 이와 상동인 단편; 및 적어도 15, 적어도 30, 또는 적어도 45 단위의 연속적인 쇄를 나타내는 핵산 서열의 단편 또한 포함된다.
핵산 서열은, 2개의 서열이 보통 내지 높은 엄중성(stringency) 하이브리드화 및 세척 조건 하에서 서로 특이적으로 하이브리드화하는 경우, 참조 핵산 서열에 "선택적으로 하이브리드화 가능한" 것으로 간주된다. 하이브리드화 조건은 핵산 결합 복합체 또는 프로브의 변성 온도(Tm)에 기반한다. 예를 들면, "최대 엄중성"은 통상적으로 약 Tm-5℃ (프로브의 Tm의 5℃ 아래)에서 발생하고; "높은 엄중성"은 Tm의 약 5 내지 10℃ 아래에서 발생하고; "중간 엄중성"은 프로브의 Tm의 약 10 내지 20℃ 아래에서 발생하고; "낮은 엄중성"은 Tm의 약 20 내지 25℃ 아래에서 발생한다. 기능적으로, 최대 엄중성 조건을 사용하여 하이브리드화 프로브와 엄격한 동일성 또는 거의 엄격한 동일성을 갖는 서열을 확인할 수 있고; 높은 엄중성 조건을 사용하여 프로브와 약 80% 이상의 서열 동일성을 갖는 서열을 확인한다.
보통 및 높은 엄중성 하이브리드화 조건은 당업계에 익히 공지되어 있다[참조: Sambrook, et al, 1989, Chapters 9 and 11, 및 Ausubel, F. M., et al., 1993]. 높은 엄중성 조건의 예에는, 약 42℃에서 50% 포름아미드, 5X SSC, 5X 덴하르트(Denhardt) 용액, 0.5% SDS 및 100㎍/ml 변성된 운반체 DNA 중에서 하이브리드화하고 나서, 2X SSC 및 0.5% SDS 중에서 실온에서 2회 세척하고, 0.1X SSC 및 0.5% SDS 중에서 42℃에서 추가로 2회 세척하는 것이 포함된다. 관심대상의 천연 단백질과 동일한 생물학적 활성을 갖는 폴리펩티드를 암호화하고 보통 내지 높은 엄중성 하이브리드화 조건 하에서 하이브리드화하는 2A 서열 변이체는 본 발명의 범위 내에 있는 것으로 간주된다.
유전 암호의 축퇴(degeneracy)의 결과로서, 동일한 2A 또는 2A-유사 폴리펩티드 서열 또는 다른 프로테아제 또는 시그날 펩티다제 절단 서열을 암호화하는 많은 암호화 서열이 생성될 수 있다. 예를 들면, 트리플렛(triplet) CGT는 아미노산 아르기닌을 암호화한다. 아르기닌은 CGA, CGC, CGG, AGA 및 AGG에 의해서도 암호화된다. 그러므로 암호화 영역 내의 동의어 코돈의 이러한 치환은 본 발명에 포함되는 서열 변이체 내에 속한다는 것이 인식된다.
이러한 서열 변이체는 높은 엄중성 조건 하에서 모 서열(parent sequence)에 하이브리드화할 수 있거나 하지 않을 수 있다는 것이 추가로 인식된다. 이는, 예를 들면, 서열 변이체가 모 뉴클레오타이드에 의해 암호화된 각각의 아미노산에 대한 상이한 코돈을 포함하는 경우, 가능할 수 있을 것이다. 이러한 변이체는, 그럼에도 불구하고, 구체적으로 고려되고 본 발명에 포함된다.
치료 양식으로서의 항체의 가능성은 현행 기술의 생산 능력 및 비용으로 인해 현재 제한되어 있다. 면역글로불린 (또는 다른 단백질) 생산을 위한 개선된 바이러스 또는 비-바이러스 단일 발현 벡터는, 2개 이상의 암호화 서열 (즉, 단일 벡터로부터 이중 또는 다중 특이성을 갖는 면역글로불린 또는 다른 단백질)의 발현 및 전달을 촉진시킨다. 본 발명은 이러한 제한을 해결하고, 단일 쇄 항체, 전체 길이 항체 또는 항체 단편, 2쇄 호르몬, 2쇄 사이토카인, 2쇄 케모카인, 2쇄 수용체 등과 같은 조작된 항체를 포함하는, 본원에서 상세히 기술되는 임의의 면역글로불린 (즉, 항체) 또는 이의 단편 또는 다른 멀티파트(multipart) 단백질 또는 결합 단백질 쌍에 대해 적용가능하다.
IRES
내부 리보좀 진입 부위(IES) 요소는 피코르나바이러스 mRNA에서 최초로 발견되었다[참조: Jackson et al. 1990. Trends Biochem. Sci. 15:477-83 및 Jackson and Kaminski. 1995. RNA 1:985-1000]. 당업자에 의해 일반적으로 사용되는 IRES의 예에는 표 1에 인용된 것 뿐만 아니라, 미국 특허 제6,692,736호에서 기술된 것이 포함된다. 당업계에 공지된 "IRES"의 예에는 피코르나바이러스로부터 수득가능한 IRES[참조: Jackson et al., 1990] 및 바이러스 또는 세포 mRNA 기원으로부터 수득가능한 IRES, 예를 들면, 면역글로불린 중쇄 결합 단백질(BiP), 혈관 내피 성장 인자(VEGF)[참조: Huez et al. 1998. Mol. Cell. Biol. 18:6178-6190], 섬유아세포 성장 인자 2 (FGF-2), 및 인슐린-유사 성장 인자(IGFII), 해독 개시 인자 eIF4G 및 효모 전사 인자 TFIID 및 HAP4, Novagen에서 시판되는 뇌심근염 바이러스(EMCV)[참조: Duke et al. 1992. J. Virol 66:1602-9] 및 VEGF IRES[참조: Huez et al. 1998. Mol. Cell. Biol. 18:6178-90]가 포함되지만, 이에 제한되는 것은 아니다. IRES는 또한 카디오바이러스(cardiovirus), 라이노바이러스(rhinovirus), 아프토바이러스(aphthovirus), HCV, 프렌드 쥐 백혈병 바이러스(FrMLV) 및 말로니 쥐 백혈병 바이러스(MoMLV)와 같은 상이한 바이러스에서 보고되었다. 본원에서 사용되는 "IRES"는, 변이가 시스트론의 개시 코돈으로의 직접적 내부 리보좀 진입을 촉진시킬 수 있는 한, IRES 서열의 기능적 변이를 포함한다. IRES는 포유동물, 바이러스 또는 원생동물의 IRES일 수 있다.
IRES는 하류 시스트론의 개시 코돈으로의 직접적 내부 리보좀 진입을 촉진시켜, 캡-비의존적 해독을 유도한다. 따라서, 하류 시스트론의 산물은, 폴리단백질의 절단 또는 단일시스트론 mRNA의 생성을 요구하지 않으면서, 이중시스트론 (또는 다중시스트론) mRNA로부터 발현될 수 있다. 내부 리보좀 진입 부위는 길이가 대략 450 뉴클레오타이드이고, 1차 서열의 적당한 보존 및 2차 구조의 강한 보존을 특징으로 한다. IRES의 가장 중요한 1차 서열 특징은, 시작이 IRES의 3' 말단의 대략 25 뉴클레오타이드 상류에 위치한 피리미딘 풍부 부위이다[참조: Jackson et al. (1990)].
피코르나바이러스 IRES의 3개 주요 계열이 확인 및 특성규명되었다: 카디오- 및 아프토바이러스 계열 (예를 들면, 뇌심근염 바이러스[참조: Jang et al. 1990. Gene Dev 4:1560-1572]); 엔테로- 및 라이노바이러스 계열 (예를 들면, 폴리오바이러스[참조: Borman et al. 1994. EMBO J. 13:3149-3157]); 및 A형 간염 바이러스 (HAV) 계열[참조: Glass et al. 1993. Virol 193:842-852]. 앞의 2개의 계열의 경우, 2개의 일반적인 원리가 적용된다. 첫번째로, IRES의 450 뉴클레오타이드 서열의 대부분은, 리보좀 결합 및 해독 개시를 유도하는 특정 2차 및 3차 구조를 유지하는 기능을 한다. 두번째로, 리보좀 진입 부위는 IRES의 3' 말단, 보존된 올리고피리미딘 쇄의 대략 25 뉴클레오타이드 하류에 위치한 AUG 트리플렛이다. 해독 개시는 리보좀 진입 부위에서 (카디오바이러스) 또는 다음 하류 AUG에서 (엔테로/라이노바이러스 계열) 일어날 수 있다. 아프토바이러스에서는 두 부위에서 모두 개시가 일어난다. HCV 및 페스티바이러스 (예: 소 바이러스성 설사 바이러스 (BVDV) 또는 돼지 콜레라 바이러스(CSFV; Classical Swine Fever Virus))는 각각 341 nt 및 370 nt 길이의 5'-UTR을 갖고 있다. 이러한 5'-UTR 단편은 유사한 RNA 2차 구조를 형성하여 적당하게 효율적인 IRES 기능을 가질 수 있다[참조: Tsukiyama-Kohara et al. 1992. J. Virol. 66:1476-1483; Frolov et al. 1998. RNA 4:1418-1435]. 최근 연구에서, 프렌드 쥐 백혈병 바이러스 (MLV) 5'-UTR 및 래트 레트로트랜스포손(retrotransposon) 바이러스-유사 30S (VL30) 서열이 레트로바이러스 기원의 IRES 구조를 함유하는 것으로 밝혀졌다[참조: Torrent et al. 1996. Hum. Gene Ther 7:603-612].
진핵생물 세포에서, 해독은 일반적으로 리보좀이, 개시 인자의 조절하에서, 캡핑된(capped) mRNA 5' 말단에서부터 스캐닝하여 시작된다. 하지만, 여러 세포 mRNA는 캡-비의존적 해독을 매개하는 IRES 구조를 갖는 것으로 밝혀졌다[참조: van der Velde, et al. 1999. Int J Biochem Cell Biol. 31:87-106]. IRES 요소의 예에는 면역글로불린 중쇄 결합 단백질(BiP)[참조: Macejak et al. 1991. Nature 353:90-94], 드로소필라의 안테나페디아(antennapedia) mRNA[참조: Oh et al. 1992. Gene and Dev 6:1643-1653], 섬유아세포 성장 인자-2 (FGF-2)[참조: Vagner et al. 1995. Mol. Cell. Biol. 15:35-44], 혈소판 유래 성장 인자 B (PDGF-B)[참조: Bernstein et al. 1997. J. Biol. Chem. 272:9356-9362], 인슐린-유사 성장 인자 II[참조: Teerink et al. (1995) Biochim. Biophys. Acta 1264:403-408], 및 해독 개시 인자 eIF4G[참조: Gan et al. 1996. J. Biol. Chem. 271:623-626]가 포함되지만, 이에 제한되는 것은 아니다. 최근에, 혈관 내피 성장 인자(VEGF)도 IRES 요소를 갖는 것으로 밝혀졌다[참조: Stein et al. 1998. Mol. Cell. Biol. 18:3112-3119; Huez et al. 1998. Mol. Cell. Biol. 18:6178-6190]. IRES 서열의 추가적인 예에는 피코르나바이러스 HAV[참조: Glass et al. 1993. Virology 193:842-852]; EMCV[참조: Jang and Wimmer. 1990. Gene Dev. 4:1560-1572]; 폴리오바이러스[참조: Borman et al. 1994. EMBO J. 13:3149-3157]; HCV[참조: Tsukiyama-Kohara et al. 1992. J. Virol. 66:1476-1483]; 페스티바이러스 BVDV[참조: Frolov et al. 1998. RNA. 4:1418-1435]; 레이슈마니아(Leishmania) LRV-1[참조: Maga et al. 1995. Mol. Cell. Biol. 15:4884-4889]; 레트로바이러스; MoMLV[참조: Torrent et al. 1996. Hum. Gene Ther. 7:603-612], VL30, 하비(Harvey) 쥐 육종 바이러스, REV[참조: Lopez-Lastra et al. 1997. Hum. Gene Ther. 8:1855-1865]가 포함된다. IRES는 당업계에 공지된 표준 재조합 및 합성 방법을 사용하여 제조할 수 있다. 클로닝의 편의를 위하여, 사용될 IRES 단편의 말단에 제한 부위를 조작해 넣을 수 있다.
바이러스 또는 비-바이러스 벡터에 의해 결정된 단일 전사체로부터 2개 이상의 단백질을 발현시키기 위하여, 내부 리보좀 진입 부위 (IRES) 서열을 통상적으로 사용하여 제2, 제3, 제4의 암호화 서열 등이 발현되게 한다. 2개의 암호화 서열이 IRES를 통해 연결된 경우, 제2의 암호화 서열의 해독적 발현 수준은 종종 상당히 감소한다[참조: Furler et al. 2001. Gene Therapy 8:864-873]. 사실, 동일한 프로모터에 작동가능하게 연결된 2개 이상의 암호화 서열의 전사를 제어하기 위한 IRES의 용도는, 프로모터에 인접한 암호화 서열에 비해 제2, 제3 등의 암호화 서열의 더 낮은 수준의 발현을 일으킬 수 있다. 또한, IRES 서열이 충분히 길어서 벡터의 완전한 패키징에 영향을 줄 수 있다 (예: eCMV IRES는 507 염기 쌍의 길이를 갖는다).
폴리단백질의 형태로 (1차 해독 산물로서) 단백질을 발현시키는 것은, 피코르나바이러스과를 포함하는 비제한적인, 많은 바이러스의 복제에서 채택된 전략이다. 해독시, 바이러스-암호화된 자가프로세싱 펩티드는 폴리펩티드의 신속한 분자내 (시스) 절단을 매개하여 분리된 (성숙한) 단백질 산물을 생성한다. 본 발명은, 자가프로세싱 펩티드 서열 (본원에서 2A 펩티드 서열로 예시됨) 또는 다른 프로테아제 절단 부위를 포함하는, 재조합 단백질 또는 폴리펩티드 발현을 위한 벡터가 제공되어, 단일 프로모터를 사용하는 2개 이상의 단백질 또는 폴리펩티드 암호화 서열의 발현을 촉진시킨다는 점에서, IRES의 사용 이상의 장점을 제공하고, 이때 2개 이상의 단백질 또는 폴리펩티드는 유리한 몰 비로 발현된다. 면역글로불린의 경우 폴리단백질은, 하나의 중쇄에 대한 암호화 서열 및 하나 또는 2개의 경쇄에 대한 암호화 서열에 의해 암호화되고, 자가프로세싱 부위 또는 프로테아제 인식 부위는 각각의 사이에 암호화된다.
인테인 함유 작제물에서, 각각의 중쇄 및 경쇄 단편 중 하나만 있을 수 있으며, 이는 2개의 면역글로불린 쇄 사이에 인테인이 있는 프레임내 융합 폴리단백질에서 발현되며, 인테인-면역글로불린 쇄 접합점(junction)에서 절단되게 하지만 2개의 면역글로불린 단백질이 재연결되지 않게 하는 적당한 특성을 갖는다. 또다른 인테인 함유 작제물에서, 절단 부위에 의해 제1 및/또는 제2의 단편으로부터 임의로 분리된, 하나 이상의 추가적인 면역글로불린 단편이 존재한다. 예를 들면, 인테인 접근법을 사용하여, 하나의 중쇄 단편 및 하나의 경쇄 단편을 발현시키거나, 하나의 중쇄 및 2개의 경쇄 등을 발현시킨다.
위에서 정의된 "자가프로세싱 절단 부위" 또는 "자가프로세싱 절단 서열"은, 해독시, 자가프로세싱 절단 부위를 포함하는 폴리펩티드의 신속한 분자내 (시스) 절단이 일어나서 분리된 성숙한 단백질 산물을 생성시키는, DNA 암호화 또는 아미노산 서열을 말한다. 이러한 "자가프로세싱 절단 부위"는, 동시 해독적(co-translational) 또는 해독후(post-translational) 프로세싱 절단 부위로도 언급될 수 있고, 본원에서 2A 부위, 서열 또는 도메인 또는 인테인으로 예시된다. 2A 부위, 서열 또는 도메인은, 리보좀의 활성을 변형시켜 에스테르 결합의 가수분해를 촉진시킴으로써, 분리된 하류 해독 산물이 계속 합성되게 하는 방식으로 해독 복합체로부터 폴리펩티드를 방출시켜, 해독 효과를 증명한다[참조: Donnelly, 2001]. 대안으로, 2A 부위 또는 도메인은 시스에 있는 자신의 C-말단을 절단하여 1차 절단 산물을 생성하여, "자가 단백질분해" 또는 "절단"을 증명한다[참조: Furler and Palmenberg. 1990. Ann. Rev. Microbiol. 44:603-623]. 다른 프로테아제 인식 서열 (예: 시그날 펩티다제 절단 부위)을 자가 프로세싱 부위로 치환시킬 수 있다. 인테인은 또한 폴리단백질에서 유용하다.
인테인
본원에서 사용되는 인테인은, 1차 발현 산물의 N-말단 쪽으로는 N-엑스테인과 경계를 이루고 1차 발현 산물의 C-말단 쪽으로는 C-엑스테인과 경계를 이루는, 발현된 단백질 내의 단편이다. 천연 인테인은 인테인의 절단 및 N- 및 C-엑스테인의 재연결(단백질 연결)을 매개한다. 하지만, 본 발현 산물과 관련하여, 인테인의 1차 서열 또는 플랭킹 엑스테인 아미노산 서열은, 엑스테인의 연결의 부재 하에서 또는 감소된 또는 최소량의 엑스테인 연결 하에서 단백질 골격의 절단이 일어나게 하여, 융합 단백질을 형성하는 이들의 연결 없이, 1차 해독 산물(폴리단백질)로부터 엑스테인 단백질이 방출되게 한다. 1차 발현 산물 (단백질분해 절단 전에, mRNA에 의해 합성된 단백질)의 인테인 부분은, N-엑스테인/인테인 및 인테인/C-엑스테인 접합점에서 단백질분해 절단을 매개한다. 일반적으로, 천연 인테인은 또한 함께 N-엑스테인 및 C-엑스테인의 스플라이싱 (펩티드 결합의 형성에 의한 연결)을 매개한다. 하지만, 2개의 폴리펩티드 (항체 분자의 중쇄 및 경쇄로 구체적으로 예시됨)를 발현시키는 목표에 적용되는 본 발명에서, 단백질 연결이 일어나지 않는 것이 바람직하다. 이는, 자연적으로 또는 돌연변이를 통해 연결 활성을 갖지 않는 인테인을 통합시켜 달성될 수 있다. 대안으로, 돌연변이에 의해 스플라이싱 부위에 있거나 그 다음에 있는 아미노산(들)을 변화시켜 스플라이싱을 방해하여, 방출된 단백질의 연결을 방해할 수 있다[참조: Xu and Perler, 1996, EMBO J. 15:5146-5153]. Ser, Thr 또는 Cys은 일반적으로 C-엑스테인의 처음에 존재한다.
인테인은, 유전자가 다른 단백질의 유전자 내에서만 발견되는 단백질의 계열이다. 엑스테인이라고 하는 플랭킹 숙주 유전자와 함께, 인테인은 단일 mRNA로 전사되어, 단일 폴리펩티드로 해독된다. 해독후, 인테인은 자가촉매성 사건을 개시하여 자신을 제거하고, 플랭킹 숙주 단백질 단편들을 새로운 폴리펩티드 결합으로 연결시킨다. 이 반응은 오직 인테인에 의해서만 촉매되고, 다른 세포 단백질, 보조인자(co-factor) 또는 ATP를 요구하지 않는다. 인테인은 다양한 단세포 유기체에서 발견되고 상이한 크기를 갖는다. 많은 인테인은 엔도뉴클레아제 도메인을 함유하고, 이는 이들의 게놈 내에서의 이동성의 원인이다.
인테인 매개 반응은 생명공학에서, 특히 정제 및 단백질 칩 작제와 같은 생체외 세팅을 위하여, 그리고 식물 품종 개량에서 사용되었다[참조: Perler, F.B. 2005. IUBMB Life 57(7):469-76]. 돌연변이를 천연 인테인 뉴클레오타이드 서열 내로 도입시켰고, 이러한 돌연변이체 중 일부는 변경된 특성을 갖는 것으로 보고되었다[참조: Xu and Perler, 1996, EMBO J. 15(9), 5146-5153]. 인테인 외에도, 세균 인테인-유사 (BIL) 도메인 및 헤지호그 (Hog) 자가프로세싱 도메인, Hog/인테인 (HINT) 상위계열의 또다른 2개의 일원은, 유사한 메커니즘을 통해 해독후 자가프로세싱을 촉매하는 것으로도 공지되어 있다[참조: Dassa et.al. 2004. J. Biol. Chem. 279(31):32001-32007].
인테인은 특정 숙주 단백질 내에 프레임내 삽입체로서 존재한다. 자가 스플라이싱 반응에서, 인테인은 자신을 전구체 단백질로부터 잘라내고, 그 동안 플랭킹 영역인 엑스테인이 연결되어 숙주 유전자 기능이 복구된다. 이러한 요소는, 이들의 게놈 내에서의 이동성의 원인인 엔도뉴클레아제 기능도 함유한다. 인테인은 다양한 크기(134 내지 1650개 아미노산)로 존재하고, 진정세균(eubacteria), 진핵생물 및 고세균(archaea)의 게놈에서 확인되었다. 모델 스플라이싱/리포터 시스템을 사용한 실험에서, 엔도뉴클레아제, 단백질 절단 및 단백질 스플라이싱 기능이 분리될 수 있다는 것이 밝혀졌다[참조: Xu and Perler. 1996. EMBO J. 15:5146-5153]. 아래에 기술된 예는, 피로코쿠스 호리코시이 Pho Pol I, 사카로마이세스 세레비지아 VMA, 및 시네코시스티스 종 유래의 인테인을 사용하여, 항체 중쇄 및 경쇄의 서열을 갖는 융합 단백질을 생성한다. 인테인의 스플라이싱 능력이 제거되도록 설계된 인테인의 돌연변이는 단일 폴리펩티드를 형성하고 자가절단을 통해서 정확하게 암호화된 항체 중쇄 및 경쇄를 생성한다. 이러한 전략은 다른 다중쇄(multichain) 단백질, 호르몬 또는 사이토카인의 발현에서 유사하게 사용될 수 있고, 전구체 단백질(프로단백질)의 성숙한, 생물학적 활성 형태로의 프로세싱에 적용될 수도 있다. 피로코쿠스 호리코시이 Pho Pol I, 에스.세레비지아 VMA, 및 시네코시스티스 종 인테인의 용도가 본원에서 구체적으로 예시되어 있지만, 당업계에 공지된 다른 인테인을 본 발명의 폴리단백질 발현 벡터 및 방법에서 사용할 수 있다.
피로코쿠스 호리코시이 Pho Pol I, 에스.세레비지아 VMA, 및 시네코시스티스 종 인테인 이외의 많은 다른 인테인이 당업계에 공지되어 있다[참조: Perler, F.B. 2002, InBase, the Intein Database, Nucl. Acids Res. 30(1):383-384 및 New England Biolabs 웹사이트(예: http://tools.neb.com/inbase/)를 통해 이용가능한 Intein Database and Registry]. 인테인은 효모, 마이코박테리아 및 초호열성(extreme thermophilic) 고세균(archaebacteria)과 같은 광범위한 유기체에서 확인되었다. 특정 인테인은 엔도뉴클레아제 활성 뿐만 아니라 부위-특이적 단백질 절단 및 스플라이싱 활성을 갖는다. 엔도뉴클레아제 활성은 본 발명의 실시에 필요하지 않다; 단백질 절단 활성이 유지되는 경우, 엔도뉴클레아제 암호화 영역을 결실시킬 수 있다.
단백질 스플라이싱 과정의 메커니즘은 상세히 연구되었고[참조: Chong et al. 1996. J. Biol. Chem. 271:22159-22168; Xu and Perler. 1996. EMBO J 15:5146-5153], 보존된 아미노산이 인테인과 엑스테인 스플라이싱 지점에서 발견되었다[참조: Xu et al. 1994. EMBO J 13:5517-5522]. 본원에서 기술된 작제물은, 제1의 암호화 서열의 5'-말단에 융합된 인테인 서열을 함유하고, 제2의 암호화 서열은 인테인의 C-말단에 프레임내 융합되어 있다. 단백질 스플라이싱 요소를 함유하는 것으로 공지된 임의의 단백질로부터 적당한 인테인 서열을 선택할 수 있다. 모든 공지된 인테인을 포함하는 데이터베이스를 월드 와이드 웹(World Wide Web) 상에서 찾을 수 있다[참조: Perler, F. B. 1999. Nucl. Acids Res. 27: 346-347]. 인테인 암호화 서열은 제2의 암호화 서열의 5' 말단에 대해 3' 말단에서 융합(프레임내)되어 있다. 이 단백질을 특정 세포소기관(organelle)으로 표적화시키기 위하여, 적당한 펩티드 시그날을 단백질의 암호화 서열에 융합시킬 수 있다.
제2의 엑스테인 암호화 서열 뒤에, 동일한 세포에서 다수의 단백질 발현을 위하여 원하는 만큼 인테인 암호화 서열 - 엑스테인 암호화 서열이 자주 반복될 수 있다. 다중 인테인 함유 작제물의 경우, 상이한 기원으로부터의 인테인 요소를 사용하는 것이 유용할 수 있다. 발현될 마지막 유전자의 서열 뒤에, 유리하게 폴리아데닐화 서열을 포함하는 전사 종결 서열이 바람직하게는 삽입된다. 폴리아데닐화 서열 및 종결 서열의 순서는 당업계에서 이해하는 바와 같을 수 있다. 한가지 양태에서, 폴리아데닐화 서열은 종결 서열보다 앞에 있을 수 있다.
변형된 인테인 스플라이싱 단위를 설계하여, 이러한 관심대상의 변형된 인테인이 인테인으로부터 엑스테인의 절단을 촉매할 수 있지만 엑스테인의 연결은 촉매할 수 없게 한다[참조: 미국 특허 제7,026,526호 및 미국 특허원 제2002/0129400호]. 피로코쿠스 종 GB-D DNA 폴리머라제 내의 C-말단 엑스테인 접합점을 돌연변이유발시켜, 엑스테인 및 인테인의 절단을 유도하지만 다음의 엑스테인의 연결을 방해하는 변경된 스플라이싱 요소가 생성되었다[참조: Xu and Perler. 1996. EMBO J 15:5146-5153]. 세린 538번의 알라닌 또는 글리신으로 (Ser에서 Ala 또는 Gly으로)의 돌연변이는 절단을 유도하지만 연결을 방해한다. 이러한 위치에서, Ser에서 Met으로 또는 Ser에서 Thr으로의 돌연변이를 또한 사용하여, 분리된 단편으로 절단되고 적어도 부분적으로 재연결되지 않는 폴리단백질의 발현을 달성한다. 다른 인테인 스플라이싱 단위 내의 동등한 잔기의 돌연변이는 또한, 인테인과 C-말단 엑스테인 접합점에서 아미노산의 상대적 보존으로 인해, 엑스테인 단편의 연결을 방해할 수 있다. 낮은 보존/상동성 (예: 처음 몇 개, 예를 들면, 약 5개)의 경우에, C-엑스테인의 잔기 및/또는 인테인 단편의 마지막 몇몇 잔기를 체계적으로 변화시키고, 주어진 엑스테인 단편, 특히 본원에서 공개되고 당업계에서 이해되는 엑스테인 단편의 절단을 지원하지만 스플라이싱은 지원하지 않는 능력에 대해 스크리닝한다. 엔도뉴클레아제 도메인을 함유하지 않는 인테인이 있다; 이에는 시네코시스티스 종 dnaE 인테인 및 마이코박테리움 제노피 GyrA 단백질이 포함된다[참조: Magnasco et al, Biochemistry, 2004, 43, 10265-10276; Telenti et al. 1997. J. Bacteriol. 179: 6378-6382]. 다른 것은 자연에서 발견되었거나, 엔도뉴클레아제 함유 인테인을 암호화하는 서열로부터 엔도뉴클레아제 암호화 도메인을 제거하여 인공적으로 생성되었다[참조: Chong et al. 1997. J. Biol. Chem. 272: 15587-15590]. 목적하는 경우, 독자적으로 인테인을 선택하여, 마이코박테리움 제노피 GyrA 단백질 유래의 인테인과 같이, 스플라이싱 기능을 수행하는데 필요한 최소한의 수의 아미노산으로 이루어지게 한다[참조: Telenti et al. 1997. supra]. 대안적 양태에서, 마이코박테리움 제노피 GyrA 단백질 유래의 인테인, 또는 변형되어 엔도뉴클레아제 도메인이 제거된 사카로마이세스 세레비지아 VMA 인테인과 같이, 엔도뉴클레아제 활성이 없는 인테인을 선택한다[참조: Chong et al. 1997. supra].
인테인 스플라이싱 단위를 추가로 변형시켜 절단 반응의 반응 속도가 변화되게 할 수 있고, 단지 스플라이싱 단위의 유전자 서열을 변형시킴으로써 단백질 투여량이 제어된다.
한가지 양태에서, C-말단 엑스테인의 첫번째 잔기가 글리신 또는 알라닌을 함유하도록 조작하며, 이 변형은 피로코쿠스 종 GB-D DNA 폴리머라제로 엑스테인 연결을 방해하는 것으로 밝혀졌다[참조: Xu and Perler. 1996. EMBO J 15: 5146-5153]. 당해 양태에서, 바람직한 C-말단 엑스테인 단백질은, 천연 아미노산 서열에서 N-말단 메티오닌 다음에 본래 글리신 또는 알라닌 잔기를 함유한다. 엑스테인의 글리신 또는 알라닌을 인테인의 C-말단으로 융합시키면, 폴리단백질의 프로세싱 후에 천연 아미노산 서열이 생성된다. 또다른 양태에서, 천연 서열을 변경하거나, 천연 서열의 N-말단에 추가적인 아미노산 잔기를 부가하여, 인공 글리신 또는 알라닌이 C-말단 엑스테인에 위치한다. 당해 양태에서, 단백질의 천연 아미노산 서열은, 폴리단백질 프로세싱 후 하나의 아미노산이 변경될 것이다. 추가적인 양태에서, 본 발명에서 유용한 다른 변형은 미국 특허 제US 7,026,526호에 기술되어 있다.
피로코쿠스 종 GB-D DNA 폴리머라제 인테인의 DNA 서열은 미국 특허 제7,026,526호의 서열번호 1이다. N-말단 엑스테인 접합점은 "aac" 서열 (서열번호 1의 뉴클레오타이드 1번 내지 3번)이고, 아스파라긴 잔기를 암호화한다. 천연 GB-D DNA 폴리머라제 전구체 단백질에서 스플라이싱 부위는, 서열번호 1의 뉴클레오타이드 3번 및 뉴클레오타이드 1614번의 다음이다. C-말단 엑스테인 접합점은 "agc" 서열 (서열번호 1의 뉴클레오타이드 1615번 내지 1617번)이고, 이는 세린 잔기를 암호화한다. C-말단 엑스테인 세린을 알라닌 또는 글리신으로 돌연변이시키면, 폴리단백질의 절단을 촉진시킬 수 있지만 엑스테인 단위의 연결은 촉진시킬 수 없는 변형된 인테인 스플라이싱 요소가 형성된다.
마이코박테리움 제노피 GyrA 최소 인테인의 DNA 서열은 미국 특허 제7,026,526호의 서열번호 2이다. N-말단 엑스테인 접합점은 "tac" 서열 (서열번호 2의 뉴클레오타이드 1번 내지 3번)이고, 티로신 잔기를 암호화한다. 전구체 단백질에서 스플라이싱 부위는 서열번호 2의 뉴클레오타이드 3번 및 뉴클레오타이드 597번의 다음이다. C-말단 엑스테인 접합점은 "acc" 서열 (서열번호 2의 뉴클레오타이드 598번 내지 600번)이고, 트레오닌 잔기를 암호화한다. C-말단 엑스테인 트레오닌을 알라닌 또는 글리신으로 돌연변이시키면, 폴리단백질의 절단을 촉진시키지만 엑스테인 단위를 연결시키지 않는 변형된 인테인 스플라이싱 요소가 형성된다.
2A 시스템
이제 본 발명의 2A 프로테아제 프로세싱 양태로 전환하여, 2A의 활성은 펩티드 결합의 형성을 방해하는 코돈 사이의 리보좀 스킵핑(skipping)을 포함할 수 있지만[참조: de Felipe et al. 2000. Human Gene Therapy 11:1921-1931; Donnelly et al. 2001. J. Gen. Virol. 82:1013-1025], 도메인은 자가용해 효소(autolytic enzyme)와 보다 더 유사하게 작용하는 것으로 생각된다[참조: Ryan et al. 1989. Virology 173:35-45]. 구제역 바이러스 (FMDV) 2A 암호화 영역을 발현 벡터 내로 클로닝하여 표적 세포 내로 형질감염시키는 연구에서, 인공 리포터 폴리단백질의 FMDV 2A 절단이 광범위한 이종 발현 시스템 (밀-배아 용해물 및 유전자전이된 담배 식물[참조: Halpin et al., 미국 특허 제5,846,767호 (1998) 및 Halpin et al. 1999. The Plant Journal 17:453-459]; Hs 683 사람 신경교종 세포주[참조: de Felipe et al. 1999. Gene Therapy 6:198-208; 본원에서 이후에 "de Felipe II"로 지칭됨]; 래빗 망상적혈구 용해물 및 사람 HTK-143 세포[참조: Ryan et al. 1994. EMBO J. 13:928-933]; 및 곤충 세포[참조: Roosien et al. 1990. J. Gen. Virol. 71:1703-1711])에서 효율적인 것으로 입증되었다. 생물학적으로 관련된 분자에 대한 이종 폴리단백질의 FMDV 2A-매개 절단은 IL-12 (p40/p35 이종 이량체)에 대해 밝혀졌다[참조: Chaplin et al. 1999. J. Interferon Cytokine Res. 19:235-241]. 형질감염된 COS-7 세포에서, FMDV 2A는 p40-2A-p35 폴리단백질이 IL-12와 관련된 활성을 갖는 생물학적으로 기능성인 p40 및 p35 서브유닛으로 절단되는 것을 매개하였다.
FMDV 2A 서열을 단독으로 또는 상이한 IRES 서열과 함께 발현 벡터 내로 통합시켜, 이중시스트론, 삼중시스트론 및 사중시스트론 벡터를 작제하였다. 동물에서 2A 매개 유전자 발현의 효율성은, FMDV 2A 서열을 통해 연결된 α-시뉴클레인(synuclein)과 EGFP 또는 Cu/Zn 슈퍼옥사이드 디스뮤타제(SOD-1)와 EGFP를 암호화하는 재조합 아데노-관련 바이러스 (AAV) 벡터를 사용하여 Furler(2001)에 의해 증명되었다. EGFP 및 α-시뉴클레인은, 상응하는 IRES-기반 벡터에 비해, 2A 서열을 포함한 벡터로부터 상당히 높은 수준으로 발현되었지만, SOD-1은 비슷하거나 약간 높은 수준으로 발현되었다.
자가프로세싱 절단 부위를 암호화하는 DNA 서열은, 엔테로-, 라이노-, 카디오-, 아프토- 또는 구제역 바이러스(FMDV)를 포함하는 비제한적인, 피코르나바이러스로부터 유래한 바이러스 서열로서 예시된다. 바람직한 양태에서, 자가프로세싱 절단 부위 암호화 서열은 FMDV로부터 유래한다. 자가프로세싱 절단 부위에는 2A 및 2A-유사 도메인이 포함되지만, 이에 제한되는 것은 아니다[참조: 전문이 참조로서 인용된, Donnelly et al. 2001. J. Gen. Virol. 82:1027-1041].
대안으로, 프로테아제 인식 부위를 자가프로세싱 부위로 치환할 수 있다. 적당한 프로테아제 및 동족(cognate) 인식 부위에는, 푸린, RXR/K-R (서열번호 1); IPNV의 VP4, S/TXA-S/AG (서열번호 2); 담배 식각 바이러스 (TEV) 프로테아제, EXXYXQ-G (서열번호 3); 라이노바이러스의 3C 프로테아제, LEVLFQ-GP (서열번호 4); PC5/6 프로테아제; PACE 프로테아제, LPC/PC7 프로테아제; 엔테로키나제, DDDDK-X (서열번호 5); 인자 Xa 프로테아제 IE/DGR-X (서열번호 6); 트롬빈, LVPR-GS (서열번호 7); 게네나제 I, PGAAH-Y (서열번호 8); 및 MMP 프로테아제; 내부적으로 절단가능한 시그날 펩티드, 예를 들면, C형 인플루엔자 바이러스의 내부적으로 절단가능한 시그날 펩티드[참조: Pekosz A. 1998. Proc. Natl. Acad. Sci. USA 95: I13233-13238] (MGRMAMKWLVVIICFSITSQPASA, 서열번호 11)가 포함되지만, 이에 제한되는 것은 아니다. 프로테아제는 폴리단백질의 일부로서 트랜스 또는 시스로 제공되어, 동일한 전사체 내에 암호화되고, 예를 들면, 자가프로세싱 부위 또는 프로테아제 인식 부위에 의해 1차 해독 산물의 나머지로부터 분리될 수 있다.
점점 더 많은 항체 치료제가 임상용으로 승인됨에 따라, 지난 20년 동안 이러한 치료 단백질의 제조 방법이 끊임없이 향상되었다[참조: Wurm, FM, 2004, "Production of recombinant protein therapeutics in cultivated mammalian cells," Nat. Biotechnol. 22(11): 1393]. 하지만, 보다 더 효율적이고 믿을만한 생산 방법이 산업계에서 요구된다. 일부 바람직한 특성에는 배양 배지로의 높은 수준의 항체 분비, 세포주 제조의 향상된 유전적 안정성, 및 보다 빠른 속도의 세포주의 생성이 포함된다.
치료학적 항체를 생산하는 보다 효율적인 방법을 위한 연구에서, 단일 개방 판독 프레임으로부터 항체 중쇄 및 경쇄를 발현시키는 방법을 개발하였다. 한가지 이러한 방법에서, 인테인 암호화 서열을 사용하여 단일 개방 판독 프레임 (sORF) 내에서 항체 중쇄 및 경쇄 유전자를 분리시킨다. 이러한 sORF 항체 발현 기술이 제공하는 장점에는 중쇄 및 경쇄에 대한 유전자 용량 비를 조절하는 능력, ER에서의 다중 서브유닛 어셈블리를 위한 중쇄 및 경쇄 폴리펩티드의 근접성, 및 고효율 단백질 분비에 대한 가능성이 포함된다.
포유동물 세포에서 모노클로날 항체를 발현시키기 위한 다른 기술은, 각각 자신의 프로모터 및 조절 서열을 갖는, 2개의 분리된 ORF에 있는 중쇄 및 경쇄 유전자를 도입시킴을 포함한다. 프로모터 간섭은 이 방법과 관련된 문제이다. 항체 중쇄 및 경쇄 암호화 서열을 발현 세포주 내로 도입시키는 대안적 방법은 내부 리보좀 진입 부위(IRES)를 사용하여 항체 중쇄 및 경쇄 암호화 서열을 분리시키는 것이다. 이 방법은, IRES 서열의 하류에 있는 암호화 서열의 해독시에 저하되는 효율로 인해 널리 사용되지 않았다. 최근에, 구제역 바이러스 펩티드(2A 펩티드)를 암호화하는 서열을 사용하여 항체 중쇄 및 경쇄에 대한 암호화 서열을 분리시키는 방법이 기술되었다[참조: Fang et al. 2005. Nat. Biotechnol. 23(5):584-90]. 이 방법에서 항체 중쇄와 경쇄 및 2A 펩티드가 단일 mRNA로서 전사된다. 하지만, 항체 중쇄 및 경쇄 폴리펩티드가 소포체(ER)로 들어가기 전에 절단된다. 또한, 중쇄 및 경쇄의 절단/분리 후, 2개의 비천연 아미노산이 중쇄의 C-말단에 남는다. 본 발명의 인테인 발현 시스템은 근본적으로 상이하다. 이는, 중쇄 및 경쇄 폴리펩티드가 단일 폴리단백질로서 해독되고 ER로 들어간다는 점에서 2A 방법과 상이하다. 유리하게, 비천연 아미노산이 성숙한 항체 분자에 포함될 필요가 없다.
다음의 기술은 모두 다음과 같은 발현 카세트를 포함하는 항체 생산 벡터와 관련된 것이다: 프로모터 - 분비 시그날 - 중쇄 - 야생형 인테인 (예: 피.호리코시이 Pol I 인테인) - 분비 시그날 - 경쇄 - 폴리A; 프로모터 - 분비 시그날 - 중쇄 - 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 경쇄 - 폴리A; 프로모터 - 분비 시그날 - 중쇄 - Pol 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 분비 시그날 - 경쇄 - Pol 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 분비 시그날 - 경쇄 - 폴리A; 프로모터 - 분비 시그날 - 중쇄 - 야생형 또는 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 변형된 분비 시그날 - 경쇄 - 폴리A; 프로모터 - 분비 시그날 - 경쇄 - 야생형 또는 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 변형된 분비 시그날 - 중쇄 - 폴리A; 프로모터 - 분비 시그날 - 중쇄 - 야생형 또는 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 변형된 분비 시그날 - 경쇄 - 야생형 또는 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 변형된 분비 시그날 - 경쇄 - 폴리A; 프로모터 - 분비 시그날 - 중쇄 - 푸린 절단 부위 - 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 푸린 절단 부위 - 분비 시그날 - 경쇄 - 폴리A; 및 프로모터 - 중쇄 - 푸린 절단 부위 - 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 푸린 절단 부위 - 경쇄 - 푸린 절단 부위 - 변형된 인테인 (예: 피.호리코시이 Pol I 인테인) - 푸린 절단 부위 - 경쇄 - 폴리A. 추가적인 작제물에서, 변형된 Psp-GBD Pol 인테인이 사용된다.
구체적으로 예시된 본원에서 기술된 폴리단백질은, 앞과 뒤에 각각 D2E7 중쇄 및 경쇄와 프레임내 융합된, 피.호리코시이 Pol I 인테인을 사용한다. -1 위치에 있었던 아미노산은 리신이었고, +1 위치에 있었던 아미노산은 메티오닌 (경쇄 시그날 펩티드의 첫번째 아미노산)이었다. +1 위치에서 메티오닌을 사용하여, 본원의 후반부에서 증명한 바와 같이, 스플라이싱을 폐지하고 중쇄와 경쇄가 연결되게 하였고, 스플라이싱이 일어나기 위해서는 세린, 시스테인 또는 트레오닌과 같은 친핵성 아미노산 잔기가 +1 위치에 필요하다는 것을 이해한다. 야생형 인테인 외에도, 마지막 아미노산인 아스파라긴과 마지막에서 두번째인 히스티딘을 변화시키는 돌연변이는, 일반적으로 스플라이싱을 폐지하고 N-말단 스플라이싱 접합점에서의 절단을 유지하는 돌연변이로서 사용될 수 있다[참조: Mills, 2004; Xu, 1996, Chong, 1997]. 대안으로, 인테인의 첫번째 아미노산을 변화시키는 돌연변이는, 일반적으로 스플라이싱을 폐지하고 C-말단 스플라이싱 접합점에서의 절단을 유지하며, N-말단 스플라이싱 접합점에서의 약화된 절단을 폐지하거나 유지하기 때문에, 또한 사용될 수 있다[참조: Nichols, 2004; Evans, 1999, 및 Xu, 1996]. 예를 들면, 이것은, "완전히 스플라이싱을 차단하고 분지된 중간체의 형성을 억제하여, 두 스플라이스 접합점에서 모두 절단이 일어나게 한다"는 것이 증명되었다[참조: Xu, M.Q., EMBO vol. 15:5146-5153].
폴리펩티드의 대안적 버전에서, 푸린 절단 부위의 포함은, 접합점 서열을 변경시켜 이후에 분비되는 동안에 푸린 절단을 통해 절단되게 한다. 인테인에 대한 야생형 서열을 표 9에 제시한다. 피로코쿠스 종 GB-D의 DNA 폴리머라제 I에서, 절단/스플라이스 접합점은 RQRAIKILAN/S (서열번호 138)(N 말단) 및 HN/SYYGYYGYAK (서열번호 139)(C 말단)이다. 바람직하게는, 엔도뉴클레아제 암호화 영역을 HindIII 절단으로 절단시킨다. 절단, 스플라이싱 및 엔도뉴클레아제 기능은 서로 분리되어 있고, 이 엔도뉴클레아제 영역은 작은 링커로 치환되어 미니 인테인(mini-intein)이 생성될 수 있으며 이는 여전히 절단 및 스플라이싱이 가능하다[참조: Telenti et al. 1997. J. Bacteriol. 179:6378-6382]. 하나 이상의 효모 인테인이 포유동물 세포에서 기능한다는 것을 주의하여야 한다[참조: Mootz et al. 2003. J. Am. Chem. Soc. 125:10561-10569]. D2E7 (면역글로불린) 인테인 작제물의 암호화 및 아미노산 서열에 관해서는 표 8A 및 8B를 참조한다; 표 8C에는 D2E7 인테인 작제물 발현 벡터의 완전한 뉴클레오타이드 서열을 제시한다. D2E7 경쇄에 대한 암호화 서열에 융합되어 있는, 변형된 Psp Pol1 인테인에 융합된 D2E7의 중쇄 (휴미라(Humira) - 아달리무맙(adalimumab)의 등록 상표)를 암호화하는 융합 작제물이 기술되어 있다. 경쇄 서열은, 이를 폴리단백질의 나머지로부터 분리시키는, 인테인, 시그날 펩티드 또는 프로테아제 절단 부위(들)와 함께 복제될 수 있다. 당해 양태에서, 성숙한 중쇄는 중쇄 분비 시그날 뒤에 위치한다. 인테인을 상기한 바와 같이 변형시켜, 세린 1번이 트레오닌으로 변화되었고 내부 Hind III 단편이 절단되어 엔도뉴클레아제 활성이 제거되었다. 인테인을 성숙한 D2E7 경쇄 영역에 프레임내 융합시킨다. 대안적 양태는 성숙한 경쇄의 5'에 경쇄 분비 시그날을 포함할 것이다. D2E7 인테인 작제물 및 발현 벡터의 도식적인 표현에 관해서는 도 10 및 11을 참조하고, 발현 작제물 및 완전한 발현 벡터의 뉴클레오타이드 서열 및 D2E7 인테인 작제물의 아미노산 서열에 관해서는 표 8A 내지 8C를 참조한다.
시그날 펩티드 및 시그날 펩티다제
단백질이 막으로의 단백질 표적화에 관한 정보를 단백질의 아미노산 서열 내에 함유한다는 시그날 가설은 30년 이상 동안 알려졌다. 밀슈타인(Milstein)과 동료는, 골수종 세포 유래의 IgG의 경쇄가 고분자량 형태로 합성되어, 소포체 소포(미세소체)가 해독 시스템에 부가되면 성숙한 형태로 전환된다는 것을 발견하였고, 이러한 결과에 따라 미세소체가, 아미노-말단 신장 펩티드를 제거하여 전구체 단백질 형태를 성숙한 형태로 전환시키는 프로테아제를 함유한다는 모델을 제안하였다. 시그날 가설은 곧 확장되어, 미토콘드리아 및 엽록체와 같은 상이한 세포내 막에 위치한 단백질 내의 다른 표적화 서열이 포함되었다. 이러한 다른 표적화 서열은 그 후, 특이적 시그날 펩티다제(SPase)에 의해 배출된 단백질로부터 절단되는 것으로 밝혀졌다.
3개 이상의 다른 SPase 세균에서 시그날 펩티드를 절단하는데 관련되어 있다. SPase I은, SecYEG 경로에 또는 트윈 아르기닌 전좌 (Tat; Twin Arginine Translocation) 경로에 의해 배출된 비지질단백질 기질을 프로세싱할 수 있다. Sec 경로에 의해 배출된 지질단백질은 SPase II에 의해 절단된다. SPase IV는, II형 분비 기구의 구성요소인 IV형 프레필린(prepilin) 및 프레필린-유사 단백질을 절단한다.
진핵생물에서, 소포체(ER) 막으로 표적화된 단백질은, 단백질을 해독과 동시에 또는 해독 후에 Sec61 전좌 기구로 표적화시키는 시그날 펩티드에 의해 매개된다. ER 시그날 펩티드는 이의 박테리아 대응물의 것과 유사한 특징을 갖는다. ER 시그날 펩티드는, 시그날 펩티다제 복합체(SPC)에 의해 ER 내강 내로 배출된 후 배출된 단백질로부터 절단된다. 단백질을 진핵생물 세포 내의 상이한 위치로 분류하는 시그날 펩티드는, 이러한 세포가 많은 상이한 막성 및 수성 구획을 함유하기 때문에 달라야 한다. ER로 표적화된 단백질은 종종 절단가능한 시그날 서열을 함유한다. 놀랍게도, 많은 인공 펩티드는 전좌 시그날로서 기능할 수 있다. 가장 중요한 특징은 특정 역치(threshold) 이상의 소수성인 것으로 생각된다. ER 시그날 펩티드는 세균 시그날 펩티드보다 높은 함량의 류신 잔기를 갖는다. 시그날 인식 입자(SRP)는 리보좀으로부터 나온 후에 절단가능한 시그날 펩티드에 결합한다. SRP는 초기의(nascent) 단백질을 ER 막으로 표적화시키는데 필요하다. 단백질이 ER 내강으로 전좌된 후, 배출된 단백질은 SPC에 의해 프로세싱된다. 또다른 양태는 진핵생물 세포에서 자연적으로 존재하는 시그날 (리더) 펩티드 프로세싱 효소를 이용한다. 진핵생물에서, 소포체(ER) 막으로 표적화된 단백질은, 단백질을 해독과 동시에 또는 해독 후에 Sec61 전좌 기구로 표적화시키는 시그날 펩티드에 의해 매개된다. ER 시그날 펩티드는, 시그날 펩티다제 복합체(SPC)에 의해 ER 내강 내로 배출된 후 배출된 단백질로부터 절단된다. 공지된 ER 시그날 펩티드의 대부분은 N-말단 절단가능하거나 내부적으로 절단불가능하다. 최근에, C형 간염 바이러스, 한타바이러스, 플라비바이러스, 루벨라 바이러스 및 C형 인플루엔자 바이러스에서 발견되는 것과 같은 많은 바이러스 폴리단백질이, 주로 ER SPC에 의해 절단되는 내부 시그날 펩티드를 함유하는 것으로 밝혀졌다. 바이러스 폴리단백질의 성숙에 관한 이러한 연구는, SPC가 아미노 말단에 위치한 시그날 펩티드 뿐만 아니라, 내부 시그날 펩티드도 절단할 수 있다는 것을 제시한다.
프레세닐린형 아스파르트산 프로테아제 시그날 펩티드 펩티다제(SPP)는, 이들의 막관통 영역에서 시그날 펩티드를 절단한다. SPP는 사람에서 시그날 펩티드-유래된 HLA-E 에피토프의 생성에 필수적이다. 최근에, C형 간염 바이러스, 한타바이러스, 플라비바이러스, 루벨라 바이러스 및 C형 인플루엔자 바이러스에서 발견되는 것과 같은 많은 바이러스 폴리단백질이, 주로 ER SPC에 의해 절단되는 내부 시그날 펩티드를 함유하는 것으로 밝혀졌다. 예측된 시그날 펩티다제 기질 특이성 요소의 돌연변이유발은 따라서 바이러스 감염성을 차단할 수 있다. 폴리단백질의 성숙에 관한 이러한 연구는 또한, SPC가 아미노 말단에 위치한 시그날 펩티드 뿐만 아니라, 내부 시그날 펩티드도 절단할 수 있다는 것을 제시하기 때문에 매우 흥미있다. 시그날 펩티다제는 당업계에 익히 공지되어 있다[참조: Paetzel M. 2002. Chem. Rev. 102(12): 4549; Pekosz A. 1998. Proc. Natl. Acad. Sci. USA. 95:13233-13238; Marius K. 2002. Molecular Cell 10:735-744; Okamoto K. 2004. J. Virol. 78:6370-6380, Vol. 78; Martoglio B. 2003. Human Molecular Genetics 12: R201-R206; 및 Xia W. 2003. J. Cell Sci. 116:2839-2844].
소포체(ER) 막으로 표적화된 단백질은, 단백질을 해독과 동시에 또는 해독 후에 Sec61 전좌 기구로 표적화시키는 시그날 펩티드에 의해 매개된다. ER 시그날 펩티드는, 시그날 펩티다제 복합체(SPC)에 의해 ER 내강 내로 배출된 후 배출된 단백질로부터 절단된다. 공지된 ER 시그날 펩티드의 대부분은 N-말단 절단가능하거나 내부적으로 절단불가능하다. 최근에, C형 간염 바이러스, 한타바이러스, 플라비바이러스, 루벨라 바이러스 및 C형 인플루엔자 바이러스에서 발견되는 것과 같은 많은 바이러스 폴리단백질이, 주로 ER SPC에 의해 절단되는 내부 시그날 펩티드를 함유하는 것으로 밝혀졌다. 바이러스 폴리단백질의 성숙에 관한 이러한 연구는, SPC가 아미노 말단에 위치한 시그날 펩티드 뿐만 아니라, 내부 시그날 펩티드도 절단할 수 있다는 것을 제시한다.
본 발명은 단일 전사체에서 폴리펩티드의 발현을 위하여 내부 절단가능한 시그날 펩티드를 사용한다. 이어서, 단일 전사된 폴리펩티드가 SPC에 의해 절단되어, 개개의 펩티드가 별개로 생성되거나 단백질로 어셈블리되는 개개의 펩티드가 생성된다. 본 발명의 방법은, 단일 전사된 폴리펩티드에서 면역글로불린 중쇄 및 경쇄가 발현된 후, 절단되고 나서, 성숙한 면역글로불린으로 어셈블리되는 것에 적용가능하다. 이 기술은, 단일 전사된 폴리펩티드에서 폴리펩티드 사이토카인, 성장 인자 또는 다양한 다른 단백질, 예를 들면, IL-12p40 및 IL-12p35가, 단일 전사된 폴리펩티드에서 IL-12, 또는 IL-12p40 및 IL-23p19로 어셈블리되고 나서, IL-23으로 어셈블리되는 것에 적용가능하다.
시그날 펩티다제 접근법은, 전구체 또는 폴리단백질로부터 기능성 항체 또는 다른 프로세싱된 산물을 발현시키는 포유동물 발현 벡터에 적용가능하다. 항체의 경우에, 이는 내부 절단가능한 시그날 펩티드인 중쇄 및 경쇄 사이의 개재 서열을 갖는, 중쇄 및 경쇄를 모두 함유하는 폴리단백질로서 벡터로부터 생산된다. 이 내부 절단가능한 시그날 펩티드는, ER에 존재하는 프로테아제, 주로 시그날 펩티다제, 프레세닐린 또는 프레세닐린-유사 프로테아제에 의해 절단되어, 중쇄 및 경쇄가 생성되고, 폴딩 및 어셈블리되어 기능성 분자가 될 수 있고, 이는 바람직하게는 분비된다. C형 간염 바이러스로부터 유래된 내부 절단가능한 시그날 펩티드 외에도, ER에 존재하는 프로테아제에 의해 절단될 수 있는 다른 내부 절단가능한 서열은 치환될 수 있다. 유사하게, 본 발명의 실시는, 시그날 펩티다제가 절단을 달성하는 숙주 세포에 한정될 필요가 없고, 폴리펩티드의 프로세싱을 위한 프레세닐린, 프레세닐린-유사 프로테아제, 및 다른 프로테아제를 포함하는 비제한적인, 프로테아제도 포함된다. 이러한 프로테아제는, 그 중에서도, 인용된 논문에서 개관되었다.
또한, 본 발명은 면역글로불린 중쇄 및 경쇄의 발현에 한정되지 않고, 단일 전사체에서 발현되고 나서 내부 시그날 펩티드 절단이 일어나 각 개개의 펩티드 또는 단백질을 방출하는 다른 폴리펩티드 및 폴리단백질도 포함한다. 이러한 단백질은 성숙한 산물에서 함께 어셈블리되거나 되지 않을 수 있다.
개개의 폴리펩티드의 순서가 교대로 존재하는 발현 작제물 (즉, "펩티드 1 - 내부 절단가능한 시그날 펩티드 - 펩티드 2" 또는 "펩티드 2 - 내부 절단가능한 시그날 펩티드 - 펩티드 1") 또한 본 발명의 범위 내에 있다. 본 발명은 "펩티드 1 - 내부 절단가능한 시그날 펩티드 - 펩티드 2 - 내부 절단가능한 시그날 펩티드 - 펩티드 3" 등과 같이, 내부 절단가능한 시그날 펩티드에 의해 연결된 2개 이상의 펩티드의 발현을 추가로 포함한다.
또한, 본 발명은 I형 및 II형 막관통 단백질의 발현, 및 발현 작제물과 인접한 다른 프로테아제 절단 부위의 부가에 적용된다. 한가지 예는 푸린 또는 PC5/6 절단 부위를 면역글로불린 중쇄 뒤에 부가하여 중쇄 펩티드의 카복시 말단에서 추가적인 아미노산 잔기의 절단을 촉진시키는 것이다 (예: "중쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - 경쇄"). 본 발명은 또한 하나 이상의 내부 절단가능한 시그날 펩티드를 별개로 또는 일렬로 포함한다 (예: "중쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - 내부 절단가능한 시그날 펩티드 - 경쇄"). 또한, 본 발명은 중쇄 및 경쇄의 자가 시그날 펩티드가 유지되거나 제거되는 상황을 포함한다 (예: "HC 시그날 펩티드 - 중쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - LC 시그날 펩티드 - 경쇄").
다음의 기술은 항체 생산 벡터와 관련된 것이고, 일부는 본원의 다른 부분에 기술되어 있다. 벡터 설계에는 다음이 포함되지만, 이에 제한되는 것은 아니다.
벡터 설계 표
프로모터 - 분비 시그날 - 중쇄 - 내부 절단가능한 시그날 펩티드 - 분비 시그날 - 경쇄 - 폴리A;
프로모터 - 분비 시그날 - 중쇄 - 내부 절단가능한 시그날 펩티드 - 경쇄 - 폴리A;
프로모터 - 분비 시그날 - 중쇄 - 내부 절단가능한 시그날 펩티드 - 분비 시그날 - 경쇄 - 내부 절단가능한 시그날 펩티드 - 분비 시그날 - 경쇄 - 폴리A;
프로모터 - 분비 시그날 - 중쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - 푸린 절단 부위 - 분비 시그날 - 경쇄 - 폴리A; 및
프로모터 - 중쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - 푸린 절단 부위 - 경쇄 - 푸린 절단 부위 - 내부 절단가능한 시그날 펩티드 - 푸린 절단 부위 - 경쇄 - 폴리A.
융합 작제물의 특정 예는, D2E7 경쇄에 대한 암호화 서열에 융합되어 있는, 내부 절단가능한 시그날 펩티드에 융합된 D2E7의 중쇄 (휴미라(Humira)/아달리무맙)를 암호화한다. 당해 양태에서, 성숙한 중쇄는 중쇄 분비 시그날 뒤에 위치한다. 내부 절단가능한 시그날 펩티드 서열은 C형 인플루엔자 바이러스로부터 유래한다. 푸린 절단 부위는 중쇄의 카복시 말단에 포함된다. 성숙한 항체에 대한 영향을 최소화하기 위하여, 중쇄의 마지막에서 세번째 잔기를 프롤린에서 아르기닌으로 돌연변이시켜 푸린 절단 부위를 생성한다. 대안적 양태는 성숙한 경쇄의 5'에 경쇄 분비 시그날을 포함할 것이다. 표 9A 내지 9C를 참조한다. 인플루엔자 C형 바이러스 유래의 최소 내부 절단가능한 시그날 펩티드 서열 (MGRMAMKWLVVIICFSITSQPASA, 서열번호 11)은 실시예에서 사용된다. 보다 긴 서열을 사용하여 절단 효율을 향상시킬 수도 있다[참조: GenBank 수탁번호 AB126196]. 동일한 아미노산 서열을 암호화하는 다양한 뉴클레오타이드 서열을 사용할 수도 있다.
본 발명은 단일 전사체 내에 암호화된 폴리단백질 내의 하나 이상의 폴리펩티드의 성숙을 위하여 내부 절단가능한 시그날 펩티드를 추가로 사용한다. 이어서, 단일 전사된 폴리펩티드는 SPC에 의해 절단되어, 개개의 펩티드가 별개로 생성되거나 단백질로 어셈블리되는 개개의 펩티드가 생성된다. 본 발명은, 단일 전사된 폴리펩티드에서 면역글로불린 중쇄 및 경쇄가 발현되고 나서, 성숙한 면역글로불린으로 어셈블리되는 것에 적용가능하다. 본 발명은, 단일 전사된 폴리펩티드에서 폴리펩티드 사이토카인, 성장 인자 또는 다양한 다른 단백질, 예를 들면, IL-12p40 및 IL-12p35가 발현되고 나서, 단일 전사된 폴리펩티드에서 IL-12, 또는 IL-12p40 및 IL-23p19로 어셈블리되고 나서, IL-23으로 어셈블리되는 것에 적용가능하다.
본 발명의 벡터 작제물을 위한 2개 이상의 이종 DNA 서열 사이의 2A 서열 또는 다른 프로테아제 또는 시그날 펩티다제 절단 (인식) 부위의 적소 서브클로닝(positional subcloning)은, 단일 발현 벡터를 통해 2개 이상의 유전자가 전달 및 발현되게 한다. 바람직하게는, 자가 프로세싱 절단 부위 (예: FMDV 2A 서열) 또는 프로테아제 인식 서열이, 예를 들면, 항체, 이종이량체 수용체 또는 이종이량체 단백질의 개개의 부분일 수 있는 2개 또는 다수의 단백질, 폴리펩티드 또는 펩티드를, 단일 바이러스 벡터로부터 발현 및 전달하는 유일한 방법을 제공한다.
FMDV 2A는 FMDV 게놈에서 자신의 C-말단에서의 단일 절단을 지시하는 기능을 하여, 시스로 기능하는 폴리단백질 영역이다. FMDV 2A 도메인은 통상적으로 길이가 약 19개 아미노산인 것으로 보고되어 있지만 (LLNFDLLKLAGDVESNPGP, 서열번호 12; TLNFDLLKLAGDVESNPGP, 서열번호 13; Ryan et al. 1991. J. Gen. Virol. 72:2727-2732), 14개 아미노산 잔기처럼 적은 올리고펩티드 (LLKLAGDVESNPGP, 서열번호 14)는 천연 FMDV 폴리단백질 프로세싱에서의 이의 역할과 유사한 방식으로 2A C-말단에서 절단을 매개하는 것으로 밝혀졌다.
2A 서열의 변이는, 폴리단백질의 효율적인 프로세싱을 매개하는 이들의 능력에 관해 연구되었다[참조: Donnelly et al. 2001]. 2A 서열의 동족체 및 변이체는 본 발명의 범위 내에 포함되고, 다음의 서열이 포함되지만, 이에 제한되는 것은 아니다:
Figure 112008005047558-PCT00001
2A 서열 및 이의 변이체를 사용하여 자가프로세싱 폴리단백질을 발현하는 벡터를 제조할 수 있고, 이에는 자가프로세싱 절단 부위 또는 다른 프로테아제 절단 부위를 통해 연결된 단백질 또는 폴리펩티드에 대한 암호화 서열을 포함하여, 자가프로세싱 또는 다른 절단 부위의 존재로 인해, 개개의 단백질이 폴리단백질의 절단 후 적당한 몰 비 및/또는 양으로 발현되는, 임의의 벡터 (플라스미드 또는 바이러스 기반 벡터)가 포함된다. 이러한 단백질은 벡터 자체에 대해, 서로에 대해, 또는 자가프로세싱 절단 부위(예: FMDV)에 대해 이종성일 수 있고, 따라서 본 발명을 실시하는데 사용하기 위한 자가프로세싱 절단 부위는, 절단에 작용하거나 이를 매개하는 능력에 있어서, 자가프로세싱 절단 부위와 동일한 기원으로부터 유래된 암호화 서열과 이종 단백질 간을 구별하지 않는다.
한가지 양태에서, 본 발명에 따른 벡터에 포함된 FMDV 2A 서열은 LLNFDLLKLAGDVESNPGP(서열번호 12)를 포함하는 아미노산 잔기를 암호화한다. 대안으로, 본 발명에 따른 벡터는, 문헌[참조: Donnelly et al. 2001. J. Gen. Virol. 82:1027-1041]에서 논의되고, 피코르나바이러스, 곤충 바이러스, C형 로타바이러스, 트리파노솜(trypanosome) 반복 서열, 또는 써마토가 마리티마 세균 유래의 2A-유사 도메인을 포함하는 비제한적인, 다른 2A-유사 영역에 대한 아미노산 잔기를 암호화할 수 있다.
본 발명은, 모 뉴클레오타이드와 비교하여 하나 이상의 아미노산에 대해 상이한 코돈을 갖는, 2A 또는 2A-유사 폴리펩티드에 대한 핵산 암호화 서열과 같은, 2A 또는 2A-유사 펩티드 서열을 암호화하는 핵산 서열 변이체의 사용을 고려한다. 이러한 변이체는 구체적으로 고려되고 본 발명에 포함된다. 2A 펩티드 및 폴리펩티드의 서열 변이체는 또한 본 발명의 범위 내에 포함된다. 유사하게, 시스 또는 트랜스로 제공된 프로테아제는, 폴리단백질의 영역 사이의 동족(cognate) 프로테아제 인식 (절단) 부위를 통해 단백질분해 프로세싱을 매개할 수 있다.
인테인-항체 발현 작제물을 사용한 추가적인 실험에서, 피로코쿠스 호리코시이 Pol I 인테인-매개된 단백질 스플라이싱 반응이, 포유동물 (293E) 세포에서, ER에서, 항체 (D2E7) 중쇄 및 경쇄 아미노산 서열과 관련하여 일어날 수 있다는 것을 증명하였다. 단일 개방 판독 프레임 (sORF) 형식에서의 항체 발현에서 이러한 유형의 반응을 사용하는 목적상, 본 발명자들은, 이 반응이 2개의 작제물 (pTT3-HcintLC1aa-p.hori 및 pTT3-HcintLC3aa-p.hori)(표 11A 및 12A를 참조한다)을 사용하여, 포유동물 세포(293E)에서, ER에서, 항체 중쇄 및 항체 경쇄 아미노산 서열과 관련하여 일어날 수 있다는 것을 증명하였다.
이러한 작제물은 PTT3 벡터 골격 상에서 제조하였다. 이 벡터는 엡스타인 바 바이러스(EBV; Epstein Barr Virus) 복제 오리진을 갖고, 이는 현탁액 배양에서 형질감염된 293E 세포 (엡스타인 바 바이러스 핵 항원 1을 발현하는 세포)에서 에피좀 증폭이 일어나게 한다[참조: Durocher, 2002, "High level and high-throughput recombinant protein production by transient transfection of suspension-growing human 293-EBNA1 cells, Nucleic Acids Research 30(2):E9]. 각각의 벡터는 하나의 ORF를 가졌고, CMV 프로모터의 조절 제어 하에서 전사적으로 발현되었다. ORF에서, 피.호리코시이 PolI 인테인을, 각각 시그날 펩티드(SP)를 갖는 D2E7 중쇄와 경쇄 사이에 프레임내 삽입시켰다. pTT3-HcintLC1aa-p.hori 및 pTT3-HcintLC3aa-p.hori 작제물은, 인테인의 한쪽 측면에 하나의 천연 엑스테인 아미노산, 또는 3개의 천연 엑스테인 아미노산이 있어서, D2E7 항체 중쇄 및 경쇄 서열이 인테인 서열로부터 분리되었다. 이러한 작제물을 293E 세포 내로 일시적 형질감염을 통해 도입시켰다. 배양 상청액 및 세포 펠릿 샘플을 둘다 분석하였다.
세포 펠릿 샘플을, 세포질 및 세포내 막 분획이 분리되게 하는 조건 하에서 용해시켰다. 이러한 분획을 둘다, 웨스턴 블롯(WB)을 사용하여 항-중쇄 및 항-카파 경쇄 항체로 분석하였다. 이러한 블롯 상에서, 작제물의 ORF에서와 같은 3조(tri-partite) 형태 (130kDa), 스플라이싱 사건으로부터 유래된 H와 L의 융합체 (80kDa), 항체 중쇄 (50kDa), 및 항체 경쇄 (25kDa)에 상응하는 4개의 단백질 종의 발현이 관찰되었다. 앞의 2개의 단백질 종은 항-중쇄 및 항-경쇄 항체로 검출하였고, 중쇄는 항-중쇄 항체로만 검출하였으며, 경쇄는 항-경쇄 항체로만 검출하였다. 이러한 두 작제물에서 중쇄 및 경쇄 항체로 검출된 80kDa 단백질 종의 존재는, 단백질 스플라이싱 사건이 일어났다는 것을 증명하였다. 또한, 모든 4개의 단백질 종은, 소포체(ER)를 함유한 세포하(sub-cellular) 막 구획에 주로 존재하였다. 이는, 중쇄 시그날 펩티드(ORF의 시작부분에 암호화됨)가 전체 폴리펩티드를 스플라이싱 반응이 일어난 ER로 지시했다는 것을 나타내었다. 임의의 특정 이론에 구속되기를 바라지 않으며, 유리 중쇄 및 경쇄 폴리펩티드는, 불완전 스플라이싱으로부터 발생한, N-말단 및 C-말단 스플라이싱 접합점에서의 절단의 결과인 것 같다고 생각된다.
세포 펠릿 샘플을 또한 사용하여, 항체 중쇄 프로브 및 항체 경쇄 프로브를 사용하여 총 RNA 추출 및 노던 블롯 분석을 하였다. 노던 블롯 분석으로 이러한 sORF 작제물에서 3조(tripartite) mRNA(3.4kb)를 검출하였고, 이는 중쇄 프로브 및 경쇄 프로브와 하이브리드화 하였지만, 분리된 중쇄 또는 경쇄에 대한 mRNA는 검출되지 않았다. 대조적으로, 통상적인 접근법을 사용하여, 즉, 2개의 pTT3 벡터에 보유된 2개의 분리된 ORF로부터의 항체 중쇄 및 경쇄를 도입시켜 D2E7 항체를 발현한 세포 펠릿 샘플에서, 중쇄에 대한 mRNA(1.4kb) 및 경쇄에 대한 mRNA(0.7kb)를 각각 중쇄 또는 경쇄 프로브를 사용하여 검출하였다. 3조 mRNA는 이들 대조군 세포 펠릿에서 검출되지 않았다.
상기한 데이터는, 단일 ORF (D2E7 중쇄 - 피.호리코시이 인테인 - D2E7 경쇄)를 함유하는 작제물을 사용하여, 모든 3개의 단백질을 함유하는 단일 mRNA가 전사된다는 것을 증명한다. 상기 3조 메시지는 3조 폴리펩티드로 해독되었고, 3조 폴리단백질의 N-말단에 존재하는 중쇄 시그날 펩티드에 의해 지시되어, 동시 해독적으로 ER 내로 이입되었다. 이 작제물의 경우, 인테인-매개된 단백질 스플라이싱 반응이 ER 내부에서 일어났다. 이는, 인테인-매개된 반응을 항체 뿐만 아니라, 다른 분비되는 다중-서브유닛 단백질 (즉, 분비 경로를 거쳐서 폴딩되고 적절히 해독후 변형될 필요가 있는 단백질)의 발현에서 사용할 수 있다는 것을 시사하였다.
배양 상청액을 또한 분석하였다. 웨스턴 블롯 및 ELISA는, pTT3-HcintLC1aa-p.hori 작제물의 발현으로부터 분비된 항체가 검출되게 한다. 이러한 연구는 본원에서 아래에 보다 상세히 논의한다; 분비된 항체 발현의 양은, 점 돌연변이 및 경쇄 시그날 펩티드를 암호화하는 서열 내의 돌연변이를 통해 증가되었다.
인테인-매개된 연결을 억제하지만 N-말단 또는 C-말단 스플라이싱 접합점에서의 절단 반응을 유지하도록 설계된 돌연변이는, 항체 분비 수준을 증가시켰다.
항체 분비의 향상된 효율성을 목표로, 세 종류의 점 돌연변이를 설계하고 검사하였다. 첫번째 종류의 돌연변이는 C-말단 엑스테인의 첫번째 세린 잔기의 코돈에 있었다; 이러한 작제물은 Ser에서 Met으로의 (S>M) 변화를 가졌다 (작제물 pTT3-HcintLC-p.hori, 작제물 E, 및 작제물 A). 두번째 종류의 돌연변이는 인테인의 첫번째 세린 잔기에 대한 코돈에 있었다; 이러한 작제물은 Ser에서 Thr으로의 (S>T) 변화를 가졌다 (작제물 E). 세번째 종류의 돌연변이는 인테인의 마지막에서 두번째 (버금) 아미노산인 히스티딘 잔기에 대한 코돈에 있었다; 이러한 작제물은 His에서 Ala으로의 (H>A) 치환 돌연변이를 가졌다 (작제물 A 및 작제물 B). 이러한 돌연변이를 단독으로 또는 조합으로 도입시켰다. 모든 돌연변이 작제물은, 문헌에 기술된 반응 메커니즘에 따라, N- 또는 C-말단 스플라이싱 접합점에서의 절단을 유지시키고 방출된 엑스테인의 스플라이싱을 감소시키도록 설계하였다. 아래에 약술한 바와 같이 D2E7 항체의 분비는 많은 이러한 작제물을 사용하여 달성한다.
한 실험에서, 이러한 작제물을 일시적 형질감염을 통해 293E 세포 내로 도입시켰고, 7일 후, 배양된 상청액을 ELISA 분석으로 IgG 항체 역가에 대해 분석하였다. 작제물 pTT3-HcintLC3aa-p.hori, pTT3-HcintLC1aa-p.hori, pTT3-HcintLC-p.hori, E, AB에 대한 항체 역가는 각각 17.0 + 0.6, 113.8 + 2.6, 225.8 + 10.0, 9.3 + 0.5, 161.7 + 4.4 및 48.2 + 1.0ng/ml(평균 + 표준편차)였다.
이러한 상청액 샘플을 또한 변성 조건 하에서 SDS-PAGE 겔 상에서 분석하였고, 사람 IgG 중쇄에 대한 항체 및 사람 카파 경쇄에 대한 항체로 블롯팅(blotting)하였다. 이러한 웨스턴 블롯에서, 항체 중쇄(약 50kDa) 및 항체 경쇄(약 25kDa)가 작제물 pTT3-HcintLC-p.hori 및 A로부터 생성된 상청에서 명확히 가시화되고, 이는 ELISA로 측정된 IgG 수준의 순위와 일관된다.
이러한 형질감염으로부터의 세포 펠릿 샘플을 또한, 웨스턴 블롯 분석을 사용하여 특성규명하였다. 3조-폴리펩티드(약 130kDa)는 항체 중쇄 (약 50kDa) 및 경쇄 (약 25kDa) 밴드와 함께, 모든 상기한 작제물을 함유하는 세포 펠릿 중에서 보인다. 이러한 작제물 중에서, pTT3-HcintLC-p.hori 및 작제물 A가 가장 강한 중쇄 및 경쇄 밴드를 보이고; 그러므로 세포내 유리 중쇄 및 경쇄의 수준과 어셈블리되어 분비된 항체의 수준 사이에 상관관계가 있다고 결론을 내렸다. 항체 중쇄와 경쇄 간의 융합체인 스플라이싱된 산물(약 80kDa)은 작제물 pTT3-HcintLC3aa-p.hori를 사용하여 생성된 세포 펠릿 중에 존재하였고, 작제물 pTT3-HcintLC1aa-p.hori로부터 생성된 세포 펠릿 중에는 보다 적은 정도로 존재하였다; 작제물 pTT3-HcintLC-p.hori 및 작제물 A, BE에는 부재하였다. 이는 단백질 스플라이싱의 수준과 항체 분비 효율 사이에 역의 상관관계가 있다는 것을 나타내었고, 이는 항체 구조에 관한 일반적인 지식에 따라, 항체 중쇄와 경쇄의 연결이 미스폴딩(misfolding)을 일으킬 것이고, 이 미스폴딩은 미스폴딩된 단백질의 분해에 대한 세포 메커니즘으로 인해 결과적으로 분비를 방해할 것이라는 예상과 일관된다. 이러한 블롯 상의 또다른 단백질 종은 인테인-경쇄 융합체 (80kDa, 경쇄 항체에 의해 인식되지만 중쇄 항체에 의해서는 인식되지 않음)였고, 이는 임의의 추가적인 절단의 부재 하에서 N-말단 스플라이싱 접합점에서의 절단으로부터 생성되었다. 이 밴드는 작제물 A, B, E, pTT3-HcintLC3aa-p.hori, pTT3-HcintLC1aa-p.hori에서 존재하였고, 본원에서 기술된 작제물 pTT3-HcintLC-p.hori 및 H에서는 대부분 부재하였다. 그러므로 이 단백질 종의 존재와 항체 분비의 양 사이에도 역의 상관관계가 있었다. 마지막으로, 피.호리코시이 펩티드에 대해 생성된, KLH에 접합된, 래빗 폴리클로날 항혈청을 사용하여 이러한 세포 용해물에서 인테인 밴드도 검출하였다.
sORF 작제물 pTT3-HcintLC-p.hori를 사용하여 분비된 D2E7 항체는 중쇄 및 경쇄의 정확한 N-말단 서열, 정확한 중쇄 및 경쇄 분자량 및 온전한 분자량을 갖는다는 것을 증명하였다.
sORF 작제물 pTT3-HcintLC-p.hori 중 하나를 사용하여 분비된 D2E7 항체를 단백질 A 친화도 크로마토그래피로 정제하고, 이의 중쇄 및 경쇄의 N-말단 서열에 대해 분석하였다. 명백한 결과는, 중쇄의 N-말단 펩티드 서열은 EVQLVESGGG (서열번호 21)이고, 경쇄의 N-말단 서열은 DIQMTQSPSS (서열번호 22)라는 것을 나타내었다. 따라서, 이 작제물을 사용하여, 시그날 펩티다제에 의해 사용된 절단 부위 DIQMTQSPSS는 DE27 항체 발현에 대한 통상적인 2개의 ORF/2 벡터 접근법에서 사용되는 것과 동일하였다.
이러한 데이터는 다음 세대의 작제물 설계를 위한 중요한 과학적 통찰력을 제공하였다: 포유동물 ER 펩티다제는 새롭게 합성된 폴리단백질에서 시그날 펩티드를 인식하고 정확하게 절단할 수 있었지만, 이의 제시(presentation)를 위한 일부 명백한 요건이 있었다 (본원의 아래를 참조).
이 정제된 항체를, 통상적인 제조 방법으로 생산된 D2E7과 함께 질량 분광법으로 분석하였다. 변성 조건 하에서, pTT3-HcintLC-p.hori 작제물로부터 생산된 D2E7 경쇄는 질량 분광법에서 하나의 단일 피크를 나타내었고, 이의 분자량(MW)은 23408.8이었으며, 표준 제조 방법으로부터 생산된 D2E7 경쇄의 분자량(MW)은 23409.7로 거의 일치하였다. 또한 변성 조건 하에서, pTT3-HcintLC-p.hori 작제물로부터 생산된 D2E7 중쇄는 질량 분광법에서 하나의 큰 피크와 2개의 작은 피크를 나타내었고, 이들의 분자량(MW)은 각각 50640.6, 50768.2 및 50802.4였으며, 표준 제조 방법으로부터 생산된 D2E7 중쇄의 분자량(MW)은 각각 50641.7, 50768.6 및 50804.1로 또한 거의 일치하였다. 3개의 피크는 D2E7 중쇄의 표준 변이에 상응한다.
pTT3-HcintLC-p.hori 작제물로부터 생산된 이 D2E7 항체에 대한 천연 조건 하에서의 온전한 분자량(MW)을, 표준 제조 방법으로부터 생산된 D2E7 항체와 함께, 질량 분광법을 사용하여 또한 결정하였다. pTT3-HcintLC-p.hori 작제물로부터 생산된 D2E7 항체는 3개의 피크를 나타냈고, 각각 MW가 148097.6, 148246.9 및 148413.1이었으며; 표준 제조 방법으로부터 생산된 D2E7 항체도 3개의 피크를 나타내었고, MW가 각각 148096.0, 148252.3 및 148412.8이었다.
이러한 데이터는, pTT3-HcintLC-p.hori 작제물로부터 생산된 D2E7 항체는, 변성 조건 및 천연 조건 하에서, 통상적인 제조 방법으로부터 생산된 D2E7 항체와 크기가 동일하다는 것을 명백히 증명하였다. 통상적인 제조 방법과 비교하여 완전히 정확한 아미노산 서열을 갖는 항체를 생산하는 능력은 본 발명의 항체 발현 시스템의 장점 중의 하나이다. 문헌[참조: Fang et al. in Nature Biotechnology, 2005]에 기술된 2A 시스템을 사용하여, 예를 들면, 생산된 항체는 중쇄의 C-말단에 2개의 추가적인 비천연 아미노산이 있었고, 이는 절단의 특성으로 인해 제거될 수 없었다.
pTT3-HcintLC-p.hori sORF 작제물을 사용하여 생산된 D2E7 항체는, TNF에 결합하는데 있어서 표준 제조 방법으로부터 생산된 D2E7 항체와 동일한 친화도를 갖는다는 것을 또한 증명하였다. 고정된 염소 항-사람 IgG를 통해 바이오센서 칩에 포획된 rhTNFa 길항제와 가용성 rhTNFa 사이의 실시간 결합 상호작용을, Biacore 3000 장치[판매원: Pharmacia LKB Biotechnology, Uppsala, Sweden]를 제조업자의 설명서 및 표준 절차에 따라 사용하여 측정하였다. 간략히 설명하면, rhTNFa 분취액을 HBS-EP[판매원: Biacore] 완충액 속에 희석시키고, 150㎕의 분취액을 25ml/분의 유속으로 고정된 단백질 매트릭스에 주사하였다. 등가 농도의 분석물을 동시에 비처리 참조 표면에 주사하여, 벌크 굴절률 바탕값을 빼는 것에 대한 블랭크 센서그램(sensorgram)으로서 역할을 하였다. 센서 칩 표면을, 10mM 글리신을 25ml/분으로 2회 5분 주사하여 사이클 간에 재생시켰다. 이어서, 생성된 실험적 결합 센서그램을 BIA 평가 4.0.1 소프트웨어를 사용해서 평가하여, 반응속도론적 속도 변수를 결정하였다. 각각의 길항제에 대한 데이터 세트를 1:1 랭무어(Langmuir) 모델로 적합시켰다. 이러한 연구를 위하여, 최대 분석물 결합 용량 (RU) 또는 Rmax 속성을 위하여 적합도를 국소적으로 선택하면서, 결합 및 해리 데이터를 전체 적합도 분석 프로토콜 하에서 분석하였다. 이 경우에, 소프트웨어가 단일 해리 상수(kd), 결합 상수(ka) 및 친화도 상수(Kd)를 계산하였다. 평형 해리 상수는 Kd = kd / ka 이었다. 반응속도론적 온-레이트(on-rate), 반응속도론적 오프-레이트(off-rate) 및 전체 친화도를, 1 내지 100 nM 범위의 상이한 TNFα 농도를 사용하여 결정하였다. 작제물 pTT3-HcintLC-p.hori로부터 생산된 D2E7 항체에 대한 반응속도론적 온-레이트, 반응속도론적 오프-레이트 및 전체 친화도는 각각 1.61E+6 (M-1s-1), 5.69E-5 (s-1) 및 3.54E-11 (M) 이었다; 표준 제조 방법을 통해 생산된 D2E7 항체에 대한 반응속도론적 온-레이트, 반응속도론적 오프-레이트 및 전체 친화도는 각각 1.73E+6 (M-1s-1), 6.72E-5 (s-1) 및 3.89E-11 (M) 이었다. Biacore 분석은, 이 sORF 작제물을 사용하여 생산된 D2E7 항체가 통상적인 제조 방법으로 생산된 D2E7 항체와 TNFα에 대해 유사한 친화도를 갖는다는 것을 나타내었다.
시그날 펩티드의 변형
sORF 작제 설계물, 중쇄-int-경쇄에 있어서, 부위-지시된 돌연변이유발을 통해 경쇄 시그날 펩티드 서열의 소수성을 감소시킨 경우, 항체 분비 수준이 약 10배 증가하였다는 것을 증명하였다.
피.호리코시이 인테인 서열 다음에, 경쇄 시그날 펩티드 서열이 "MDMRVPAQLLGLLLLWFPGSRC" (서열번호 23)에서 "MDMRVPAQLLG DEWFPGSRC" (서열번호 24)로 변화된, 작제물 H를 설계하였다. 상기한 바와 같은 동일한 유형의 형질감염 실험에서, 이 작제물을 발현한 세포의 상청액은, ELISA 분석으로 측정된 바와 같이 2047 + 116 ng/ml의 항체를 함유하였다. 이 항체 분비 수준은 2A 기술을 사용하여 기술된 것 (1.6 ㎍/ml)과 유사하다. 이 상청액의 웨스턴 블롯 분석은, 항체 중쇄 및 항체 경쇄에 상응하는 강한 밴드를 보였다.
대조군 실험에서, 이 동일한 경쇄 시그날 펩티드 돌연변이를, 통상적인 접근법 (2개의 별도의 벡터 내의 2개의 별도의 개방 판독 프레임으로부터 항체 중쇄 및 경쇄를 발현시키기 위한 것)을 사용하여 이 항체를 발현시키기 위한 벡터 내로 도입시켰다. 통상적인 작제 설계물에서, 소수성 영역은 ER에 있는 시그날 인식 입자 (SRP) 복합체로의 표적화 및 트랜스로콘(translocon)으로의 진입을 지시하는데 중요하기 때문에, 예상한 바와 같이, 이 작제물에서, 서열번호 23을 서열번호 24로 변화시키면 항체가 분비되지 않았다. 이는, sORF 작제 설계물에 있어서, ER 시그날 펩티다제에 의해 인식 및 절단될 수 있더라도, 경쇄 시그날 펩티드의 표적화 기능은 없어도 된다는 것을 입증하였고, 이는 전체 ORF가 ORF의 시작부분에 있는 중쇄 시그날 펩티드에 의해 지시되어 ER 내로 들어갔다는 가설과 일관된다.
sORF 작제물 H를 사용하여 분비된 D2E7 항체를 단백질 A 친화도 크로마토그래피로 정제하고 경쇄의 N-말단 서열에 대해 분석하였다. 경쇄의 N-말단 펩티드 서열은 MDMRVPAQLL(서열번호 26)(모호성 없음)이었고, 이는 비절단된 시그날 펩티드를 제시하였다. 문헌에서 포유동물 ER 시그날 펩티드의 H 영역은 SRP 복합체로의 표적화 및 트랜스로콘을 통한 전좌를 지시하는데 주로 기능을 한다는 것을 시사하지만, 본원의 데이터는 시그날 펩티드의 소수성 (H) 영역이 시그날 펩티다제에 의한 인식 및 절단에서 일정한 역할을 한다는 것을 시사하였다.
본 발명자들은 pTT3-HcintLC-p.hori 작제물 및 작제물 H를 사용하여 분비된 D2E7 항체는 세포-기반 검정에서 생물학적으로 활성이라는 것을 증명하였다. 작제물 pTT3-HcintLC-p.hori 및 작제물 H를 사용하여 생산된 D2E7 항체를 정제하고, L929 세포에서 TNFa 유도된 세포독성을 중화시키는 능력을 검정하였다. 이 검정을 본질적으로 US 6,090,382(실시예 4)에 기술된 바와 같이 수행하였다. 사람 재조합 TNFa는 쥐 L929 세포에서 세포독성을 일으키고 이를 본 검정에서 사용하였다. D2E7, 즉 항-TNFa 항체는 이 세포독성을 중화시킬 수 있기 때문에, L929 검정은 특정 D2E7 항체 제제의 생물학적 활성을 평가하는데 사용할 수 있는 세포 기반 검정 중 하나이다. 이 검정을 사용하여 분석한 경우, pTT3-HcintLC-p.hori 작제물 및 작제물 H로부터 생산된 D2E7은 TNFa 유도된 세포독성을 중화시켰다. 이들의 IC50 값은 표준 제조 방법으로부터 생산된 D2E7에 의한 것과 유사하였다.
본 발명자들은 경쇄 시그날 펩티드 영역에서 상이한 설계를 갖는 추가적인 작제물을 조사하였다. 항체 분비 효율을 높일 최적 sORF 작제 설계물을 확인하기 위하여, C-말단 스플라이싱 부위 주변 및 다음의 시그날 펩티드 영역이 상이한 다수의 추가적인 작제물을 설계하였다. 작제물 JH 작제물의 "MDMRVPAQLLGDE WFPGSRC" (서열번호 24) 대신에 인테인의 마지막 N 다음에 "MDMRVPAQWFPGSRC" (서열번호 25)를 결정하였고, 이는 C-말단 영역 뿐만 아니라 시그날 펩티다제 절단 부위를 보존하면서 이 시그날 펩티드 내의 소수성 영역을 추가로 제거하였다. 작제물 K는 인테인의 마지막 N 바로 다음의 성숙한 경쇄 서열의 발현을 지시하였다. 작제물 L은 작제물 pTT3-HcintLC-p.hori에서와 같이, "MDMRVPAQLLGLLLLWFPGSRC" (서열번호 23) 대신에 인테인의 마지막 N 다음에 "MDMRVPAQLLGLLLLWFPGSGG" (서열번호 27)의 발현을 지시하였고, 이는 시그날 펩티다제에 의한 절단 부위 앞의 -1 및 -2 아미노산을 변화시켰다.
한 실험에서, 이러한 작제물을 293E 세포 내로 일시적 형질감염을 통해 도입시키고, 7일 후, 배양된 상청액을 ELISA 분석으로 IgG 항체 역가에 대해 분석하였다. 작제물 H, J, KL에 대한 항체 역가는 각각 2328.5 + 79.9, 1289.7 + 129.6, 139.3 + 4.7 및 625.0 + 20.6 ng/ml(평균 + 표준편차)였다.
이러한 형질감염으로부터의 세포 펠릿 샘플을 또한 웨스턴 블롯 분석으로 분석하였다. 모든 작제물은 앞서 기술된 3조 폴리펩티드 밴드 (약 130kDa), 중쇄 밴드 (약 50kDa) 및 경쇄 밴드 (약 25kDa)를 나타내었고, 어느 작제물에서도 검출가능한 스플라이싱된 산물 (80kDa, 중쇄 및 경쇄 항체 둘다에 의해 인식됨)이 없었다. 이 작제물 그룹 중에서, 작제물 K는 매우 적은 양의 세포내 경쇄만 생산했다는 점에서 가장 특이한 웨스턴 블롯 (WB) 패턴을 나타내었고, 대신에 이는 N-말단 스플라이싱 접합점에서의 1회의 절단 사건의 산물인 인테인-경쇄 융합체에 상응하는 단백질 종을 생산하였다. 이 단백질 종은 이 그룹 내의 다른 작제물의 경우에는 부재하였다. 작제물 K는 다른 작제물과 두가지 양상에서 상이하였다: 이는 시그날 펩티다제에 의한 절단 부위를 갖지 않았고, C-말단 엑스테인의 첫번째 아미노산 잔기로서 메티오닌 또는 세린 대신에 아스파르트산을 가졌다. 이러한 특징 중 하나 또는 둘다는 인테인과 항체 경쇄 사이의 영역에서의 절단을 방해하여, 항체 분비를 감소시킬 수 있었을 것이다.
sORF 작제물 JL을 사용하여 분비된 D2E7 항체를 단백질 A 친화도 크로마토그래피로 정제하고, 이들의 경쇄의 N-말단 서열에 대해 분석하였다. 이 분석은 작제물 J에 의해 생산된 경쇄의 N-말단 펩티드 서열은 MDMRVPAQLL이라는 것을 나타내었고, 이는 비절단된 시그날 펩티드를 제시하였다; 반면에 작제물 L에 의해 생산된 경쇄의 N-말단 펩티드 서열은 DIQMTQSPSS였고, 이는 정확한 시그날 펩티드 절단 후 성숙한 경쇄를 제시하였다. 그러므로, 작제물 L은, 작제물 pTT3-HcintLC-p.hori와 비교하여 향체 분비를 증가시키고 (상이한 일시적 형질감염에서 0.6 내지 1 ug/ml) 동시에 경쇄가 정확한 N-말단 서열을 갖는 설계를 제시한다.
본 발명자들은 인테인을 사용하는 sORF 작제물로부터 어셈블리된 항체 발현의 메커니즘 및 항체 분비 수준을 추가로 증가시키는 방법을 탐색하였다. 기술된 대부분의 sORF 작제물로 형질감염된 세포의 세포내 샘플은, 비프로세싱된 및 프로세싱된 경쇄에 상응하는 2개의 항체 경쇄 종을 함유하였다. 양성 대조군 작제물 또는 pTT3-HcintLC-p.hori 작제물로만 형질감염된 세포에서, 프로세싱된 경쇄가 분비되었고, 이는 야생형 경쇄 시그날 펩티드를 부착한 비프로세싱된 경쇄가 어셈블리 및 분비되지 않을 수 있다는 것을 나타내었다. 대조적으로, HJ 작제물로부터의 비프로세싱된 경쇄는 어셈블리 및 분비될 수 있었다; 둘다 돌연변이된 시그날 펩티드를 가졌다. 경쇄 시그날 펩티드 프로세싱의 정도는, 비프로세싱된 및 프로세싱된 형태 사이의 세포내 경쇄 폴리펩티드의 분포에서 나타나는 바와 같이, 작제물에 따라 달라진다. 작제물 pTT3-HcintLC-p.hori와 비교하여, 작제물 L은 프로세싱된 경쇄의 양을 증가시켰고, 이는 항체 분비를 증가시켰다.
상기 실험 데이터에 따라, sORF 작제물로부터 항체 분비를 증가시키는 한가지 방법은, 경쇄 시그날 펩티드의 프로세싱 효율을 개선시키는 것이다. 이는, 소수성 영역에서 뿐만 아니라 절단 부위 근처의 영역에서 돌연변이를 체계적으로 검사하고, 상이한 길이의 시그날 펩티드를 검사하여 수행한다. 이는 또한, 효모에서 이러한 제시에서 효율적으로 절단될 수 있는 펩티드 서열에 대해 스크리닝하고, CHO 세포에서 유사한 스크리닝을 하여 수행할 수 있다.
sORF 작제물로부터 항체 분비 수준을 증가시키는데 사용될 수 있는 또다른 방법은, 상이한 5' 및 3' 비해독 영역(UTR)을 검사하여 3조 mRNA의 안정성을 증가시키는 것이며, 이는 이러한 mRNA는 별개로 항체 중쇄 및 경쇄를 암호화하는 통상적인 mRNA보다 더 길기 때문이다.
sORF 작제물로부터 항체 분비 수준을 증가시키는 또다른 방법은, 안정한 CHO 또는 NS0 세포주를 생성 및 선별하고, DHFR 또는 GS를 사용하여 증폭시켜 재조합 유전자 카피수를 증가시키는 것이다. 항체 분비 수준은, 재조합 유전자의 위치를 에피좀(일시적)에서 게놈(안정한)으로 변화시킴으로써 독립적으로 증가된다. 이는 또한 카피수를 증가시키고/시키거나 5' 및 3' UTR, 프로모터 및 인핸서 서열을 조작함으로써 향상된다. 디하이드로폴레이드 리덕타제(dhfr)를 발현하는 벡터를 dhfr-결핍된 세포주 내로 형질감염시킨다. 높은 벡터 카피수를 갖는 세포주를, dhfr의 경쟁적 억제제인 메토트렉세이트[참조: Kaufman, R.J. and Sharp, P.A. J Mol. Biol. (1982) 159:601-621]를 사용하여 선별한다. 추가적인 독립적 대안으로서, 사이토메갈로바이러스 프로모터 인핸서와 함께 글루타민 신테타제 선별가능 마커를 보유하는 발현 벡터를 사용하여 발현을 증가시킨다[참조: Bebbington, C.R. (1991) Methods 2:138-145]. 재조합 유전자 카피수를 증가시키는 것 외에도, sORF 작제 설계물로부터 프로세싱하는데 특히 적용가능한 세포 계통을 또한 이 과정에서 선별한다.
삽입체를 함유하는 변형된 인테인의 사용
D2E7 중쇄 및 경쇄 폴리펩티드로부터 분리된 세포내 인테인 단백질을 추적하기 위하여, 본 발명자들은, 작제물 pTT3-LcintHC-p.hori 및 작제물 H에서, 아미노산 서열 위치 FRKVR!RGRG (!는 삽입 부위를 나타낸다, -HT1) 및 EGKR!IPEF (-HT2)에 히스티딘 태그를 도입시킨 4개의 작제물을 제조하였다. 피.호리코시이 인테인 내의 이러한 2개의 위치는, 3차원 구조를 유지시키고 따라서 기능을 유지시키면서 삽입체를 허용할 수 있는 루프인 것으로 가설을 세웠다. 한 실험에서, 293E 세포의 형질감염 후 4일간의 배양 후, 배양 상청액을 ELISA 분석으로 IgG 항체 역가에 대해 분석하였다. 작제물 pTT3-LcintHC-p.hori-HT1, pTT3-LcintHC-p.hori-HT2, 작제물 H-HT1, 작제물 H-HT2 및 작제물 H에 대한 항체 역가는 각각 78.3+3.2, 67.3+0.6, 663.0+15.5, 402.7+5.5, 747.0+22.5 ng/ml(평균 + 표준편차)였다. 두 위치에 모두 삽입체를 갖는 피.호리코시이 인테인의 사용은 어셈블리된 항체가 분비되게 하였다. 특히, 첫번째 위치에 내부 삽입된 태그를 갖는 인테인의 사용은, 삽입이 없는 인테인을 사용하는 것과 유사한 항체 분비 수준을 나타냈다.
상기 데이터는, 본 발명의 sORF 작제 설계물이 내부 태그를 함유하는 변형된 인테인의 사용을 포함한다는 것을 증명한다. 다양한 태그가 당업계에 공지되어 있다. 본 발명의 태그에는 형광 태그 및 화학발광 태그가 포함되지만, 이에 제한되는 것은 아니다. 이러한 작제물을 사용하여, 발현되는 폴리단백질의 양을 개개의 세포에서 형광 검출을 사용하여 모니터할 수 있다. 또한, 이러한 세포를, FACS를 사용하여 단백질 발현 수준에 따라 분류할 수 있다. 이러한 태그의 사용은, FACS 분석을 통해 고 생산 세포 또는 세포주의 선별을 가능하게 하므로, 안정한 세포주 생성에서 특히 유용하다. 본 발명에서 설명한 바와 같이, 전체 길이 인테인은 플랭킹 항체 중쇄 및 경쇄로부터 자가절단된 후 세포 용해물에서 관찰되었다. 이는 형광 표지된 인테인의 검출에 대한 기반 및 안정한 세포주 생성에서의 이들의 용도를 제공한다. 태그는 또한 단백질 정제에서 사용될 수 있다.
위에 제시된 데이터로부터, 본 발명자들은 피.호리코시이 Pol I 인테인-매개된 단백질 스플라이싱 반응이, 293E 세포에서, ER에서, 항체 (D2E7로 구체적으로 예시됨) 중쇄 및 경쇄 아미노산 서열과 관련하여 일어날 수 있다는 것을 이해하였다. C-말단 엑스테인의 첫번째 아미노산에서의 S>M 및 인테인의 마지막에서 두번째 아미노산에서의 H>A와 같은 점 치환 돌연변이는 분비되는 항체의 수준을 증가시켰다. 작제물 H 및 J에서와 같은, 경쇄 시그날 펩티드의 H 영역의 소수성을 감소시키면, 항체 분비의 수준이 보다 더 높아졌다. 경쇄 시그날 펩티드가 없는 작제물에서 항체 분비 수준은 상대적으로 낮고, 이는 C-말단 스플라이싱 접합점에서 효율성이 낮은 절단 때문인 것으로 생각된다. 두가지 접근법을 사용하여 이 절단의 효율성을 증가시킨다. 첫번째는, +1 위치에서 아스파르트산 이외의 아미노산을 사용한다. 또한 본원에서 기술된 다수의 작제물은 +1 위치에 메티오닌을 사용하였고, C-말단 스플라이싱 접합점에서 효율적인 절단이 일어났다. 이 절단의 효율성을 증가시키기 위한 두번째 접근법은, 링커를 사용하고, 임의로 그 뒤에 본 명세서에서 기술된 것과 같은 상이한 유형의 절단 부위를 사용하여, C-말단 절단 부위와 경쇄 구형 구조 사이의 간격을 변화시키는 것이다.
피.호리코시이 인테인 및 DE27 항체를 포함하는 다양한 작제물을 기술하고 검사하였지만, 본 발명의 sORF 설계에서 다른 인테인 및 인테인-유사 단백질 (예: 헤지호그 및 관련된 계열)을 사용한다 (예: 항체 중쇄와 경쇄 사이에 통합시킨다). 다른 다중 서브유닛 단백질 (예: 2개의 서브유닛을 갖는 단백질 및 2개 이상의 서브유닛을 갖는 단백질)을 항체의 중쇄 및 경쇄 단백질로 또한 치환시킨다.
본원에서 상기한 피.호리코시이 PolI 인테인 작제물 외에도, Sce.VMA 인테인 및 Ssp.dnaE 미니 인테인을 사용하여 유사한 작제물을 설계하였다: pTT3-Hc-VMAint-LC-0aa, pTT3-Hc-VMAint-LC-1aa, pTT3-Hc-VMAint-LC-3aa, pTT3-Hc-Ssp-GA-int-LC-0aa, pTT3-Hc-Ssp-GA-int-LC-1aa 및 pTT3-Hc-Ssp-GA-int-LC-3aa. 이러한 작제물을 293E 세포 내로 형질감염시키고, 상청액 및 세포 펠릿 샘플을 분석하였다.
한 실험에서, 293E 세포의 형질감염 후 7일간의 배양 후에, 세포 상청액을 ELISA 분석으로 IgG 항체 역가에 대해 분석하였다. 작제물 pTT3-Hc-VMAint-LC-0aa, pTT3-Hc-VMAint-LC-1aa, pTT3-Hc-VMAint-LC-3aa, pTT3-HC-Ssp-GA-int-LC-0aa, pTT3-HC-Ssp-GA-int-LC-1aa 및 pTT3-HC-Ssp-GA-int-LC-3aa에 대한 항체 역가는 각각 9.0±3.5, 12.0±0.0, 39.7±1.2, 90.0±2.0, 38.7±1.5 및 32±2.6 ng/ml(평균±표준편차)였다.
이러한 형질감염으로부터의 세포 펠릿 샘플을 또한 웨스턴 블롯 분석으로 분석하였다. 3조 폴리펩티드가 모든 이러한 샘플에서 관찰되었다. 또한, 중쇄 폴리펩티드는 작제물 pTT3-Hc-VMAint-LC-0aa, pTT3-HC-Ssp-GA-LC-0aa, pTT3-HC-Ssp-GA-int-LC-1aa 및 pTT3-HC-Ssp-GA-int-LC-3aa에서 관찰되었고; 경쇄 폴리펩티드는 pTT3-HC-Ssp-GA-int-LC-0aa, pTT3-HC-Ssp-GA-int-LC-1aa 및 pTT3-HC-Ssp-GA-int-LC-3aa에서 관찰되었다.
이러한 실험의 결과는, 단백질의 계열로서의 인테인은 본원에 기술된 바와 같은 sORF 단백질 발현 전략에서 성공적으로 사용될 수 있다는 것을 나타내었다. 또한, 세균 인테인-유사 (BIL) 도메인 및 헤지호그 (Hog) 자가프로세싱 도메인, 인테인 이외의 Hog/인테인 (HINT) 상위계열의 또다른 2개의 일원은, 본원에서 기술된 것과 유사한 작제 설계물에서 적용가능하다.
또한, 피.호리코시이 PolI 인테인 및 Sce.VMA 인테인을 포함하는 많은 인테인에 존재하는 엔도뉴클레아제 영역은, 본 유전자 발현 전략에서 유용하지 않기 때문에, 엔도뉴클레아제 도메인을 결실시켜 작은 링커로 치환하여 "미니 인테인"을 생성할 수 있다.
이러한 조작된 미니 인테인은 또한 기술된 작제 설계물에서 유용하고, 인테인 암호화 영역이 유의적으로 작다는 장점을 제공하여, 관심대상의 폴리펩티드를 암호화하는 큰 서열을 가능하게 하고/하거나 재조합 DNA 분자를 매우 쉽게 처리할 수 있게 한다.
2A 또는 2A-유사 서열 또는 프로테아제 인식 서열과 같은 자가프로세싱 펩티드의 사용과 관련된 한가지 문제는, 하나 이상의 폴리펩티드 쇄의 C 또는 N 말단이, 절단된 위치 및 1차 해독 산물 내에서 특정 쇄의 상대적인 위치에 따라, 자가프로세싱 펩티드로부터 유래한 아미노산, 즉, 2A-유래된 아미노산 잔기, 또는 프로테아제 인식 서열을 함유한다는 것이다. 이러한 아미노산 잔기는 숙주에 대해 "외래의" 것이고, 재조합 단백질이 생체내에서 발현되거나 전달되는 경우 (즉, 유전자 치료와 관련하여 바이러스 또는 비-바이러스 벡터로부터 발현되거나, 시험관내에서 생산된 재조합 단백질로서 투여되는 경우) 면역 반응을 유도할 수 있다. 또한, 제거되지 않는 경우, 2A-유래된 또는 프로테아제 부위-유래된 아미노산 잔기는, 생산자 세포에서 단백질 분비를 방해하고/하거나 단백질 형태를 변형시켜, 재조합 단백질의 발현 수준이 최적의 수준보다 낮아지고/지거나 생물학적 활성이 감소될 수 있다.
절단 후에 나머지 자가 프로세싱 절단 부위 유래된 아미노산 잔기를 제거시키기 위한 방법으로서, 폴리펩티드 암호화 서열과 자가 프로세싱 절단 부위 (즉, 2A 서열) 또는 다른 프로테아제 절단 부위 사이에 추가적인 단백질분해 절단 부위가 제공되도록 조작된 유전자 발현 작제물은, 본 발명의 실시에서 사용될 수 있다.
추가적인 단백질분해 절단 부위의 예에는 컨센서스 서열 RXK(R)R (서열번호 1)을 갖는 푸린 절단 부위가 있고, 이는 단백질 분비 경로 내의 푸린 및 다른 세린 프로테아제와 같은, 내인성 서브틸리신-유사 프로테아제에 의해 절단될 수 있다. 미국 특허원 제2005/0042721호는, 제1의 단백질의 N 말단에 있는 2A 잔기를, 제1의 폴리펩티드와 2A 서열 사이에 푸린 절단 부위 RAKR을 도입시켜 효율적으로 제거할 수 있다는 것을 제시한다. 또한, 2A 서열 및 2A 부위 근처에 푸린 절단 부위를 함유하는 플라스미드의 사용은, 2A 서열만 함유하는 플라스미드보다 단백질 발현 수준을 더 높이는 것으로 밝혀졌다. 이러한 개선은, 2A 잔기를 단백질의 N-말단으로부터 제거하는 경우, 보다 긴 2A- 또는 2A 유사 서열 또는 다른 자가프로세싱 서열을 사용할 수 있다는 점에서 추가적인 장점을 제공한다. 2A- 또는 2A 유사 서열과 같은 이러한 긴 자가프로세싱 서열은, 단일 프로모터를 사용하는 2개 이상의 폴리펩티드의 보다 우수한 등몰량 발현을 촉진시킬 수 있다. 폴리단백질에서 면역글로불린 경쇄 암호화 서열은 2회 존재하고 중쇄 암호화 서열은 1회만 존재하는 경우, 면역글로불린 발현의 추가적인 증가가 달성된다.
완전한 사람 특성을 갖는 항체 또는 이의 유사체를 사용하는 것이 유리하다. 이러한 반응물은 비-사람 종으로부터 유래한 항체 또는 유사체에 의해 유도되는 바람직하지 않은 면역 반응을 방지한다. 자가프로세싱 펩티드로부터 유래된 아미노산 잔기에 대한 가능한 숙주 면역 반응을 해결하기 위하여, 제1의 단백질에 대한 암호화 서열과 자가프로세싱 펩티드에 대한 암호화 서열 사이에 단백질분해 절단 부위에 대한 암호화 서열을 (당업계에 공지된 표준 방법론을 사용하여) 삽입하여, 발현된 폴리펩티드, 즉 항체로부터 자가프로세싱 펩티드 서열을 제거할 수 있다. 이는 생체내에서의 사용을 위한 치료 또는 진단 항체에서 특정 유용성을 제공한다.
재조합 DNA 벡터 기술을 사용하여 발현될 수 있는 당업계에 공지된 임의의 추가적인 단백질분해 절단 부위는 본 발명의 실시에서 사용될 수 있다. 폴리펩티드 또는 단백질 암호화 서열과 자가 프로세싱 절단 서열 (예: 2A 서열) 사이에 삽입될 수 있는 대표적인 추가적인 단백질분해 절단 부위에는 푸린 절단 부위, RXK(R)R (서열번호 1); 인자 Xa 절단 부위, IE(D)GR (서열번호 6); 시그날 펩티다제 I 절단 부위, 예를 들면, LAGFATVAQA (서열번호 28) 및 트롬빈 절단 부위, LVPRGS (서열번호 7)가 포함되지만, 이에 제한되는 것은 아니다.
단일 개방 판독 프레임으로부터 하나 이상의 성숙한 단백질을 발현시키기 위한 IRES, 푸린, 2A 및 인테인 접근법에 대한 대안으로서, 본 발명은 또한 폴리단백질 내에서 제1 및 제2의 단백질 부분 사이에 위치한 헤지호그 단백질 도메인을 사용하는 단백질 프로세싱을 제공한다. 항체 중쇄 및 경쇄 유전자를 분리시키는 헤지호그 자가프로세싱 도메인을 사용하여, 항체 중쇄 및 경쇄를 발현시키기 위한 단일 개방 판독 프레임을 설계하였다. 이러한 ORF를 보유하는 세포에서, 하나 이상의 항체 중쇄, 하나의 항체 경쇄 및 하나의 헤지호그 자가프로세싱 도메인으로 이루어진 단일 mRNA가 전사되고 이를 사용하여 상응하는 폴리단백질이 생성된다. 해독 후, 헤지호그 자가프로세싱 도메인은 항체 중쇄와 경쇄의 분리를 매개한다.
단백질의 헤지호그 계열은 상이한 발생 시스템에서 형태형성인자(morphogen)로서 작용하는 보존된 시그날전달 분자를 함유하고, 광범위한 사람 질병에 관련되어 있다[참조: Kalderon, D. 2005. Biochem Soc Trans. Dec;33(Pt6):1509-12]. 헤지호그 단백질은 2개의 구조 도메인, 세포 시그날전달에서 기능하는 N-말단 도메인 (Hh-N) 및 이러한 2개의 도메인 사이를 절단하는 해독후 자가프로세싱 사건을 촉매하는 C-말단 도메인(Hh-C)을 갖고 있고, N-말단 도메인의 C-말단에 콜레스테롤 잔기를 부가하여, 시그날전달 분자를 활성화시킨다[참조: Traci et al. 1997. Cell, 91, 85-97].
이러한 sORF 항체 발현 기술이 제공하는 장점에는 중쇄 및 경쇄에 대한 유전자 용량 비를 조절하는 능력, ER에서의 다중 서브유닛 어셈블리를 위한 중쇄 및 경쇄 폴리펩티드의 근접성, 및 고효율 단백질 분비에 대한 가능성이 포함된다.
Hh-C 단백질 도메인을 사용하여, ER에서의 자가프로세싱 반응을 촉매할 수 있고, 이는 하기한 단일 개방 판독 프레임 작제 설계물에서 항체 중쇄 폴리펩티드와 Hh-C 폴리펩티드 사이를 해독후 절단한다.
헤지호그 계열의 단백질은 N-말단 시그날전달 도메인 및 C-말단 자가프로세싱 도메인을 갖는다. 이들의 C-말단 자가프로세싱 도메인은 N-말단 도메인으로부터 자신을 절단하고, C-말단에 2단계 반응 메커니즘을 통해 콜레스테롤 잔기를 부가한다[참조: Porter et al. 1996. Science. 274(5285):255-9]. 콜레스테롤 외에도, DTT 또는 글루타티온과 같은 다른 친핵체도 자가프로세싱을 자극시킨다[참조: Lee et al. 1994. Science, 266, 1528-1537]. 절단 반응이 C-말단 자가프로세싱 도메인에 의해 촉매되는 바와 같이, 헤지호그 단백질의 N-말단 시그날전달 도메인이 항체 중쇄 또는 경쇄 폴리펩티드로 치환되는 경우 유사한 절단 반응이 일어난다. 이 반응을 사용하여, 단일 개방 판독 프레임에 의해 암호화된 폴리단백질 내에 함유된 항체 중쇄와 경쇄를 분리할 수 있다.
먼저 일시적 발현 시스템에서 항체 발현을 검사하고, 이를 위하여 PTT3 벡터 골격 상에서 작제물을 제조한다. 이 벡터는 EBV 복제 오리진을 갖고, 이는 현탁액 배양에서 형질감염된 293E 세포 (엡스타인 바 바이러스 핵 항원 1을 발현하는 세포)에서 에피좀 증폭이 일어나게 한다[참조: Durocher et al. 2002]. 각각의 벡터는 CMV 프로모터에 의해 작동하는 단일 개방 판독 프레임을 갖는다. 한가지 작제 설계물, pTT3-HC-Hh-C25-LC에서, 드로소필라 멜라노가스터 유래의 소닉 헤지호그 단백질의 전체 C-말단 도메인을, 각각 시그날 펩티드(SP)를 갖는 D2E7 중쇄와 경쇄 사이에 프레임내 삽입시켰다. 이러한 작제물을 293E 세포 내로 일시적 형질감염을 통해 도입시킨다. 배양 상청액 및 세포 펠릿 샘플을 둘다 분석한다.
세포 펠릿 샘플을, 세포질 및 세포내 막 분획이 분리되게 하는 조건 하에서 용해시킨다. 이러한 분획을 둘다, 면역블롯 기술을 사용하여 항-중쇄 및 항-카파 경쇄 항체로 분석한다. 이러한 블롯 상에서, 폴리단백질(HC-Hh-C25-LC), Hh-C25-LC, 및 분리된 중쇄(HC) 및 경쇄(LC)를 포함하는 단백질 종이 관찰된다. 뒤의 3개의 단백질 종의 존재는 자가프로세싱 반응이 일어났다는 것을 확인시킨다. 유리 중쇄는 Hh-C 단백질 도메인에 의해 촉매되는 절단으로부터 생성된다; 유리 경쇄 폴리펩티드는 시그날 펩티다제에 의한 절단의 결과이다. 소포체(ER)를 함유한 세포하(sub-cellular) 막 구획에서 단백질 종의 분리는, ORF의 시작부분에 있는 중쇄 시그날 펩티드가 전체 ORF를 절단 반응이 일어나는 ER 내로 지시했다는 것을 시사한다.
이러한 세포 펠릿 샘플을 또한 사용하여, 항체 중쇄-특이적 프로브 및 항체 경쇄-특이적 프로브를 사용하여 총 RNA 추출 및 노던 블롯 분석을 한다. 이러한 노던 블롯 상에서, 중쇄 프로브 및 경쇄 프로브에 둘다 하이브리드화하는 3조 mRNA의 관찰은, 작제 설계물의 sORF 성질을 확인시킨다. 대조적으로, 통상적인 접근법 (즉, 2개의 pTT3 벡터 내에 보유된 2개의 별도의 ORF로부터 항체 중쇄 및 경쇄를 도입시킴)을 사용하여 D2E7 항체를 발현한 세포 펠릿 샘플에서, 중쇄에 대한 mRNA (1.4kb) 및 경쇄에 대한 mRNA(0.7kb)가 각각 중쇄 또는 경쇄 프로브를 사용하여 검출되었다.
이러한 실험은, 단일 ORF를 함유하는 작제물 (D2E7 중쇄 - Hh - C25 - D2E7 경쇄)을 사용하여, 모든 3개의 단백질을 함유하는 단일 mRNA가 전사된다는 것을 증명한다. 이 3조 메시지는 3조 폴리펩티드로 해독되고, ORF의 시작부분에 존재하는 중쇄 시그날 펩티드에 의해 지시되어, 동시 해독적으로 ER 내로 이입된다. 이는, Hh-C 단백질 도메인은 항체 뿐만 아니라, 다른 분비되는 다중 서브유닛 단백질 및/또는 분비 경로를 거쳐서 폴딩되고 적절히 해독후 변형될 필요가 있는 다른 단백질의 발현에 유용하다는 것을 나타낸다.
세포 펠릿 외에도 배양된 상청액을, 본원에서 논의된 바와 같이, 웨스턴 블롯 및 ELISA를 사용하여 분비된 항체에 대해 분석한다. 결실된 hh-C25를 사용하는 작제물을 검사하여 폴리단백질 프로세싱의 효율성 및 항체 분비 수준을 비교할 수 있다.
Hh-C25 단백질 도메인으로부터 C-말단 63개의 아미노산을 결실시켜 단백질 도메인 Hh-C17을 생성하여, 이는 단백질 프로세싱을 촉매할 수 있지만 콜레스테롤 부가는 촉매하지 않는다는 것을 밝혀내었다. Hh-C17은 재조합 단백질로서 잘 발현되었고 이의 결정 구조가 결정되었다[참조: Traci et al. 1997. supra]. 그러므로, 또다른 작제 설계물 pTT3-HC-C17-LC에서, 이 절두된 단백질 도메인을 D2E7 항체 중쇄와 경쇄 사이에 삽입시켰다.
본원에서 상세히 기술한 유사한 작제 설계물에서 검사한, 헤지호그 단백질 및 인테인의 상동성 정렬에서, 마지막 8개의 아미노산은 예측된 마지막 β-쉬트 2차 구조 이후의 연장이고, 이는 자가프로세싱의 효율성에 기여할 수 있거나 하지 않을 수 있다. 그러므로, 추가적인 작제물, pTT3-HC-C17sc-LC도 검사한다.
이러한 작제물을 일시적 형질감염을 통해 293E 세포 내로 도입시키고, 7일 후, 배양된 상청액을 ELISA 분석으로 IgG 항체 역가에 대해 분석할 수 있다. pTT3-HC-C25-LC, pTT3-HC-C17-LC, pTT3-HC-C17sc-LC 및 pTT3-HC-C17hn-LC에 대한 항체 역가는 각각 0.038, 0.042, 0.040 및 0.046 ug/ml이다.
이러한 상청액 샘플을 또한 SDS-PAGE 겔(변성 조건)에서 분석하고, 사람 IgG 중쇄에 특이적인 항체 및 사람 카파 경쇄에 특이적인 항체로 블롯팅한다. 이러한 웨스턴 블롯에서 항체 중쇄 (약 50kDa) 및 항체 경쇄 (약 25kDa) 단백질을 관찰할 수 있고 ELISA로 측정된 IgG 수준과 관련시킬 수 있다.
이러한 형질감염으로부터의 세포 펠릿 샘플을 또한 웨스턴 블롯 분석으로 분석한다. 기술된 4개의 단백질 종의 존재 및 상대적 농도를 상이한 작제물 간에 비교하여, 각각의 작제 설계물이 제공하는 단백질 프로세싱 효율성을 결정할 수 있다.
또다른 계열의 자가프로세싱 단백질인 인테인에서, 마지막 2개의 아미노산은 HisAsn인 경향이 있다. 인테인에 의해 촉매되는 단백질 스플라이싱의 과정에서 Asn은 His의 도움으로 고리화가 일어나고, 이는 인테인과 C-말단 플랭킹 폴리펩티드 사이의 펩티드 결합이 절단되게 한다. 인테인과 대조적으로, 헤지호그 자가프로세싱 단백질은 자연에서 C-말단 플랭킹 폴리펩티드를 갖지 않고, 폴리펩티드의 이 위치에 보존된 Asn을 갖지 않는다. 한가지 작제 설계물, pTT3-HC-C17hn-LC에서, His-Asn을 이 위치에 도입시켜 Ser-Cys을 치환시켰다. 이론에 구속되기를 바라지 않으며, 이 위치에 있는 조작된 절단 부위는, 헤지호그 자가프로세싱 단백질과 항체 경쇄 사이를 이 특정 작제 설계물에서 보다 효율적으로 분리시킨다. 항체 분비의 효율성을 상기한 바와 같이 검사한다.
헤지호그 자가프로세싱 단백질을 함유하는 sORF 작제물을 통해 생산된 항체를 특성규명한다. 상기 sORF 작제물을 사용하여 분비된 D2E7 항체를 단백질 A 친화도 크로마토그래피로 정제하고 이의 중쇄 및 경쇄의 N-말단 서열에 대해 분석한다. 이러한 정제된 항체를, 표준 제조 방법으로부터 생산된 D2E7과 함께, 앞서 기술한 바와 같이 질량 분광법으로 변성 조건 하에서 분석한다. 질량 분광법을 사용하여 천연 조건 하에서의 온전한 분자량(MW)을, 이러한 작제물로부터 생산된 D2E7 항체에 대해, 표준 제조 방법으로부터 생산된 D2E7 항체와 함께 결정한다.
D2E7 항체와 사람 TNFα 사이의 결합을 앞서 기술한 Biacore를 사용하여 분석한다. 반응속도론적 온-레이트(on-rate), 반응속도론적 오프-레이트(off-rate) 및 전체 친화도를, 1 내지 100nM 범위의 상이한 TNFα 농도를 사용하여 결정한다.
본 발명은, 2개 이상의 폴리펩티드 또는 단백질에 대한 암호화 서열 및 자가 프로세싱 절단 서열을 포함하는 작제물을 세포 내로 도입시키기 위한 임의의 다양한 벡터의 용도를 고려한다. 유전자 발현 벡터의 많은 예는 당업계에 공지되어 있고, 바이러스 또는 비-바이러스 기원의 벡터일 수 있다. 본 발명의 실시에서 사용될 수 있는 비-바이러스 유전자 전달 방법에는 플라스미드, 리포좀, 핵산/리포좀 복합체, 양이온성 지질 등이 포함되지만, 이에 제한되는 것은 아니다.
바이러스 벡터
바이러스 벡터 및 다른 벡터는 세포를 효율적으로 형질도입시키고 자신의 DNA를 숙주 세포 내로 도입시킬 수 있다. 재조합 바이러스 벡터를 생성하는데 있어서, 비필수 유전자를, 관심대상의 단백질 또는 폴리펩티드를 암호화하는 발현가능한 서열로 치환시킨다. 대표적인 벡터에는, 레트로바이러스 벡터 (예: 렌티바이러스 벡터), 아데노바이러스(Ad) 벡터 (예: 이의 복제 가능한, 복제 결함 및 독성유전자 부재(gutless) 형태), 아데노-관련 바이러스(AAV) 벡터, 시미안 바이러스 40 (SV-40) 벡터, 소 파필로마 벡터, 엡스타인 바 벡터, 헤르페스 벡터, 백시니아 벡터, 말로니 쥐 백혈병 벡터, 하비 쥐 육종 바이러스 벡터, 쥐 유방 종양 바이러스 벡터, 라우스 육종 바이러스 벡터 및 비바이러스 플라스미드와 같은, 바이러스 및 비-바이러스 벡터가 포함되지만, 이에 제한되는 것은 아니다. 배큘로바이러스 벡터는 익히 공지되어 있고 곤충 세포에서의 발현에 적당하다. 포유동물 또는 다른 진핵생물 세포에서의 발현에 적당한 수많은 벡터가 당업계에 공지되어 있고, 많은 벡터가 시판된다. 판매원에는 Stratagene, La Jolla, Ca; Invitrogen, Carlsbad, CA; Promega, Madison, WI 및 Sigma-Aldrich, St. Louis, MO가 포함되지만, 이에 제한되는 것은 아니다. 많은 벡터 서열은 GenBank를 통해 입수가능하고, 벡터에 관한 추가적인 정보는 Riken BioSource Center를 통해 인터넷 상에서 입수가능하다.
벡터는 통상적으로 복제 오리진을 포함하고, 벡터는 또한 벡터를 확인하고 선별할 수 있는 "마커" 또는 "선별가능 마커" 기능을 추가적으로 포함할 수 있거나 하지 않을 수 있다. 임의의 선별가능 마커를 사용할 수 있지만, 재조합 벡터용 선별가능 마커는 일반적으로 당업계에 공지되어 있으며, 적당한 선별가능 마커의 선택은 숙주 세포에 따라 달라질 것이다. 항생제 또는 다른 독소에 대한 내성을 부여하는 단백질을 암호화하는 선별가능 마커 유전자의 예에는 앰피실린, 메토트렉세이트, 테트라사이클린, 네오마이신[참조: Southern et al. 1982. J Mol Appl Genet. 1:327-41], 마이코페놀산[참조: Mulligan et al. 1980. Science 209:1422-7], 퓨로마이신, 제오마이신, 하이그로마이신[참조: Sugden et al. 1985. Mol Cell Biol. 5:410-3], 디하이드로폴레이트 리덕타제, 글루타민 신테타제 및 G418이 포함되지만, 이에 제한되는 것은 아니다. 당업자가 이해하는 바와 같이, 발현 벡터는 통상적으로, 발현되는 암호화 서열(들)에 적당한, 복제 오리진, 암호화 서열 또는 발현될 서열에 작동가능하게 연결된 프로모터 뿐만 아니라, 리보좀 결합 부위, RNA 스플라이싱 부위, 폴리아데닐화 부위 및 전사 종결 서열을 포함한다.
벡터 또는 다른 DNA 서열을 "재조합체"로서 언급하는 것은 단지, 통상적으로 자연으로부터 분리되거나 자연에서 발견되는 바와 같이 작동가능하게 연결되어 있지 않는, DNA 서열의 작동가능한 연결을 인정하는 것이다. 조절 (발현 및/또는 제어) 서열은, 발현 및/또는 제어 서열이 전사 및, 적당한 경우, 핵산 서열의 해독을 조절하는 경우, 핵산 암호화 서열에 작동가능하게 연결된 것이다. 따라서 발현 및/또는 제어 서열은 프로모터, 인핸서, 전사 터미네이터, 암호화 서열의 5'에 시작 코돈 (즉, ATG), 인트론에 대한 스플라이싱 시그날, 및 종결 코돈을 포함할 수 있다.
아데노바이러스 유전자 치료 벡터는 강력한 일시적 발현, 우수한 역가, 및 생체내에서 분열 및 비-분열 세포를 형질도입시키는 능력을 나타내는 것으로 알려져 있다[참조: Hitt et al. 2000. Adv in Virus Res 55:479-505]. 본 발명의 재조합 Ad 벡터는, 벡터가 복제 결함 Ad 비리온(virion) 내로 통합될 수 있게 하는 패키징 부위; 2개 이상의 관심대상의 폴리펩티드 또는 단백질 (예: 관심대상의 면역글로불린의 중쇄 및 경쇄)에 대한 암호화 서열; 및 단독으로 또는 추가적인 단백질분해 절단 부위와 함께 자가프로세싱 절단 부위를 암호화하는 서열을 포함한다. 감염성 비리온 내로 통합시키는데 필요하거나 유용한 다른 요소에는 5' 및 3' Ad ITR, E2 유전자, E4 유전자의 일부 및 임의로 E3 유전자가 포함된다.
재조합 Ad 벡터를 캡슐화하는 복제 결함 Ad 비리온은, Ad 패키징 세포 및 패키징 기술을 사용하여 당업계에 공지된 표준 기술로 제조한다. 이러한 방법의 예는, 예를 들면, 미국 특허 제5,872,005호에서 찾을 수 있다. 2개 이상의 관심대상의 폴리펩티드 또는 단백질에 대한 암호화 서열을 통상적으로 아데노바이러스 내로 바이러스 게놈의 결실된 E3 영역에 삽입시킨다. 본 발명을 실시하는데 사용하기 위한 바람직한 아데노바이러스 벡터는 하나 이상의 야생형 Ad 유전자 산물, 예를 들면, E1a, E1b, E2, E3 및 E4를 발현하지 않는다. 바람직한 양태는 E1, E2A, E4 및 임의로 E3 유전자 영역의 기능을 보완하는 패키징 세포주와 함께 통상적으로 사용되는 비리온이다[참조: 미국 특허 제5,872,005호, 제5,994,106호, 제6,133,028호 및 제6,127,175호].
따라서, 본원에서 사용되는 "아데노바이러스" 및 "아데노바이러스 입자"는 바이러스 자체 또는 이의 유도체를 말하고, 달리 명시되는 경우를 제외하고, 모든 혈청형과 아형 및 천연 형태와 재조합 형태가 포함된다. 이러한 아데노바이러스는 야생형일 수 있거나, 당업계에 공지되거나 본원에서 공개한 다양한 방법으로 변형될 수 있다. 이러한 변형에는, 입자 내에 패키징되어 감염성 바이러스를 형성하는 아데노 바이러스 게놈에 대한 변형이 포함된다. 이러한 변형에는, 하나 이상의 E1a, E1b, E2a, E2b, E3 또는 E4 암호화 영역 내의 결실과 같은 당업계에 공지된 결실이 포함된다. 대표적인 패키징 및 생산자 세포는 293, A549 또는 HeLa 세포로부터 유래된다. 아데노바이러스 벡터를 당업계에 공지된 표준 기술을 사용하여 정제하고 제형화한다.
아데노-관련 바이러스(AAV)는, 염색체 통합으로 세포를 잠복 감염시킬 수 있는 헬퍼-의존적 사람 파보바이러스이다. 염색체로 통합될 수 있는 능력 및 비병원성 특징으로 인해, AAV는 사람 유전자 치료 벡터로서 상당한 가능성을 갖고 있다. 본 발명을 실시하는데 사용하기 위하여, rAAV 비리온을 당업자에게 공지된 표준 방법론을 사용하여 생산하고 작제하여, 전사 방향으로 작동가능하게 연결된 구성요소로서, 제어 서열 (예: 전사 개시 및 종결 서열) 및 관심대상의 암호화 서열(들)이 포함되게 할 수 있다. 보다 구체적으로, 본 발명의 재조합 AAV 벡터는, 벡터가 복제 결함 AAV 비리온 내로 통합될 수 있게 하는 패키징 부위; 2개 이상의 관심대상의 폴리펩티드 또는 단백질에 대한 암호화 서열 (예: 관심대상의 면역글로불린의 중쇄 및 경쇄); 단독으로 또는 하나 이상의 추가적인 단백질분해 절단 부위와 함께 자가프로세싱 절단 부위를 암호화하는 서열을 포함한다. 본 발명을 실시하는데 사용하기 위한 AAV 벡터를 작제하여 또한, 전사 방향으로 작동가능하게 연결된 구성요소로서, 제어 서열 (예: 전사 개시 및 종결 서열)이 포함되게 한다. 이러한 구성요소의 5' 및 3' 말단 측면에는 기능성 AAV ITR 서열이 위치한다. "기능성 AAV ITR 서열"은, ITR 서열이 AAV 비리온의 구제(rescue), 복제 및 패키징을 위하여 의도된 바와 같이 기능하는 것을 의미한다.
재조합 AAV 벡터는 또한, 표적 세포에서, 선택된 재조합 폴리펩티드 또는 단백질 산물의 발현 및 생산을 지시할 수 있다는 점을 특징으로 한다. 따라서, 재조합 벡터는 적어도 재조합 AAV(rAAV) 비리온의 감염을 위한 캡슐화 및 물리적 구조에 필수적인 모든 AAV의 서열을 포함한다. 그러므로, 발현 벡터용 AAV ITR은 야생형 뉴클레오타이드 서열[참조: Kotin. 1994. Hum. Gene Ther. 5:793-801]을 가질 필요가 없고, 뉴클레오타이드의 삽입, 결실 또는 치환에 의해 변형될 수 있거나, AAV ITR은 임의의 다수의 AAV 혈청형으로부터 유래할 수 있다. 일반적으로, AAV 벡터는 당업계에 공지된 아데노-관련 바이러스 혈청형으로부터 유래된 임의의 벡터일 수 있다.
통상적으로, AAV 발현 벡터를 생산자 세포 내로 도입시키고 나서, AAV 헬퍼 작제물을 도입시키며, 이때 헬퍼 작제물은 생산자 세포에서 발현될 수 있는 AAV 암호화 영역을 포함하고, 보완 AAV 헬퍼는 AAV 벡터의 부재 하에서 기능한다. 헬퍼 작제물을 설계하여, 본원에 참조로서 인용된 미국 특허 제6,548,286호에 기술된 바와 같이, 통상적으로 p5 뒤의 시작 코돈을 ATG에서 ACG로 돌연변이시켜, 큰 Rep 단백질(Rep78 및 Rep68)의 발현을 하향조절할 수 있다. 이어서, 헬퍼 바이러스 및/또는 추가적인 벡터를 생산자 세포 내로 도입시키고, 이때 헬퍼 바이러스 및/또는 추가적인 벡터는 효율적인 rAAV 바이러스 생산을 지원할 수 있는 보조적인 기능을 제공한다. 이어서, 생산자 세포를 배양하여 rAAV를 생산한다. 이러한 단계는 표준 방법론을 사용하여 수행한다. 본 발명의 재조합 AAV 벡터를 캡슐화하는 복제 결함 AAV 비리온을 AAV 패키징 세포 및 패키징 기술을 사용하여 당업계에 공지된 표준 기술로 제조한다. 이러한 방법의 예는, 예를 들면, 전문이 본원에 참조로서 인용된 미국 특허 제5,436,146호; 제5,753,500호, 제6,040,183호, 제6,093,570호 및 제6,548,286호에서 찾을 수 있다. 추가적인 조성물 및 패키징 방법은 또한 전문이 본원에 참조로서 인용된 문헌[참조: Wang et al. (미국 특허원 제2002/0168342호)]에 기술되어 있고, 당업자의 지식 내에 있는 기술이 포함된다.
본 발명을 실시하는데 있어서, rAAV 또는 다른 벡터, 발현 벡터, 비리온을 생산하기 위한 숙주 세포에는 포유동물 세포, 곤충 세포, 미생물 및 효모가 포함된다. 숙주 세포는 또한, AAV 벡터 게놈이 안정하게 유지되고 패키징되는 숙주 세포 또는 생산자 세포 내에서 AAV (또는 다른) rep 및 cap 유전자가 안정하게 유지되는 패키징 세포일 수 있다. 대표적인 패키징 및 생산자 세포는 293, A549 또는 HeLa 세포로부터 유래된다. AAV 벡터를 당업계에 공지된 표준 기술을 사용하여 정제하고 제형화한다. 추가적인 적당한 숙주 세포 (벡터에 따라 달라짐)에는 중국 햄스터 난소 (CHO) 세포, CHO 디하이드로폴레이트 리덕타제 결핍 변이체 (예: CHO DX B11 또는 CHO DG44 세포)[참조: Urlaub and Chasin. 1980. Proc. Natl. Acad. Sci. 77:4216-4220], PerC.6 세포[참조: Jones et al. 2003. Biotechnol. Prog. 19:163-168] 또는 Sp/20 마우스 골수종 세포[참조: Coney et al. 1994. Cancer Res. 54:2448-2455]가 포함된다.
레트로바이러스 벡터
레트로바이러스 벡터는 또한 유전자 전달을 위한 통상적인 수단이다[참조: Miller. 1992. Nature 357:455-460]. 레트로바이러스 벡터 및 보다 특히 렌티바이러스 벡터는 본 발명을 실시하는데 사용될 수 있다. 따라서, 본원에서 사용되는 "레트로바이러스" 또는 "레트로바이러스 벡터"라는 용어는 각각 "렌티바이러스" 및 "렌티바이러스 벡터"를 포함하도록 의도된다. 레트로바이러스 벡터를 검사하여, 관심대상의 유전자를 광범위한 표적 세포의 게놈 내로 안정하게 도입시키기 위한 적당한 전달 운반체인 것을 밝혀내었다. 재배열되지 않은, 단일 카피 전이유전자를 세포 내로 전달하는 레트로바이러스 벡터의 능력으로 인해, 레트로바이러스 벡터는 유전자를 세포 내로 전달하는데 매우 적당하다. 또한, 레트로바이러스는, 레트로바이러스 외피(envelope) 당단백질이 숙주 세포 상의 특정 세포 표면 수용체에 결합하여 숙주 세포로 들어간다. 그 결과, 암호화된 천연 외피 단백질이, 천연 외피 단백질과 상이한 세포 특이성을 갖는 (예: 천연 외피 단백질과 비교하여 상이한 세포 표면 수용체에 결합하는) 이종 외피 단백질로 대체된, 위형화된(pseudotyped) 레트로바이러스 벡터는 또한 본 발명을 실시하는데 있어서 유용성이 있을 수 있다. 하나 이상의 표적 단백질 암호화 서열을 암호화하는 레트로바이러스 벡터의 특정 표적 세포로의 전달을 지시하는 능력은 본 발명의 실시에서 바람직하다.
본 발명은, 예를 들면, 하나 이상의 전이유전자 서열을 포함하는 레트로바이러스 전달 벡터 및 하나 이상의 패키징 요소를 포함하는 레트로바이러스 패키징 벡터를 포함하는, 레트로바이러스 벡터를 제공한다. 특히, 본 발명은 위형화된 레트로바이러스를 생산하기 위한 이종 또는 기능적으로 변형된 외피 단백질을 암호화하는 위형화된 레트로바이러스 벡터를 제공한다.
본 발명의 레트로바이러스 벡터의 코어 서열은, 예를 들면, B, C 및 D형 레트로바이러스 뿐만 아니라 스푸마바이러스(spumavirus) 및 렌티바이러스를 포함하는, 광범위한 레트로바이러스로부터 쉽게 유래될 수 있다[참조: RNA Tumor Viruses, Second Edition, Cold Spring Harbor Laboratory, 1985]. 본 발명의 조성물 및 방법에서 사용하기에 적당한 레트로바이러스의 예에는 렌티바이러스가 포함되지만, 이에 제한되는 것은 아니다. 본 발명의 조성물 및 방법에서 사용하기에 적당한 다른 레트로바이러스에는 조류 백혈병 바이러스, 소 백혈병 바이러스, 쥐 백혈병 바이러스, 밍크 세포 병소 유도 바이러스(Mink-Cell Focus-Inducing Virus), 쥐 육종 바이러스, 세망내피증(Reticuloendotheliosis) 바이러스 및 라우스 육종 바이러스가 포함되지만, 이에 제한되는 것은 아니다. 특히 바람직한 쥐 백혈병 바이러스에는 4070A 및 1504A[참조: Hartley and Rowe. 1976. J. Virol. 19:19-25], Abelson (ATCC 수탁번호 VR-999), Friend (ATCC 수탁번호 VR-245), Graffi, Gross (ATCC 수탁번호 VR-590), Kirsteni Harvey 육종 바이러스 및 Rauscher (ATCC 수탁번호 VR-998) 및 Moloney 쥐 백혈병 바이러스 (ATCC 수탁번호 VR-190)가 포함된다. 이러한 레트로바이러스는 American Type Culture Collection (ATCC; Manassas, VA)과 같은 기탁기관 또는 수탁기관으로부터 쉽게 입수하거나, 통상적으로 사용가능한 기술을 사용하여 공지된 기원으로부터 분리할 수 있다. 이 외에는 시판된다.
본 발명의 레트로바이러스 벡터 서열은 렌티바이러스로부터 유래될 수 있다. 바람직한 렌티바이러스는 사람 면역결핍 바이러스, 예를 들면, 1형 또는 2형 (즉, HIV-1 또는 HIV-2, 이때 HIV-1은 이전에는 림프절증 관련 바이러스 3 (HTLV-III) 및 후천성 면역결핍 바이러스(AIDS)-관련 바이러스(ARV)라고 하였다), 또는 확인되고 AIDS 또는 AIDS-유사 질환과 관련된 HIV-1 또는 HIV-2와 관련된 다른 바이러스이다. 다른 렌티바이러스에는 양 비스나/매디(Visna/maedi) 바이러스, 고양이 면역결핍 바이러스(FIV), 소 렌티바이러스, 원숭이 면역결핍 바이러스(SIV), 말 감염성 빈혈 바이러스(EIAV) 및 염소 관절염-뇌염 바이러스(CAEV)가 포함된다.
적당한 레트로바이러스의 속 및 주(strain)는 당업계에 익히 공지되어 있다[참조:본원에 참조로서 인용된, Fields Virology, Third Edition, edited by B. N. Fields et al. 1996. Lippincott-Raven Publishers, 예를 들면, Chapter 58, Retroviridae: The Viruses and Their Replication, Classification, pages 1768-1771, 표 1 포함]. 레트로바이러스를 생산하는 생산자 세포 및 생산자 세포주를 생성하기 위한 레트로바이러스 패키징 시스템, 및 이러한 패키징 시스템을 제조하는 방법은 또한 당업계에 공지되어 있다.
통상적인 패키징 시스템은 2개 이상의 패키징 벡터를 포함한다: 제1의 패키징 벡터는 gag, pol, 또는 gag 및 pol 유전자를 포함하는 제1의 뉴클레오타이드 서열을 포함하고; 제2의 패키징 벡터는 이종 또는 기능적으로 변형된 외피 유전자를 포함하는 제2의 뉴클레오타이드 서열을 포함한다. 레트로바이러스 요소는 HIV와 같은 렌티바이러스로부터 유래될 수 있다. 벡터는 기능성 tat 유전자 및/또는 기능성 보조 유전자 (vif, vpr, vpu, vpx, nef)가 없을 수 있다. 상기 시스템은 rev 유전자를 포함하는 뉴클레오타이드 서열을 갖는 제3의 패키징 벡터를 추가로 포함할 수 있다. 패키징 시스템은 제1, 제2, 및 임의로 제3의 뉴클레오타이드 서열을 함유하는 패키징 세포의 형태로 제공될 수 있다.
본 발명은 다양한 발현 시스템, 특히 진핵생물 세포, 및 유리하게는 포유동물 세포를 사용하는 발현 시스템에 적용가능하다. 천연 단백질이 글리코실화되는 경우, 발현 시스템이 천연-유사 글리코실화를 발현되는 단백질에 제공하는 것이 바람직하다.
렌티바이러스는 env 유전자에 의해 암호화되는 외피 당단백질 SU (gp120) 및 TM (gp41); gag 유전자에 의해 암호화되는 CA (p24), MA (p17) 및 NC (p7-11); 및 pol 유전자에 의해 암호화되는 RT, PR 및 IN을 포함하는, 수개의 구조적 비리온 단백질을 공통적으로 공유한다. HIV-1 및 HIV-2는 바이러스 RNA의 합성 및 프로세싱 및 다른 복제 기능의 조절에 관련된 보조 및 다른 단백질을 함유한다. vif, vpr, vpu/vpx 및 nef 유전자에 의해 암호화되는 보조 단백질은 재조합 시스템으로부터 제외 (또는 불활성화) 시킬 수 있다. 또한, tat 및 rev는, 예를 들면, 돌연변이 또는 결실에 의해, 제외시키거나 불활성화시킬 수 있다.
제1 세대 렌티바이러스 벡터 패키징 시스템은 gag/pol 및 env에 대한 별도의 패키징 작제물을 제공하고, 안전을 위하여 통상적으로 이종 또는 기능적으로 변형된 외피 단백질을 사용한다. 제2 세대 렌티바이러스 벡터 시스템에서, 보조 유전자, vif, vpr, vpu 및 nef를 결실시키거나 불활성화시킨다. 제3 세대 렌티바이러스 벡터 시스템은 tat 유전자가 결실되거나 그렇지 않으면 불활성화된 것이다 (예: 돌연변이를 통해).
일반적으로 tat이 제공하는 전사 조절에 대한 보상은, 사람 사이토메갈로바이러스 즉시 초기(immediate early) (HCAAV-IE) 인핸서/프로모터와 같은 강력한 구성적(constitutive) 프로모터를 사용하여 제공될 수 있다. 다른 프로모터/인핸서는, 구성적 프로모터 활성의 세기, 표적 조직에 대한 특이성 (예: 간 특이적 프로모터) 또는 당업계에서 이해되는 바와 같은 목적하는 발현 제어와 관련된 다른 요인에 따라 선택할 수 있다. 예를 들면, 일부 양태에서, tet와 같은 유도가능한 프로모터를 사용하여 제어된 발현을 달성하는 것이 바람직하다. rev를 암호화하는 유전자를 별도의 발현 작제물 상에 제공하여, 통상적인 제3 세대 렌티바이러스 벡터 시스템이 4개의 플라스미드를 포함하게 할 수 있다: 각각 gagpol, rev, 외피 및 전달 벡터에 대한 플라스미드. 사용되는 패키징 시스템의 세대에 상관없이, gag 및 pol은 단일 작제물 또는 별도의 작제물 상에 제공될 수 있다.
통상적으로, 패키징 벡터를 패키징 세포 내에 포함시켜고, 형질감염, 형질도입 또는 감염을 통해 세포 내로 도입시킨다. 형질감염, 형질도입 또는 감염 방법은 당업자에게 익히 공지되어 있다. 본 발명의 레트로바이러스 전달 벡터를 형질감염, 형질도입 또는 감염을 통해 패키징 세포주 내로 도입시켜, 생산자 세포 또는 세포주를 생성할 수 있다. 본 발명의 패키징 벡터는 표준 방법, 예를 들면, 인산칼슘 형질감염, 리포펙션(lipofection) 또는 전기천공으로 사람 세포 또는 세포주 내로 도입시킬 수 있다. 일부 양태에서, 패키징 벡터를 neo, 디하이드로폴레이트 리덕타제(DHFR), 글루타민 신테타제 또는 ADA와 같은 우성 선별가능 마커와 함께 세포 내로 도입시키고 나서, 적당한 약물의 존재 하에서 선별하고 클론을 분리할 수 있다. 선별가능 마커 유전자를 패키징 벡터에 의해 암호화된 유전자에 물리적으로 연결시킬 수 있다.
패키징 기능이 적당한 패키징 세포에 의해 발현되도록 구성된 안정한 세포주는 공지되어 있다. 예를 들면, 패키징 세포가 기술되어 있는 미국 특허 제5,686,279호; 및 문헌[참조: Ory et al. 1996. Proc. Natl. Acad. Sci. 93:11400-11406]을 참조한다. 안정한 세포주 생산에 관한 추가적인 기술은 문헌[참조: Dull et al. 1998. J. Virol. 72(11):8463-8471; 및 Zufferey et al. 1998. J. Virol. 72:9873-9880]에서 찾을 수 있다.
문헌[참조: Zufferey et al. 1997. Nat. Biotechnol. 15:871-75]에는, HIV-1 외피 유전자를 포함하는 pol의 3' 서열이 결실된 렌티바이러스 패키징 플라스미드가 기술되어 있다. 상기 작제물은 tat 및 rev 서열을 함유하고, 3' LTR이 폴리 A 서열로 치환되어 있다. 5' LTR 및 psi 서열은, 유도가능한 것과 같은 다른 프로모터로 치환되어 있다. 예를 들면, CMV 프로모터 또는 이의 유도체를 사용할 수 있다.
패키징 벡터는 패키징 기능에 추가적인 변화를 함유하여, 렌티바이러스 단백질 발현 및 안전성을 향상시킬 수 있다. 예를 들면, gag의 상류에 있는 모든 HIV 서열을 제거할 수 있다. 또한, 외피 하류의 서열을 제거할 수 있다. 또한, 벡터를 변형시키는 방법을 사용하여, RNA의 스플라이싱 및 해독을 향상시킬 수 있다.
임의로, 상기 문헌[참조: Dull et al. 1998]에 기술된 것과 같은 조건부 패키징 시스템을 사용한다. 자가 불활성화 벡터(SIN)를 사용하는 것 또한 바람직하며, 이는 예를 들면, 문헌[참조: Zufferey et al. 1998. J. Virol. 72:9873-9880]에 기술된 바와 같이, HIV-1 긴 말단 반복(LTR)의 결실에 의해 벡터의 생물안전성을 향상시킨다. 예를 들면, 테트라사이클린-유도성 LTR을 통해, 유도성 벡터를 사용할 수도 있다.
프로모터
본 발명의 벡터는 통상적으로 이종 제어 서열을 포함하고, 이에는 사이토메갈로바이러스(CMV) 즉시 초기 프로모터, RSV LTR, MOMLV LTR 및 PGK 프로모터와 같은 구성적 프로모터; 조직 또는 세포 유형 특이적 프로모터 (예: mTTR, TK, HBV, hAAT), 조절가능 또는 유도가능 프로모터, 인핸서 등이 포함되지만, 이에 제한되는 것은 아니다.
유용한 프로모터에는 LSP 프로모터[참조: Ill et al. 1997. Blood Coagul. Fibrinolysis 8S2:23-30], EF1-알파 프로모터[참조: Kim et al. 1990. Gene 91(2):217-23 및 Guo et al. 1996. Gene Ther. 3(9):802-10]가 포함된다. 가장 바람직한 프로모터에는 연장 인자 1-알파 (EF1a) 프로모터, 포스포글리세레이트 키나제-1 (PGK) 프로모터, 사이토메갈로바이러스 즉시 초기 유전자 (CMV) 프로모터, 키메릭 간-특이적 프로모터 (LSP), 사이토메갈로바이러스 인핸서/닭 베타-액틴 (CAG) 프로모터, 테트라사이클린 반응성 프로모터 (TRE), 트랜스티레틴(transthyretin) 프로모터 (TTR), 시미안 바이러스 40 (SV40) 프로모터 및 CK6 프로모터가 포함된다. 본 발명의 실시에 유용한 유리한 프로모터는 아데노바이러스 주요 후기 프로모터(major late promoter)[참조: Berkner and Sharp. 1985. Nucl. Acids Res. 13:841-857]이다. 아데노바이러스 주요 후기 프로모터를 사용하는 구체적으로 예시된 발현 벡터의 서열은 본원의 아래에 제시되어 있다. 이러한 프로모터 및 많은 추가적인 프로모터의 서열은 당업계에 공지되어 있다. 관련된 서열은 공공 데이터베이스로부터 쉽게 입수하여, 본 발명을 실시하는데 사용하기 위한 벡터 내로 통합시킬 수 있다.
본 발명의 실시에서 특히 바람직한 프로모터는 아데노바이러스 주요 후기 프로모터이다. 발현 카세트는, 5'에서 3' 방향으로, 아데노바이러스 주요 후기 프로모터, 관심대상의 단백질 또는 관심대상의 단백질 쇄에 대한 제1의 암호화 서열에 작동가능하게 연결된 3조 리더 서열, 자가 프로세싱 서열 또는 프로테아제 절단 서열을 암호화하는 서열, 관심대상의 단백질 또는 단백질 쇄에 대한 제2의 암호화 서열, 및 임의로 자가 프로세싱 서열 또는 프로테아제 절단 서열을 암호화하는 서열을 포함할 수 있고, 그 뒤에 관심대상의 단백질 또는 단백질 쇄에 대한 제3의 암호화 서열을 포함할 수 있다. 모든 이러한 암호화 서열은 동일한 판독 프레임 내에 공유결합되어 있어서, 해독이 폴리단백질 암호화 서열 내에서 종결되지 않는다. 단백질 합성 동안 또는 폴리펩티드의 합성 완료 후, 자가 프로세싱 또는 단백질분해 프로세싱은 폴리단백질을 적당한 단백질 쇄 또는 단백질로 절단한다. 면역글로불린 합성의 경우에서, 경쇄에 대한 암호화 서열은 폴리단백질 암호화 서열 내에 2회 존재한다. 유리하게, 리더 서열 암호화 영역을 단백질 또는 단백질 쇄 서열과 연결시킬 수 있고; 시그날 펩티다제에 의한 프로세싱은 프로세싱 부위의 하류에 단백질의 N-말단에 있는 특정 잔여 아미노산 잔기를 제거하는 추가적인 이점을 가질 수 있다. 면역글로불린 중쇄를 위한 구성요소는 Met, 단백질 개시 메티오닌; HC, 중쇄; LC, 경쇄; SPPC, 자가프로세싱 또는 프로테아제 절단 부위이다. 면역글로불린 합성을 위한 발현 작제물은 다음을 포함할 수 있다: Met-프로테아제-SPPC-HC 리더 서열-HC-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC; Met-프로테아제-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC-SPPC-HC 리더 서열-HC; Met-프로테아제-SPPC-LC 리더 서열-LC-SPPC-HC 리더 서열-HC-SPPC-LC 리더 서열-LC; HC 리더 서열-HC-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC; LC 리더 서열-LC-SPPC-HC 리더 서열-HC-SPPC-LC 리더 서열-LC; LC 리더 서열-LC-SPPC-LC 리더 서열-LC-SPPC-HC 리더 서열-HC; Met-프로테아제-SPPC-HC 리더-HC-SPPC-LC 리더-LC.
구체적으로 예시된 폴리단백질 암호화 서열 산물 Met-HC 리더-HC-조작된 푸린 부위-TEV 절단 부위-TEV Nia 프로테아제-TEV 절단 부위-LC 리더-LC는 도 1에 도식적으로 제시되어 있고, 이 작제물의 발현을 위한 발현 벡터의 도식은 도 2에 제시되어 있다. 항-TNFα(D2E7)은 HC 및 LC 서열에 관한 대표적인 항체이다. LC 리더 서열은 치료학적 항체의 생산을 위하여 필요하지 않을 수 있다. SPPS는 TEV 프로테아제 인식 서열이고, TEV 부위의 5'에 암호화된 푸린 부위가 있다. TEV 절단 후 푸린 절단은 "정확한" C 말단 리신 잔기를 중쇄에 복구시킨다. D2E7-TEV 발현 벡터의 완전한 DNA 서열은 표 1에 제시되어 있다.
LC의 일렬 반복을 암호화하고 절단 부위로서 2A 프로테아제 서열을 사용하여 절단되는, 구체적으로 예시된 D2E7 폴리단백질 발현 작제물(D2E7-Lc-LC-HC)을 설계하였다. D2E7 경쇄 C 말단을 변형시켜 푸린 절단 부위를 부가하였다. 이는, (일반적으로) 마지막에서 두번째 아미노산에서 Glu를 Arg으로 변화시키고, 리신을 C-말단에 부가한다. HC의 5'에 2개의 LC 서열을 위치시킴으로써, 2개의 LC 카피는 동일한 아미노산 서열을 유지한다. 발현 벡터의 완전한 뉴클레오타이드 서열은 표 6C에 제시되어 있고, 폴리단백질의 아미노산 서열 및 암호화 서열은 각각 표 6B 및 6A에 제시되어 있다. 또한 서열번호 29 내지 31을 참조한다. 도식적 발현 벡터 지도는 도 7에 제시되어 있다.
또다른 구체적으로 예시된 폴리단백질 (및 이의 암호화 서열)은 ABT-007-TEV의 것이다; 각각 표 2B 및 2A를 참조한다. 서열번호 33 및 32를 참조한다. 이 재조합 항체는 에리트로포이에틴 수용체(EpoR)에 특이적으로 결합한다. 조작된 ABT-007-TEV 폴리단백질을 암호화하는 발현 벡터의 완전한 서열은 표 2C (서열번호 35. 또한 서열번호 34를 참조한다)에 제시되어 있다. 벡터의 도식적인 표현은 도 3에 제시되어 있다.
추가적인 구체적으로 예시된 폴리단백질 및 이의 암호화 서열은 ABT-874-TEV의 것이다; 각각 표 3B 및 3A를 참조한다. 이 항체는 인터루킨-12에 특이적으로 결합한다. 발현 벡터의 도식적인 표현은 도 4에 제시되어 있다. 또한 서열번호 35 내지 37을 참조한다.
또다른 구체적으로 예시된 폴리단백질 (및 이의 암호화 서열)은 EL246-GG-TEV의 것이다; 표 4B 및 4A를 참조한다. 여기에 암호화된 항체는 E/L 셀렉틴에 특이적으로 결합한다. 발현 벡터는 도 5에 도식적인 형태로 제시되어 있다. 또한 서열번호 38 내지 40을 참조한다.
ABT-325-TEV는 인터루킨-18에 대한 결합 특이성을 갖는 조작된 항체이다. 폴리단백질의 암호화 및 아미노산 서열은 각각 표 5A 및 5B에 제시되어 있고, 완전한 발현 벡터 서열은 표 5C에 제시되어 있다. 이의 합성을 위한 발현 벡터는 도 6에 제시되어 있다. 또한 서열번호 41 내지 43을 참조한다.
핵 위치결정(localization) 시그날 (NLS)이 제거된 TEV 프로테아제 (TEV NLS-) 또한 제공된다. TEV 또는 TEV(NLS-) 프로테아제는 세포에서 일시적으로 또는 분리된 벡터 또는 분리된 전사체의 일부분으로서 안정하게 발현될 수도 있다. TEV(NLS-) 단백질은, 각각 앞의 NLS 부분에, ER 고정(anchor) 서열을 포함하거나 작은 리보좀 결합 단백질에 융합되어, ER에 또는 리보좀에 고정될 수 있다.
본 특허원은 합성 동안 또는 합성 후 세포 내에서 전구체 단백질 및 폴리단백질의 단백질분해 절단에 관한 논의를 포함하지만, 폴리단백질 및 전구체 단백질(프로단백질)은 적당한 프로테아제(들)를 시험관내에서 사용하여 이러한 단백질을 수집한 후 달성될 수 있다는 것을 이해하여야 한다.
본 발명의 범위 내에서, 특정한 발현되는 항체(면역글로불린)에는, 특히, 종양 괴사 인자에 특이적으로 결합하는 항체 (HUMIRA/D2E7 (Abbott Biotechnology Ltd., Hamilton의 아달리무맙(adalimumab)에 대한 상표)에 상응하고/하거나 이로부터 유래된 조작된 항체); 인터루킨-12에 특이적으로 결합하는 항체 (ABT-874로부터 유래된 조작된 항체); 인터루킨-18에 특이적으로 결합하는 항체 (ABT-325로부터 유래된 조작된 항체); 재조합 에리트로포이에틴 수용체에 특이적으로 결합하는 항체 (ABT-007로부터 유래된 조작된 항체); 인터루킨-18에 특이적으로 결합하는 항체 (ABT-325로부터 유래된 조작된 항체); 또는 E/L 셀렉틴에 특이적으로 결합하는 항체 (EL246-GG로부터 유래된 조작된 항체)가 포함될 수 있다. 조작된 폴리단백질의 암호화 및 아미노산 서열은 표 1 내지 5에 제시되어 있다. 본 발명에 적당한 추가적인 항체에는, 예를 들면, 레미케이드(Remicade) (인플릭시맙); 리툭산/맙테라(Rituxan/Mabthera) (리툭시맙); 허셉틴(Herceptin) (트라스투주맙); 아바스틴(Avastin) (베바시주맙); 시나지스(Synagis) (팔리비주맙); 에르비툭스(Erbitux) (세툭시맙); 리오프로(Reopro) (압식시맙); 오르토클론(Orthoclone) OKT3 (무로모납-CD3); 제나팍스(Zenapax) (다클리주맙); 시뮬렉트(Simulect) (바실릭시맙); 마일로탈그(Mylotarg) (겜투주맙); 캠패스(Campath) (알렘투주맙); 제발린(Zevalin) (이브리투모맙); 졸레어(Xolair) (오말리주맙); 벡사르(Bexxar) (토시투모맙); 및 랍티바(Raptiva) (에팔리주맙)가 포함되고; 여기서, 일반적으로 상표명 다음에 각각의 일반명을 괄호 안에 제시하였다. 추가적인 적당한 단백질에는, 예를 들면, 하나 이상의 에포에틴 알파, 에포에틴 베타, 에타네르셉트, 다르베포에틴 알파, 필그라스팀, 인터페론 베타 1a, 인터페론 베타 1b, 인터페론 알파-2b, 인슐린 글라진, 소마트로핀, 테리파라타이드, 폴리트로핀 알파, 도르나제, 인자 VIII, 인자 VII, 인자 IX, 이미글루세라제, 네시리타이드, 레노그라스팀 및 폰 빌레브란트(Von Willebrand) 인자가 포함되고; 여기서, 하나 이상의 일반 명칭은 각각 하나 이상의 제품의 상표명에 상응할 수 있다. 다른 항체 및 단백질은 당업계에서 이해되는 바와 같이 본 발명에 적당하다.
본 발명은 또한 관심대상의 2개 이상의 폴리펩티드 또는 단백질 또는 프로단백질에 대한 암호화 서열의 제어 발현을 고려한다. 유전자 조절 시스템은 특정 유전자(들)의 조절 발현에서 유용하다. 한가지 대표적인 접근법에서, 유전자 조절 시스템 또는 스위치는, 리간드 결합 도메인, 전사 활성화 도메인 및 DNA 결합 도메인을 갖는 키메릭 전사 인자를 포함한다. 도메인은 거의 모든 기원으로부터 수득할 수 있고 임의의 많은 방법으로 조합하여 신규 단백질을 수득할 수 있다. 조절가능한 유전자 시스템은 또한 키메릭 전사 인자와 상호작용하는 DNA 반응 요소를 포함한다. 이 전사 조절 요소는 조절될 유전자에 인접하여 위치한다.
본 발명을 실시하는데 사용될 수 있는 대표적인 전사 조절 시스템에는, 예를 들면, 드로소필라 엑디손(ecdysone) 시스템[참조: Yao et al. 1996. Proc. Natl. Acad. Sci. 93:3346], 봄빅스(Bombyx) 엑디손 시스템[참조: Suhr et al. 1998. Proc. Natl. Acad. Sci. 95:7999], RU486을 유도인자로서 사용하는 GeneSwitch (Valentis, The Woodlands, TX의 상표) 합성 프로게스테론 수용체 시스템[참조: Osterwalder et al. 2001. Proc. Natl. Acad. Sci. USA 98(22):12596-601]; 테트라사이클린(Tc) 또는 유사체(예: 독시사이클린)와 같은 작은 분자를 사용하여 표적 유전자의 전사를 조절하는(켜거나 끄는) Tet and RevTet 시스템 (테트라사이클린 조절된 발현 시스템, BD Biosciences Clontech, Mountain View, CA의 상표)[참조: Knott et al. 2002. Biotechniques 32(4):796, 798, 800]; 각각 전사 활성화제 또는 DNA 결합 단백질에 연결된 2개의 세포내 분자를 모으는 작은 분자의 용도를 기반으로 하는, ARIAD 조절 기술 (Ariad, Cambridge, MA)이 포함된다. 이러한 구성요소를 합하면, 관심대상의 유전자의 발현이 활성화된다. Ariad는 동종이량체화에 기반한 시스템 및 이종이량체화에 기반한 시스템을 갖고 있다[참조: Rivera et al. 1996. Nature Med. 2(9):1028-1032; Ye et al. 2000. Science 283:88-91].
자가프로세싱 또는 프로테아제-절단된 재조합 폴리펩티드의 형태로 항체 또는 이의 단편 또는 다른 이종 단백질 또는 프로단백질을 암호화하는 핵산 서열을 포함하는 본 발명의 발현 벡터 작제물을 시험관내, 생체외 또는 생체내에서 세포 내로 도입시켜, 외래, 치료학적 또는 전이유전자를 세포(예: 체세포)로 전달하거나, 벡터-형질도입된 세포에 의해 재조합 폴리펩티드를 생산할 수 있다.
숙주 세포 및 벡터의 전달
본 발명의 벡터 작제물을 당업계에 공지된 표준 방법론을 사용하여 시험관내 또는 생체외에서 적당한 세포 내로 도입시킬 수 있다. 이러한 기술에는, 예를 들면, 인산칼슘을 사용하는 형질감염, 배양된 세포 내로의 미세주사[참조: Capecchi. 1980. Cell 22:479-488], 전기천공[참조: Shigekawa et al. 1988. BioTechnology 6:742-751], 리포좀-매개된 유전자 전달[참조: Mannino et al. 1988. BioTechnology 6:682-690], 지질-매개된 형질도입[참조: Feigner et al. 1987. Proc. Natl. Acad. Sci. USA 84:7413-7417], 및 고속 미세투사를 사용한 핵산 전달[참조: Klein et al. 1987. Nature 327:70-73]이 포함된다.
시험관내 또는 생체외 발현을 위하여, 기능적 단백질 산물을 발현하는데 효과적인 임의의 세포를 사용할 수 있다. 단백질 발현을 위하여 사용되는 세포 및 세포주의 많은 예는 당업계에 공지되어 있다. 예를 들면, 원핵생물 세포 및 곤충 세포를 발현을 위하여 사용할 수 있다. 또한, 효모와 같은 진핵 미생물을 사용할 수 있다. 원핵생물, 곤충 및 효모 시스템에서의 재조합 단백질의 발현은, 일반적으로 당업계에 공지되어 있고, 본 발명의 조성물 및 방법을 사용하는 항체 또는 다른 단백질 발현을 위하여 적용될 수 있다.
발현에 유용한 세포의 예에는 포유동물 세포 (예: 섬유아세포), 비-사람 포유동물 유래의 세포 (예: 양, 돼지, 쥐 및 소 세포), 곤충 세포 등이 추가로 포함된다. 포유동물 세포의 구체적인 예에는 COS 세포, VERO 세포, HeLa 세포, 중국 햄스터 난소 (CHO) 세포, CHO DX B11 세포, CHO DG44 세포, PerC.6 세포, Sp2/0 세포, 293 세포, NSO 세포, 3T3 섬유아세포, W138 세포, BHK 세포, HEPG2 세포 및 MDCK 세포가 포함되지만, 이에 제한되는 것은 아니다.
숙주 세포를, 프로모터를 유도하거나, 형질전환체를 선별하거나, 목적하는 서열을 암호화하는 유전자를 증폭시키는데 적당하도록 변형된 통상적인 영양 배지 중에서 배양한다. 포유동물 숙주 세포를 다양한 배지 중에서 배양할 수 있다. 햄의(Ham's) F10[판매원: Sigma], 최소 필수 배지(MEM)[판매원: Sigma], RPMI 1640[판매원: Sigma] 및 둘베코의 변형된 이글 배지(DMEM; Dulbecco's Modified Eagle's Medium)[판매원: Sigma]와 같은 시판되는 배지는 통상적으로 숙주 세포를 배양하는데 적당하다. 주어진 배지는 일반적으로 필요에 따라 호르몬 및/또는 다른 성장 인자 (예: 인슐린, 트랜스페린 또는 상피 성장 인자), 염 (예: 염화나트륨, 칼슘, 마그네슘 및 포스페이트), 완충액 (예: HEPES), 뉴클레오사이드 (예: 아데노신 및 티미딘), 항생제, 미량 원소 및 글루코스 또는 동등한 에너지원이 보충된다. 임의의 다른 필요한 보충물이 또한 당업자에게 공지된 적당한 농도로 포함될 수 있다. 온도, pH 등과 같은, 특정 세포주에 대한 적당한 배양 조건은 일반적으로 당업계에 공지되어 있고, 많은 세포주의 배양에 대한 권장 배양 조건은, 예를 들면, ATCC 카탈로그 (인터넷 상에서 "atcc.org/SearchCatalogs/AllCollections.cfm"에서 이용가능함)에 있거나 상업적 공급업자가 지시하는 바와 같다.
발현 벡터는 다양한 경로 (예: 피내, 정맥내, 종양내, 뇌내, 문맥내, 복강내, 근육내, 방광내 등)를 통해 생체내로 투여되어, 자가 프로세싱 절단 서열을 통해 연결된 다수의 유전자를 전달하여, 동물 모델 또는 사람 피험자에서 2개 이상의 단백질 또는 폴리펩티드를 발현할 수 있다. 투여 경로에 따라, 치료학적 단백질은 효과를 국부적으로(뇌 또는 방광에서) 또는 전신적으로(다른 투여 경로) 유도한다. 개방 판독 프레임(들)의 5'에 조직 특이적 프로모터를 사용하면, 전체 개방 판독 프레임에 의해 암호화된 단백질 또는 폴리펩티드가 조직 특이적으로 발현된다.
전이유전자를 보유하는 재조합 발현 벡터를 표적 세포 내로 시험관내, 생체외 또는 생체내에서 도입시키는 다양한 방법은 이전에 기술되었고 당업계에 익히 공지되어 있다. 본 발명은, 관심대상의 2개 이상의 단백질 또는 폴리펩티드에 대한 암호화 서열을 함유하고 단백질 또는 폴리펩티드를 표적화된 세포에서 발현하는 재조합 벡터로, 표적화된 세포를 감염시킴으로써 치료학적 방법, 백신 및 암 치료법을 제공한다.
예를 들면, 본 발명의 재조합 벡터의 생체내 전달은, 뇌, 간, 혈관, 근육, 심장, 폐 및 피부를 포함하는 비제한적인, 광범위한 기관 종류로 표적화될 수 있다.
생체외 유전자 전달의 경우에, 표적 세포를 숙주로부터 제거하여, 본 발명의 재조합 벡터 및 당업계에 익히 공지된 방법을 사용하여 실험실에서 유전적으로 변형시킨다.
본 발명의 재조합 벡터는 상기한 방법을 포함하는 비제한적인 통상적인 투여 방법을 사용하여 투여될 수 있다. 본 발명의 재조합 벡터는 액체 용액제 및 현탁액제, 미세소포제, 리포좀제 및 주사가능하거나 주입가능한 용액제를 포함하는 비제한적인, 다양한 제형으로 존재할 수 있다. 바람직한 형태는 투여 방법 및 치료학적 적용에 따라 달라진다.
생체내에서 면역글로불린 또는 다른 생물학적 활성 단백질을 생산하는데 있어서 본 발명의 독창적인 재조합 발현 벡터 작제물의 장점에는, 환자에서 장기간 지속되는 항체 발현을 위한 단일 벡터의 투여; 완전한 생물학적 활성을 갖는 항체 또는 이의 단편 (또는 다른 생물학적 활성 단백질)의 생체내 발현; 및 사람 세포에서 생성된 항체의 천연 해독후 변형이 포함된다. 바람직하게는, 발현된 단백질은 천연 단백질과 동일하거나 충분히 동일하여, 발현된 단백질을 다수의 경우에 투여하거나 상기 단백질을 필요로 하는 환자에서 계속적으로 발현되는 경우, 면역학적 반응이 유발되지 않는다.
본 발명의 재조합 벡터 작제물은, 치료 또는 연구용 재조합 항체 및 다른 생물학적 활성 단백질의 시험관내 생산에서 추가적인 유용성이 있다. 재조합 단백질 생산 방법은 당업계에 익히 공지되어 있고, 본원에서 기술된 자가 프로세싱 절단 부위 또는 다른 프로테아제 절단 부위를 함유하는 벡터 작제물을 사용하는 재조합 항체의 발현을 위하여 사용될 수 있다.
한가지 양상에서, 본 발명은 상기한 것과 같은 발현 벡터를 세포 내로 도입하여 형질감염된 세포를 수득함으로써, 재조합 면역글로불린 또는 이의 단편을 생산하는 방법을 제공하고, 이때 벡터는 5'에서 3' 방향으로, 면역글로불린 중쇄 및 2개의 경쇄 또는 이의 단편에 대한 암호화 서열에 작동가능하게 연결된 프로모터, 2A 또는 2A-유사 서열과 같은 자가 프로세싱 서열 또는 각각의 상기 쇄 사이의 프로테아제 절단 부위를 포함한다. 면역글로불린 중쇄에 대한 암호화 서열 또는 면역글로불린 경쇄에 대한 암호화 서열은 주어진 벡터 작제물에서 2A 서열의 5'(즉, 첫번째)에 있을 수 있다는 것이 인식된다. 대안으로, 프로테아제 절단 부위에 대한 프로테아제 동족(cognate)이 폴리단백질의 일부로서 발현되어, 폴리단백질의 나머지로부터 자가 프로세싱되거나 별도의 (또는 동일한) 프로테아제에 의한 단백질분해에 의해 절단될 수 있다. 다른 다중쇄(multichain) 단백질 또는 다른 단백질 (예: 이중 또는 삼중 하이브리드 시스템으로부터의 단백질)은, 자가프로세싱 부위 또는 프로테아제 인식 부위에 의해 산재된, 관련된 암호화 서열을 치환시켜, 프로세싱된 활성 형태로 발현될 수 있고, 또한 크기가 정확한 별도의 단백질이 생산된다.
이중 (및 다른) 하이브리드 시스템 접근법을 사용하여, 공지된 리간드 또는 단백질 복합체의 서브유닛에 대한 이전에 비인식된 결합 상대물에 대해 cDNA 라이브러리를 스크리닝하였다. 이 시스템을 적절히 변형시켜, 공지된 복합체에서 결합을 억제, 경쟁 또는 파괴하는 단백질 또는 서브유닛을 또한 확인할 수 있다. 이중 (및 다른) 하이브리드 시스템은 다양한 과학적 연구에 적용되었지만, 이러한 시스템은 상당한 빈도의 거짓 양성 또는 거짓 음성 결과로 인해 비효율적일 수 있다. 이러한 거짓 시그날은 적어도 일부 예에서 있었고, 후보 결합 상대 단백질 또는 후보 파괴 단백질에 대한 "베이트(bait)" 단백질의 상대적 발현에서의 불균형이 원인이었다. 본 발명의 전략의 추가적인 장점은 오직 하나의 플라스미드만 숙주 세포 내로 형질감염되거나 형질전환되고, 상기 플라스미드에 대해 이원(binary) 벡터 이중 하이브리드 구성에서의 이중 선별 대신에 오직 단일 선별만 필요하다는 것이다. 상기 접근법은 또한 삼중 하이브리드 시스템용으로 적용될 수 있다. 이중 하이브리드 시스템에 관한 논의의 경우, 문헌[참조: Toby and Golemis. 2001. Methods 24:201-217; Vidal and Legrain. 1999. Nucl. Acids Res. 27:919-929; Drees, B. 1999. Curr. Op. Chem. Biol. 3:64-70; 및 Fields and Song. 1989. Nature 340:245-246]을 참조한다. 도 9에는 베이트 및 프레이 단백질 (또는 후보 프레이 단백질)에 대한 폴리단백질/자가프로세싱 또는 프로테아제 절단 발현 전략의 도식적인 표현이 제시되어 있고, 도 8에는 이러한 접근법을 사용하는 베이트 및 프레이 단백질 생산을 위한 발현 카세트를 포함하는 벡터가 제시되어 있다. 벡터 발현 카세트는 베이트 단백질을 우선 GAL4::베이트::2A 펩티드 융합체로서 해독하도록 구성되어 있고, 이는 2A 펩티드의 해독 후 자가프로세싱된다. 제2의 개방 판독 프레임(ORF)은 NF카파B::라이브러리 융합 단백질이다. 베이트 단백질을 MCS1로 조작하는 것은 2A 자가프로세싱 펩티드 서열로의 프레임내 해독을 요구한다. 하류 MCS2에서 발현 라이브러리의 조작은 덜 결정적이다.
본원에서 제공된 전략은 단백질분해 절단에 의해 성숙한 활성 형태로 프로세싱되는 프로형태(pro-form)로서 발현되는 단백질의 발현에 유사하게 적용되어, 재조합 발현을 위한 조성물 및 방법을 제공할 수 있다. 이러한 단백질의 예에는, 그 중에서도, 인터루킨 1 및 18 (IL-1 및 IL-18), 인슐린이 포함되지만, 이에 제한되는 것은 아니다. IL-1 및 IL-18은 염증 세포의 세포질에서 생산된다. 이러한 분자는 통상적인 분비 시그날이 없고, 프로테아제에 의해 절단되어 생물학적 활성 형태로 분비되어야 한다. IL-1은 인터루킨 전환 효소(ICE)에 의해 성숙한 형태로 프로세싱된다. 프로-IL-18은 카스파제에 의해 성숙한 IL-18로 전환된다. 이러한 분자를 재조합 형태로 생산하는 것은, 종종 숙주로서 사용되는 세포가 이러한 단백질의 생물학적으로 활성인 성숙한 형태를 생산하는데 필요한 프로테아제를 발현하지 않기 때문에 어렵다. 프로 도메인 없이 이러한 사이토카인의 발현시키면, 분자가 불활성화되고/되거나 생산 수준이 낮아지게 된다. 본 발명은 프로 도메인과 성숙한 폴리펩티드의 아미노산 사이에 조작된 자가 프로세싱 부위 (예: 2A 서열) 또는 삽입된 프로테아제 절단 부위를 함유하는 1차 해독 산물을 제공하여, 관심대상의 단백질과 동시에 잠재적으로 독성인 프로테아제를 발현시킬 필요가 없다.
관련된 양상에서, 본 발명은 상기한 것과 같은 발현 벡터를 세포 내로 도입시켜 재조합 면역글로불린 또는 이의 단편을 생산하는 방법을 제공하고, 이때 벡터는 제1 및 제2의 면역글로불린 암호화 서열 사이에 추가적인 단백질분해 절단 부위를 추가로 포함한다. 바람직한 추가적인 단백질분해 절단 부위는 컨센서스 서열 RXK/R-R (서열번호 1)을 갖는 푸린 절단 부위이다. 논의를 위해서는, 미국 특허원 제2005/0003482A1호를 참조한다.
본 발명의 한가지 대표적인 양상에서, 벡터를 세포로 도입 또는 투여하고 나서 다음의 단계 중 하나 이상을 실시한다: 형질감염된 세포를 세포 선별을 위한 조건 하에서 배양하여 폴리단백질 또는 프로단백질을 발현시키는 단계; 면역글로불린 또는 이의 단편 또는 다른 단백질(들)의 발현을 측정하는 단계; 및 면역글로불린 또는 이의 단편 또는 다른 단백질(들)을 수집하는 단계.
본 발명의 또다른 양상은 재조합 면역글로불린 또는 이의 단편 또는 다른 단백질(들) 또는 관심대상의 단백질을 발현시키기 위한 세포를 제공하고; 이때 세포는 2개 이상의 면역글로불린 쇄 또는 이의 단편 또는 다른 프로단백질 또는 단백질의 발현을 위한 발현 벡터, 면역글로불린 또는 다른 쇄 또는 이의 단편에 대한 제1의 암호화 서열에 작동가능하게 연결된 프로모터, 자가 프로세싱 또는 다른 절단 암호화 서열 (예: 2A 또는 2A-유사 서열) 또는 프로테아제 인식 부위, 및 면역글로불린 또는 다른 쇄 또는 이의 단편에 대한 제2의 암호화 서열을 포함하고, 이때 자가 프로세싱 절단 서열 또는 프로테아제 인식 부위 암호화 서열은 제1 및 제2의 암호화 서열 사이에 삽입된다. 관련된 양상에서, 세포는 상기한 바와 같은 발현 벡터를 포함하고, 이때 발현 벡터는 관심대상의 제1 및 제2의 면역글로불린 또는 다른 암호화 서열 사이에 추가적인 단백질분해 절단 부위를 추가로 포함한다. 바람직한 추가적인 단백질분해 절단 부위는 컨센서스 서열 RXR/K-R (서열번호 1)을 갖는 푸린 절단 부위이다.
본원에서 사용되는 "면역글로불린 분자의 제1의 쇄에 대한 암호화 서열 또는 이의 단편"은, 항체 또는 면역글로불린에 대한 경쇄 또는 중쇄를 포함하는 비제한적인, 단백질 분자를 암호화하는 핵산 서열, 또는 이의 단편을 말한다.
본원에서 사용되는 "면역글로불린 분자의 제2의 쇄에 대한 암호화 서열 또는 이의 단편"은, 항체 또는 면역글로불린에 대한 경쇄 또는 중쇄를 포함하는 비제한적인, 단백질 분자를 암호화하는 핵산 서열, 또는 이의 단편을 말한다. 본 발명의 한가지 양상에서, 중쇄 암호화 서열 1 카피 당 2 카피의 면역글로불린 경쇄 암호화 서열이 있는 경우 발현이 개선된다는 것을 이해하여야 한다.
항체 또는 면역글로불린에 대한 제1 또는 제2의 쇄를 암호화하는 서열 또는 이의 단편은 IgG, IgM, IgD, IgE 또는 IgA로부터 유래된 중쇄 또는 이의 단편을 포함한다. 광범위하게 말한 바와 같이, 항체 또는 면역글로불린에 대한 쇄를 암호화하는 서열 또는 이의 단편은 또한 IgG, IgM, IgD, IgE 또는 IgA로부터의 경쇄 또는 이의 단편을 포함한다. 전체 항체 분자 뿐만 아니라 이의 변형되거나 유래된 형태는, 예를 들면, Fab, 단일 쇄 Fv (scFv) 및 F(ab')2와 같은 다른 항원 인식 분자 단편을 포함한다. 항체 및 단편은 동물로부터 유래된 항체, 사람-마우스 키메릭 항체, 사람화된 항체, Deimmunisation™(Biovation Ltd)에 의해 변형된 항체, 변형되어 Fc 수용체에 대한 친화도가 변화된 항체, 또는 완전히 사람 항체일 수 있다. 바람직하게는, 항체 또는 다른 재조합 단백질은 이들이 투여된 사람 또는 동물에서 면역 반응을 유도하지 않는다.
항체는 이중특이적(bispecific)일 수 있고, 이항체(diantibody), 쿼드로마(quadroma), 소형 항체, ScBs 항체 및 knobs-into-holes 항체가 포함되지만, 이에 제한되는 것은 아니다.
항체 자체의 생산 및 회수는 당업계에 익히 공지된 다양한 방법으로 달성될 수 있다[참조: Harlow et al. 1988. Antibodies, A Laboratory Manual, Cold Spring Harbor Laboratory]. 관심대상의 다른 단백질은 당업계에 익히 공지된 방법에 따라 수집하고/하거나 정제하고/하거나 사용한다.
본 발명의 실시에서, 재조합 DNA 기술을 사용한 항체 또는 이의 변이체(유사체)의 생산은, 변형된 재조합 숙주 세포를 숙주 세포의 성장 및 암호화 서열의 발현에 적당한 배양 조건 하에서 배양하여 달성될 수 있다. 발현의 성공을 모니터하기 위하여, 항원에 대한 항체 수준을 ELISA, RIA 등과 같은 표준 기술을 사용하여 모니터할 수 있다. 항체를 배양 상청액으로부터 당업계에 공지된 표준 기술을 사용하여 회수한다. 이러한 항체의 정제된 형태는, 물론, 단백질 A, 단백질 G 또는 단백질 L 칼럼을 통한 친화도 크로마토그래피를 포함하는 비제한적인 표준 정제 기술로, 또는 특정 항원에 대해, 또는 특이성을 요구하는 항원의 특정 에피토프에 대해 쉽게 제조될 수 있다. 항체는 또한 이온 교환 또는 크기 배제 칼럼과 같은 통상적인 크로마토그래피와 함께, 황산암모늄 침전 및 크기 제한 막 여과와 같은 다른 기술로 정제할 수 있다. 발현 시스템이 시그날 펩티드를 포함하도록 설계된 경우, 생성되는 항체는 배양 배지 또는 상청액으로 분비되지만; 세포내 생산 또한 가능하다.
사람 Ig 좌로 조작된 마우스로부터의 항원 특이적인 완전한 사람 모노클로날 항체의 생산 및 선별은 이전에 기술되었다[참조: Jakobovits et al. 1998. Advanced Drug Delivery Riviews 31:33-42; Mendez et al. 1997. Nature Genetics 15: 146-156; Jakobovits et al. 1995. Curr Opin Biotechnol 6:561-566; Green et al. 1994. Nature Genetics Vol. 7:13-21].
치료학적 모노클로날 항체의 고 수준 발현은 유전자전이된 염소의 밀크에서 달성되었고, 항원 결합 수준이 통상적인 세포 배양 기술을 사용하여 생산된 모노클로날 항체의 경우와 동등하다고 밝혀졌다. 이 방법은 사람 치료학적 단백질을 밀크에 발현하게 하는 유전 정보를 보유하는 유전자전이된 동물의 밀크에서의 사람 치료학적 단백질의 개발에 기반한다. 일단 생산되면, 이러한 재조합 단백질은 표준 기술을 사용하여 밀크로부터 효율적으로 정제할 수 있다[참조: Pollock et al. 1999. J. Immunol. Meth. 231:147-157 및 Young et al. 1998. Res Immunol. 149(6):609-610]. 유전자전이된 동물로부터의 동물 밀크, 난백, 혈액, 소변, 정장(seminal plasma) 및 누에고치는, 산업적 규모로 재조합 단백질을 생산하기 위한 공급원으로서 가능성이 있는 것으로 증명되었다[참조: Houdebine L M. 2002. Curr Opin Biotechnol 13:625-629; Little et al. 2000. Immunol Today, 21 (8):364-70; 및 Gura T. 2002. Nature, 417:584-5860]. 본 발명은 본 발명의 자가프로세싱 절단 부위-암호화 및/또는 프로테아제 인식 부위 벡터를 사용하여 재조합 항체 또는 이의 변이체(유사체) 또는 관심대상의 다른 단백질(들)을 발현시키기 위한 유전자전이된 동물 발현 시스템의 용도를 고려한다.
재조합 단백질의 생산은 또한, 아그로박테리움(Agrobacterium) 감염, 생탄도법(biolistic) 형질전환, 원형질체(protoplast) 형질전환 등에 의해 형질전환된 감자, 토마토, 담배, 벼 및 다른 식물을 포함하는 비제한적인 식물에서 성공적으로 증명되었다. 유전자전이된 담배 식물의 종자에서의 재조합 사람 GM-CSF 발현 및 식물에서의 단일 쇄 항체를 포함하는 항체의 발현이 증명되었다[참조: Streaffield and Howard. 2003. Int. J. Parasitol. 33:479-93; Schillberg et al. 2003. Cell Mol Life Sci. 60:433A5; Pogue et al. 2002. Annu. Rev. Phytopathol. 40:45-74; 및 McCormick et al. 2003. J Immunological Methods, 278:95-104]. 본 발명은, 본 발명의 프로테아제 절단 부위 또는 자가프로세싱 절단 부위-암호화 벡터를 사용하여 재조합 면역글로불린 또는 이의 단편 또는 관심대상의 다른 단백질(들)을 발현시키기 위한 유전자전이된 식물 발현 시스템의 용도를 고려한다.
곤충 세포와 함께 배큘로바이러스 벡터 발현 시스템은 또한 재조합 단백질 생산을 위한 실용적인 기반으로서 입지를 얻고 있다. 배큘로바이러스 벡터 발현 시스템은, 포유동물 세포 배양에 대해 배양의 용이함 및 높은 발현 수준과 같은 장점을 제공하는 것으로 보고되었다[참조: Ghosh et al. 2002. Mol Ther. 6:5-11, 및 Ikonomou et al. 2003. Appl Microbiol Biotechnol. 62:1-20]. 본 발명은, 본 발명의 자가프로세싱 절단 부위-암호화 벡터를 사용하여 재조합 면역글로불린 또는 이의 단편을 발현시키기 위한 배큘로바이러스 벡터 발현 시스템의 용도를 추가로 고려한다. 배큘로바이러스 벡터 및 적당한 숙주 세포는 당업계에 익히 공지되어 있고 시판된다.
이중 또는 삼중 하이브리드 시스템을 포함하는 효모-기반 시스템은 또한, 본 발명의 자가프로세싱 절단 부위-암호화 벡터를 사용하여, 재조합 면역글로불린 또는 이의 단편 또는 관심대상의 다른 단백질(들)을 발현시키기 위하여 사용될 수 있다[참조: 본원에 참조로서 인용된, 미국 특허 제5,643,745호].
자가프로세싱 펩티드에 대한 암호화 서열을 단독으로 또는 단백질분해 절단 부위에 대한 추가적인 암호화 서열과 함께 포함하는, 본 발명의 발현 카세트 및 벡터 및 재조합 숙주 세포는, 다수가 당업계에 공지되어 있고 이의 예가 본원에 기술되어 있는, 임의의 단백질 발현 시스템에서의, 이중 및 삼중 하이브리드 시스템의 재조합 면역글로불린 또는 이의 단편, 프로단백질, 생물학적 활성 단백질 및 단백질 구성요소의 발현에서 유용성이 있다는 것을 이해하여야 한다. 당업자는 본 발명의 벡터를 임의의 단백질 발현 시스템에서 사용하기 위하여 쉽게 적용할 것이다.
화합물, 작제물 또는 조성물을 청구하는 경우, 본원에 공개된 참조문헌에서 제시된 것을 포함하는 당업계에 공지된 화합물, 작제물 및 조성물은 포함되지 않는다는 것을 이해하여야 한다. 마쿠쉬(Markush) 그룹 또는 다른 그룹을 본원에서 사용하는 경우, 그룹의 모든 개개의 일원 및 그룹 내에서 가능한 모든 조합 및 하위조합(subcombination)은 개별적으로 본 특허원에 포함되는 것으로 의도된다.
실시예 1. 인테인 - 매개된 프로세싱을 사용한 면역글로불린의 발현
항체 분자의 효율적인 발현을 위한 전략은 폴리단백질 발현을 통한 것이고, 이때 인테인은 중쇄와 경쇄 사이에 위치하며, 인테인 서열 및/또는 접합점 서열이 변형되어 N-말단과 C-말단 단백질이 연결되지 않으면서 구성요소 단백질이 방출되게 한다. 이러한 작제물 내에서, 1 카피의 각각의 관련된 중쇄 및 경쇄가 존재하거나, 경쇄가 복제되거나, 다수의 카피의 중쇄 및 경쇄가 존재할 수 있으며, 단 기능성 절단 서열이 제공되어 폴리단백질 내의 각 면역글로불린-유래된 단백질의 분리를 촉진시킨다. 인테인 전략이 1회 이상 사용되거나, 상이한 단백질분해 프로세싱 서열 또는 효소가 면역글로불린 유래된 단백질의 적어도 한쪽 말단에 위치할 수 있다.
피로코쿠스 호리코시이 유래의 인테인을 위에서 간략히 기술한 바와 같이 작제물 내로 도입시켰고, 정확하게 프로세싱되어 완전히 기능성인 D2E7 항체가 성공적으로 생산되는 것으로 밝혀졌다. 검사된 추가적인 인테인은 사카로마이세스 세레비지아 및 시네코시스티스 종 PCC6803 균주로부터 유래하고, 분비되는 항체를 생산하는 것으로 ELISA를 통해 밝혀졌다.
피로코쿠스 호리코시이 Pho Pol I 인테인의 PCR 증폭 및 서브클로닝:
다음의 올리고뉴클레오타이드를 사용하여, 피.호리코시이 Pho Pol I 인테인 (NCBI/단백질 번호 O59610, 전체 DNA 폴리머라제 I DNA 서열에 대한 GenBank 수탁번호는 피.호리코시이에 대한 전체 게놈 서열로부터 얻은 바와 같이 BA000001.2:1686361..1690068이다)을, 게놈 DNA를 주형으로서 사용하고 Platinum Taq Hi Fidelity DNA Polymerase Supermix[판매원: Invitrogen, Carlsbad, CA]를 사용하여 증폭시켰다. 게놈 DNA는 ATCC로부터 구입하였다.
Figure 112008005047558-PCT00002
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 55℃ 72℃ 2 단계로 감 (34회) 72℃ 4℃ 종료
시간 2분 1분 1분 2분 5분 유지
PCR 산물을 pCR2.1-TOPO[판매원: Invitrogen] 내로 서브클로닝하고, 삽입체를 서열분석하여 정확한 것으로 입증되었다. 이때, 프린트출력 오류로 인해 인테인의 3' 말단으로부터 서열 손실이 있었다는 것을 파악하였다. 이어서, 손실된 서열을 이후의 PCR 반응 동안에 채워, 인테인을 D2E7의 중쇄 및 경쇄에 연결시켰다.
올리고뉴클레오타이드 프라이머를 설계하여 D2E7 중쇄 - 인테인 - D2E7 경쇄의 융합체를 생성하였다. 프라이머를, PCR 산물이 이후의 PCR 반응에서 프라이머로서 사용될 수 있게 설계하였다.
Figure 112008005047558-PCT00003
Figure 112008005047558-PCT00004
D2E7 중쇄 - 인테인 - D2E7 경쇄 융합체의 PCR 증폭 및 어셈블리: 앞서 생성한 pCR2.1-TOPO-p.horikoshii 인테인 클론을 주형으로서 사용하고, 프라이머 P. horikoshii int-5' 및 수정된 P.hori-3'을 사용하여 PCR을 수행하여, 인테인에 적당한 3' 말단을 복구시켰다. 폴리머라제로는 Pful DNA 폴리머라제를 사용하여, Platinum Taq.을 사용할 때 발생하는 A-테일링(tailing)을 방지하였다.
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 55℃ 72℃ 2 단계로 감 (34회) 72℃ 4℃ 종료
시간 2분 1분 1분 2분 5분 유지
PCR 증폭 산물을 Qiaquick Gel Extraction 키트[판매원: Qiagen, Valencia, CA]를 사용하여 겔 정제하였다. 이 산물을 다음의 반응 세트에서 주형으로서 사용하였다.
3 세트의 PCR 반응을 수행하여, 인테인 암호화 서열의 5' 및 3'에 다양한 수의 엑스테인 잔기를 갖는 인테인 암호화 서열을 생성하였다. 엑스테인 코돈은, 이 인테인을 본래 일부분으로 갖고 있는 피.호리코시이의 천연 DNA 폴리머라제 유전자의 것이다. 프라이머를 다음과 같이 사용하였다: 1 세트는 0개의 엑스테인 서열 (HC-인테인-5' 및 수정된 LC-인테인-3')을 도입시키고, 2 세트는 하나의 아미노산 (3개의 염기 쌍)을 인테인 (HC-인테인(1aa)-5' 및 수정된 LC-인테인(1aa)-3')의 양 말단에 도입시키고, 3 세트는 3개의 아미노산 (9개의 염기 쌍)을 인테인 (HC-인테인(3aa)-5' 및 수정된 LC-인테인(3aa)-3')의 양 말단에 도입시킨다.
PCR 프로그램은 위에 제시한 것과 동일하였다. PCR 산물을 Qiaquick Gel Extraction 키트[판매원: Qiagen]를 사용하여 겔 정제하였다. 이러한 산물을 다음의 반응 세트에서 프라이머로서 사용하였다.
3 세트의 PCR 반응을 수행하여, 사이에 0, 1 또는 3개의 엑스테인 아미노산을 갖는, D2E7 중쇄와 인테인과의 융합체를 생성하였다. 반응을 위한 주형은 D2E7 중쇄 DNA이다. 상기한 PCR 산물을 3' 프라이머로서 각각 사용하였고, HC-SrfI-5'을 모든 반응에서 5' 프라이머로서 사용하였다. Pful DNA 폴리머라제를 사용하였다.
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 50℃ 72℃ 2 단계로 감 (39회) 72℃ 4℃ 종료
시간 2분 1분 1분 3분 5분 유지
PCR 산물을 Qiaquick Gel Extraction 키트[판매원: Qiagen]를 사용하여 겔 정제하였다. 이 산물을 다음의 반응 세트에서 프라이머로서 사용하였다.
3 세트의 PCR 반응을 수행하여, 사이에 0, 1 또는 3개의 엑스테인 아미노산을 갖는, D2E7 중쇄 - 인테인과 D2E7 경쇄와의 융합체를 생성하였다. 반응을 위한 주형은 D2E7 경쇄 DNA이다. 바로 위에 기술한 PCR 산물을 5' 프라이머로서 각각 사용하였고, LC-BamHI-3'을 모든 반응에서 3' 프라이머로서 사용하였다. Pful DNA 폴리머라제를 사용하였다.
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 55℃ 72℃ 2 단계로 감 (39회) 72℃ 4℃ 종료
시간 2분 1분 1분 5분 5분 유지
생성된 PCR 산물은, 겔 상에 러닝(running)시켰을 때 확산되고 희박하였다. 이러한 반응물을 PCR의 마지막 회에서 직접 주형으로서 사용하고, HC-SrfI-5' 및 LC-BamHI-3'을 프라이머로서 사용하였다. Pful DNA 폴리머라제를 사용하였다. 동일한 PCR 프로그램을 위에 제시한 바와 같이 사용하였다. PCR 산물을 Qiaquick Gel Extraction 키트[판매원: Qiagen]를 사용하여 겔 정제하였다.
상기한 정제된 PCR 산물을, pCR-BluntII-TOPO[판매원: Invitrogen] 내로 Zero Blunt TOPO PCR Cloning 키트[판매원: Invitrogen]를 사용하여 서브클로닝하였다. 클론을 서열분석하여 작제물이 예측된 핵산 서열을 나타낸다는 것을 입증하였다. 각각의 종류의 산물에 대해 정확한 클론이 발견되었다. D2E7 중쇄 - 인테인 - D2E7 경쇄 카세트를 SrfI 및 NotI을 사용하여 pCR-BluntII-TOPO로부터 절단시키고, 동일한 제한 효소로 처리하여 겔 정제된 pTT3 내로 서브클로닝하였다.
D2E7 중쇄 - 인테인 - D2E7 경쇄에 대한 3개의 발현 작제물을 피.호리코시이 인테인을 사용하여 설계하였다: pTT3-HcintLC-p.hori (플라스미드 지도에 대해서는 도 14를 참조한다); pTT3-HcintLC1aa-p.hori; 및 pTT3-HcintLC3aa-p.hori.
표 10Aa. pTT3-HcintLC-p.hori의 뉴클레오타이드 서열 (서열번호 62)
Figure 112008005047558-PCT00005
표 10Ab.
Figure 112008005047558-PCT00006
표 10Ac.
Figure 112008005047558-PCT00007
표 10Ad.
Figure 112008005047558-PCT00008
표 10B. pTT3-HcintLC-p.hori 내의 개방 판독 프레임의 아미노산 서열 (서열번호 63)
Figure 112008005047558-PCT00009
서열에 대한 문자/글자체 기호:
pTT3 벡터 - 중쇄 - 인테인 - 경쇄
다음의 2개의 작제물에서, 상기 작제물과의 차이점은 단지 피.호리코시이의 천연 엑스테인 서열(밑줄)의 포함이다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (적색으로 표시한 마지막 9개의 염기 쌍)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (분홍색으로 표시한 처음 9개의 염기 쌍, 별도의 행에 제시함)까지이다.
표 11A. pTT3-HcintLC1aa-p.hori 부분적 암호화 서열 (서열번호 64)
Figure 112008005047558-PCT00010
표 11B. 중쇄의 상류에 4개의 아미노산 및 인테인의 하류에 4개의 아미노산을 제시하는 pTT3-HcintLC1aa-p.hori 부분적 아미노산 서열 (서열번호 65)
Figure 112008005047558-PCT00011
중쇄 3' 서열-인테인-엑스테인-경쇄 5' 서열
표 12A. pTT3-HcintLC3aa-p.hori 부분적 암호화 서열 (서열번호 66)
Figure 112008005047558-PCT00012
표 12B. 인테인 및 플랭킹 서열을 제시하는 pTT3-HcintLC3aa-p.hori 부분적 아미노산 서열 (서열번호 67)
Figure 112008005047558-PCT00013
중쇄 3' 서열-인테인-엑스테인-경쇄 5' 서열
작제물 A, B, E, H, I, J, K 및 L을 위하여 사용된 프라이머는 다음과 같았다:
Figure 112008005047558-PCT00014
작제물 A를 제조하기 위하여, 플라스미드 pTT3 HC-int-LC P.hori를 주형 2로서 사용하였고, 중복되는 DNA 단편을 돌연변이유발 프라이머 YKF1과 프라이머 YKR3, 및 돌연변이유발 프라이머 YKR1과 프라이머 YKF3을 각각 사용하여 증폭시켰다. 상기 2개의 단편을 연결시키는 DNA 단편을, 상기 2개의 PCR 단편의 혼합물을 주형으로서 사용하고 프라이머 YKF3 및 YKR3을 사용하여 PCR 증폭으로 생성하였다. 이어서, 이 PCR 단편을 제한 효소 EcoRI 및 NotI으로 절단하고, 동일한 제한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝한다.
돌연변이유발 프라이머 YKF2와 YKR2를 YKF1과 YKR1 대신에 사용하였고, 플라스미드 pTT3 HC-int-LC-1aa P.hori를 PCR 주형으로서 플라스미드 pTT3 HC-int-LC P.hori 대신에 사용하였으며, pTT3 HC-int-LC P.hori 벡터를 클로닝을 위한 골격으로서 사용한 것을 제외하고, 작제물 A의 경우와 유사한 방법으로 작제물 B를 생성하였다.
작제물 E를 제조하기 위하여, 플라스미드 pTT3 HC-int-LC-1aa P.hori를 주형으로서 사용하고 프라이머 YKF4 및 돌연변이유발 프라이머 YKR4를 사용하여 DNA 단편을 증폭시켰다. 이 PCR 단편을 SacII 및 MfeI으로 절단하고, 동일한 제한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝하였다.
작제물 H의 경우, pTT3 HC-int-LC P.hori를 주형 2로서 사용하였고, 하나의 단편을 위한 돌연변이유발 프라이머 YKF5 및 프라이머 YKR3을 사용하고 또다른 단편을 위한 프라이머 F3 및 돌연변이유발 프라이머 R5를 사용하여, 중복되는 단편을 증폭시켰다. PCR 증폭의 제2회를, 상기 2개의 단편을 주형으로서 사용하고 프라이머 YKF3 및 YKR3을 사용하여 실시하였다. 이 단편을 제한 효소 EcoRI 및 NotI으로 분해시키고, 동일한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝하였다.
작제물 J를 제조하기 위하여, pTT3 HC-int-LC P.hori를 주형 2로서 사용하였고, 하나의 단편을 위한 돌연변이유발 프라이머 YKF13 및 프라이머 YKR3을 사용하고 또다른 단편을 위한 프라이머 F3 및 돌연변이유발 프라이머 R13을 사용하여, 중복되는 단편을 증폭시켰다. PCR 증폭의 제2회를, 상기 2개의 단편을 주형으로서 사용하고 프라이머 YKF3 및 YKR3을 사용하여 실시하였다. 이 단편을 제한 효소 EcoRI 및 NotI으로 절단하고, 동일한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝하였다.
작제물 K의 경우, pTT3 HC-int-LC P.hori가 주형 2의 역할을 하였다. 하나의 단편을 위한 돌연변이유발 프라이머 YKF14 및 프라이머 YKR3을 사용하고 또다른 단편을 위한 프라이머 F3 및 돌연변이유발 프라이머 R14를 사용하여, 중복되는 단편을 증폭시켰다. PCR 증폭의 제2회를, 상기 2개의 단편을 주형으로서 사용하고 프라이머 YKF3 및 YKR3을 사용하여 실시하였다. 이 단편을 제한 효소 EcoRI 및 NotI으로 분해시키고, 동일한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝하였다.
작제물 L을 제조하기 위하여, pTT3 HC-int-LC P.hori를 주형 2로서 사용하였고, 하나의 단편을 위한 돌연변이유발 프라이머 YKF15 및 프라이머 YKR3을 사용하고 또다른 단편을 위한 프라이머 F3 및 돌연변이유발 프라이머 R15를 사용하여, 중복되는 단편을 증폭시켰다. PCR 증폭의 제2회를, 상기 2개의 단편을 주형으로서 사용하고 프라이머 YKF3 및 YKR3을 사용하여 실시하였다. 이 단편을 제한 효소 EcoRI 및 NotI으로 분해시키고, 동일한 효소로 절단된 pTT3 HC-int-LC P.hori 내로 클로닝하였다.
모든 작제물의 뉴클레오타이드 서열을 확인하였다. 모든 작제물은, D2E7 중쇄의 마지막 코돈(PGK를 암호화함)과 D2E7 경쇄 성숙한 서열의 첫번째 코돈(DIQ를 암호화함) 사이의 서열을 제외하고, pTT3 HC-int-LC P.hori와 동일한 서열을 갖는다. 야생형 또는 돌연변이형 인테인과 함께 야생형 또는 돌연변이형 경쇄 시그날 서열을 포함하는 이 영역 내의 서열을, 모든 작제물에 대해 아래와 같이 제시한다.
표 13A. 작제물 A의 부분적 암호화 서열 (서열번호 98)
Figure 112008005047558-PCT00015
표 13B. 작제물 A 내의 인테인 및 플랭킹 서열을 제시하는 부분적 아미노산 서열 (서열번호 99)
Figure 112008005047558-PCT00016
표 14A. 작제물 B 내의 부분적 암호화 서열 (서열번호 100)
Figure 112008005047558-PCT00017
표 14B. 작제물 B 내의 부분적 아미노산 서열 (서열번호 101)
Figure 112008005047558-PCT00018
표 15A. 작제물 E 내의 부분적 암호화 서열 (서열번호 102)
Figure 112008005047558-PCT00019
표 15B. 작제물 E 내의 부분적 아미노산 서열 (서열번호 103)
Figure 112008005047558-PCT00020
표 16A. 작제물 H 내의 부분적 암호화 서열 (서열번호 104)
Figure 112008005047558-PCT00021
Figure 112008005047558-PCT00022
표 16B. 작제물 H 내의 부분적 아미노산 서열 (서열번호 105)
Figure 112008005047558-PCT00023
표 17A. 작제물 J 내의 부분적 암호화 서열 (서열번호 106)
Figure 112008005047558-PCT00024
표 17B. 작제물 J 내의 부분적 아미노산 서열 (서열번호 107)
Figure 112008005047558-PCT00025
표 18A. 작제물 K 내의 부분적 암호화 서열 (서열번호 108)
Figure 112008005047558-PCT00026
표 18B. 작제물 K 내의 부분적 아미노산 서열 (서열번호 109)
Figure 112008005047558-PCT00027
표 19A. 작제물 L 내의 부분적 암호화 서열 (서열번호 110)
Figure 112008005047558-PCT00028
표 19B. 작제물 L 내의 부분적 아미노산 서열 (서열번호 111)
Figure 112008005047558-PCT00029
중쇄 3' 서열-인테인 + 경쇄 시그날 펩티드 서열-경쇄 성숙한 서열
다음의 올리고뉴클레오타이드를 사용하여, 사카로마이세스 세레비지아 VMA 인테인(GenBank 수탁번호 AB093499)을, 게놈 DNA를 주형으로서 사용하고 Pfu-I Hi Fidelity DNA 폴리머라제[판매원: Stratagene]를 사용하여 증폭시켰다. 게놈 DNA를, 사카로마이세스 세레비지아의 배양물로부터 Yeast-Geno-DNA-Template 키트[판매원: G Biosciences, 카탈로그 번호 786-134]를 사용하여 제조하였다.
Figure 112008005047558-PCT00030
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 55℃ 72℃ 2 단계로 감 (39회) 72℃ 4℃ 종료
시간 2분 1분 1분 2분 5분 유지
PCR 산물을 주형으로서 사용하고 다음의 프라이머 쌍을 사용하여, 인테인의 0aa, 1aa 또는 3aa 버전을 피.호리코시이 인테인 작제물의 경우와 같이 생산하였다. Pfu-I Hi Fidelity DNA 폴리머라제[판매원: Stratagene]를 사용하였다.
Figure 112008005047558-PCT00031
PCR을 위에 제시한 동일한 프로그램을 사용하여 수행하였다. 각각의 반응 종류로부터의 PCR 산물을 pCR-BluntII-TOPO[판매원: Invitrogen] 내로 서브클로닝하고, 각 종류의 삽입체를 서열분석하여 정확한 것으로 입증되었다.
올리고뉴클레오타이드 프라이머를 설계하여, D2E7 중쇄 - 인테인 - D2E7 경쇄의 융합체를 상동 재조합으로 pTT3-HcintLC p.horikoshii 작제물 내로 이.콜라이에서 생성하였다. PCR 생성된 벡터(pTT3 벡터, 중쇄 및 경쇄 영역이 포함되지만, 피.호리코시이 인테인은 포함되지 않음)와 VMA 인테인 삽입체 사이에 걸쳐있는 40개의 염기 쌍을 조작하여, 2개의 DNA를 혼합하고 이.콜라이 내로 연결의 도움 없이 형질전환시켜, 2개의 단편이 pTT3-HC-VMAint-LC 내로 0aa, 1aa 및 3aa 버전으로 이.콜라이 상동 재조합이 일어나게 할 수 있다.
VMA 상동 재조합 프라이머:
Figure 112008005047558-PCT00032
pTT3-HcintLC 상동 재조합 프라이머:
Figure 112008005047558-PCT00033
인테인을 위한 PCR을 다음의 프로그램에 따라 수행하였다: Pfu-I Hi Fidelity DNA 폴리머라제[판매원: Stratagene]를 사용하였다.
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 60℃ 72℃ 2 단계로 감 (34회) 72℃ 4℃ 종료
시간 2분 1분 1분 1.5분 5분 유지
벡터를 위한 PCR을 다음의 프로그램에 따라 수행하였다: Platinum Taq Hi Fidelity Supermix[판매원: Invitrogen]를 사용하였다.
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 60℃ 68℃ 2 단계로 감 (24회) 68℃ 4℃ 종료
시간 2분 30초 30초 10분 5분 유지
VMA 인테인의 pTT3-HcintLC 내로의 상동 재조합을 달성하기 위하여 다음의 전략을 사용하였다. PCR 산물을 겔 정제하고, 각각을 Qiaquick Gel Extraction 키트[판매원: Qiagen]를 사용하여 50㎕ 용출 완충액 속에 용출시켰다. 3㎕의 벡터 PCR 산물을 에펜도르프 튜브 내에서 혼합하고, 3㎕의 목적하는 VMA 인테인 PCR 산물(분리된 튜브 내의 0aa, 1aa 또는 3aa)을 첨가하였다. 각각의 혼합물을 이.콜라이 내로 형질전환시키고 나서, 세포를 LB + 앰피실린 플레이트 상에 평판배양하고 37℃에서 하룻밤 동안 배양하였다. 콜로니를 2ml 배양물로 성장시키고, 플라스미드 DNA를 Wizard Prep 키트[판매원: Promega]를 사용하여 제조하여, 제한 엔도뉴클 레아제 분해 및 아가로스 겔 전기영동으로 분석하였다. 정확한 제한 패턴을 형성한 클론을 DNA 서열에 대해 분석하였다.
D2E7 중쇄 - 인테인 - D2E7 경쇄에 대한 3개의 발현 작제물을 에스.세레비지아 VMA 인테인을 사용하여 생성하였다: pTT3-Hc-VMAint-LC-0aa; pTT3-Hc-VMAint-LC-1aa; 및 pTT3-Hc-VMAint-LC-3aa. 또한 플라스미드 지도에 대해서는 도 15를 참조한다.
표 20a. 전체 플라스미드 pTT3-D2E7 중쇄 - 인테인 - D2E7 경쇄의 서열 (서열번호 124)
Figure 112008005047558-PCT00034
표 20b.
Figure 112008005047558-PCT00035
표 20c.
Figure 112008005047558-PCT00036
pTT3 벡터-중쇄-인테인-경쇄
다음의 작제물에서, 상기 작제물과의 차이점은 단지 에스.세레비지아의 천연 엑스테인 서열(청색으로 표시됨)의 포함이다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (적색으로 표시한 마지막 9개의 염기 쌍)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (분홍색으로 표시한 처음 9개의 염기 쌍)까지이다.
표 21. pTT3-HC-VMAint-LC-1aa 내의 부분적 암호화 서열 (서열번호 125)
Figure 112008005047558-PCT00037
중쇄 3' 서열-인테인-엑스테인-경쇄 5' 서열
표 22. pTT3-HC-VMAint-LC-3aa (서열번호 126)
Figure 112008005047558-PCT00038
중쇄 3' 서열-인테인-엑스테인-경쇄 5' 서열
시네코시스티스 PCC6803 균주 DnaE 인테인 : 합성, PCR 증폭 및 클로닝
시네코시스티스 종 PCC6803 균주 DnaE 인테인은 자연적으로 분리된 인테인이다 (NCBI 번호 S76958 및 S75328). 이 인테인의 N 말단과 C 말단 절반을 하나의 개방 판독 프레임으로서 합성적으로 합성하여 연결시켰다. 목적하는 단백질 서열에 대한 암호화 서열을 CHO 세포에서의 발현을 위하여 코돈 최적화시켰다 (www.geneart.com). 생성된 뉴클레오타이드 서열을 표 23에 제시한다.
표 23. Ssp-Di (크리세툴루스 그리세우스(Cricetulus griseus)에서의 발현을 위하여 최적화된 암호화 서열) (또한 서열번호 127 및 128을 참조한다)
Figure 112008005047558-PCT00039
다음의 올리고뉴클레오타이드를 사용하여, 시네코시스티스 종 PCC6803 균주 DnaE 인테인을, 상기 합성 DNA를 주형으로서 사용하고 Platinum Taq Hi Fidelity Supermix[판매원: Invitrogen]를 사용하여 증폭시켰다. 이러한 프라이머는 또한 엑스테인 서열을 도입시켜, 에스.세레비지아 VMA 인테인을 사용하여 생성시킨 바와 같이, 0aa, 1aa 및 3aa 버전 뿐만 아니라, PCR 산물의 pTT3-HcintLC 벡터 내로의 상동 재조합을 위한 서열을 생성시킨다:
Figure 112008005047558-PCT00040
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 60℃ 68℃ 2 단계로 감 (34회) 68℃ 4℃ 종료
시간 2분 30초 30초 1분 5분 유지
코돈 최적화된 시네코시스티스 종 PCC6803 균주 DnaE 인테인을 pTT3-HcintLC 내로 상동 재조합시키기 위하여, 다음의 전략을 사용하였다. PCR 산물을 겔 정제하고 각각 50ul 용출 완충액(Qiaquick Gel Extraction 키트[판매원: Qiagen]) 속에 용출시켰다. 2㎕의 벡터 PCR 산물 (VMA 인테인을 사용한 상동 재조합에서 사용한 것과 동일함)을 에펜도르프 튜브 내에서 혼합하고, 2㎕의 목적하는 시네코시스티스 종 PCC6803 균주 DnaE 인테인 PCR 산물(분리된 튜브 내의 0aa, 1aa 또는 3aa)을 첨 가하였다. 이어서, 핵산을 이.콜라이 내로 형질전환시키고, LB + 앰피실린 플레이트 상에 평판배양하고 나서, 37℃에서 하룻밤 동안 배양하였다. 콜로니를 2ml 배양물로 성장시키고, Wizard prep 키트[판매원: Promega]를 사용하여 DNA를 제조하여, 제한 엔도뉴클레아제 분해 및 아가로스 겔 전기영동으로 분석하였다. 정확한 제한 패턴을 형성한 클론을 DNA 서열에 대해 분석하여 목적하는 서열이 존재하는 것을 확인하였다.
D2E7 중쇄 - 인테인 - D2E7 경쇄에 대한 3개의 발현 작제물을 시네코시스티스 종 PCC6803 균주 DnaE 인테인을 사용하여 설계하였다: pTT3-Hc-Ssp-GA-int-LC-0aa (플라스미드 지도에 대해서는 도 16을 참조한다); pTT3-Hc-Ssp-GA-int-LC-1aa; 및 pTT3-Hc-Ssp-GA-int-LC-3aa.
표 24a. 전체 플라스미드 pTT3-D2E7 중쇄 - Ssp - GA - 인테인 - D2E7 경쇄의 서열 (서열번호 135)
Figure 112008005047558-PCT00041
표 24b.
Figure 112008005047558-PCT00042
표 24c.
Figure 112008005047558-PCT00043
pTT3 벡터-중쇄-인테인-경쇄
다음의 작제물에서, 상기 작제물과의 차이점은 단지 시네코시스티스 종 PCC6803 균주(청색으로 표시됨)의 천연 엑스테인 서열의 포함이다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (적색으로 표시한 마지막 9개의 염기 쌍)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (분홍색으로 표시한 처음 9개의 염기 쌍)까지이다.
표 25. pTT3-HC-Ssp-GA-int-LC-1aa, 암호화 영역 중 관련된 일부분 (서열번호 136)
Figure 112008005047558-PCT00044
pTT3 벡터-중쇄-인테인-경쇄
표 26. pTT3-HC-Ssp-GA-int-LC-3aa - 암호화 영역 중 관련된 일부분 (서열번호 137)
Figure 112008005047558-PCT00045
pTT3 벡터-중쇄-인테인-경쇄
또한, 표 8A 내지 8C에는, 돌연변이된(세린에서 트레오닌으로) 피로코쿠스 종 GBD Pol 인테인을 사용한 D2E7 인테인 융합 단백질, 발현 벡터 및 암호화 서열에 대한 관련된 서열을 제공한다.
표 8Aa. D2E7 인테인 융합 단백질의 암호화 서열 (서열번호 48)
Figure 112008005047558-PCT00046
표 8Ab.
Figure 112008005047558-PCT00047
표 8B. D2E7 인테인 융합 작제물의 아미노산 서열 (서열번호 49)
Figure 112008005047558-PCT00048
표 8Ca. D2E7 인테인 융합 작제물을 위한 발현 벡터의 완전한 뉴클레오타이드 서열 (서열번호 50)
Figure 112008005047558-PCT00049
표 8Cb.
Figure 112008005047558-PCT00050
표 8Cc.
Figure 112008005047558-PCT00051
표 8Cd.
Figure 112008005047558-PCT00052
표 9. 제한된 플랭킹 서열 정보(NCBI 번호 AAA67132.1)를 갖는 천연 Psp-GBD Pol 인테인 서열의 아미노산 서열 (서열번호 51)
Figure 112008005047558-PCT00053
/는 스플라이스 접합점을 나타내고, 밑줄친 아미노산은 인테인 서열을 나타내며, 나머지는 엑스테인 서열 정보를 나타낸다.
실시예 2. 드로소필라 멜라노가스터 헤지호그 자가 프로세싱 도메인, C17 C25 서열을 사용한 면역글로불린 폴리단백질 서열 및 벡터의 작제
항체 분자의 효율적인 발현을 위한 추가적인 전략은 폴리단백질 발현이고, 이때 헤지호그 도메인은 중쇄와 경쇄 사이에 위치하며, 헤지호그 도메인 서열 및/또는 접합점 서열이 변형되어 콜레스테롤이 N-말단 단백질에 부가되지 않으면서 구성요소 단백질이 방출되게 한다. 이러한 작제물 내에서, 1 카피의 각각의 관련된 중쇄 및 경쇄가 존재하거나, 경쇄가 복제되어 2개 이상의 경쇄가 존재하거나, 다수의 카피의 중쇄 및 경쇄가 존재할 수 있으며, 단 기능성 절단 서열이 제공되어 폴리단백질 내의 각 면역글로불린-유래된 단백질의 분리를 촉진시킨다. 특정 절단 부위 전략(예: 헤지호그 도메인)은 1회 이상 사용되거나, 다수의 절단 부위에 대해 각각 독립적일 수 있다. 따라서 상이한 단백질분해 프로세싱 서열 또는 효소가 면역글로불린 또는 면역글로불린-유래된 단백질의 적어도 한쪽 말단에 위치할 수 있다.
다음의 올리고뉴클레오타이드를 사용하여, 드로소필라 멜라노가스터 헤지호그 C-말단 자가 프로세싱 도메인 (Hh-C), 서열 Hh-C17, Hh-17 절두물 (및 돌연변이를 갖는 것) 및 Hh-C25 (GenBank 수탁번호 L02793.1)를, 게놈 DNA를 주형으로서 사용하고 Platinum Taq Hi Fidelity Supermix[판매원: Invitrogen]를 사용하여 증폭시켰다. 게놈 DNA를 드로소필라 D.Mel-2 세포[판매원: Invitrogen, 카탈로그 번호 10831-014]의 냉동 바이알로부터 제조하였다.
Figure 112008005047558-PCT00054
PCR을 다음의 프로그램에 따라 수행하였다:
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 55℃ 68℃ 2 단계로 감 (34회) 68℃ 4℃ 종료
시간 2분 1분 1분 2.5분 5분 유지
올리고뉴클레오타이드 프라이머를 설계하여, D2E7 중쇄 - Hh-C - D2E7 경쇄의 융합체를 상동 재조합으로 pTT3-HcintLC p. horikoshii 작제물 내로 이.콜라이에서 생성하였다. PCR 생성된 벡터(pTT3 벡터, 중쇄 및 경쇄 영역이 포함되지만, 피.호리코시이 인테인은 포함되지 않음)와 Hh-C 도메인 삽입체 사이에 걸쳐있는 40개의 염기 쌍을 조작하여, 2개의 DNA 단편을 혼합하고 이.콜라이 내로 연결의 도움 없이 형질전환시켜, 2개의 단편이 pTT3-HC-Hh-C-LC 내로 (초기 PCR 산물의 지시에 따라 다양한 버전으로) 이.콜라이 상동 재조합이 일어나게 한다.
Hh-C 도메인 상동 재조합 프라이머:
Figure 112008005047558-PCT00055
pTT3-HcintLC 상동 재조합 프라이머:
Figure 112008005047558-PCT00056
Hh-C 도메인을 위한 PCR을 다음의 프로그램에 따라 수행하였다: Pfu-I Hi Fidelity DNA 폴리머라제[판매원: Stratagene]를 사용하였다.
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 60℃ 72℃ 2 단계로 감 (34회) 72℃ 4℃ 종료
시간 2분 1분 1분 1.5분 5분 유지
벡터를 위한 PCR을 다음의 프로그램에 따라 수행하였다: Platinum Taq Hi Fidelity Supermix[판매원: Invitrogen]를 사용하였다.
단계 1 2 3 4 5 6 7 8
온도 94℃ 94℃ 60℃ 68℃ 2 단계로 감 (24회) 68℃ 4℃ 종료
시간 2분 30초 30초 10분 5분 유지
Hc-C 도메인을 pTT3-HcintLC 내로 상동 재조합시키기 위하여, 다음의 전략을 사용하였다. PCR 산물을 겔 정제하고 각각 50㎕ 용출 완충액(Qiaquick Gel Extraction 키트, 판매원: Qiagen) 속에 용출시켰다. 3㎕의 벡터 PCR 산물을 에펜도르프 튜브 내에서 혼합하고, 3㎕의 목적하는 Hint 도메인 PCR 산물(다양한 버전)을 첨가하였다. PCR 증폭 산물을 이.콜라이 내로 형질전환시키고, LB + 앰피실린 플레이트 상에 평판배양하여, 37℃에서 하룻밤 동안 배양하고, 콜로니를 2ml 배양물로 성장시키고, 플라스미드 DNA를 Wizard prep 키트[판매원: Promega]를 사용하여 추출하여, DNA 샘플을 제한 엔도뉴클레아제 분해 및 아가로스 겔 전기영동으로 검정하였다. 정확한 제한 패턴을 형성한 클론을 DNA 서열에 대해 분석하여 목적하 는 서열이 제조된 것을 확인하였다.
D2E7 중쇄 - Hh-C - D2E7 경쇄 발현을 위한 5개의 발현 작제물을 드로소필라 멜라노가스터 헤지호그 C-말단 자가프로세싱 도메인을 사용하여 설계하였다: pTT3-HC-Hh-C17-LC; pTT3-HC-Hh-C17-SC-LC; pTT3-HC-Hh-C17-HN-LC; 및 pTT3-HC-Hh-C25-LC.
표 27a. 전체 플라스미드 pTT3-D2E7 중쇄 - Hh-C17 - D2E7 경쇄의 서열 (서열번호 155)
Figure 112008005047558-PCT00057
표 27b.
Figure 112008005047558-PCT00058
표 27c.
Figure 112008005047558-PCT00059
pTT3 벡터-중쇄-Hh-C17-경쇄
다음의 작제물에서, 상기 작제물과의 차이점은 단지 C17 영역이 절두되어, 콜레스테롤 전달 활성이 제거된 것이다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (HC 암호화 서열의 마지막 9개의 염기 쌍, 표의 첫번째 행)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (LC 암호화 서열의 처음 9개의 염기 쌍, 표의 마지막 행)까지이다.
표 28. 플라스미드 pTT3-HC-C17-sc-LC의 부분적 암호화 서열 (서열번호 156)
Figure 112008005047558-PCT00060
중쇄 3' 서열-Hh-C17-경쇄 5' 서열
다음의 작제물에서, 상기 작제물 pTT3-HC-C17-sc-LC 와의 차이점은 단지 헤 지호그 C17 영역에서 마지막 2개의 아미노산이 SC에서 HN(밑줄)으로 돌연변이된 것이다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (HC 암호화 서열의 마지막 9개의 염기 쌍, 표의 첫번째 행)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (표의 마지막 행)까지이다.
표 29. 플라스미드 pTT3-HC-C17-hn-LC로부터의 부분적 암호화 서열 (서열번호 157)
Figure 112008005047558-PCT00061
중쇄 3' 서열-Hh-C17-돌연변이-경쇄 5' 서열
다음의 작제물에서, Hint 도메인의 C17 대신에 전체 C25 영역을 사용한다. 제시된 서열은 D2E7 중쇄 암호화 영역의 말단 (HC 암호화 서열의 마지막 9개의 염기 쌍, 표의 첫번째 행)에서부터 D2E7 경쇄 암호화 영역의 5' 말단 (LC 암호화 서열의 처음 9개의 염기 쌍, 표의 마지막 행)까지이다.
표 29B. pTT3-HC-C25-Hint-LC로부터의 부분적 암호화 서열 (서열번호 158)
Figure 112008005047558-PCT00062
[중쇄 3' 서열-Hh-C25 도메인-경쇄 5' 서열]
(서열번호 140)
Hh-C25 및 관련된 작제물의 아미노산 서열 (아래쪽 화살표는 절단 부위를 나타낸다; : Hh - C17 ↓: Hh-C17sc)
Figure 112008005047558-PCT00063
실시예 3. 단백질분해 프로세싱을 위한 TEV 인식 서열을 사용한 항체 발현
작제물 및 발현 벡터를 생성하여, 관심대상의 항체를 포함하는 면역글로불린 중쇄와 경쇄 서열 단편 사이의 TEV 인식 서열로, 종양 괴사 인자-α, 인터루킨-12, 인터루킨-18 및 에리트로포이에틴 수용체에 특이적인 항체의 발현을 지시한다. 바람직하게는, 작제물은 프레임내 리더 서열 뒤에 위치하는 관심대상의 항체 중쇄의 전사를 지시하는 아데노바이러스 주요 후기 프로모터 및 사이토메갈로바이러스 인핸서를 포함하는 발현 벡터를 포함한다. 중쇄 암호화 서열을 프레임내 푸린 절단 부위 및 TEV 인식 서열 (E-P-V-Y-F-Q-G)에 연결시키고, 그 뒤에는 핵 위치결정 영역이 결실된 TEV 프로테아제[참조: Ceriani et al. (1998) Plant Molec Biol. 36:239]에 대한 암호화 영역이 위치하고, 그 뒤에는 제2의 TEV 인식 서열이 위치한다. 제2의 TEV 인식 서열을, 관심대상의 항체 경쇄에 대한 암호화 영역 및 종결 코돈에 연결된, 항체 경쇄에 대한 리더 서열에 프레임내 연결시킨다. 암호화 영역 뒤에는 폴리아데닐화 시그날이 위치한다. 관련된 서열을 본원에서 아래에 제시한다.
표 1a. D2E7 (휴미라(Humira)/아달리무맙) TEV 발현 벡터의 완전한 DNA 서열 (서열번호 44)
Figure 112008005047558-PCT00064
표 1b.
Figure 112008005047558-PCT00065
표 1c.
Figure 112008005047558-PCT00066
표 1d.
Figure 112008005047558-PCT00067
표 2A. ABT-007 TEV 작제물: 폴리단백질에 대한 암호화 서열 (서열번호 32)
Figure 112008005047558-PCT00068
표 2Ba. ABT-007 TEV 폴리단백질 아미노산 서열 (서열번호 33)
Figure 112008005047558-PCT00069
표 2Bb.
Figure 112008005047558-PCT00070
표 2Ca. 완전한 ABT-007 TEV 작제물 발현 벡터 서열 (서열번호 34)
Figure 112008005047558-PCT00071
표 2Cb.
Figure 112008005047558-PCT00072
표 2Cc.
Figure 112008005047558-PCT00073
표 3A. ABT-874 (J695) TEV 폴리단백질에 대한 암호화 서열 (서열번호 35)
Figure 112008005047558-PCT00074
표 3B. ABT-874 (J695) TEV 폴리단백질의 아미노산 서열 (서열번호 36)
Figure 112008005047558-PCT00075
표 3Ca. ABT-874 (J695) TEV 발현 벡터의 완전한 뉴클레오타이드 서열 (서열번호 37)
Figure 112008005047558-PCT00076
표 3Cb.
Figure 112008005047558-PCT00077
표 3Cc.
Figure 112008005047558-PCT00078
표 4Aa. EL246 GG (항-E/L 셀렉틴) TEV 폴리단백질을 암호화하는 핵산 서열 (서열번호 38)
Figure 112008005047558-PCT00079
표 4Ab.
Figure 112008005047558-PCT00080
표 4B. EL246 GG (항-E/L 셀렉틴) TEV 폴리단백질의 아미노산 서열 (서열번호 39)
Figure 112008005047558-PCT00081
표 4Ca. EL246 GG (항-E/L 셀렉틴) TEV 폴리단백질 발현 벡터에 대한 완전한 뉴클 레오타이드 서열 (서열번호 40)
Figure 112008005047558-PCT00082
표 4Cb.
Figure 112008005047558-PCT00083
표 4Cc.
Figure 112008005047558-PCT00084
표 5Aa. ABT-325 TEV 폴리단백질에 대한 암호화 서열 (서열번호 41)
Figure 112008005047558-PCT00085
표 5Ab.
Figure 112008005047558-PCT00086
표 5B. ABT-325 TEV 폴리단백질 아미노산 서열 (서열번호 42)
Figure 112008005047558-PCT00087
표 5Ca. 완전한 ABT-325 TEV 폴리단백질 발현 벡터의 뉴클레오타이드 서열 (서열번호 43)
Figure 112008005047558-PCT00088
표 5Cb.
Figure 112008005047558-PCT00089
표 5Cc.
Figure 112008005047558-PCT00090
표 6A. D2E7 LC-LC-HC 폴리단백질 작제물에 대한 암호화 서열 (서열번호 29)
Figure 112008005047558-PCT00091
표 6B. D2E7 LC-LC-HC 폴리단백질 아미노산 서열 (서열번호 30)
Figure 112008005047558-PCT00092
표 6Ca. D2E7 LC-LC-HC 폴리단백질 발현 벡터 DNA 서열의 완전한 뉴클레오타이드 서열 (서열번호 31)
Figure 112008005047558-PCT00093
표 6Cb.
Figure 112008005047558-PCT00094
표 6Cc.
Figure 112008005047558-PCT00095
표 6Cd.
Figure 112008005047558-PCT00096
실시예 4. 내부 절단가능한 시그날 펩티드 작제물을 갖는 폴리단백질로서의 항체의 발현
추가적인 양태는 암호화 서열, 발현 벡터 및 항체 발현 방법으로 구성된다. 1차 발현 작제물은 내부 절단가능한 시그날 펩티드를 갖는 폴리단백질을 포함하고, 발현된 후 절단되어 다중쇄(예: 2-쇄) 항체 분자가 형성된다.
표 7A. D2E7 내부 절단가능한 시그날 펩티드 작제물에 대한 암호화 서열 (서열번호 45)
Figure 112008005047558-PCT00097
표 7B. D2E7 내부 절단가능한 시그날 펩티드 폴리단백질의 아미노산 서열 (서열번호 46)
Figure 112008005047558-PCT00098
표 7Ca. 완전한 D2E7 내부 절단가능한 시그날 펩티드 폴리단백질 발현 벡터 DNA 서열 (서열번호 47)
Figure 112008005047558-PCT00099
표 7Cb.
Figure 112008005047558-PCT00100
표 7Cc.
Figure 112008005047558-PCT00101
재료 및 방법:
기술된 작제물의 293-6E 세포 내로의 형질감염을 다음과 같이 수행한다. 사용된 세포는 지수 성장기(exponential growth phase)에 있는 HEK293-6E 세포 (0.8 내지 1.5x106 세포/ml)이고, 세포를 30회 미만으로 계대 배양하였다; 배양물을 3일 또는 4일 마다 새로운 성장 배지 내에 접종하여 3 x 105 세포/ml의 농도가 되게 한다. 성장 배지는, 제네티신(G418) 25ug/ml (GIBCO™ 카탈로그 번호 10131-027) 및 0.1% 플루로닉(Pluronic) F-68 (계면활성제, GIBCO™ 카탈로그 번호 24040-032)이 보충된 FreeStyle™ 293 발현 배지(GIBCO™ 카탈로그 번호 12338-018, Invitrogen, Carlsbad, CA)이다. 형질감염 배지는 최종 농도가 10mM HEPES 완충 용액 (GIBCO™ 카탈로그 번호 15630-080)인 FreeStyle™ 293 발현 배지 (GIBCO™ 카탈로그 번호 12338-018)이다. 형질감염을 위하여, 선택한 벡터 DNA를 첨가하여 1㎍(중쇄 + 경쇄)/ml의 농도를 달성하고, 최적화 실험에 따라 변화시킨다. PEI (폴리에틸렌이민), 선형, 25 kDa, 1mg/ml 멸균 원액(pH 7.0)[판매원: Polysciences, Inc., Warrington, PA]을 형질감염 매개제로서 1:2의 DNA:PEI 비로 첨가한다. 사용된 피딩(feeding) 배지는 트립톤 N1 배지 (Organotechnie France에서 시판하는 TN1 분말, 카탈로그 번호 19554, TekniScience Inc.(전화번호 1-800-267-9799)를 통해 구입가능함)이다. FreeStyle™ 293 발현 배지 중의 5% w/v 원액을 첨가하여 최종 농도가 0.5%가 되게 한다. 표준 실험실 장비가 일반적으로 사용된다. Cedex Cell Counting System[판매원: Innovatis, Bielefeld, Germany]을 사용한다.
각각의 소규모 형질감염을 125ml 에를렌마이어(Erlenmeyer) 플라스크에서 다음과 같이 수행한다. 새로운 배양 배지의 20ml의 분취액을 1x106 생존 세포(viable cell)/ml로 접종한다. (주의: 큰 용적의 경우, 배양물은 용기의 일반적인 용량의 20 내지 25% (예: 500ml 플라스크 중의 100ml의 배양물) 이어야 한다). 이어서, 배양물을 37℃ 배양기 안에 놓고 가습된 5% CO2의 대기에서 130 rpm 회전 속도로 배양한다.
DNA-PEI 복합체를, 형질감염 배지를 37℃로 수조에서 가온시키고, 냉동된 PEI 원액 및 DNA 용액 (-20℃에서 보관됨)을 실온에서 해동시켜 제조한다. 사용된 DNA 및 PEI의 양은 형질감염되는 배양물의 총 용적에 따른다. 2.5ml의 DNA/PEI 복합체 및 2.5ml의 Tn1이 있는 20ml의 배양물은 총 25㎍의 DNA 및 50㎍의 PEI를 요구한다. DNA:PEI 복합체(예: 10회 형질감염의 경우)를, 선택된 DNA 벡터를 함유하는 용액을 10㎍/ml의 최종 농도로 첨가한 12.5ml의 형질감염 배지와, PEI를 첨가한(20㎍/ml, 최종 농도) 12.5ml의 형질감염 배지를 튜브 A에 합하여 형성한다. PEI 혼합물을, DNA 용액과 혼합하기 약 10초 전에 와동시켜 혼합한다. PEI 및 DNA 혼합물을 합한 후, 배합물을 10초 동안 와동시켜 혼합한다. 이어서, 혼합물을 실온에서 15분 동안 (20분을 초과하지 않도록 함) 유지한다. 2.5ml의 DNA:PEI 복합체 용액을 20ml의 HEK-6E 세포 마다 첨가한다. 5% TN1 보충물을, 0.5%의 최종 농도로 각각의 플라스크에 형질감염 후 약 20 내지 24 시간 후에 첨가한다.
세포 밀도 및 생존률을 4일차 및 7일차에 측정한다. 세포 펠릿을 2ml의 배양물 분취액으로부터 수집하여 4일차에 웨스턴 분석 및 노던 블롯 분석을 한다. 펠릿을 분석할 때까지 -80℃에서 냉동시킨다. 세포를 형질감염 후 7일 후에 1000 rpm (10 분)에서 원심분리로 수거하고, 예비필터 종이 및 Corning 0.22㎛ CA 필터 시스템을 사용하여 상청액을 여과한다. 상청액 샘플을 또한 분석(예를 들어, ELISA 분석을 사용하여)할 때까지 -80℃에서 보관한다.
노던 블롯 분석을 위하여, 총 RNA를 일시적으로 형질감염된 293-6E 세포로부터 다음과 같이 분리한다. 냉동된 세포 펠릿을 얼음 상에서 해동시킨다. RNA를 Qiagen Rneasy Mini Kit[판매원: Qiagen, 카탈로그 번호 74104]를 사용하여 제조업자의 설명서에 따라 정제한다.
포름알데히드/아가로스 겔 제조는 다음과 같다. 2g의 아가로스[판매원: Ambion, 카탈로그 번호 9040]를 161.3ml의 증류수 중에 비등시킨다. 4ml의 1M MOPS(모폴리노프로판설폰산)(pH 7.0), 1ml의 1M NaOAc, 0.4ml의 0.5M EDTA를 첨가하고, 혼합물을 60℃로 냉각시킨다. 이어서, 33.3ml의 37% 포름알데히드[판매원: J.T. Baker, 카탈로그 번호 2106-01]를 첨가하고, 용융된 아가로스 용액을 서서히 혼합한다. 겔을 붓고 퓸 후드(fume hood)에서 고체화시킨다.
러닝 완충액을, 30ml의 1M MOPS (pH 7.0), 7ml의 1M NaOAc, 3ml의 0.5M EDTA 및 DEPC (디에틸피로카보네이트) 처리된 dH2O를 혼합하여 1.5로 제조한다.
RNA 샘플을, 3부 포름알데히드 로드(load) 염료[판매원: Ambion, 카탈로그 번호 8552]를 1부 RNA와 혼합하여 제조한다. 3 내지 5㎍의 RNA를 레인(lane)마다 러닝시킨다. 사용된 RNA 분자량 마커는 0.5 내지 10 Kb RNA Ladder[판매원: Invitrogen, 카탈로그 번호 15623-200]이다. 샘플을 65℃에서 5분 동안 가열하여 변성시키고 얼음 상에서 냉각시킨다. 이어서, 0.5㎕의 10㎍/㎕ 에티디움 브로마이드[판매원: Pierce, 카탈로그 번호 17898]를 각각의 샘플에 첨가한다. 각각의 샘플을 잠깐 회전시켜 액체를 펠렛팅한다.
겔 전기영동을 다음과 같이 수행한다. 포름알데히드/아가로스 겔을 러닝 완 충액으로 덮고, 샘플을 로딩하고 나서 150V에서 2시간 동안 퓸 후드에서 러닝시킨다. 밴드를 자외선 투조(transillumination)를 사용하여 가시화하고, 사진 촬영하여 영구적으로 기록한다.
모세관 전달을, DEPC-처리된 dH2O를 수회 교환하여 5분 동안 겔을 흡수시키는 방법으로 수행하여, 포름알데히드를 제거한다. 이어서, 겔을 50mM NaOH, 10mM NaCl 중에서 20분 동안 실온에서 흡수시켜, 임의의 이본쇄 RNA를 추가로 변성시킨다. 겔을 DEPC-처리된 dH2O 중에서 1회 헹구고 나서, 20X SSC (175.3g의 NaCl; 88.2g의 시트르산나트륨; 10mM NaOH로 pH를 약 7.0으로 조절, 용적을 1L로 조절함) 중에 20분 동안 실온에서 흡수시켜 중화시킨다. Hybond-N+ 막[판매원: Amersham Biosciences, 카탈로그 번호 RPN303B]을 흡수시키고, DEPC-처리된 dH2O 중에서 겔과 동일한 크기로 절단하여 적신다. 3M 필터 종이[판매원: Whatman 카탈로그 번호 3030917]를 겔 및 막과 동일한 크기로 자른다. 전달 시스템을, 20X SSC의 저장소 위에 고체 지지체 상에 3M 종이 층을 위치시켜 조립하여, 종이가 20X SSC를 가장 위에 조립될 층을 통해 위킹(wicking)하게 한다. 겔을 이 윅(wick), Hybond-N+ 막, 자른 3장의 3M 종이, 및 두껍게 쌓은 Gel Blot Paper[판매원: Schleicher & Schuell, 카탈로그 번호 10427920] 상에 위치시킨다. 편평한 지지체를 가장 위에 위치시키고, 필요에 따라, 중량(보통 작은 물병)을 추가하여 효율적인 모세관 전달이 일어나게 한다. 플라스틱 랩을 사용하여 공기에 노출된 임의의 저장소를 덮어 증발되지 않게 한다. 전달을, 하룻밤 동안 실온에서 진행시킨다. 이어서, 전달 시스템을 분해하고 블롯을 6X SSC 중에 흡수시켜 임의의 아가로스를 제거한다. 막을 공기 건조시키고 UV에 노출시켜 블롯을 교차결합시킨다.
DNA 프로브 주형은 D2E7의 중쇄 및 경쇄에 대한 암호화 영역이다. 100ng의 목적하는 주형을, AlkPhos Direct Labeling Reagents 키트(알칼리성 포스파타제 표지 시스템, Amersham Biosciences, 카탈로그 번호 RPN3680)를 제조업자의 설명서에 따라 사용하여 알칼리성 포스페이트로 표지한다. 예비하이브리드화 및 하이브리드화 단계를, 표지의 경우와 동일한 키트(하이브리드화 완충액을 함유함)를 사용하여 수행하였다. 막을 적어도 1시간 동안 65℃에서 하이브리드화 오븐에서 예비하이브리드화시키고, 프로브를 비등시켜 예비하이브리드화 완충액/블롯에 직접 첨가하였다. 하이브리드화를 하룻밤 동안 65℃에서 하이브리드화 오븐에서 수행하였다. 하이브리드화 용액을 경사분리(decantation)하고, 막을 2X SSC로 잠깐 세척하여 하이브리드화 용액을 제거하고 나서, 2X SSC, 0.1% SDS로 65℃에서 각 회마다 15분 동안 2회 세척하고, 최종적으로 0.1X SSC, 0.1% SDS로 65℃에서 각 회마다 15분 동안 2회 세척하였다. 밴드를 막 상에 시각화시키기 위하여, 화학발광을 사용하였다. 블롯을 CDP-Star Detection Reagent (1,2-디옥세탄 기질로부터의 포톱(photope)의 알칼리성 포스파타제-의존성 제품, Amersham Biosciences, 카탈로그 번호 RPN3682)로 5분 동안 실온에서 덮어씌웠다. 과량의 시약을 블롯으로부터 배수시키고 나서, 플라스틱 쉬트 보호장치에 넣었다. 블롯을 Kodak Biomax MR 필름 (엑스 레이 필름, Kodak, 카탈로그 번호 8952855)에 10초 동안 시작하여 최대 10분 동안 노출시켰다. 필름을 Kodak M35A X-OMAT Processor(엑스 레이 현상액/현상기) 를 사용하여 현상하였다.
웨스턴 블롯팅을 위한 세포 펠릿 샘플을 다음과 같이 제조하였다. 세포내 항체 발현의 분석을 위하여, 세포를 NP 40 Lysis 완충액 (50mM Tris-HCl (pH 7.5), 150mM NaCl, 1% NP40 (옥틸페놀폴리(에틸렌글리콜에테르)), 5mM BME, 및 프로테아제 억제제 칵테일 III) 중에, 얼음 상에서 10분 동안 항온처리하면서 용해시켰다. 막 및 불용성 단백질에 대한 분획을, 마이크로원심분리기를 사용하여 16,000 rpm에서 30분 동안 원심분리로 수집한다. 가용성 세포내, 또는 세포질 분획으로 지정된 상청액을 사용하여, DTT가 있는 SDS 로딩 완충액을 첨가하여 겔 분석을 하였다. 펠릿을 동일한 용적의 용해 완충액으로 현탁시키고, DTT가 있는 SDS 겔 로딩 완충액을 첨가하였다. 배양 상청액 샘플을 웨스턴 블롯을 위하여 다음과 같이 제조하였다. 배양 상청액을, MW 컷 오프가 30,000 달톤인 Centricon Ultra (한외여과 장치, Millipore)를 사용하여 농축시키거나, 직접 웨스턴 블롯팅에 사용하였다. 면역블롯팅(웨스턴 분석)을 위하여, 샘플을 NUPAGE 4 내지 12% Bis-Tris (폴리아크릴아미드) 겔에 용해시키고, 표준 방법을 사용하여 PVDF 막으로 이동시켰다. 막을 1시간 동안 차단 용액 (0.05% Tween 20 (폴리옥시에틸렌 소르비탄 모노라우레이트) 및 5% 분유를 함유한 PBS) 중에서 항온처리하고, 세척하여, DakoCytomation(덴마크)에서 시판하는 폴리클로날 래빗 항-사람 IgG/HRP 또는 폴리클로날 래빗 항-사람 카파 경쇄/HRP로 PBST 완충액 중의 1:1000 희석액에서 항온처리하고 나서, PBST를 3회 교환하여 실온에서 다시 세척하였다. GE/Amersham Biosciences(Piscataway, NJ)에서 시판하는 ECL Plus Western Blotting Detection (화학발광 및 화학형광 검 출) 시스템을 사용하여 검출하였다.
ELISA 검정을, 표준 방법을 사용하여, 염소 항-사람 IgG, UNLB 및 염소 항-사람 IgG/HRP [판매원: Southern Biotech(Birmingham, AL)]를 사용하고, PBS 중의 2% 밀크를 블롯팅 완충액으로서 사용하고, K-Blue (3,3', 5,5' 테트라메틸벤지딘 및 과산화수소(H2O2, Neogen, Lansing, MI)를 기질로서 사용하여 수행하였다. 플레이트를, Spectramax 마이크로플레이트 판독기로 650nm의 1차 파장 및 490nm의 참조 파장에서 판독하였다.
분비된 항체를, 표준 방법으로 단백질 A 아가로스 비드(bead)[판매원: Invitrogen(Carlsbad, CA)], Immuno Pure (A) IgG Binding Buffer[판매원: Pierce], 세척 완충액으로서 PBS (pH 7.4), 및 용출 완충액으로서 0.1M 아세트산/150mM NaCl(pH 3.5)(1M Tris pH 9.5를 사용하여 중화시킴)을 사용하여 친화도 정제하였다.
온전한 분자량의 측정. 작제물 pTT3 HC-int-LC P.hori로부터 생산된 D2E7 샘플의 온전한 분자량을 LC-MS로 분석하였다. 단백질 마이크로트랩(Michrom Bioresources, Inc. 카탈로그 번호 004/25109/03)이 있는 1100 모세관 HPLC 시스템(Agilent SN DE 14900659)을 사용하여 샘플을 탈염시키고 Q Star Pulsar i 질량 분광계(Applied Biosystems, SN K1820202) 내로 도입시켰다. 샘플을 용출시키기 위하여, 구배(gradient)를 완충액 A (HPLC 수 중의 0.08% FA, 0.02% TFA) 및 완충액 B (아세토니트릴 중의 0.08% FA 및 0.02% TFA)를 사용하여 50㎕/분의 유속으로 15분 동안 적용시켰다.
경쇄 중쇄 분자량의 측정. 작제물 pTT3 HC-int-LC P.hori로부터 생산된 천연 D2E7 샘플을 LC-MS로 분석하였다. 경쇄와 중쇄를 함께 연결시킨 이황화결합의 환원을 20mM DTT 중에서 37℃에서 30분 동안 수행하였다. PLRP-S 칼럼(Michrom Bioresources, Inc. 8㎛, 4000 Å, 1.0 x 150mm, P/N 901-00911-00)이 있는 1100 모세관 HPLC 시스템(Agilent SN DE 14900659)을 사용하여 경쇄를 중쇄로부터 분리시키고, Q Star Pulsar i 질량 분광계(Applied Biosystems, SN K1820202) 내로 도입시켰다. 칼럼을 60℃에서 가열하였다. 완충액 A (HPLC 수 중의 0.08% FA, 0.02% TFA) 및 완충액 B (아세토니트릴 중의 0.08% FA 및 0.02% TFA)를 사용하여 적용된 HPLC 구배를, 50㎕/분의 유속으로 60분 동안 적용시켜 샘플을 용출시켰다.
제한 엔도뉴클레아제는 New England Biolabs(Beverly, MA)로부터 구입하였다. 클로닝을 위하여 사용된 주문제작 올리고뉴클레오타이드, DNA 폴리머라제, DNA 리가제 및 이.콜라이 균주는 Invitrogen(Carlsbad, CA)으로부터 구입하였다. 프로테아제 억제제 칵테일 III는 Calbiochem(La Jolla, CA)으로부터 구입하였다. Qiagen(Valencia, CA) 제품을 사용하여 DNA 분리 및 정제를 하였다.
참조에 의한 인용 및 변형물에 관한 사항
본 특허원 전체에 걸쳐 언급된 모든 참조문헌, 예를 들면, 발행되거나 승인된 특허 또는 동등물을 포함하는 특허 문서; 특허 출원 공보; 비공개된 특허 출원; 및 비-특허 문헌 문서 또는 다른 출처 자료는, 개별적으로 참조로서 인용된 것처럼, 전문이 본원에 참조로서 인용된다. 인용된 참조문헌과 본 특허원의 공개가 불 일치하는 경우, 본원의 공개가 우선한다. 본원에서 제공된 일부 참조문헌은 참조로서 인용되어, 정보, 예를 들면, 본 발명의 출발 물질, 추가적인 출발 물질, 추가적인 시약, 추가적인 합성 방법, 추가적인 분석 방법, 추가적인 생물학적 물질, 추가적인 세포 및 추가적인 용도의 출처에 관한 세부사항을 제공한다.
본원에서 언급된 모든 특허 및 발행물은 본 발명과 관련된 당업자의 수준을 나타낸다. 본원에서 인용된 참조문헌은 공개 또는 출원일자를 기준으로 당업계의 기술 수준을 나타낼 수 있고, 이러한 정보는 본원에서 사용되어, 필요에 따라, 적격인 선행 기술에 있는 특정 양태를 제외할 수 있다. 예를 들면, 물질의 조성이 본원에서 청구된 경우, 공지되어 있고 출원인의 발명에 대해 적격인 선행 기술로서 이용가능한 화합물 (예: 가능하게 하는 공개가 본원에 인용된 참조문헌에 제공된 화합물)은, 본원에서 청구하는 물질의 조성에 포함되는 것으로 의도되지 않는다는 것을 이해하여야 한다.
이에 속한 임의의 첨부물(들)은 명세서 및/또는 도면의 일부분으로서 참조로서 인용된다.
"포함한다", "포함된", 또는 "포함하는"이라는 용어가 본원에서 사용되는 경우, 이들은 제시된 특징, 정수, 단계 또는 화합물의 존재를 구체화하지만, 하나 이상의 다른 특징, 정수, 단계, 구성요소 또는 이의 그룹의 존재 또는 추가를 제외하지 않는 것으로 해석되어야 한다. 따라서 본원에서 사용되는 바와 같이, "포함하는"은 "포함하는", "함유하는", "갖는", 또는 "~을 특징으로 하는"과 동의어이고, 포괄적이거나 제한이 없다. 본원에서 사용되는 "~로 이루어진"은 청구항 기술에 명시되지 않은 임의의 요소, 단계 또는 성분 등을 제외한다. 본원에서 사용되는 "~로 필수적으로 이루어진"은 청구항의 기본적이고 신규한 특징에 (예: 활성 성분과 관련하여) 실질적으로 영향을 주지 않는 물질 또는 단계를 제외하지 않는다. 본원의 각각의 예에서, 임의의 "포함하는", "~로 필수적으로 이루어진" 및 "~로 이루어진"이라는 용어는 다른 두 용어 중 하나로 대체되어, 반드시 동일한(coextensive) 것은 아닌 별도의 양태 및/또는 범위를 공개할 수 있다. 본원에서 설명적으로 기술한 본 발명은, 본원에서 구체적으로 공개되지 않은 임의의 요소(들) 또는 제한(들)의 부재 하에서 적당하게 실시될 수 있다.
범위 (예: 온도 범위, 시간 범위, 조성 또는 농도 범위, 또는 다른 값 범위 등)를 본원에서 공개하는 경우 마다, 주어진 범위 내에 포함된 모든 중간 범위 및 하위범위 뿐만 아니라 모든 개개의 값이 본 특허원에 포함되는 것으로 의도된다. 본 발명은, 예시 또는 설명으로 주어진, 임의의 도면에 제시되거나 명세서에서 예시된 것을 포함하는, 공개된 양태에 의해 한정되어서는 안된다. 본원의 설명에 포함된 범위 또는 하위범위 내의 임의의 하위범위 또는 개개의 값은 본원의 청구항에서 제외될 수 있다는 것을 이해할 것이다.
본 발명은 다양한 구체적이고/이거나 바람직한 양태 및 기술을 참조하여 기술되었다. 하지만, 많은 변이물 및 변형물이 본 발명의 취지 및 범위 내에 속하면서 제조될 수 있다는 것을 이해하여야 한다. 본원에서 구체적으로 기술된 것 이외의 조성, 방법, 장치, 장치 요소, 물질, 절차 및 기술은, 부적당한 실험에 의존하지 않고 본원에서 광범위하게 공개된 본 발명의 실시에서 사용될 수 있다는 것은 당업자에게 명백할 것이다; 이는, 예를 들면, 구체적으로 예시된 것 이외의 출발 물질, 생물학적 물질, 시약, 합성 방법, 정제 방법, 분석 방법, 검정 방법 및 생물학적 방법으로 확장될 수 있다. 앞서 본원에서 기술한 것 (예: 조성, 방법, 장치, 장치 요소, 물질, 절차 및 기술 등)의 모든 당업계에 공지된 기능적 동등물은 본 발명에 포함되는 것으로 의도된다. 사용된 용어 및 표현은 한정하는 용어가 아닌 설명하는 용어로서 사용되며, 이러한 용어 및 표현의 사용에 있어서 제시 및 기술된 특징의 임의의 동등물 또는 이의 일부를 제외시키는 의도가 없지만, 청구된 본 발명의 범위 내에서 다양한 변형물이 가능하다는 것이 인식된다. 따라서, 본 발명을 양태, 바람직한 양태 및 임의의 특징으로 구체적으로 공개하였지만, 본원에서 공개된 개념의 변형 및 변이는 당업자에게 의존할 수 있다는 것과, 이러한 변형물 및 변이물은 첨부된 청구항에 의해 정의된 본 발명의 범위 내에 있는 것으로 생각된다는 것을 이해하여야 한다.
추가적인 참조문헌
Figure 112008005047558-PCT00102
<110> Abbott Laboratories <120> Multiple gene expression including sORF constructs and methods with polyproteins, pro-proteins, and proteolysis <130> 74-05_WO <150> US 60/701,855 <151> 2005-07-21 <160> 158 <170> KopatentIn 1.71 <210> 1 <211> 4 <212> PRT <213> Artificial <220> <223> Synthetic: cleavage recognition site for furin. <220> <221> MISC_FEATURE <222> (2)..(3) <223> At position 2, Xaa can be any amino acid and at position 3, Xaa can be Arg or Lys. <400> 1 Arg Xaa Xaa Arg 1 <210> 2 <211> 5 <212> PRT <213> Artificial <220> <223> Recognition sequence for VP4 of IPNV. <220> <221> MISC_FEATURE <222> (1)..(4) <223> At position 1, Xaa can be Ser or Thr and at position 4, Xaa can be Ser or Ala. <400> 2 Xaa Xaa Ala Xaa Gly 1 5 <210> 3 <211> 7 <212> PRT <213> Artificial <220> <223> Recognition sequence for TEV protease. <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <400> 3 Glu Xaa Xaa Tyr Xaa Gln Gly 1 5 <210> 4 <211> 8 <212> PRT <213> Artificial <220> <223> recognition site for rhinovirus 3C protease <400> 4 Leu Glu Val Leu Phe Gln Gly Pro 1 5 <210> 5 <211> 6 <212> PRT <213> Artificial <220> <223> Recongition sequence of PC5/6 protease, LPC/PC7 protese and enterokinase. <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any amino acid. <400> 5 Asp Asp Asp Asp Lys Xaa 1 5 <210> 6 <211> 5 <212> PRT <213> Artificial <220> <223> Recognition seuqence for Factor Xa protease. <220> <221> MISC_FEATURE <222> (2)..(5) <223> At position 2 Xaa is Glu or Asp, and at position 5 Xaa can be any amino acid. <400> 6 Ile Xaa Gly Arg Xaa 1 5 <210> 7 <211> 7 <212> PRT <213> Artificial <220> <223> Recognition sequence for thrombin. <400> 7 Leu Val Gly Pro Arg Gly Ser 1 5 <210> 8 <211> 6 <212> PRT <213> Artificial <220> <223> Recognition sequence for genenase I. <400> 8 Pro Gly Ala Ala His Tyr 1 5 <210> 9 <211> 7 <212> PRT <213> Artificial <220> <223> Recognition sequence for MMP protease, N1a of turnip mosaic potyvirus and KEX2 protease. <400> 9 Met Tyr Lys Arg Glu Ala Asp 1 5 <210> 10 <211> 4 <212> PRT <213> Artificial <220> <223> Amino acod sequence of furin which targets protein to Trans Golgi Network. <400> 10 Glu Glu Asp Glu 1 <210> 11 <211> 24 <212> PRT <213> Artificial <220> <223> Internally cleavable signal peptide of influenza virus C. <400> 11 Met Gly Arg Met Ala Met Lys Trp Leu Val Val Ile Ile Cys Phe Ser 1 5 10 15 Ile Thr Ser Gln Pro Ala Ser Ala 20 <210> 12 <211> 19 <212> PRT <213> Artificial <220> <223> FMDV 2A sequence <400> 12 Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 13 <211> 19 <212> PRT <213> Artificial <220> <223> FMDV 2A sequence. <400> 13 Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 14 <211> 14 <212> PRT <213> Artificial <220> <223> FDMV 2A sequence. <400> 14 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 15 <211> 20 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 15 Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 16 <211> 19 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 16 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 1 5 10 15 Pro Phe Phe <210> 17 <211> 14 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 17 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 18 <211> 17 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 18 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 1 5 10 15 Pro <210> 19 <211> 24 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 19 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 1 5 10 15 Asp Val Glu Ser Asn Pro Gly Pro 20 <210> 20 <211> 58 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 20 Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro 1 5 10 15 Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys 20 25 30 Ile Val Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu 35 40 45 Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 50 55 <210> 21 <211> 10 <212> PRT <213> Artificial <220> <223> N-terminal sequence of D2E7 immunoglobulin heavy chain. <400> 21 Glu Val Gln Leu Val Glu Ser Gly Gly Gly 1 5 10 <210> 22 <211> 10 <212> PRT <213> Artificial <220> <223> N-terminal sequence of D2E7 immunoglobulin light chain. <400> 22 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser 1 5 10 <210> 23 <211> 22 <212> PRT <213> Artificial <220> <223> D2E7 light chain signal sequence. <400> 23 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys 20 <210> 24 <211> 20 <212> PRT <213> Artificial <220> <223> D2E7 signal peptide sequence in Construct H. <400> 24 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro 1 5 10 15 Gly Ser Arg Cys 20 <210> 25 <211> 15 <212> PRT <213> Artificial <220> <223> Amino acid sequence at end of intein and in start of light chain protein in Construct J. <400> 25 Met Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys 1 5 10 15 <210> 26 <211> 10 <212> PRT <213> Artificial <220> <223> N-terminal sequence of light chain in Construct H. <400> 26 Met Asp Met Arg Val Pro Ala Gln Leu Leu 1 5 10 <210> 27 <211> 22 <212> PRT <213> Artificial <220> <223> Amino acid sequence following intein in Construct L. <400> 27 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly 20 <210> 28 <211> 10 <212> PRT <213> Artificial <220> <223> Signal peptidase cleavage site sequence. <400> 28 Leu Ala Gly Phe Ala Thr Val Ala Gln Ala 1 5 10 <210> 29 <211> 2925 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 LC-LC-HC Polyprotein coding sequence. <220> <221> CDS <222> (1)..(2922) <400> 29 atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg 48 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 ttc ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc 96 Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser 20 25 30 ctg tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt 144 Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser 35 40 45 cag ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa 192 Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys 50 55 60 gcc cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc 240 Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val 65 70 75 80 cca tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc 288 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr 85 90 95 atc agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg 336 Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg 100 105 110 tat aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc 384 Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile 115 120 125 aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat 432 Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp 130 135 140 gag cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac 480 Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn 145 150 155 160 ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 528 Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu 165 170 175 caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac 576 Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp 180 185 190 agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac 624 Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr 195 200 205 gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc 672 Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser 210 215 220 tcg ccc gtc aca aag agc ttc aac agg gga agg tgt aag aga ctt ctc 720 Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu 225 230 235 240 aag ttg gca gga gac gtt gag tcc aac cct ggg ccc atg gac atg cgc 768 Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg 245 250 255 gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc ccc ggc tcg 816 Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser 260 265 270 cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg tct gca tct 864 Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser 275 280 285 gta ggg gac aga gtc acc atc act tgt cgg gca agt cag ggc atc aga 912 Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg 290 295 300 aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc cct aag ctc 960 Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu 305 310 315 320 ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca tct cgg ttc 1008 Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe 325 330 335 agt ggc agt gga tct ggg aca gat ttc act ctc acc atc agc agc cta 1056 Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu 340 345 350 cag cct gaa gat gtt gca act tat tac tgt caa agg tat aac cgt gca 1104 Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala 355 360 365 ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa cgt acg gtg 1152 Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val 370 375 380 gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa 1200 Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys 385 390 395 400 tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga 1248 Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg 405 410 415 gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac 1296 Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn 420 425 430 tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc tac agc 1344 Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser 435 440 445 ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa 1392 Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys 450 455 460 gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca 1440 Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr 465 470 475 480 aag agc ttc aac agg gga agg tgt aag aga ctt ctc aag ttg gca gga 1488 Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly 485 490 495 gac gtt gag tcc aac cct ggg ccc atg gag ttt ggg ctg agc tgg ctt 1536 Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu 500 505 510 ttt ctt gtc gcg att tta aaa ggt gtc cag tgt gag gtg cag ctg gtg 1584 Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val 515 520 525 gag tct ggg gga ggc ttg gta cag ccc ggc agg tcc ctg aga ctc tcc 1632 Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser 530 535 540 tgt gcg gcc tct gga ttc acc ttt gat gat tat gcc atg cac tgg gtc 1680 Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val 545 550 555 560 cgg caa gct cca ggg aag ggc ctg gaa tgg gtc tca gct atc act tgg 1728 Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp 565 570 575 aat agt ggt cac ata gac tat gcg gac tct gtg gag ggc cga ttc acc 1776 Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr 580 585 590 atc tcc aga gac aac gcc aag aac tcc ctg tat ctg caa atg aac agt 1824 Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser 595 600 605 ctg aga gct gag gat acg gcc gta tat tac tgt gcg aaa gtc tcg tac 1872 Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr 610 615 620 ctt agc acc gcg tcc tcc ctt gac tat tgg ggc caa ggt acc ctg gtc 1920 Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val 625 630 635 640 acc gtc tcg agt gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca 1968 Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala 645 650 655 ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg 2016 Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu 660 665 670 gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc 2064 Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly 675 680 685 gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca 2112 Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser 690 695 700 gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg 2160 Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu 705 710 715 720 ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc aac acc 2208 Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr 725 730 735 aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca 2256 Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr 740 745 750 tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca gtc ttc 2304 Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe 755 760 765 ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct 2352 Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro 770 775 780 gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc 2400 Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val 785 790 795 800 aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca 2448 Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr 805 810 815 aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc 2496 Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val 820 825 830 ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc 2544 Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys 835 840 845 aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc 2592 Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser 850 855 860 aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca 2640 Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro 865 870 875 880 tcc cgg gat gag ctg acc aag aac cag gtc agc ctg acc tgc ctg gtc 2688 Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val 885 890 895 aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg 2736 Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly 900 905 910 cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac 2784 Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp 915 920 925 ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg 2832 Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp 930 935 940 cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac 2880 Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His 945 950 955 960 aac cac tac acg cag aag agc ctc tcc ctg tct ccg ggt aaa tga 2925 Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 965 970 <210> 30 <211> 974 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 30 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser 20 25 30 Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser 35 40 45 Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys 50 55 60 Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr 85 90 95 Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg 100 105 110 Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile 115 120 125 Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp 130 135 140 Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn 145 150 155 160 Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu 165 170 175 Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp 180 185 190 Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr 195 200 205 Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser 210 215 220 Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu 225 230 235 240 Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg 245 250 255 Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser 260 265 270 Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser 275 280 285 Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg 290 295 300 Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu 305 310 315 320 Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe 325 330 335 Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu 340 345 350 Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala 355 360 365 Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val 370 375 380 Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys 385 390 395 400 Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg 405 410 415 Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn 420 425 430 Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser 435 440 445 Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys 450 455 460 Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr 465 470 475 480 Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly 485 490 495 Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu 500 505 510 Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val 515 520 525 Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser 530 535 540 Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val 545 550 555 560 Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp 565 570 575 Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr 580 585 590 Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser 595 600 605 Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr 610 615 620 Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val 625 630 635 640 Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala 645 650 655 Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu 660 665 670 Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly 675 680 685 Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser 690 695 700 Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu 705 710 715 720 Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr 725 730 735 Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr 740 745 750 Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe 755 760 765 Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro 770 775 780 Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val 785 790 795 800 Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr 805 810 815 Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val 820 825 830 Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys 835 840 845 Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser 850 855 860 Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro 865 870 875 880 Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val 885 890 895 Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly 900 905 910 Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp 915 920 925 Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp 930 935 940 Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His 945 950 955 960 Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 965 970 <210> 31 <211> 10323 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 LC-LC-HC Polyprotein Expression Vector. <400> 31 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggac 1260 atgcgcgtgc ccgcccagct gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc 1320 gacatccaga tgacccagtc tccatcctcc ctgtctgcat ctgtagggga cagagtcacc 1380 atcacttgtc gggcaagtca gggcatcaga aattacttag cctggtatca gcaaaaacca 1440 gggaaagccc ctaagctcct gatctatgct gcatccactt tgcaatcagg ggtcccatct 1500 cggttcagtg gcagtggatc tgggacagat ttcactctca ccatcagcag cctacagcct 1560 gaagatgttg caacttatta ctgtcaaagg tataaccgtg caccgtatac ttttggccag 1620 gggaccaagg tggaaatcaa acgtacggtg gctgcaccat ctgtcttcat cttcccgcca 1680 tctgatgagc agttgaaatc tggaactgcc tctgttgtgt gcctgctgaa taacttctat 1740 cccagagagg ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag 1800 gagagtgtca cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg 1860 ctgagcaaag cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc 1920 ctgagctcgc ccgtcacaaa gagcttcaac aggggaaggt gtaagagact tctcaagttg 1980 gcaggagacg ttgagtccaa ccctgggccc atggacatgc gcgtgcccgc ccagctgctg 2040 ggcctgctgc tgctgtggtt ccccggctcg cgatgcgaca tccagatgac ccagtctcca 2100 tcctccctgt ctgcatctgt aggggacaga gtcaccatca cttgtcgggc aagtcagggc 2160 atcagaaatt acttagcctg gtatcagcaa aaaccaggga aagcccctaa gctcctgatc 2220 tatgctgcat ccactttgca atcaggggtc ccatctcggt tcagtggcag tggatctggg 2280 acagatttca ctctcaccat cagcagccta cagcctgaag atgttgcaac ttattactgt 2340 caaaggtata accgtgcacc gtatactttt ggccagggga ccaaggtgga aatcaaacgt 2400 acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga 2460 actgcctctg ttgtgtgcct gctgaataac ttctatccca gagaggccaa agtacagtgg 2520 aaggtggata acgccctcca atcgggtaac tcccaggaga gtgtcacaga gcaggacagc 2580 aaggacagca cctacagcct cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa 2640 cacaaagtct acgcctgcga agtcacccat cagggcctga gctcgcccgt cacaaagagc 2700 ttcaacaggg gaaggtgtaa gagacttctc aagttggcag gagacgttga gtccaaccct 2760 gggcccatgg agtttgggct gagctggctt tttcttgtcg cgattttaaa aggtgtccag 2820 tgtgaggtgc agctggtgga gtctggggga ggcttggtac agcccggcag gtccctgaga 2880 ctctcctgtg cggcctctgg attcaccttt gatgattatg ccatgcactg ggtccggcaa 2940 gctccaggga agggcctgga atgggtctca gctatcactt ggaatagtgg tcacatagac 3000 tatgcggact ctgtggaggg ccgattcacc atctccagag acaacgccaa gaactccctg 3060 tatctgcaaa tgaacagtct gagagctgag gatacggccg tatattactg tgcgaaagtc 3120 tcgtacctta gcaccgcgtc ctcccttgac tattggggcc aaggtaccct ggtcaccgtc 3180 tcgagtgcgt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc 3240 tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga accggtgacg 3300 gtgtcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag 3360 tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc 3420 cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt 3480 gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 3540 gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 3600 acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 3660 aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 3720 tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 3780 ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 3840 atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 3900 gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 3960 gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 4020 cccgtgctgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 4080 aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 4140 tacacgcaga agagcctctc cctgtctccg ggtaaatgag aattagtcta ctcgcaaggg 4200 gcggccgcgt ttaaactgaa tgagcgcgtc catccagaca tgataagata cattgatgag 4260 tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat 4320 gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc 4380 attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag caagtaaaac 4440 ctctacaaat gtggtatggc tgattatgat ccggctgcct cgcgcgtttc ggtgatgacg 4500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 4560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 4620 ccatgaccgg tcgacggcgc gccttttttt ttaattttta ttttatttta tttttgacgc 4680 gccgaaggcg cgatctgagc tcggtacagc ttggctgtgg aatgtgtgtc agttagggtg 4740 tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 4800 agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 4860 tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 4920 gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 4980 cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5040 aggcttttgc aaaaagctcc tcgaggaact gaaaaaccag aaagttaact ggtaagttta 5100 gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct 5160 cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa 5220 gctgcggaat tgtacccgcg gcctaatacg actcactata gggactagta tggttcgacc 5280 attgaactgc atcgtcgccg tgtcccaaaa tatggggatt ggcaagaacg gagacctacc 5340 ctggcctccg ctcaggaacg agttcaagta cttccaaaga atgaccacaa cctcttcagt 5400 ggaaggtaaa cagaatctgg tgattatggg taggaaaacc tggttctcca ttcctgagaa 5460 gaatcgacct ttaaaggaca gaattaatat agttctcagt agagaactca aagaaccacc 5520 acgaggagct cattttcttg ccaaaagttt agatgatgcc ttaagactta ttgaacaacc 5580 ggaattggca agtaaagtag acatggtttg gatagtcgga ggcagttctg tttaccagga 5640 agccatgaat caaccaggcc acctcagact ctttgtgaca aggatcatgc aggaatttga 5700 aagtgacacg tttttcccag aaattgattt ggggaaatat aaacttctcc cagaataccc 5760 aggcgtcctc tctgaggtcc aggaggaaaa aggcatcaag tataagtttg aagtctacga 5820 gaagaaagac taagcggccg agcgcgcgga tctggaaacg ggagatgggg gaggctaact 5880 gaagcacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag 5940 aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg 6000 gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt 6060 ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc 6120 ggcaggccct gccatagcca ctggccccgt gggttaggga cggggtcccc catggggaat 6180 ggtttatggt tcgtgggggt tattattttg ggcgttgcgt ggggtctgga gatcccccgg 6240 gctgcaggaa ttccgttaca ttacttacgg taaatggccc gcctggctga ccgcccaacg 6300 acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 6360 tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 6420 tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 6480 attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 6540 tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 6600 ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 6660 accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaaagg 6720 gcgggaattc gagctcggta ctcgagcggt gttccgcggt cctcctcgta tagaaactcg 6780 gaccactctg agacgaaggc tcgcgtccag gccagcacga aggaggctaa gtgggagggg 6840 tagcggtcgt tgtccactag ggggtccact cgctccaggg tgtgaagaca catgtcgccc 6900 tcttcggcat caaggaaggt gattggttta taggtgtagg ccacgtgacc gggtgttcct 6960 gaaggggggc tataaaaggg ggtgggggcg cgttcgtcct cactctcttc cgcatcgctg 7020 tctgcgaggg ccagctgttg ggctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 7080 actcttggat cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc 7140 gagtccgcat cgaccggatc ggaaaacctc tcgactgttg gggtgagtac tccctctcaa 7200 aagcgggcat gacttctgcg ctaagattgt cagtttccaa aaacgaggag gatttgatat 7260 tcacctggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca gaaaagacaa 7320 tctttttgtt gtcaagcttg aggtgtggca ggcttgagat ctggccatac acttgagtga 7380 caatgacatc cactttgcct ttctctccac aggtgtccac tcccaggtcc aaccggaatt 7440 gtacccgcgg ccagagcttg cgggcgccac cgcggccgcg gggatccaga catgataaga 7500 tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 7560 gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 7620 aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttcg 7680 gatcctcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 7740 aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 7800 gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 7860 gtgccagctg cattaatgaa tcggccaacg cgcggggaaa ggcggtttgc gtattgggcg 7920 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 7980 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 8040 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 8100 gttcttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 8160 gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 8220 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 8280 aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 8340 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 8400 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 8460 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 8520 gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 8580 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 8640 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 8700 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 8760 ggtcatgaga ttatcaaaaa ggatcttcac ctagatccct tttaattaaa aatgaagttt 8820 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 8880 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 8940 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 9000 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 9060 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 9120 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 9180 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 9240 atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 9300 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 9360 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 9420 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 9480 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 9540 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 9600 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 9660 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 9720 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 9780 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 9840 aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 9900 gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca 9960 catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 10020 ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc 10080 agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag 10140 gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt gggaagggcg 10200 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 10260 attaagttgg gtaacgccag ggttttccca gttacgacgt tgtaaaacga cggccagtga 10320 att 10323 <210> 32 <211> 2835 <212> DNA <213> Artificial <220> <223> Synthetic construct, coding seuqence for ABT-007 polyprotein. <220> <221> CDS <222> (1)..(2832) <400> 32 atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgt cag gtg cag ctg cag gag tcg ggc cca gga ctg gtg aag 96 Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys 20 25 30 cct tcg gag acc ctg tcc ctc acc tgc act gtc tct ggt gcc tcc atc 144 Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile 35 40 45 agt agt tac tac tgg agc tgg atc cgg cag ccc cca ggg aag gga ctg 192 Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu 50 55 60 gag tgg att ggg tat atc ggg ggg gag ggg agc acc aac tac aac ccc 240 Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro 65 70 75 80 tcc ctc aag agt cga gtc acc ata tca gta gac acg tcc aag aac cag 288 Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln 85 90 95 ttc tcc ctg aag ctg agg tct gtg acc gct gcg gac acg gcc gtg tat 336 Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr 100 105 110 tac tgt gcg aga gag cga ctg ggg atc ggg gac tac tgg ggc cag gga 384 Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly 115 120 125 acc ctg gtc acc gtc tcc tca gcg tcg acc aag ggc cca tcg gtc ttc 432 Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe 130 135 140 ccc ctg gcg ccc tgc tct aga agc acc tcc gag agc aca gcg gcc ctg 480 Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu 145 150 155 160 ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg 528 Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp 165 170 175 aac tca ggc gct ctg acc agc ggc gtg cac acc ttc cca gct gtc ctg 576 Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu 180 185 190 cag tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc 624 Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser 195 200 205 agc aac ttc ggc acc cag acc tac aca tgc aac gta gat cac aag ccc 672 Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro 210 215 220 agc aac acc aag gtg gac aag aca gtt gag cgc aaa tgt tgt gtc gag 720 Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu 225 230 235 240 tgc cca ccg tgc cca gca cca cct gtg gca gga ccg tca gtc ttc ctc 768 Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu 245 250 255 ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag 816 Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu 260 265 270 gtc acg tgc gtg gtg gtg gac gtg agc cac gaa gac ccc gag gtc cag 864 Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln 275 280 285 ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag 912 Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys 290 295 300 cca cgg gag gag cag ttc aac agc acg ttc cgt gtg gtc agc gtc ctc 960 Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu 305 310 315 320 acc gtt gtg cac cag gac tgg ctg aac ggc aag gag tac aag tgc aag 1008 Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys 325 330 335 gtc tcc aac aaa ggc ctc cca gcc ccc atc gag aaa acc atc tcc aaa 1056 Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys 340 345 350 acc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc 1104 Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser 355 360 365 cgg gag gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa 1152 Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys 370 375 380 ggc ttc tac ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag 1200 Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln 385 390 395 400 ccg gag aac aac tac aag acc aca cct ccc atg ctg gac tcc gac ggc 1248 Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly 405 410 415 tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag 1296 Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln 420 425 430 cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac 1344 Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn 435 440 445 cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca 1392 His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro 450 455 460 gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca 1440 Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro 465 470 475 480 ata tcg agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca 1488 Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr 485 490 495 aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag 1536 Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys 500 505 510 cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat 1584 His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His 515 520 525 ggt gtg ttc aag gta aag aat acc aca act ttg caa caa cac ctc att 1632 Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile 530 535 540 gat ggg agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca 1680 Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro 545 550 555 560 ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata 1728 Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile 565 570 575 tgt ctt gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt 1776 Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val 580 585 590 tca gat act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa 1824 Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys 595 600 605 cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca 1872 His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser 610 615 620 act aga gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc 1920 Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr 625 630 635 640 aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta 1968 Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu 645 650 655 ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat 2016 Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn 660 665 670 gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct 2064 Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro 675 680 685 gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa 2112 Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu 690 695 700 tta gtc tac tcg caa ggg atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2160 Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu 705 710 715 720 ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc cag ctg acc caa 2208 Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln 725 730 735 tct cca tcc tcc ctg tct gca tct gta gga gac aga gtc acc atc act 2256 Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr 740 745 750 tgc cgg gca agt cag ggc att aga aat gat tta ggc tgg tat cag cag 2304 Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln 755 760 765 aaa cca ggg aaa gcc cct aag cgc ctg atc tat gct gca tcc agt ttg 2352 Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu 770 775 780 caa agt ggg gtc cca tca agg ttc agc ggc agt gga tct ggg aca gaa 2400 Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu 785 790 795 800 ttc act ctc aca atc agc agc ctg cag cct gaa gat ttt gca act tat 2448 Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr 805 810 815 tac tgt cta cag cat aat act tac cct ccg acg ttc ggc caa ggg acc 2496 Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr 820 825 830 aag gtg gaa atc aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc 2544 Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe 835 840 845 ccg cca tct gat gag cag ttg aaa tct gga act gcc tct gtt gtg tgc 2592 Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys 850 855 860 ctg ctg aat aac ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg 2640 Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val 865 870 875 880 gat aac gcc ctc caa tcg ggt aac tcc cag gag agt gtc aca gag cag 2688 Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln 885 890 895 gac agc aag gac agc acc tac agc ctc agc agc acc ctg acg ctg agc 2736 Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser 900 905 910 aaa gca gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat 2784 Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His 915 920 925 cag ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt 2832 Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 930 935 940 tga 2835 <210> 33 <211> 944 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 33 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys 20 25 30 Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile 35 40 45 Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu 50 55 60 Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro 65 70 75 80 Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln 85 90 95 Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr 100 105 110 Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly 115 120 125 Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe 130 135 140 Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu 145 150 155 160 Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp 165 170 175 Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu 180 185 190 Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser 195 200 205 Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro 210 215 220 Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu 225 230 235 240 Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu 245 250 255 Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu 260 265 270 Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln 275 280 285 Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys 290 295 300 Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu 305 310 315 320 Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys 325 330 335 Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys 340 345 350 Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser 355 360 365 Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys 370 375 380 Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln 385 390 395 400 Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly 405 410 415 Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln 420 425 430 Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn 435 440 445 His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro 450 455 460 Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro 465 470 475 480 Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr 485 490 495 Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys 500 505 510 His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His 515 520 525 Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile 530 535 540 Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro 545 550 555 560 Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile 565 570 575 Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val 580 585 590 Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys 595 600 605 His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser 610 615 620 Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr 625 630 635 640 Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu 645 650 655 Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn 660 665 670 Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro 675 680 685 Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu 690 695 700 Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu 705 710 715 720 Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln 725 730 735 Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr 740 745 750 Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln 755 760 765 Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu 770 775 780 Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu 785 790 795 800 Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr 805 810 815 Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr 820 825 830 Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe 835 840 845 Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys 850 855 860 Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val 865 870 875 880 Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln 885 890 895 Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser 900 905 910 Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His 915 920 925 Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 930 935 940 <210> 34 <211> 10212 <212> DNA <213> Artificial <220> <223> Synthetic construct, ABT-007 polyprotein expression vector. <400> 34 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320 ctgcaggagt cgggcccagg actggtgaag ccttcggaga ccctgtccct cacctgcact 1380 gtctctggtg cctccatcag tagttactac tggagctgga tccggcagcc cccagggaag 1440 ggactggagt ggattgggta tatcgggggg gaggggagca ccaactacaa cccctccctc 1500 aagagtcgag tcaccatatc agtagacacg tccaagaacc agttctccct gaagctgagg 1560 tctgtgaccg ctgcggacac ggccgtgtat tactgtgcga gagagcgact ggggatcggg 1620 gactactggg gccagggaac cctggtcacc gtctcctcag cgtcgaccaa gggcccatcg 1680 gtcttccccc tggcgccctg ctctagaagc acctccgaga gcacagcggc cctgggctgc 1740 ctggtcaagg actacttccc cgaaccggtg acggtgtcgt ggaactcagg cgctctgacc 1800 agcggcgtgc acaccttccc agctgtcctg cagtcctcag gactctactc cctcagcagc 1860 gtggtgaccg tgccctccag caacttcggc acccagacct acacatgcaa cgtagatcac 1920 aagcccagca acaccaaggt ggacaagaca gttgagcgca aatgttgtgt cgagtgccca 1980 ccgtgcccag caccacctgt ggcaggaccg tcagtcttcc tcttcccccc aaaacccaag 2040 gacaccctca tgatctcccg gacccctgag gtcacgtgcg tggtggtgga cgtgagccac 2100 gaagaccccg aggtccagtt caactggtac gtggacggcg tggaggtgca taatgccaag 2160 acaaagccac gggaggagca gttcaacagc acgttccgtg tggtcagcgt cctcaccgtt 2220 gtgcaccagg actggctgaa cggcaaggag tacaagtgca aggtctccaa caaaggcctc 2280 ccagccccca tcgagaaaac catctccaaa accaaagggc agccccgaga accacaggtg 2340 tacaccctgc ccccatcccg ggaggagatg accaagaacc aggtcagcct gacctgcctg 2400 gtcaaaggct tctaccccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 2460 aacaactaca agaccacacc tcccatgctg gactccgacg gctccttctt cctctacagc 2520 aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 2580 catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctag gggtaaacgc 2640 gaaccagttt atttccaggg gagcttgttt aaggggccgc gtgattataa cccaatatcg 2700 agtgccattt gtcatctaac gaatgaatct gatgggcaca caacatcgtt gtatggtatt 2760 ggttttggcc ctttcatcat cacaaacaag catttgttta gaagaaataa tggtacactg 2820 ttagttcaat cactacatgg tgtgttcaag gtaaagaata ccacaacttt gcaacaacac 2880 ctcattgatg ggagggacat gatgctcatt cgcatgccta aggatttccc accatttcct 2940 caaaagctga aattcagaga gccacaaagg gaagagcgca tatgtcttgt gacaaccaac 3000 ttccaaacta agagcatgtc tagcatggtt tcagatacta gttgcacatt cccttcatct 3060 gatggtatat tctggaaaca ttggattcag accaaggatg ggcactgtgg tagcccgttg 3120 gtgtcaacta gagatgggtt tattgttggt atacactcag catcaaattt caccaacaca 3180 aacaattatt ttacaagtgt gccgaaagac ttcatggatt tattgacaaa tcaagaggcg 3240 cagcaatggg ttagtggttg gcgattgaat gctgactcag tgttatgggg aggccacaaa 3300 gttttcatga gcaaacctga agaacccttt cagccagtca aagaagcaac tcaactcatg 3360 agtgaattag tctactcgca agggatgcgc gtgcccgccc agctgctggg cctgctgctg 3420 ctgtggttcc ccggctcgcg atgcgacatc cagctgaccc aatctccatc ctccctgtct 3480 gcatctgtag gagacagagt caccatcact tgccgggcaa gtcagggcat tagaaatgat 3540 ttaggctggt atcagcagaa accagggaaa gcccctaagc gcctgatcta tgctgcatcc 3600 agtttgcaaa gtggggtccc atcaaggttc agcggcagtg gatctgggac agaattcact 3660 ctcacaatca gcagcctgca gcctgaagat tttgcaactt attactgtct acagcataat 3720 acttaccctc cgacgttcgg ccaagggacc aaggtggaaa tcaaacgtac ggtggctgca 3780 ccatctgtct tcatcttccc gccatctgat gagcagttga aatctggaac tgcctctgtt 3840 gtgtgcctgc tgaataactt ctatcccaga gaggccaaag tacagtggaa ggtggataac 3900 gccctccaat cgggtaactc ccaggagagt gtcacagagc aggacagcaa ggacagcacc 3960 tacagcctca gcagcaccct gacgctgagc aaagcagact acgagaaaca caaagtctac 4020 gcctgcgaag tcacccatca gggcctgagc tcgcccgtca caaagagctt caacagggga 4080 gagtgttgag cggccgcgtt taaactgaat gagcgcgtcc atccagacat gataagatac 4140 attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 4200 atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 4260 aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 4320 aagtaaaacc tctacaaatg tggtatggct gattatgatc cggctgcctc gcgcgtttcg 4380 gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 4440 aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 4500 ggggcgcagc catgaccggt cgacggcgcg cctttttttt taatttttat tttattttat 4560 ttttgacgcg ccgaaggcgc gatctgagct cggtacagct tggctgtgga atgtgtgtca 4620 gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct 4680 caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 4740 aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc 4800 cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt tttttattta 4860 tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt 4920 tggaggccta ggcttttgca aaaagctcct cgaggaactg aaaaaccaga aagttaactg 4980 gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 5040 agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag tgttacttct 5100 gctctaaaag ctgcggaatt gtacccgcgg cctaatacga ctcactatag ggactagtat 5160 ggttcgacca ttgaactgca tcgtcgccgt gtcccaaaat atggggattg gcaagaacgg 5220 agacctaccc tggcctccgc tcaggaacga gttcaagtac ttccaaagaa tgaccacaac 5280 ctcttcagtg gaaggtaaac agaatctggt gattatgggt aggaaaacct ggttctccat 5340 tcctgagaag aatcgacctt taaaggacag aattaatata gttctcagta gagaactcaa 5400 agaaccacca cgaggagctc attttcttgc caaaagttta gatgatgcct taagacttat 5460 tgaacaaccg gaattggcaa gtaaagtaga catggtttgg atagtcggag gcagttctgt 5520 ttaccaggaa gccatgaatc aaccaggcca cctcagactc tttgtgacaa ggatcatgca 5580 ggaatttgaa agtgacacgt ttttcccaga aattgatttg gggaaatata aacttctccc 5640 agaataccca ggcgtcctct ctgaggtcca ggaggaaaaa ggcatcaagt ataagtttga 5700 agtctacgag aagaaagact aagcggccga gcgcgcggat ctggaaacgg gagatggggg 5760 aggctaactg aagcacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata 5820 aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc 5880 ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt 5940 ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa 6000 cgtcggggcg gcaggccctg ccatagccac tggccccgtg ggttagggac ggggtccccc 6060 atggggaatg gtttatggtt cgtgggggtt attattttgg gcgttgcgtg gggtctggag 6120 atcccccggg ctgcaggaat tccgttacat tacttacggt aaatggcccg cctggctgac 6180 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 6240 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 6300 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 6360 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 6420 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 6480 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 6540 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 6600 cgcaaaaggg cgggaattcg agctcggtac tcgagcggtg ttccgcggtc ctcctcgtat 6660 agaaactcgg accactctga gacgaaggct cgcgtccagg ccagcacgaa ggaggctaag 6720 tgggaggggt agcggtcgtt gtccactagg gggtccactc gctccagggt gtgaagacac 6780 atgtcgccct cttcggcatc aaggaaggtg attggtttat aggtgtaggc cacgtgaccg 6840 ggtgttcctg aaggggggct ataaaagggg gtgggggcgc gttcgtcctc actctcttcc 6900 gcatcgctgt ctgcgagggc cagctgttgg gctcgcggtt gaggacaaac tcttcgcggt 6960 ctttccagta ctcttggatc ggaaacccgt cggcctccga acggtactcc gccaccgagg 7020 gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgactgttgg ggtgagtact 7080 ccctctcaaa agcgggcatg acttctgcgc taagattgtc agtttccaaa aacgaggagg 7140 atttgatatt cacctggccc gcggtgatgc ctttgagggt ggccgcgtcc atctggtcag 7200 aaaagacaat ctttttgttg tcaagcttga ggtgtggcag gcttgagatc tggccataca 7260 cttgagtgac aatgacatcc actttgcctt tctctccaca ggtgtccact cccaggtcca 7320 accggaattg tacccgcggc cagagcttgc gggcgccacc gcggccgcgg ggatccagac 7380 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 7440 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 7500 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 7560 gttttttcgg atcctcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 7620 tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 7680 ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7740 aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggaaag gcggtttgcg 7800 tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7860 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7920 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7980 gttgctggcg ttcttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 8040 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 8100 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8160 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8220 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8280 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8340 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8400 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 8460 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8520 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8580 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8640 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccctt ttaattaaaa 8700 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8760 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8820 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8880 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8940 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 9000 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 9060 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9120 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9180 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9240 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9300 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9360 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9420 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9480 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9540 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9600 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9660 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9720 atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta 9780 taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 9840 cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 9900 cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 9960 tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag 10020 atgcgtaagg agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg 10080 ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 10140 tgcaaggcga ttaagttggg taacgccagg gttttcccag ttacgacgtt gtaaaacgac 10200 ggccagtgaa tt 10212 <210> 35 <211> 2853 <212> DNA <213> Artificial <220> <223> Synthetic construct, sequence encoding ABT-874 (J695) TEV Polyprotein. <220> <221> CDS <222> (1)..(2850) <400> 35 atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgt cag gtg cag ctg gtg gag tct ggg gga ggc gtg gtc cag 96 Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln 20 25 30 cct ggg agg tcc ctg aga ctc tcc tgt gca gcg tct gga ttc acc ttc 144 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 agt agc tat ggc atg cac tgg gtc cgc cag gct cca ggc aag ggg ctg 192 Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 gag tgg gtg gca ttt ata cgg tat gat gga agt aat aaa tac tat gca 240 Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala 65 70 75 80 gac tcc gtg aag ggc cga ttc acc atc tcc aga gac aat tcc aag aac 288 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn 85 90 95 acg ctg tat ctg cag atg aac agc ctg aga gct gag gac acg gct gtg 336 Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 tat tac tgt aag acc cat ggt agc cat gac aac tgg ggc caa ggg aca 384 Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr 115 120 125 atg gtc acc gtc tct tca gcg tcg acc aag ggc cca tcg gtc ttc ccc 432 Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro 130 135 140 ctg gca ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc 480 Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly 145 150 155 160 tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac 528 Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn 165 170 175 tca ggc gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag 576 Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln 180 185 190 tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc 624 Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser 195 200 205 agc ttg ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc 672 Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser 210 215 220 aac acc aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act 720 Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr 225 230 235 240 cac aca tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca 768 His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser 245 250 255 gtc ttc ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg 816 Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg 260 265 270 acc cct gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct 864 Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro 275 280 285 gag gtc aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc 912 Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala 290 295 300 aag aca aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc 960 Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val 305 310 315 320 agc gtc ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac 1008 Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr 325 330 335 aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc 1056 Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr 340 345 350 atc tcc aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg 1104 Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu 355 360 365 ccc cca tcc cgc gag gag atg acc aag aac cag gtc agc ctg acc tgc 1152 Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys 370 375 380 ctg gtc aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc 1200 Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser 385 390 395 400 aat ggg cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac 1248 Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp 405 410 415 tcc gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc 1296 Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser 420 425 430 agg tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct 1344 Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala 435 440 445 ctg cac aac cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa 1392 Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys 450 455 460 cgc gaa cca gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat 1440 Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp 465 470 475 480 tat aac cca ata tcg agt gcc att tgt cat cta acg aat gaa tct gat 1488 Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp 485 490 495 ggg cac aca aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc 1536 Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile 500 505 510 aca aac aag cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa 1584 Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln 515 520 525 tca cta cat ggt gtg ttc aag gta aag aat acc aca act ttg caa caa 1632 Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln 530 535 540 cac ctc att gat ggg agg gac atg atg ctc att cgc atg cct aag gat 1680 His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp 545 550 555 560 ttc cca cca ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa 1728 Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu 565 570 575 gag cgc ata tgt ctt gtg aca acc aac ttc caa act aag agc atg tct 1776 Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser 580 585 590 agc atg gtt tca gat act agt tgc aca ttc cct tca tct gat ggt ata 1824 Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile 595 600 605 ttc tgg aaa cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg 1872 Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro 610 615 620 ttg gtg tca act aga gat ggg ttt att gtt ggt ata cac tca gca tca 1920 Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser 625 630 635 640 aat ttc acc aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc 1968 Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe 645 650 655 atg gat tta ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg 2016 Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp 660 665 670 cga ttg aat gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg 2064 Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met 675 680 685 agc aaa cct gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc 2112 Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu 690 695 700 atg agt gaa tta gtc tac tcg caa ggg atg act tgg acc cca ctc ctc 2160 Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu 705 710 715 720 ttc ctc acc ctc ctc ctc cac tgc aca gga agc tta tcc cag tct gtg 2208 Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val 725 730 735 ctg act cag ccc ccc tca gtg tct ggg gcc ccc ggg cag aga gtc acc 2256 Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr 740 745 750 atc tct tgt tct gga agc aga tcc aac atc ggc agt aat act gta aag 2304 Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys 755 760 765 tgg tat cag cag ctc cca gga acg gcc ccc aaa ctc ctc atc tat tac 2352 Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr 770 775 780 aat gat cag cgg ccc tca ggg gtc cct gac cga ttc tct gga tcc aag 2400 Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys 785 790 795 800 tct ggc acc tca gcc tcc ctc gcc atc act ggg ctc cag gct gaa gac 2448 Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp 805 810 815 gag gct gac tat tac tgc cag tca tat gac aga tac acc cac ccc gcc 2496 Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala 820 825 830 ctg ctc ttc gga act ggg acc aag gtc aca gta cta ggt cag ccc aag 2544 Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys 835 840 845 gct gcc ccc tcg gtc act ctg ttc ccg ccc tcc tct gag gag ctt caa 2592 Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln 850 855 860 gcc aac aag gcc aca ctg gtg tgt ctc ata agt gac ttc tac ccg gga 2640 Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly 865 870 875 880 gcc gtg aca gtg gcc tgg aag gca gat agc agc ccc gtc aag gcg gga 2688 Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly 885 890 895 gtg gag acc acc aca ccc tcc aaa caa agc aac aac aag tac gcg gcc 2736 Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala 900 905 910 agc agc tac ctg agc ctg acg cct gag cag tgg aag tcc cac aga agc 2784 Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser 915 920 925 tac agc tgc cag gtc acg cat gaa ggg agc acc gtg gag aag aca gtg 2832 Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val 930 935 940 gcc cct aca gaa tgt tca tga 2853 Ala Pro Thr Glu Cys Ser 945 950 <210> 36 <211> 950 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 36 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln 20 25 30 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala 65 70 75 80 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn 85 90 95 Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr 115 120 125 Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro 130 135 140 Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly 145 150 155 160 Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn 165 170 175 Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln 180 185 190 Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser 195 200 205 Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser 210 215 220 Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr 225 230 235 240 His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser 245 250 255 Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg 260 265 270 Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro 275 280 285 Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala 290 295 300 Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val 305 310 315 320 Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr 325 330 335 Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr 340 345 350 Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu 355 360 365 Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys 370 375 380 Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser 385 390 395 400 Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp 405 410 415 Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser 420 425 430 Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala 435 440 445 Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys 450 455 460 Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp 465 470 475 480 Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp 485 490 495 Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile 500 505 510 Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln 515 520 525 Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln 530 535 540 His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp 545 550 555 560 Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu 565 570 575 Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser 580 585 590 Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile 595 600 605 Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro 610 615 620 Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser 625 630 635 640 Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe 645 650 655 Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp 660 665 670 Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met 675 680 685 Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu 690 695 700 Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu 705 710 715 720 Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val 725 730 735 Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr 740 745 750 Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys 755 760 765 Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr 770 775 780 Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys 785 790 795 800 Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp 805 810 815 Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala 820 825 830 Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys 835 840 845 Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln 850 855 860 Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly 865 870 875 880 Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly 885 890 895 Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala 900 905 910 Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser 915 920 925 Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val 930 935 940 Ala Pro Thr Glu Cys Ser 945 950 <210> 37 <211> 10230 <212> DNA <213> Artificial <220> <223> Synthetic construct, ABT-874 TEV polyprotein expression vector. <400> 37 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320 ctggtggagt ctgggggagg cgtggtccag cctgggaggt ccctgagact ctcctgtgca 1380 gcgtctggat tcaccttcag tagctatggc atgcactggg tccgccaggc tccaggcaag 1440 gggctggagt gggtggcatt tatacggtat gatggaagta ataaatacta tgcagactcc 1500 gtgaagggcc gattcaccat ctccagagac aattccaaga acacgctgta tctgcagatg 1560 aacagcctga gagctgagga cacggctgtg tattactgta agacccatgg tagccatgac 1620 aactggggcc aagggacaat ggtcaccgtc tcttcagcgt cgaccaaggg cccatcggtc 1680 ttccccctgg caccctcctc caagagcacc tctgggggca cagcggccct gggctgcctg 1740 gtcaaggact acttccccga accggtgacg gtgtcgtgga actcaggcgc cctgaccagc 1800 ggcgtgcaca ccttcccggc tgtcctacag tcctcaggac tctactccct cagcagcgtg 1860 gtgaccgtgc cctccagcag cttgggcacc cagacctaca tctgcaacgt gaatcacaag 1920 cccagcaaca ccaaggtgga caagaaagtt gagcccaaat cttgtgacaa aactcacaca 1980 tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca 2040 aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac 2100 gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat 2160 aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc 2220 ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac 2280 aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa 2340 ccacaggtgt acaccctgcc cccatcccgc gaggagatga ccaagaacca ggtcagcctg 2400 acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg 2460 cagccggaga acaactacaa gaccacgcct cccgtgctgg actccgacgg ctccttcttc 2520 ctctacagca agctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc 2580 tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctagg 2640 ggtaaacgcg aaccagttta tttccagggg agcttgttta aggggccgcg tgattataac 2700 ccaatatcga gtgccatttg tcatctaacg aatgaatctg atgggcacac aacatcgttg 2760 tatggtattg gttttggccc tttcatcatc acaaacaagc atttgtttag aagaaataat 2820 ggtacactgt tagttcaatc actacatggt gtgttcaagg taaagaatac cacaactttg 2880 caacaacacc tcattgatgg gagggacatg atgctcattc gcatgcctaa ggatttccca 2940 ccatttcctc aaaagctgaa attcagagag ccacaaaggg aagagcgcat atgtcttgtg 3000 acaaccaact tccaaactaa gagcatgtct agcatggttt cagatactag ttgcacattc 3060 ccttcatctg atggtatatt ctggaaacat tggattcaga ccaaggatgg gcactgtggt 3120 agcccgttgg tgtcaactag agatgggttt attgttggta tacactcagc atcaaatttc 3180 accaacacaa acaattattt tacaagtgtg ccgaaagact tcatggattt attgacaaat 3240 caagaggcgc agcaatgggt tagtggttgg cgattgaatg ctgactcagt gttatgggga 3300 ggccacaaag ttttcatgag caaacctgaa gaaccctttc agccagtcaa agaagcaact 3360 caactcatga gtgaattagt ctactcgcaa gggatgactt ggaccccact cctcttcctc 3420 accctcctcc tccactgcac aggaagctta tcccagtctg tgctgactca gcccccctca 3480 gtgtctgggg cccccgggca gagagtcacc atctcttgtt ctggaagcag atccaacatc 3540 ggcagtaata ctgtaaagtg gtatcagcag ctcccaggaa cggcccccaa actcctcatc 3600 tattacaatg atcagcggcc ctcaggggtc cctgaccgat tctctggatc caagtctggc 3660 acctcagcct ccctcgccat cactgggctc caggctgaag acgaggctga ctattactgc 3720 cagtcatatg acagatacac ccaccccgcc ctgctcttcg gaactgggac caaggtcaca 3780 gtactaggtc agcccaaggc tgccccctcg gtcactctgt tcccgccctc ctctgaggag 3840 cttcaagcca acaaggccac actggtgtgt ctcataagtg acttctaccc gggagccgtg 3900 acagtggcct ggaaggcaga tagcagcccc gtcaaggcgg gagtggagac caccacaccc 3960 tccaaacaaa gcaacaacaa gtacgcggcc agcagctacc tgagcctgac gcctgagcag 4020 tggaagtccc acagaagcta cagctgccag gtcacgcatg aagggagcac cgtggagaag 4080 acagtggccc ctacagaatg ttcatgagcg gccgcgttta aactgaatga gcgcgtccat 4140 ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 4200 aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 4260 aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 4320 tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtatggctga ttatgatccg 4380 gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 4440 cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 4500 cgggtgttgg cgggtgtcgg ggcgcagcca tgaccggtcg acggcgcgcc ttttttttta 4560 atttttattt tattttattt ttgacgcgcc gaaggcgcga tctgagctcg gtacagcttg 4620 gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 4680 tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 4740 agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 4800 aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 4860 actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa 4920 gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcctcg aggaactgaa 4980 aaaccagaaa gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc 5040 ggtggtggtg caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg 5100 tacggaagtg ttacttctgc tctaaaagct gcggaattgt acccgcggcc taatacgact 5160 cactataggg actagtatgg ttcgaccatt gaactgcatc gtcgccgtgt cccaaaatat 5220 ggggattggc aagaacggag acctaccctg gcctccgctc aggaacgagt tcaagtactt 5280 ccaaagaatg accacaacct cttcagtgga aggtaaacag aatctggtga ttatgggtag 5340 gaaaacctgg ttctccattc ctgagaagaa tcgaccttta aaggacagaa ttaatatagt 5400 tctcagtaga gaactcaaag aaccaccacg aggagctcat tttcttgcca aaagtttaga 5460 tgatgcctta agacttattg aacaaccgga attggcaagt aaagtagaca tggtttggat 5520 agtcggaggc agttctgttt accaggaagc catgaatcaa ccaggccacc tcagactctt 5580 tgtgacaagg atcatgcagg aatttgaaag tgacacgttt ttcccagaaa ttgatttggg 5640 gaaatataaa cttctcccag aatacccagg cgtcctctct gaggtccagg aggaaaaagg 5700 catcaagtat aagtttgaag tctacgagaa gaaagactaa gcggccgagc gcgcggatct 5760 ggaaacggga gatgggggag gctaactgaa gcacggaagg agacaatacc ggaaggaacc 5820 cgcgctatga cggcaataaa aagacagaat aaaacgcacg ggtgttgggt cgtttgttca 5880 taaacgcggg gttcggtccc agggctggca ctctgtcgat accccaccga gaccccattg 5940 gggccaatac gcccgcgttt cttccttttc cccaccccac cccccaagtt cgggtgaagg 6000 cccagggctc gcagccaacg tcggggcggc aggccctgcc atagccactg gccccgtggg 6060 ttagggacgg ggtcccccat ggggaatggt ttatggttcg tgggggttat tattttgggc 6120 gttgcgtggg gtctggagat cccccgggct gcaggaattc cgttacatta cttacggtaa 6180 atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 6240 ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 6300 aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 6360 tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 6420 ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 6480 agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 6540 ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 6600 acaactccgc cccattgacg caaaagggcg ggaattcgag ctcggtactc gagcggtgtt 6660 ccgcggtcct cctcgtatag aaactcggac cactctgaga cgaaggctcg cgtccaggcc 6720 agcacgaagg aggctaagtg ggaggggtag cggtcgttgt ccactagggg gtccactcgc 6780 tccagggtgt gaagacacat gtcgccctct tcggcatcaa ggaaggtgat tggtttatag 6840 gtgtaggcca cgtgaccggg tgttcctgaa ggggggctat aaaagggggt gggggcgcgt 6900 tcgtcctcac tctcttccgc atcgctgtct gcgagggcca gctgttgggc tcgcggttga 6960 ggacaaactc ttcgcggtct ttccagtact cttggatcgg aaacccgtcg gcctccgaac 7020 ggtactccgc caccgaggga cctgagcgag tccgcatcga ccggatcgga aaacctctcg 7080 actgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agattgtcag 7140 tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct ttgagggtgg 7200 ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttgagg tgtggcaggc 7260 ttgagatctg gccatacact tgagtgacaa tgacatccac tttgcctttc tctccacagg 7320 tgtccactcc caggtccaac cggaattgta cccgcggcca gagcttgcgg gcgccaccgc 7380 ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 7440 atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 7500 attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 7560 cagggggagg tgtgggaggt tttttcggat cctcttggcg taatcatggt catagctgtt 7620 tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 7680 gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 7740 gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 7800 ggggaaaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 7860 ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 7920 cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 7980 gaaccgtaaa aaggccgcgt tgctggcgtt cttccatagg ctccgccccc ctgacgagca 8040 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 8100 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 8160 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 8220 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 8280 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 8340 cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 8400 cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 8460 tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 8520 cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 8580 cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 8640 gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 8700 gatccctttt aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 8760 gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 8820 ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 8880 atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 8940 agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 9000 ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 9060 tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 9120 ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 9180 caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 9240 gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 9300 atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 9360 accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 9420 aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 9480 gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 9540 tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 9600 aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 9660 ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 9720 aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 9780 tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt 9840 cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 9900 gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 9960 tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc accatatgcg 10020 gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc attcgccatt 10080 caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat tacgccagct 10140 ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtt 10200 acgacgttgt aaaacgacgg ccagtgaatt 10230 <210> 38 <211> 2901 <212> DNA <213> Artificial <220> <223> Synthetic construct, sequence encoding EL246 GG TEV polyprotein. <220> <221> CDS <222> (1)..(2898) <400> 38 atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgc gag gtg cag ctg gtg cag tct gga gca gag gtg aaa aag 96 Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys 20 25 30 ccc ggg gag tct ctg aag atc tcc tgt aag ggg tcc gga tac gca ttc 144 Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe 35 40 45 agt agt tcc tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192 Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu 50 55 60 gag tgg atg ggg cgg att tat cct gga gat gga gat act aac tac aat 240 Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn 65 70 75 80 ggg aag ttc aag ggc cag gtc acc atc tca gcc gac aag tcc atc agc 288 Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser 85 90 95 acc gcc tac ctg cag tgg agc agc ctg aag gct agc gac acc gcc atg 336 Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met 100 105 110 tat tac tgt gcg aga gcg cgc gtg gga tcc acg gtc tat gat ggt tac 384 Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr 115 120 125 ctc tat gca atg gac tac tgg ggt caa ggt acc tca gtc acc gtc tcc 432 Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser 130 135 140 tca gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc 480 Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser 145 150 155 160 aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac 528 Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp 165 170 175 tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc gcc ctg acc 576 Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr 180 185 190 agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca gga ctc tac 624 Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr 195 200 205 tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg ggc acc cag 672 Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln 210 215 220 acc tac atc tgc aac gtg aat cac aag ccc agc aac acc aag gtg gac 720 Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp 225 230 235 240 aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca tgc cca ccg 768 Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro 245 250 255 tgc cca gca cct gaa gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc 816 Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro 260 265 270 cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag gtc aca 864 Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr 275 280 285 tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc aag ttc aac 912 Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn 290 295 300 tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag ccg cgg 960 Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg 305 310 315 320 gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc ctc acc gtc 1008 Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val 325 330 335 ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc aag gtc tcc 1056 Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser 340 345 350 aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc aaa gcc aaa 1104 Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys 355 360 365 ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc cgc gag 1152 Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu 370 375 380 gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc 1200 Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe 385 390 395 400 tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag ccg gag 1248 Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu 405 410 415 aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac ggc tcc ttc 1296 Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe 420 425 430 ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag cag ggg 1344 Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly 435 440 445 aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac cac tac 1392 Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr 450 455 460 acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca gtt tat 1440 Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr 465 470 475 480 ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca ata tcg 1488 Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser 485 490 495 agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca aca tcg 1536 Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser 500 505 510 ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag cat ttg 1584 Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu 515 520 525 ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat ggt gtg 1632 Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val 530 535 540 ttc aag gta aag aat acc aca act ttg caa caa cac ctc att gat ggg 1680 Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly 545 550 555 560 agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca ttt cct 1728 Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro 565 570 575 caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata tgt ctt 1776 Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu 580 585 590 gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt tca gat 1824 Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp 595 600 605 act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa cat tgg 1872 Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp 610 615 620 att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca act aga 1920 Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg 625 630 635 640 gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc aac aca 1968 Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr 645 650 655 aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta ttg aca 2016 Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr 660 665 670 aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat gct gac 2064 Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp 675 680 685 tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct gaa gaa 2112 Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu 690 695 700 ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa tta gtc 2160 Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val 705 710 715 720 tac tcg caa ggg atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2208 Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu 725 730 735 ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc gtg atg acc cag 2256 Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln 740 745 750 tct cca gac tcc ctg gct gtg tct ctg ggc gag agg gcc acc atc aac 2304 Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn 755 760 765 tgc aag tcc agt cag agc ctt tca tat aga agc aat caa aag aac tcg 2352 Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser 770 775 780 ttg gcc tgg tac cag cag aaa cca gga cag cct cct aag ctg ctc att 2400 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile 785 790 795 800 tac tgg gct agc act agg gaa tct ggg gtc cct gac cga ttc agt gga 2448 Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly 805 810 815 tcc ggg tct ggg aca gat ttc act ctc acc atc agc agc ctg cag gct 2496 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala 820 825 830 gaa gat gtg gca gtt tat tac tgt cac caa tat tat agc tat ccg tac 2544 Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr 835 840 845 acg ttc gga ggg ggg acc aag gtg gaa att aaa cgt acg gtg gct gca 2592 Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 850 855 860 cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa tct gga 2640 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 865 870 875 880 act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga gag gcc 2688 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 885 890 895 aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac tcc cag 2736 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 900 905 910 gag agt gtc aca gag cag gac agc aag gac agc acc tac agc ctc agc 2784 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 915 920 925 agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa gtc tac 2832 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 930 935 940 gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca aag agc 2880 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 945 950 955 960 ttc aac agg gga gag tgt tga 2901 Phe Asn Arg Gly Glu Cys 965 <210> 39 <211> 966 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 39 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys 20 25 30 Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe 35 40 45 Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu 50 55 60 Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn 65 70 75 80 Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser 85 90 95 Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met 100 105 110 Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr 115 120 125 Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser 130 135 140 Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser 145 150 155 160 Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp 165 170 175 Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr 180 185 190 Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr 195 200 205 Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln 210 215 220 Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp 225 230 235 240 Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro 245 250 255 Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro 260 265 270 Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr 275 280 285 Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn 290 295 300 Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg 305 310 315 320 Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val 325 330 335 Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser 340 345 350 Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys 355 360 365 Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu 370 375 380 Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe 385 390 395 400 Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu 405 410 415 Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe 420 425 430 Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly 435 440 445 Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr 450 455 460 Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr 465 470 475 480 Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser 485 490 495 Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser 500 505 510 Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu 515 520 525 Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val 530 535 540 Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly 545 550 555 560 Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro 565 570 575 Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu 580 585 590 Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp 595 600 605 Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp 610 615 620 Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg 625 630 635 640 Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr 645 650 655 Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr 660 665 670 Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp 675 680 685 Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu 690 695 700 Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val 705 710 715 720 Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu 725 730 735 Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln 740 745 750 Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn 755 760 765 Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser 770 775 780 Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile 785 790 795 800 Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly 805 810 815 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala 820 825 830 Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr 835 840 845 Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 850 855 860 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 865 870 875 880 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 885 890 895 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 900 905 910 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 915 920 925 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 930 935 940 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 945 950 955 960 Phe Asn Arg Gly Glu Cys 965 <210> 40 <211> 10278 <212> DNA <213> Artificial <220> <223> Synthetic construct, EL246 GG TEV Polyprotein expression vector. <400> 40 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg cgaggtgcag 1320 ctggtgcagt ctggagcaga ggtgaaaaag cccggggagt ctctgaagat ctcctgtaag 1380 gggtccggat acgcattcag tagttcctgg atcggctggg tgcgccagat gcccgggaaa 1440 ggcctggagt ggatggggcg gatttatcct ggagatggag atactaacta caatgggaag 1500 ttcaagggcc aggtcaccat ctcagccgac aagtccatca gcaccgccta cctgcagtgg 1560 agcagcctga aggctagcga caccgccatg tattactgtg cgagagcgcg cgtgggatcc 1620 acggtctatg atggttacct ctatgcaatg gactactggg gtcaaggtac ctcagtcacc 1680 gtctcctcag cgtcgaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc 1740 acctctgggg gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1800 acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1860 cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1920 acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa 1980 gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccagc acctgaagcc 2040 gcggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 2100 cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 2160 ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 2220 cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 2280 aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 2340 accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcccccatcc 2400 cgcgaggaga tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 2460 agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg 2520 cctcccgtgc tggactccga cggctccttc ttcctctaca gcaagctcac cgtggacaag 2580 agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 2640 cactacacgc agaagagcct ctccctgtct aggggtaaac gcgaaccagt ttatttccag 2700 gggagcttgt ttaaggggcc gcgtgattat aacccaatat cgagtgccat ttgtcatcta 2760 acgaatgaat ctgatgggca cacaacatcg ttgtatggta ttggttttgg ccctttcatc 2820 atcacaaaca agcatttgtt tagaagaaat aatggtacac tgttagttca atcactacat 2880 ggtgtgttca aggtaaagaa taccacaact ttgcaacaac acctcattga tgggagggac 2940 atgatgctca ttcgcatgcc taaggatttc ccaccatttc ctcaaaagct gaaattcaga 3000 gagccacaaa gggaagagcg catatgtctt gtgacaacca acttccaaac taagagcatg 3060 tctagcatgg tttcagatac tagttgcaca ttcccttcat ctgatggtat attctggaaa 3120 cattggattc agaccaagga tgggcactgt ggtagcccgt tggtgtcaac tagagatggg 3180 tttattgttg gtatacactc agcatcaaat ttcaccaaca caaacaatta ttttacaagt 3240 gtgccgaaag acttcatgga tttattgaca aatcaagagg cgcagcaatg ggttagtggt 3300 tggcgattga atgctgactc agtgttatgg ggaggccaca aagttttcat gagcaaacct 3360 gaagaaccct ttcagccagt caaagaagca actcaactca tgagtgaatt agtctactcg 3420 caagggatgg acatgcgcgt gcccgcccag ctgctgggcc tgctgctgct gtggttcccc 3480 ggctcgcgat gcgacatcgt gatgacccag tctccagact ccctggctgt gtctctgggc 3540 gagagggcca ccatcaactg caagtccagt cagagccttt catatagaag caatcaaaag 3600 aactcgttgg cctggtacca gcagaaacca ggacagcctc ctaagctgct catttactgg 3660 gctagcacta gggaatctgg ggtccctgac cgattcagtg gatccgggtc tgggacagat 3720 ttcactctca ccatcagcag cctgcaggct gaagatgtgg cagtttatta ctgtcaccaa 3780 tattatagct atccgtacac gttcggaggg gggaccaagg tggaaattaa acgtacggtg 3840 gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc tggaactgcc 3900 tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca gtggaaggtg 3960 gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga cagcaaggac 4020 agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga gaaacacaaa 4080 gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa gagcttcaac 4140 aggggagagt gttgagcggc cgcgtttaaa ctgaatgagc gcgtccatcc agacatgata 4200 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 4260 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 4320 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 4380 taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatccggc tgcctcgcgc 4440 gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 4500 gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 4560 ggtgtcgggg cgcagccatg accggtcgac ggcgcgcctt tttttttaat ttttatttta 4620 ttttattttt gacgcgccga aggcgcgatc tgagctcggt acagcttggc tgtggaatgt 4680 gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 4740 gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 4800 tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 4860 cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 4920 tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 4980 cttttttgga ggcctaggct tttgcaaaaa gctcctcgag gaactgaaaa accagaaagt 5040 taactggtaa gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca 5100 aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt 5160 acttctgctc taaaagctgc ggaattgtac ccgcggccta atacgactca ctatagggac 5220 tagtatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg ggattggcaa 5280 gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtacttcc aaagaatgac 5340 cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga aaacctggtt 5400 ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc tcagtagaga 5460 actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttagatg atgccttaag 5520 acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag tcggaggcag 5580 ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg tgacaaggat 5640 catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga aatataaact 5700 tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca tcaagtataa 5760 gtttgaagtc tacgagaaga aagactaagc ggccgagcgc gcggatctgg aaacgggaga 5820 tgggggaggc taactgaagc acggaaggag acaataccgg aaggaacccg cgctatgacg 5880 gcaataaaaa gacagaataa aacgcacggg tgttgggtcg tttgttcata aacgcggggt 5940 tcggtcccag ggctggcact ctgtcgatac cccaccgaga ccccattggg gccaatacgc 6000 ccgcgtttct tccttttccc caccccaccc cccaagttcg ggtgaaggcc cagggctcgc 6060 agccaacgtc ggggcggcag gccctgccat agccactggc cccgtgggtt agggacgggg 6120 tcccccatgg ggaatggttt atggttcgtg ggggttatta ttttgggcgt tgcgtggggt 6180 ctggagatcc cccgggctgc aggaattccg ttacattact tacggtaaat ggcccgcctg 6240 gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 6300 cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact 6360 tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 6420 aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 6480 acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg 6540 ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg 6600 ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc 6660 cattgacgca aaagggcggg aattcgagct cggtactcga gcggtgttcc gcggtcctcc 6720 tcgtatagaa actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag 6780 gctaagtggg aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga 6840 agacacatgt cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg 6900 tgaccgggtg ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc 6960 tcttccgcat cgctgtctgc gagggccagc tgttgggctc gcggttgagg acaaactctt 7020 cgcggtcttt ccagtactct tggatcggaa acccgtcggc ctccgaacgg tactccgcca 7080 ccgagggacc tgagcgagtc cgcatcgacc ggatcggaaa acctctcgac tgttggggtg 7140 agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 7200 aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 7260 ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 7320 catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 7380 ggtccaaccg gaattgtacc cgcggccaga gcttgcgggc gccaccgcgg ccgcggggat 7440 ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 7500 aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 7560 aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 7620 tgggaggttt tttcggatcc tcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 7680 ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 7740 gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 7800 gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggaaaggcgg 7860 tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 7920 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 7980 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 8040 ggccgcgttg ctggcgttct tccataggct ccgcccccct gacgagcatc acaaaaatcg 8100 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 8160 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 8220 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 8280 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8340 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8400 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8460 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8520 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8580 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8640 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8700 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tcccttttaa 8760 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8820 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8880 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8940 tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 9000 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 9060 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 9120 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 9180 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 9240 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9300 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9360 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9420 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9480 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9540 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9600 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9660 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9720 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9780 gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 9840 aacctataaa aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg 9900 tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc 9960 cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggct 10020 taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc 10080 gcacagatgc gtaaggagaa aataccgcat caggcgccat tcgccattca ggctgcgcaa 10140 ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg 10200 atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagttac gacgttgtaa 10260 aacgacggcc agtgaatt 10278 <210> 41 <211> 2865 <212> DNA <213> Artificial <220> <223> Synthetic construct, ABT-325 TEV polyprotein coding sequence. <220> <221> CDS <222> (1)..(2862) <400> 41 atg gag ttt ggg ctg agc tgg ctt ttc ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgt gag gtg cag ctg gtg cag tct gga aca gag gtg aaa aaa 96 Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys 20 25 30 ccc ggg gag tct ctg aag atc tcc tgt aag ggt tct gga tac act gtt 144 Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val 35 40 45 acc agt tac tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192 Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu 50 55 60 gag tgg atg gga ttc atc tat cct ggt gac tct gaa acc aga tac agt 240 Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser 65 70 75 80 ccg acc ttc caa ggc cag gtc acc atc tca gcc gac aag tcc ttc aat 288 Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn 85 90 95 acc gcc ttc ctg cag tgg agc agt cta aag gcc tcg gac acc gcc atg 336 Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met 100 105 110 tat tac tgt gcg cga gtc ggc agt ggc tgg tac cct tat act ttt gat 384 Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp 115 120 125 atc tgg ggc caa ggg aca atg gtc acc gtc tct tca gcg tcg acc aag 432 Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816 Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 cca cag gtg tac acc ctg ccc cca tcc cgc gag gag atg acc aag aac 1152 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn 370 375 380 cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 tcc ctg tct agg ggt aaa cgc gaa cca gtt tat ttc cag ggg agc ttg 1440 Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu 465 470 475 480 ttt aag ggg ccg cgt gat tat aac cca ata tcg agt gcc att tgt cat 1488 Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His 485 490 495 cta acg aat gaa tct gat ggg cac aca aca tcg ttg tat ggt att ggt 1536 Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly 500 505 510 ttt ggc cct ttc atc atc aca aac aag cat ttg ttt aga aga aat aat 1584 Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn 515 520 525 ggt aca ctg tta gtt caa tca cta cat ggt gtg ttc aag gta aag aat 1632 Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn 530 535 540 acc aca act ttg caa caa cac ctc att gat ggg agg gac atg atg ctc 1680 Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu 545 550 555 560 att cgc atg cct aag gat ttc cca cca ttt cct caa aag ctg aaa ttc 1728 Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe 565 570 575 aga gag cca caa agg gaa gag cgc ata tgt ctt gtg aca acc aac ttc 1776 Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe 580 585 590 caa act aag agc atg tct agc atg gtt tca gat act agt tgc aca ttc 1824 Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe 595 600 605 cct tca tct gat ggt ata ttc tgg aaa cat tgg att cag acc aag gat 1872 Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp 610 615 620 ggg cac tgt ggt agc ccg ttg gtg tca act aga gat ggg ttt att gtt 1920 Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val 625 630 635 640 ggt ata cac tca gca tca aat ttc acc aac aca aac aat tat ttt aca 1968 Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr 645 650 655 agt gtg ccg aaa gac ttc atg gat tta ttg aca aat caa gag gcg cag 2016 Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln 660 665 670 caa tgg gtt agt ggt tgg cga ttg aat gct gac tca gtg tta tgg gga 2064 Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly 675 680 685 ggc cac aaa gtt ttc atg agc aaa cct gaa gaa ccc ttt cag cca gtc 2112 Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val 690 695 700 aaa gaa gca act caa ctc atg agt gaa tta gtc tac tcg caa ggg atg 2160 Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met 705 710 715 720 gaa gcc cca gcg cag ctt ctc ttc ctc ctg cta ctc tgg ctc cca gat 2208 Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp 725 730 735 acc act gga gaa ata gtg atg acg cag tct cca gcc acc ctg tct gtg 2256 Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val 740 745 750 tct cca ggg gaa aga gcc acc ctc tcc tgc agg gcc agt gag agt att 2304 Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile 755 760 765 agc agc aac tta gcc tgg tac cag cag aaa cct ggc cag gct ccc agg 2352 Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg 770 775 780 ctc ttc atc tat act gca tcc acc agg gcc act gat atc cca gcc agg 2400 Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg 785 790 795 800 ttc agt ggc agt ggg tct ggg aca gag ttc act ctc acc atc agc agc 2448 Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser 805 810 815 ctg cag tct gaa gat ttt gca gtt tat tac tgt cag cag tat aat aac 2496 Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn 820 825 830 tgg cct tcg atc acc ttc ggc caa ggg aca cga ctg gag att aaa cga 2544 Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg 835 840 845 act gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag 2592 Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln 850 855 860 ttg aaa tct gga act gct agc gtt gtg tgc ctg ctg aat aac ttc tat 2640 Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr 865 870 875 880 ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg 2688 Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser 885 890 895 ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc 2736 Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr 900 905 910 tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa 2784 Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys 915 920 925 cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc 2832 His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro 930 935 940 gtc aca aag agc ttc aac agg gga gag tgt tga 2865 Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 945 950 <210> 42 <211> 954 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 42 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys 20 25 30 Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val 35 40 45 Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu 50 55 60 Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser 65 70 75 80 Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn 85 90 95 Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met 100 105 110 Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp 115 120 125 Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn 370 375 380 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu 465 470 475 480 Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His 485 490 495 Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly 500 505 510 Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn 515 520 525 Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn 530 535 540 Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu 545 550 555 560 Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe 565 570 575 Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe 580 585 590 Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe 595 600 605 Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp 610 615 620 Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val 625 630 635 640 Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr 645 650 655 Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln 660 665 670 Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly 675 680 685 Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val 690 695 700 Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met 705 710 715 720 Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp 725 730 735 Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val 740 745 750 Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile 755 760 765 Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg 770 775 780 Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg 785 790 795 800 Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser 805 810 815 Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn 820 825 830 Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg 835 840 845 Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln 850 855 860 Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr 865 870 875 880 Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser 885 890 895 Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr 900 905 910 Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys 915 920 925 His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro 930 935 940 Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 945 950 <210> 43 <211> 10242 <212> DNA <213> Artificial <220> <223> Synthetic construct, ABT-325 TEV polyprotein expression vector. <400> 43 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt ccttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320 ctggtgcagt ctggaacaga ggtgaaaaaa cccggggagt ctctgaagat ctcctgtaag 1380 ggttctggat acactgttac cagttactgg atcggctggg tgcgccagat gcccgggaaa 1440 ggcctggagt ggatgggatt catctatcct ggtgactctg aaaccagata cagtccgacc 1500 ttccaaggcc aggtcaccat ctcagccgac aagtccttca ataccgcctt cctgcagtgg 1560 agcagtctaa aggcctcgga caccgccatg tattactgtg cgcgagtcgg cagtggctgg 1620 tacccttata cttttgatat ctggggccaa gggacaatgg tcaccgtctc ttcagcgtcg 1680 accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740 gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800 tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860 tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920 tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980 tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aagccgcggg gggaccgtca 2040 gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100 acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160 gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220 taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280 aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340 aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccgcga ggagatgacc 2400 aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460 gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520 tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580 gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640 agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700 gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760 gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820 ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880 aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940 atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000 gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060 gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120 aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180 cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240 atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300 gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360 ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggaagcc 3420 ccagcgcagc ttctcttcct cctgctactc tggctcccag ataccactgg agaaatagtg 3480 atgacgcagt ctccagccac cctgtctgtg tctccagggg aaagagccac cctctcctgc 3540 agggccagtg agagtattag cagcaactta gcctggtacc agcagaaacc tggccaggct 3600 cccaggctct tcatctatac tgcatccacc agggccactg atatcccagc caggttcagt 3660 ggcagtgggt ctgggacaga gttcactctc accatcagca gcctgcagtc tgaagatttt 3720 gcagtttatt actgtcagca gtataataac tggccttcga tcaccttcgg ccaagggaca 3780 cgactggaga ttaaacgaac tgtggctgca ccatctgtct tcatcttccc gccatctgat 3840 gagcagttga aatctggaac tgctagcgtt gtgtgcctgc tgaataactt ctatcccaga 3900 gaggccaaag tacagtggaa ggtggataac gccctccaat cgggtaactc ccaggagagt 3960 gtcacagagc aggacagcaa ggacagcacc tacagcctca gcagcaccct gacgctgagc 4020 aaagcagact acgagaaaca caaagtctac gcctgcgaag tcacccatca gggcctgagc 4080 tcgcccgtca caaagagctt caacagggga gagtgttgag cggccgcgtt taaactgaat 4140 gagcgcgtcc atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 4200 atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4260 attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4320 cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtatggct 4380 gattatgatc cggctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 4440 agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc 4500 agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgaccggt cgacggcgcg 4560 cctttttttt taatttttat tttattttat ttttgacgcg ccgaaggcgc gatctgagct 4620 cggtacagct tggctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc 4680 agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc 4740 cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat 4800 agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc 4860 gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga 4920 gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctcct 4980 cgaggaactg aaaaaccaga aagttaactg gtaagtttag tctttttgtc ttttatttca 5040 ggtcccggat ccggtggtgg tgcaaatcaa agaactgctc ctcagtggat gttgccttta 5100 cttctaggcc tgtacggaag tgttacttct gctctaaaag ctgcggaatt gtacccgcgg 5160 cctaatacga ctcactatag ggactagtat ggttcgacca ttgaactgca tcgtcgccgt 5220 gtcccaaaat atggggattg gcaagaacgg agacctaccc tggcctccgc tcaggaacga 5280 gttcaagtac ttccaaagaa tgaccacaac ctcttcagtg gaaggtaaac agaatctggt 5340 gattatgggt aggaaaacct ggttctccat tcctgagaag aatcgacctt taaaggacag 5400 aattaatata gttctcagta gagaactcaa agaaccacca cgaggagctc attttcttgc 5460 caaaagttta gatgatgcct taagacttat tgaacaaccg gaattggcaa gtaaagtaga 5520 catggtttgg atagtcggag gcagttctgt ttaccaggaa gccatgaatc aaccaggcca 5580 cctcagactc tttgtgacaa ggatcatgca ggaatttgaa agtgacacgt ttttcccaga 5640 aattgatttg gggaaatata aacttctccc agaataccca ggcgtcctct ctgaggtcca 5700 ggaggaaaaa ggcatcaagt ataagtttga agtctacgag aagaaagact aagcggccga 5760 gcgcgcggat ctggaaacgg gagatggggg aggctaactg aagcacggaa ggagacaata 5820 ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca cgggtgttgg 5880 gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg cactctgtcg ataccccacc 5940 gagaccccat tggggccaat acgcccgcgt ttcttccttt tccccacccc accccccaag 6000 ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg gcaggccctg ccatagccac 6060 tggccccgtg ggttagggac ggggtccccc atggggaatg gtttatggtt cgtgggggtt 6120 attattttgg gcgttgcgtg gggtctggag atcccccggg ctgcaggaat tccgttacat 6180 tacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 6240 taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 6300 agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 6360 cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6420 tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6480 tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 6540 gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 6600 caaaatgtcg taacaactcc gccccattga cgcaaaaggg cgggaattcg agctcggtac 6660 tcgagcggtg ttccgcggtc ctcctcgtat agaaactcgg accactctga gacgaaggct 6720 cgcgtccagg ccagcacgaa ggaggctaag tgggaggggt agcggtcgtt gtccactagg 6780 gggtccactc gctccagggt gtgaagacac atgtcgccct cttcggcatc aaggaaggtg 6840 attggtttat aggtgtaggc cacgtgaccg ggtgttcctg aaggggggct ataaaagggg 6900 gtgggggcgc gttcgtcctc actctcttcc gcatcgctgt ctgcgagggc cagctgttgg 6960 gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc ggaaacccgt 7020 cggcctccga acggtactcc gccaccgagg gacctgagcg agtccgcatc gaccggatcg 7080 gaaaacctct cgactgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc 7140 taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc 7200 ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga 7260 ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgcctt 7320 tctctccaca ggtgtccact cccaggtcca accggaattg tacccgcggc cagagcttgc 7380 gggcgccacc gcggccgcgg ggatccagac atgataagat acattgatga gtttggacaa 7440 accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 7500 ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 7560 atgtttcagg ttcaggggga ggtgtgggag gttttttcgg atcctcttgg cgtaatcatg 7620 gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 7680 cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 7740 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 7800 cggccaacgc gcggggaaag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 7860 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7920 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 7980 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg ttcttccata ggctccgccc 8040 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 8100 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 8160 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 8220 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 8280 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 8340 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 8400 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 8460 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 8520 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 8580 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 8640 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 8700 gatcttcacc tagatccctt ttaattaaaa atgaagtttt aaatcaatct aaagtatata 8760 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8820 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 8880 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 8940 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 9000 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 9060 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 9120 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 9180 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 9240 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 9300 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 9360 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 9420 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 9480 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 9540 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 9600 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 9660 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 9720 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 9780 agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 9840 tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 9900 cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 9960 tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 10020 gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 10080 ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 10140 attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 10200 gttttcccag ttacgacgtt gtaaaacgac ggccagtgaa tt 10242 <210> 44 <211> 10245 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 TEV polyprotein exprsesion vector. <400> 44 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320 ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380 gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440 ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500 gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560 aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620 accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680 accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740 gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800 tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860 tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920 tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980 tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040 gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100 acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160 gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220 taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280 aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340 aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400 aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460 gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520 tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580 gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640 agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700 gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760 gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820 ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880 aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940 atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000 gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060 gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120 aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180 cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240 atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300 gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360 ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggacatg 3420 cgcgtgcccg cccagctgct gggcctgctg ctgctgtggt tccccggctc gcgatgcgac 3480 atccagatga cccagtctcc atcctccctg tctgcatctg taggggacag agtcaccatc 3540 acttgtcggg caagtcaggg catcagaaat tacttagcct ggtatcagca aaaaccaggg 3600 aaagccccta agctcctgat ctatgctgca tccactttgc aatcaggggt cccatctcgg 3660 ttcagtggca gtggatctgg gacagatttc actctcacca tcagcagcct acagcctgaa 3720 gatgttgcaa cttattactg tcaaaggtat aaccgtgcac cgtatacttt tggccagggg 3780 accaaggtgg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct 3840 gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgctgaataa cttctatccc 3900 agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag 3960 agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg 4020 agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccca tcagggcctg 4080 agctcgcccg tcacaaagag cttcaacagg ggagagtgtt gagcggccgc gtttaaactg 4140 aatgagcgcg tccatccaga catgataaga tacattgatg agtttggaca aaccacaact 4200 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 4260 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 4320 gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtatg 4380 gctgattatg atccggctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 4440 tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 4500 gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc ggtcgacggc 4560 gcgccttttt ttttaatttt tattttattt tatttttgac gcgccgaagg cgcgatctga 4620 gctcggtaca gcttggctgt ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc 4680 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa 4740 gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 4800 catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc 4860 tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctcggcctc 4920 tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct 4980 cctcgaggaa ctgaaaaacc agaaagttaa ctggtaagtt tagtcttttt gtcttttatt 5040 tcaggtcccg gatccggtgg tggtgcaaat caaagaactg ctcctcagtg gatgttgcct 5100 ttacttctag gcctgtacgg aagtgttact tctgctctaa aagctgcgga attgtacccg 5160 cggcctaata cgactcacta tagggactag tatggttcga ccattgaact gcatcgtcgc 5220 cgtgtcccaa aatatgggga ttggcaagaa cggagaccta ccctggcctc cgctcaggaa 5280 cgagttcaag tacttccaaa gaatgaccac aacctcttca gtggaaggta aacagaatct 5340 ggtgattatg ggtaggaaaa cctggttctc cattcctgag aagaatcgac ctttaaagga 5400 cagaattaat atagttctca gtagagaact caaagaacca ccacgaggag ctcattttct 5460 tgccaaaagt ttagatgatg ccttaagact tattgaacaa ccggaattgg caagtaaagt 5520 agacatggtt tggatagtcg gaggcagttc tgtttaccag gaagccatga atcaaccagg 5580 ccacctcaga ctctttgtga caaggatcat gcaggaattt gaaagtgaca cgtttttccc 5640 agaaattgat ttggggaaat ataaacttct cccagaatac ccaggcgtcc tctctgaggt 5700 ccaggaggaa aaaggcatca agtataagtt tgaagtctac gagaagaaag actaagcggc 5760 cgagcgcgcg gatctggaaa cgggagatgg gggaggctaa ctgaagcacg gaaggagaca 5820 ataccggaag gaacccgcgc tatgacggca ataaaaagac agaataaaac gcacgggtgt 5880 tgggtcgttt gttcataaac gcggggttcg gtcccagggc tggcactctg tcgatacccc 5940 accgagaccc cattggggcc aatacgcccg cgtttcttcc ttttccccac cccacccccc 6000 aagttcgggt gaaggcccag ggctcgcagc caacgtcggg gcggcaggcc ctgccatagc 6060 cactggcccc gtgggttagg gacggggtcc cccatgggga atggtttatg gttcgtgggg 6120 gttattattt tgggcgttgc gtggggtctg gagatccccc gggctgcagg aattccgtta 6180 cattacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 6240 caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 6300 tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 6360 cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 6420 ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg 6480 tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 6540 caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 6600 ttccaaaatg tcgtaacaac tccgccccat tgacgcaaaa gggcgggaat tcgagctcgg 6660 tactcgagcg gtgttccgcg gtcctcctcg tatagaaact cggaccactc tgagacgaag 6720 gctcgcgtcc aggccagcac gaaggaggct aagtgggagg ggtagcggtc gttgtccact 6780 agggggtcca ctcgctccag ggtgtgaaga cacatgtcgc cctcttcggc atcaaggaag 6840 gtgattggtt tataggtgta ggccacgtga ccgggtgttc ctgaaggggg gctataaaag 6900 ggggtggggg cgcgttcgtc ctcactctct tccgcatcgc tgtctgcgag ggccagctgt 6960 tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7020 cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 7080 tcggaaaacc tctcgactgt tggggtgagt actccctctc aaaagcgggc atgacttctg 7140 cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgcggtga 7200 tgcctttgag ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct 7260 tgaggtgtgg caggcttgag atctggccat acacttgagt gacaatgaca tccactttgc 7320 ctttctctcc acaggtgtcc actcccaggt ccaaccggaa ttgtacccgc ggccagagct 7380 tgcgggcgcc accgcggccg cggggatcca gacatgataa gatacattga tgagtttgga 7440 caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 7500 gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 7560 tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt cggatcctct tggcgtaatc 7620 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 7680 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7740 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7800 aatcggccaa cgcgcgggga aaggcggttt gcgtattggg cgctcttccg cttcctcgct 7860 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7920 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7980 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgttcttcc ataggctccg 8040 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8100 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8160 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8220 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8280 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8340 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8400 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8460 tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8520 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8580 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8640 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 8700 aaggatcttc acctagatcc cttttaatta aaaatgaagt tttaaatcaa tctaaagtat 8760 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8820 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8880 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8940 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 9000 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 9060 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 9120 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 9180 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 9240 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 9300 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9360 atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9420 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9480 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9540 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9600 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 9660 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 9720 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 9780 ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 9840 tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 9900 ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 9960 gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag 10020 agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 10080 gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 10140 gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 10200 agggttttcc cagttacgac gttgtaaaac gacggccagt gaatt 10245 <210> 45 <211> 2196 <212> DNA <213> Artificial <220> <223> Synthetic construct, sequence encodign D2E7 internal cleavabe signal peptide construct. <220> <221> CDS <222> (1)..(2193) <400> 45 atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag 96 Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt 144 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg 192 Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg 240 Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala 65 70 75 80 gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac 288 Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta 336 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac 384 Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp 115 120 125 tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag 432 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn 370 375 380 cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 tcc ctg tct agg ggt aaa cgc atg gga cga atg gca atg aaa tgg tta 1440 Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu 465 470 475 480 gtt gtt ata ata tgt ttc tct ata aca agt caa cct gct tct gct atg 1488 Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met 485 490 495 gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc 1536 Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe 500 505 510 ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg 1584 Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 515 520 525 tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag 1632 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln 530 535 540 ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 1680 Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala 545 550 555 560 cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca 1728 Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro 565 570 575 tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc 1776 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile 580 585 590 agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat 1824 Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr 595 600 605 aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa 1872 Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 610 615 620 cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag 1920 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 625 630 635 640 cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc 1968 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 645 650 655 tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa 2016 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 660 665 670 tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc 2064 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 675 680 685 acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag 2112 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 690 695 700 aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg 2160 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 705 710 715 720 ccc gtc aca aag agc ttc aac agg gga gag tgt tga 2196 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 725 730 <210> 46 <211> 731 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 46 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala 65 70 75 80 Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp 115 120 125 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn 370 375 380 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu 465 470 475 480 Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met 485 490 495 Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe 500 505 510 Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 515 520 525 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln 530 535 540 Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala 545 550 555 560 Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro 565 570 575 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile 580 585 590 Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr 595 600 605 Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 610 615 620 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 625 630 635 640 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 645 650 655 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 660 665 670 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 675 680 685 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 690 695 700 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 705 710 715 720 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 725 730 <210> 47 <211> 9573 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 internal cleavable signal peptide polyprotein expression vector. <400> 47 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320 ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380 gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440 ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500 gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560 aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620 accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680 accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740 gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800 tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860 tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920 tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980 tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040 gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100 acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160 gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220 taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280 aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340 aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400 aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460 gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520 tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580 gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640 agcctctccc tgtctagggg taaacgcatg ggacgaatgg caatgaaatg gttagttgtt 2700 ataatatgtt tctctataac aagtcaacct gcttctgcta tggacatgcg cgtgcccgcc 2760 cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat ccagatgacc 2820 cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac ttgtcgggca 2880 agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa agcccctaag 2940 ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt cagtggcagt 3000 ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga tgttgcaact 3060 tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac caaggtggaa 3120 atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga tgagcagttg 3180 aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag agaggccaaa 3240 gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag tgtcacagag 3300 caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag caaagcagac 3360 tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag ctcgcccgtc 3420 acaaagagct tcaacagggg agagtgttga gcggccgcgt ttaaactgaa tgagcgcgtc 3480 catccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 3540 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 3600 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 3660 gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat 3720 ccggctgcct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 3780 agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 3840 cagcgggtgt tggcgggtgt cggggcgcag ccatgaccgg tcgacggcgc gccttttttt 3900 ttaattttta ttttatttta tttttgacgc gccgaaggcg cgatctgagc tcggtacagc 3960 ttggctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 4020 aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 4080 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 4140 cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 4200 ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 4260 gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc tcgaggaact 4320 gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc aggtcccgga 4380 tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt acttctaggc 4440 ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat tgtacccgcg gcctaatacg 4500 actcactata gggactagta tggttcgacc attgaactgc atcgtcgccg tgtcccaaaa 4560 tatggggatt ggcaagaacg gagacctacc ctggcctccg ctcaggaacg agttcaagta 4620 cttccaaaga atgaccacaa cctcttcagt ggaaggtaaa cagaatctgg tgattatggg 4680 taggaaaacc tggttctcca ttcctgagaa gaatcgacct ttaaaggaca gaattaatat 4740 agttctcagt agagaactca aagaaccacc acgaggagct cattttcttg ccaaaagttt 4800 agatgatgcc ttaagactta ttgaacaacc ggaattggca agtaaagtag acatggtttg 4860 gatagtcgga ggcagttctg tttaccagga agccatgaat caaccaggcc acctcagact 4920 ctttgtgaca aggatcatgc aggaatttga aagtgacacg tttttcccag aaattgattt 4980 ggggaaatat aaacttctcc cagaataccc aggcgtcctc tctgaggtcc aggaggaaaa 5040 aggcatcaag tataagtttg aagtctacga gaagaaagac taagcggccg agcgcgcgga 5100 tctggaaacg ggagatgggg gaggctaact gaagcacgga aggagacaat accggaagga 5160 acccgcgcta tgacggcaat aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt 5220 tcataaacgc ggggttcggt cccagggctg gcactctgtc gataccccac cgagacccca 5280 ttggggccaa tacgcccgcg tttcttcctt ttccccaccc caccccccaa gttcgggtga 5340 aggcccaggg ctcgcagcca acgtcggggc ggcaggccct gccatagcca ctggccccgt 5400 gggttaggga cggggtcccc catggggaat ggtttatggt tcgtgggggt tattattttg 5460 ggcgttgcgt ggggtctgga gatcccccgg gctgcaggaa ttccgttaca ttacttacgg 5520 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 5580 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 5640 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg 5700 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact 5760 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 5820 ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 5880 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 5940 gtaacaactc cgccccattg acgcaaaagg gcgggaattc gagctcggta ctcgagcggt 6000 gttccgcggt cctcctcgta tagaaactcg gaccactctg agacgaaggc tcgcgtccag 6060 gccagcacga aggaggctaa gtgggagggg tagcggtcgt tgtccactag ggggtccact 6120 cgctccaggg tgtgaagaca catgtcgccc tcttcggcat caaggaaggt gattggttta 6180 taggtgtagg ccacgtgacc gggtgttcct gaaggggggc tataaaaggg ggtgggggcg 6240 cgttcgtcct cactctcttc cgcatcgctg tctgcgaggg ccagctgttg ggctcgcggt 6300 tgaggacaaa ctcttcgcgg tctttccagt actcttggat cggaaacccg tcggcctccg 6360 aacggtactc cgccaccgag ggacctgagc gagtccgcat cgaccggatc ggaaaacctc 6420 tcgactgttg gggtgagtac tccctctcaa aagcgggcat gacttctgcg ctaagattgt 6480 cagtttccaa aaacgaggag gatttgatat tcacctggcc cgcggtgatg cctttgaggg 6540 tggccgcgtc catctggtca gaaaagacaa tctttttgtt gtcaagcttg aggtgtggca 6600 ggcttgagat ctggccatac acttgagtga caatgacatc cactttgcct ttctctccac 6660 aggtgtccac tcccaggtcc aaccggaatt gtacccgcgg ccagagcttg cgggcgccac 6720 cgcggccgcg gggatccaga catgataaga tacattgatg agtttggaca aaccacaact 6780 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 6840 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 6900 gttcaggggg aggtgtggga ggttttttcg gatcctcttg gcgtaatcat ggtcatagct 6960 gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 7020 aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 7080 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 7140 cgcggggaaa ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 7200 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 7260 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 7320 caggaaccgt aaaaaggccg cgttgctggc gttcttccat aggctccgcc cccctgacga 7380 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 7440 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 7500 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 7560 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 7620 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 7680 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 7740 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 7800 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 7860 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 7920 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7980 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 8040 ctagatccct tttaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 8100 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 8160 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 8220 accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 8280 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 8340 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 8400 tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 8460 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 8520 gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 8580 agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 8640 aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 8700 gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 8760 tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 8820 gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 8880 tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 8940 aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 9000 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 9060 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 9120 tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg 9180 tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 9240 tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 9300 gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 9360 gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 9420 attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 9480 gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 9540 gttacgacgt tgtaaaacga cggccagtga att 9573 <210> 48 <211> 3252 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 intein fusion polyprotein coding sequence. <220> <221> CDS <222> (1)..(3249) <400> 48 atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag 96 Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt 144 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg 192 Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg 240 Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala 65 70 75 80 gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac 288 Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta 336 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac 384 Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp 115 120 125 tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag 432 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn 370 375 380 cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 tcc ctg tct ccg ggt aaa acc att tta ccg gaa gaa tgg gtt cca cta 1440 Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu 465 470 475 480 att aaa aac ggt aaa gtt aag ata ttc cgc att ggg gac ttc gtt gat 1488 Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp 485 490 495 gga ctt atg aag gcg aac caa gga aaa gtg aag aaa acg ggg gat aca 1536 Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr 500 505 510 gaa gtt tta gaa gtt gca gga att cat gcg ttt tcc ttt gac agg aag 1584 Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys 515 520 525 tcc aag aag gcc cgt gta atg gca gtg aaa gcc gtg ata aga cac cgt 1632 Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg 530 535 540 tat tcc gga aat gtt tat aga ata gtc tta aac tct ggt aga aaa ata 1680 Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile 545 550 555 560 aca ata aca gaa ggg cat agc cta ttt gtc tat agg aac ggg gat ctc 1728 Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu 565 570 575 gtt gag gca act ggg gag gat gtc aaa att ggg gat ctt ctt gca gtt 1776 Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val 580 585 590 cca aga tca gta aac cta cca gag aaa agg gaa cgc ttg aat att gtt 1824 Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val 595 600 605 gaa ctt ctt ctg aat ctc tca ccg gaa gag aca gaa gat ata ata ctt 1872 Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu 610 615 620 acg att cca gtt aaa ggc aga aag aac ttc ttc aag gga atg ttg aga 1920 Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg 625 630 635 640 aca tta cgt tgg att ttt ggt gag gaa aag aga gta agg aca gcg agc 1968 Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser 645 650 655 cgc tat cta aga cac ctt gaa aat ctc gga tac ata agg ttg agg aaa 2016 Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys 660 665 670 att gga tac gac atc att gat aag gag ggg ctt gag aaa tat aga acg 2064 Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr 675 680 685 ttg tac gag aaa ctt gtt gat gtt gtc cgc tat aat ggc aac aag aga 2112 Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg 690 695 700 gag tat tta gtt gaa ttt aat gct gtc cgg gac gtt atc tca cta atg 2160 Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met 705 710 715 720 cca gag gaa gaa ctg aag gaa tgg cgt att gga act aga aat gga ttc 2208 Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe 725 730 735 aga atg ggt acg ttc gta gat att gat gaa gat ttt gcc aag ctt gga 2256 Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly 740 745 750 tac gat agc gga gtc tac agg gtt tat gta aac gag gaa ctt aag ttt 2304 Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe 755 760 765 acg gaa tac aga aag aaa aag aat gta tat cac tct cac att gtt cca 2352 Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro 770 775 780 aag gat att ctc aaa gaa act ttt ggt aag gtc ttc cag aaa aat ata 2400 Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile 785 790 795 800 agt tac aag aaa ttt aga gag ctt gta gaa aat gga aaa ctt gac agg 2448 Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg 805 810 815 gag aaa gcc aaa cgc att gag tgg tta ctt aac gga gat ata gtc cta 2496 Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu 820 825 830 gat aga gtc gta gag att aag aga gag tac tat gat ggt tac gtt tac 2544 Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr 835 840 845 gat cta agt gtc gat gaa gat gag aat ttc ctt gct ggc ttt gga ttc 2592 Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe 850 855 860 ctc tat gca cat aat gac atc cag atg acc cag tct cca tcc tcc ctg 2640 Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 865 870 875 880 tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag 2688 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln 885 890 895 ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 2736 Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala 900 905 910 cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca 2784 Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro 915 920 925 tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc 2832 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile 930 935 940 agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat 2880 Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr 945 950 955 960 aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa 2928 Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 965 970 975 cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag 2976 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 980 985 990 cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc 3024 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 995 1000 1005 tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 3069 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu 1010 1015 1020 caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag 3114 Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys 1025 1030 1035 gac agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca 3159 Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala 1040 1045 1050 gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag 3204 Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln 1055 1060 1065 ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt 3249 Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 1070 1075 1080 tga 3252 <210> 49 <211> 1083 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 49 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala 65 70 75 80 Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp 115 120 125 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn 370 375 380 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu 465 470 475 480 Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp 485 490 495 Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr 500 505 510 Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys 515 520 525 Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg 530 535 540 Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile 545 550 555 560 Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu 565 570 575 Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val 580 585 590 Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val 595 600 605 Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu 610 615 620 Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg 625 630 635 640 Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser 645 650 655 Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys 660 665 670 Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr 675 680 685 Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg 690 695 700 Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met 705 710 715 720 Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe 725 730 735 Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly 740 745 750 Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe 755 760 765 Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro 770 775 780 Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile 785 790 795 800 Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg 805 810 815 Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu 820 825 830 Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr 835 840 845 Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe 850 855 860 Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 865 870 875 880 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln 885 890 895 Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala 900 905 910 Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro 915 920 925 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile 930 935 940 Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr 945 950 955 960 Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 965 970 975 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 980 985 990 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 995 1000 1005 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu 1010 1015 1020 Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys 1025 1030 1035 Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala 1040 1045 1050 Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln 1055 1060 1065 Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 1070 1075 1080 <210> 50 <211> 10629 <212> DNA <213> Artificial <220> <223> Synthetic construct, D2E7 intein fusion protein expression vector. <400> 50 gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480 cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540 tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600 aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660 gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720 gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780 tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840 actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900 ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960 ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080 ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140 tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200 ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260 tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320 ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380 gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440 ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500 gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560 aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620 accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680 accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740 gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800 tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860 tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920 tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980 tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040 gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100 acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160 gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220 taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280 aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340 aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400 aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460 gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520 tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580 gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640 agcctctccc tgtctccggg taaaaccatt ttaccggaag aatgggttcc actaattaaa 2700 aacggtaaag ttaagatatt ccgcattggg gacttcgttg atggacttat gaaggcgaac 2760 caaggaaaag tgaagaaaac gggggataca gaagttttag aagttgcagg aattcatgcg 2820 ttttcctttg acaggaagtc caagaaggcc cgtgtaatgg cagtgaaagc cgtgataaga 2880 caccgttatt ccggaaatgt ttatagaata gtcttaaact ctggtagaaa aataacaata 2940 acagaagggc atagcctatt tgtctatagg aacggggatc tcgttgaggc aactggggag 3000 gatgtcaaaa ttggggatct tcttgcagtt ccaagatcag taaacctacc agagaaaagg 3060 gaacgcttga atattgttga acttcttctg aatctctcac cggaagagac agaagatata 3120 atacttacga ttccagttaa aggcagaaag aacttcttca agggaatgtt gagaacatta 3180 cgttggattt ttggtgagga aaagagagta aggacagcga gccgctatct aagacacctt 3240 gaaaatctcg gatacataag gttgaggaaa attggatacg acatcattga taaggagggg 3300 cttgagaaat atagaacgtt gtacgagaaa cttgttgatg ttgtccgcta taatggcaac 3360 aagagagagt atttagttga atttaatgct gtccgggacg ttatctcact aatgccagag 3420 gaagaactga aggaatggcg tattggaact agaaatggat tcagaatggg tacgttcgta 3480 gatattgatg aagattttgc caagcttgga tacgatagcg gagtctacag ggtttatgta 3540 aacgaggaac ttaagtttac ggaatacaga aagaaaaaga atgtatatca ctctcacatt 3600 gttccaaagg atattctcaa agaaactttt ggtaaggtct tccagaaaaa tataagttac 3660 aagaaattta gagagcttgt agaaaatgga aaacttgaca gggagaaagc caaacgcatt 3720 gagtggttac ttaacggaga tatagtccta gatagagtcg tagagattaa gagagagtac 3780 tatgatggtt acgtttacga tctaagtgtc gatgaagatg agaatttcct tgctggcttt 3840 ggattcctct atgcacataa tgacatccag atgacccagt ctccatcctc cctgtctgca 3900 tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag aaattactta 3960 gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccact 4020 ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga tttcactctc 4080 accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag gtataaccgt 4140 gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt ggctgcacca 4200 tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg 4260 tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc 4320 ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac 4380 agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc 4440 tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag 4500 tgttgagcgg ccgcgtttaa actgaatgag cgcgtccatc cagacatgat aagatacatt 4560 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4620 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4680 aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag 4740 taaaacctct acaaatgtgg tatggctgat tatgatccgg ctgcctcgcg cgtttcggtg 4800 atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 4860 cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 4920 gcgcagccat gaccggtcga cggcgcgcct ttttttttaa tttttatttt attttatttt 4980 tgacgcgccg aaggcgcgat ctgagctcgg tacagcttgg ctgtggaatg tgtgtcagtt 5040 agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 5100 ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 5160 catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct 5220 aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc 5280 agaggccgag gccgcctcgg cctctgagct attccagaag tagtgaggag gcttttttgg 5340 aggcctaggc ttttgcaaaa agctcctcga ggaactgaaa aaccagaaag ttaactggta 5400 agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc aaatcaaaga 5460 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 5520 ctaaaagctg cggaattgta cccgcggcct aatacgactc actataggga ctagtatggt 5580 tcgaccattg aactgcatcg tcgccgtgtc ccaaaatatg gggattggca agaacggaga 5640 cctaccctgg cctccgctca ggaacgagtt caagtacttc caaagaatga ccacaacctc 5700 ttcagtggaa ggtaaacaga atctggtgat tatgggtagg aaaacctggt tctccattcc 5760 tgagaagaat cgacctttaa aggacagaat taatatagtt ctcagtagag aactcaaaga 5820 accaccacga ggagctcatt ttcttgccaa aagtttagat gatgccttaa gacttattga 5880 acaaccggaa ttggcaagta aagtagacat ggtttggata gtcggaggca gttctgttta 5940 ccaggaagcc atgaatcaac caggccacct cagactcttt gtgacaagga tcatgcagga 6000 atttgaaagt gacacgtttt tcccagaaat tgatttgggg aaatataaac ttctcccaga 6060 atacccaggc gtcctctctg aggtccagga ggaaaaaggc atcaagtata agtttgaagt 6120 ctacgagaag aaagactaag cggccgagcg cgcggatctg gaaacgggag atgggggagg 6180 ctaactgaag cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa 6240 agacagaata aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca 6300 gggctggcac tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc 6360 ttccttttcc ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt 6420 cggggcggca ggccctgcca tagccactgg ccccgtgggt tagggacggg gtcccccatg 6480 gggaatggtt tatggttcgt gggggttatt attttgggcg ttgcgtgggg tctggagatc 6540 ccccgggctg caggaattcc gttacattac ttacggtaaa tggcccgcct ggctgaccgc 6600 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 6660 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 6720 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 6780 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 6840 tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 6900 agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 6960 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 7020 aaaagggcgg gaattcgagc tcggtactcg agcggtgttc cgcggtcctc ctcgtataga 7080 aactcggacc actctgagac gaaggctcgc gtccaggcca gcacgaagga ggctaagtgg 7140 gaggggtagc ggtcgttgtc cactaggggg tccactcgct ccagggtgtg aagacacatg 7200 tcgccctctt cggcatcaag gaaggtgatt ggtttatagg tgtaggccac gtgaccgggt 7260 gttcctgaag gggggctata aaagggggtg ggggcgcgtt cgtcctcact ctcttccgca 7320 tcgctgtctg cgagggccag ctgttgggct cgcggttgag gacaaactct tcgcggtctt 7380 tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac 7440 ctgagcgagt ccgcatcgac cggatcggaa aacctctcga ctgttggggt gagtactccc 7500 tctcaaaagc gggcatgact tctgcgctaa gattgtcagt ttccaaaaac gaggaggatt 7560 tgatattcac ctggcccgcg gtgatgcctt tgagggtggc cgcgtccatc tggtcagaaa 7620 agacaatctt tttgttgtca agcttgaggt gtggcaggct tgagatctgg ccatacactt 7680 gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc aggtccaacc 7740 ggaattgtac ccgcggccag agcttgcggg cgccaccgcg gccgcgggga tccagacatg 7800 ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 7860 atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 7920 gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 7980 ttttcggatc ctcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 8040 gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 8100 atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 8160 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggaaaggcg gtttgcgtat 8220 tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 8280 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 8340 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 8400 gctggcgttc ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 8460 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 8520 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 8580 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 8640 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 8700 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 8760 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 8820 gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 8880 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 8940 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 9000 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 9060 gattttggtc atgagattat caaaaaggat cttcacctag atccctttta attaaaaatg 9120 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 9180 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 9240 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 9300 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 9360 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 9420 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 9480 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 9540 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 9600 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 9660 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 9720 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 9780 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 9840 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 9900 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 9960 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 10020 aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 10080 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 10140 tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 10200 aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 10260 ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 10320 acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 10380 ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 10440 cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga 10500 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 10560 aaggcgatta agttgggtaa cgccagggtt ttcccagtta cgacgttgta aaacgacggc 10620 cagtgaatt 10629 <210> 51 <211> 547 <212> PRT <213> Pyrococcus sp. <400> 51 Asn Ser Ile Leu Pro Glu Glu Trp Val Pro Leu Ile Lys Asn Gly Lys 1 5 10 15 Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp Gly Leu Met Lys Ala 20 25 30 Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr Glu Val Leu Glu Val 35 40 45 Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys Ser Lys Lys Ala Arg 50 55 60 Val Met Ala Val Lys Ala Val Ile Arg His Arg Tyr Ser Gly Asn Val 65 70 75 80 Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile Thr Ile Thr Glu Gly 85 90 95 His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu Val Glu Ala Thr Gly 100 105 110 Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val Pro Arg Ser Val Asn 115 120 125 Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val Glu Leu Leu Leu Asn 130 135 140 Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu Thr Ile Pro Val Lys 145 150 155 160 Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile 165 170 175 Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser Arg Tyr Leu Arg His 180 185 190 Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys Ile Gly Tyr Asp Ile 195 200 205 Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr Leu Tyr Glu Lys Leu 210 215 220 Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu 225 230 235 240 Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met Pro Glu Glu Glu Leu 245 250 255 Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe Arg Met Gly Thr Phe 260 265 270 Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Leu Gly Tyr Tyr Val Ser 275 280 285 Glu Gly Ser Ala Arg Lys Trp Lys Asn Gln Thr Gly Gly Trp Ser Tyr 290 295 300 Thr Val Arg Leu Tyr Asn Glu Asn Asp Glu Val Leu Asp Asp Met Glu 305 310 315 320 His Leu Ala Lys Lys Phe Phe Gly Lys Val Lys Arg Gly Lys Asn Tyr 325 330 335 Val Glu Ile Pro Lys Lys Met Ala Tyr Ile Ile Phe Glu Ser Leu Cys 340 345 350 Gly Thr Leu Ala Glu Asn Lys Arg Val Pro Glu Val Ile Phe Thr Ser 355 360 365 Ser Lys Gly Val Arg Trp Ala Phe Leu Glu Gly Tyr Phe Ile Gly Asp 370 375 380 Gly Asp Val His Pro Ser Lys Arg Val Arg Leu Ser Thr Lys Ser Glu 385 390 395 400 Leu Leu Val Asn Gly Leu Val Leu Leu Leu Asn Ser Leu Gly Val Ser 405 410 415 Ala Ile Lys Leu Gly Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn 420 425 430 Glu Glu Leu Lys Phe Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His 435 440 445 Ser His Ile Val Pro Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val 450 455 460 Phe Gln Lys Asn Ile Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn 465 470 475 480 Gly Lys Leu Asp Arg Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn 485 490 495 Gly Asp Ile Val Leu Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr 500 505 510 Asp Gly Tyr Val Tyr Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu 515 520 525 Ala Gly Phe Gly Phe Leu Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr 530 535 540 Gly Tyr Ala 545 <210> 52 <211> 26 <212> DNA <213> Artificial <220> <223> Synthetic construct, oligonucleotide useful as primer. <400> 52 agcattttac cagatgaatg gctccc 26 <210> 53 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic construct, oligonucleotide useful as primer. <400> 53 aacgaggaag ttctcattat cctcaac 27 <210> 54 <211> 44 <212> DNA <213> Artificial <220> <223> Synthetic construct; oligonucleotide useful as a primer. <400> 54 agcctctccc tgtctccggg taaaagcatt ttaccagatg aatg 44 <210> 55 <211> 42 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 55 gggcgggcac gcgcatgtcc atgttgtgtg cgtaaagtag tc 42 <210> 56 <211> 47 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 56 agcctctccc tgtctccggg taaaaacagc attttaccag atgaatg 47 <210> 57 <211> 45 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 57 gggcgggcac gcgcatgtcc atactgttgt gtgcgtaaag tagtc 45 <210> 58 <211> 53 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 58 agcctctccc tgtctccggg taaattagca aacagcattt taccagatga atg 53 <210> 59 <211> 51 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 59 gggcgggcac gcgcatgtcc atgtaataac tgttgtgtgc gtaaagtagt c 51 <210> 60 <211> 36 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 60 tgcccgggcg ccaccatgga gtttgggctg agctgg 36 <210> 61 <211> 36 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 61 tgcccgggcg ccaccatgga gtttgggctg agctgg 36 <210> 62 <211> 9460 <212> DNA <213> Artificial <220> <223> Synthetic construct: sequence of plasmid pTT3-HcintLC-p.hori <400> 62 gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60 aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120 atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180 ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240 atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300 cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360 gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420 tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480 ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540 ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600 aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660 ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720 agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780 tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840 tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900 tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960 ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020 tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080 gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140 gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200 gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260 tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320 cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380 aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440 ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500 aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560 gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620 gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680 cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740 tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800 tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860 tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920 tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980 ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040 gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100 ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160 ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220 ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280 ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400 gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760 cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060 tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240 tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320 cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380 ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560 ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620 atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680 acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740 attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800 tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220 cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340 aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400 agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460 ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520 atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580 atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640 gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700 gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760 caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820 cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880 ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940 aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000 tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060 cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120 gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180 tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240 cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300 ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360 taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420 ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480 ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540 cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600 cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660 ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720 agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780 cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840 ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900 gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960 ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020 ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080 cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140 aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200 ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260 caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320 ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aaagcatttt 7380 accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt cgattcgtaa aaattggaga 7440 cttcatagat agggagattg aggaaaacgc tgagagagtg aagagggatg gtgaaactga 7500 aattctagag gttaaagatc ttaaagccct ttccttcaat agagaaacaa aaaagagcga 7560 gctcaagaag gtaaaggccc taattagaca ccgctattca gggaaggttt acagcattaa 7620 actaaagtca gggagaagga tcaaaataac ctcaggtcat agtctgttct cagtaaaaaa 7680 tggaaagcta gttaaggtca ggggagatga actcaagcct ggtgatctcg ttgtcgttcc 7740 aggaaggtta aaacttccag aaagcaagca agtgctaaat ctcgttgaac tactcctgaa 7800 attacccgaa gaggagacat cgaacatcgt aatgatgatc ccagttaaag gtagaaagaa 7860 tttcttcaaa gggatgctca aaacattata ctggatcttc ggggagggag aaaggccaag 7920 aaccgcaggg cgctatctca agcatcttga aagattagga tacgttaagc tcaagagaag 7980 aggctgtgaa gttctcgact gggagtcact taagaggtac aggaagcttt acgagaccct 8040 cattaagaac ctgaaatata acggtaatag cagggcatac atggttgaat ttaactctct 8100 cagggatgta gtgagcttaa tgccaataga agaacttaag gagtggataa ttggagaacc 8160 taggggtcct aagataggta ccttcattga tgtagatgat tcatttgcaa agctcctagg 8220 ttactacata agtagcggag atgtagagaa agatagggtg aagttccaca gtaaagatca 8280 aaacgttctc gaggatatag cgaaacttgc cgagaagtta tttggaaagg tgaggagagg 8340 aagaggatat attgaggtat cagggaaaat tagccatgcc atatttagag ttttagcgga 8400 aggtaagaga attccagagt tcatcttcac atccccaatg gatattaagg tagccttcct 8460 taagggactc aacggtaatg ctgaagaatt aacgttctcc actaagagtg agctattagt 8520 taaccagctt atccttctcc tgaactccat tggagtttcg gatataaaga ttgaacatga 8580 gaaaggggtt tacagagttt acataaataa gaaggaatcc tccaatgggg atatagtact 8640 tgatagcgtc gaatctatcg aagttgaaaa atacgagggc tacgtttatg atctaagtgt 8700 tgaggataat gagaacttcc tcgttggctt cggactactt tacgcacaca acatggacat 8760 gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg ttccccggct cgcgatgcga 8820 catccagatg acccagtctc catcctccct gtctgcatct gtaggggaca gagtcaccat 8880 cacttgtcgg gcaagtcagg gcatcagaaa ttacttagcc tggtatcagc aaaaaccagg 8940 gaaagcccct aagctcctga tctatgctgc atccactttg caatcagggg tcccatctcg 9000 gttcagtggc agtggatctg ggacagattt cactctcacc atcagcagcc tacagcctga 9060 agatgttgca acttattact gtcaaaggta taaccgtgca ccgtatactt ttggccaggg 9120 gaccaaggtg gaaatcaaac gtacggtggc tgcaccatct gtcttcatct tcccgccatc 9180 tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc ctgctgaata acttctatcc 9240 cagagaggcc aaagtacagt ggaaggtgga taacgccctc caatcgggta actcccagga 9300 gagtgtcaca gagcaggaca gcaaggacag cacctacagc ctcagcagca ccctgacgct 9360 gagcaaagca gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct 9420 gagctcgccc gtcacaaaga gcttcaacag gggagagtgt 9460 <210> 63 <211> 1166 <212> PRT <213> Artificial <220> <223> Synthetic: amino Acid Sequence of the open reading frame in pTT3-HcintLC-p.hori <400> 63 Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly 1 5 10 15 Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 35 40 45 Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala 65 70 75 80 Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp 115 120 125 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn 370 375 380 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 Ser Leu Ser Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile 465 470 475 480 Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp 485 490 495 Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr 500 505 510 Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu 515 520 525 Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg 530 535 540 Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile 545 550 555 560 Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu 565 570 575 Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val 580 585 590 Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val 595 600 605 Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met 610 615 620 Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys 625 630 635 640 Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly 645 650 655 Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg 660 665 670 Arg Gly Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys 675 680 685 Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg 690 695 700 Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met 705 710 715 720 Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro 725 730 735 Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu 740 745 750 Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe 755 760 765 His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu 770 775 780 Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser 785 790 795 800 Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg 805 810 815 Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe 820 825 830 Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys 835 840 845 Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly 850 855 860 Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr 865 870 875 880 Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val 885 890 895 Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser 900 905 910 Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala 915 920 925 His Asn Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu 930 935 940 Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro 945 950 955 960 Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg 965 970 975 Ala Ser Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro 980 985 990 Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser 995 1000 1005 Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe 1010 1015 1020 Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr 1025 1030 1035 Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly 1040 1045 1050 Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe 1055 1060 1065 Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser 1070 1075 1080 Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val 1085 1090 1095 Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu 1100 1105 1110 Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 1115 1120 1125 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val 1130 1135 1140 Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr 1145 1150 1155 Lys Ser Phe Asn Arg Gly Glu Cys 1160 1165 <210> 64 <211> 1404 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from pTT3-HcintLC1aa-p.hori <400> 64 ccgggtaaaa acagcatttt accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt 60 cgattcgtaa aaattggaga cttcatagat agggagattg aggaaaacgc tgagagagtg 120 aagagggatg gtgaaactga aattctagag gttaaagatc ttaaagccct ttccttcaat 180 agagaaacaa aaaagagcga gctcaagaag gtaaaggccc taattagaca ccgctattca 240 gggaaggttt acagcattaa actaaagtca gggagaagga tcaaaataac ctcaggtcat 300 agtctgttct cagtaaaaaa tggaaagcta gttaaggtca ggggagatga actcaagcct 360 ggtgatctcg ttgtcgttcc aggaaggtta aaacttccag aaagcaagca agtgctaaat 420 ctcgttgaac tactcctgaa attacccgaa gaggagacat cgaacatcgt aatgatgatc 480 ccagttaaag gtagaaagaa tttcttcaaa gggatgctca aaacattata ctggatcttc 540 ggggagggag aaaggccaag aaccgcaggg cgctatctca agcatcttga aagattagga 600 tacgttaagc tcaagagaag aggctgtgaa gttctcgact gggagtcact taagaggtac 660 aggaagcttt acgagaccct cattaagaac ctgaaatata acggtaatag cagggcatac 720 atggttgaat ttaactctct cagggatgta gtgagcttaa tgccaataga agaacttaag 780 gagtggataa ttggagaacc taggggtcct aagataggta ccttcattga tgtagatgat 840 tcatttgcaa agctcctagg ttactacata agtagcggag atgtagagaa agatagggtg 900 aagttccaca gtaaagatca aaacgttctc gaggatatag cgaaacttgc cgagaagtta 960 tttggaaagg tgaggagagg aagaggatat attgaggtat cagggaaaat tagccatgcc 1020 atatttagag ttttagcgga aggtaagaga attccagagt tcatcttcac atccccaatg 1080 gatattaagg tagccttcct taagggactc aacggtaatg ctgaagaatt aacgttctcc 1140 actaagagtg agctattagt taaccagctt atccttctcc tgaactccat tggagtttcg 1200 gatataaaga ttgaacatga gaaaggggtt tacagagttt acataaataa gaaggaatcc 1260 tccaatgggg atatagtact tgatagcgtc gaatctatcg aagttgaaaa atacgagggc 1320 tacgtttatg atctaagtgt tgaggataat gagaacttcc tcgttggctt cggactactt 1380 tacgcacaca acagtatgga catg 1404 <210> 65 <211> 468 <212> PRT <213> Artificial <220> <223> Synthetic: partial amino acid sequence from pTT3-HcintLC1aa-p.hori, showing 4 amino acids upstream of the heavy chain and r amino acids downstream of the intein. <400> 65 Pro Gly Lys Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu 1 5 10 15 Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu 20 25 30 Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile 35 40 45 Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys 50 55 60 Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser 65 70 75 80 Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile 85 90 95 Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys 100 105 110 Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly 115 120 125 Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu 130 135 140 Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile 145 150 155 160 Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu 165 170 175 Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr 180 185 190 Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly 195 200 205 Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr 210 215 220 Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr 225 230 235 240 Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile 245 250 255 Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile 260 265 270 Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr 275 280 285 Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser 290 295 300 Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu 305 310 315 320 Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys 325 330 335 Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro 340 345 350 Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys 355 360 365 Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu 370 375 380 Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser 385 390 395 400 Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn 405 410 415 Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser 420 425 430 Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu 435 440 445 Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn 450 455 460 Ser Met Asp Met 465 <210> 66 <211> 1416 <212> DNA <213> Artificial <220> <223> Synthetic construct: pTT3-HcintLC3aa-p.hori partial coding sequence. <400> 66 ccgggtaaat tagcaaacag cattttacca gatgaatggc tcccaattgt tgaaaatgaa 60 aaagttcgat tcgtaaaaat tggagacttc atagataggg agattgagga aaacgctgag 120 agagtgaaga gggatggtga aactgaaatt ctagaggtta aagatcttaa agccctttcc 180 ttcaatagag aaacaaaaaa gagcgagctc aagaaggtaa aggccctaat tagacaccgc 240 tattcaggga aggtttacag cattaaacta aagtcaggga gaaggatcaa aataacctca 300 ggtcatagtc tgttctcagt aaaaaatgga aagctagtta aggtcagggg agatgaactc 360 aagcctggtg atctcgttgt cgttccagga aggttaaaac ttccagaaag caagcaagtg 420 ctaaatctcg ttgaactact cctgaaatta cccgaagagg agacatcgaa catcgtaatg 480 atgatcccag ttaaaggtag aaagaatttc ttcaaaggga tgctcaaaac attatactgg 540 atcttcgggg agggagaaag gccaagaacc gcagggcgct atctcaagca tcttgaaaga 600 ttaggatacg ttaagctcaa gagaagaggc tgtgaagttc tcgactggga gtcacttaag 660 aggtacagga agctttacga gaccctcatt aagaacctga aatataacgg taatagcagg 720 gcatacatgg ttgaatttaa ctctctcagg gatgtagtga gcttaatgcc aatagaagaa 780 cttaaggagt ggataattgg agaacctagg ggtcctaaga taggtacctt cattgatgta 840 gatgattcat ttgcaaagct cctaggttac tacataagta gcggagatgt agagaaagat 900 agggtgaagt tccacagtaa agatcaaaac gttctcgagg atatagcgaa acttgccgag 960 aagttatttg gaaaggtgag gagaggaaga ggatatattg aggtatcagg gaaaattagc 1020 catgccatat ttagagtttt agcggaaggt aagagaattc cagagttcat cttcacatcc 1080 ccaatggata ttaaggtagc cttccttaag ggactcaacg gtaatgctga agaattaacg 1140 ttctccacta agagtgagct attagttaac cagcttatcc ttctcctgaa ctccattgga 1200 gtttcggata taaagattga acatgagaaa ggggtttaca gagtttacat aaataagaag 1260 gaatcctcca atggggatat agtacttgat agcgtcgaat ctatcgaagt tgaaaaatac 1320 gagggctacg tttatgatct aagtgttgag gataatgaga acttcctcgt tggcttcgga 1380 ctactttacg cacacaacag ttattacatg gacatg 1416 <210> 67 <211> 472 <212> PRT <213> Artificial <220> <223> Synthetic: pTT3-HcintLC3aa-p.hori partial amino acid sequence showing intein and flanking sequences. <400> 67 Pro Gly Lys Leu Ala Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile 1 5 10 15 Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp 20 25 30 Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr 35 40 45 Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu 50 55 60 Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg 65 70 75 80 Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile 85 90 95 Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu 100 105 110 Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val 115 120 125 Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val 130 135 140 Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met 145 150 155 160 Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys 165 170 175 Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly 180 185 190 Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg 195 200 205 Arg Gly Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys 210 215 220 Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg 225 230 235 240 Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met 245 250 255 Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro 260 265 270 Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu 275 280 285 Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe 290 295 300 His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu 305 310 315 320 Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser 325 330 335 Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg 340 345 350 Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe 355 360 365 Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys 370 375 380 Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly 385 390 395 400 Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr 405 410 415 Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val 420 425 430 Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser 435 440 445 Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala 450 455 460 His Asn Ser Tyr Tyr Met Asp Met 465 470 <210> 68 <211> 31 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 68 ggactacttt acgcagccaa catggacatg c 31 <210> 69 <211> 31 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 69 gcatgtccat gttggctgcg taaagtagtc c 31 <210> 70 <211> 34 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 70 ggactacttt acgcagccaa cagtatggac atgc 34 <210> 71 <211> 34 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 71 gcatgtccat actgttggct gcgtaaagta gtcc 34 <210> 72 <211> 18 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 72 ggtgaggaga ggaagagg 18 <210> 73 <211> 16 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 73 ccagaggtcg aggtcg 16 <210> 74 <211> 14 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 74 cggcgtggag gtgc 14 <210> 75 <211> 45 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 75 caacaattgg gagccattca tctggtaaaa tggttttacc cggag 45 <210> 76 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 76 ccgcccagct gctgggcgac gagtggttcc ccggctcgcg 40 <210> 77 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 77 cgcgagccgg ggaaccactc gtcgcccagc agctgggcgg 40 <210> 78 <211> 15 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 78 tgagcggccg ctcga 15 <210> 79 <211> 15 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 79 gttgtgtgcg taaag 15 <210> 80 <211> 15 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 80 agcattttac cagat 15 <210> 81 <211> 15 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 81 ggtggcgccc aaact 15 <210> 82 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 82 ctttacgcac acaacatgga catgcgcgtg 30 <210> 83 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 83 tcgagcggcc gctcaacact ctcccct 27 <210> 84 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 84 agtttgggcg ccaccatgga gtttgggctg 30 <210> 85 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 85 atctggtaaa atgcttttac ccggagacag 30 <210> 86 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 86 agtttgggcg ccaccatgga catgcgcgtg 30 <210> 87 <211> 31 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 87 atctggtaaa atgctacact ctcccctgtt g 31 <210> 88 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 88 ctttacgcac acaacatgga gtttgggctg 30 <210> 89 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 89 tcgagcggcc gctcatttac ccggagacag 30 <210> 90 <211> 14 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 90 cgccaagctc tagc 14 <210> 91 <211> 14 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 91 ggtcgaggtc gggg 14 <210> 92 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 92 acatgcgcgt gcccgcccag tggttccccg gctcgcgatg 40 <210> 93 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 93 catcgcgagc cggggaacca ctgggcgggc acgcgcatgt 40 <210> 94 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 94 ctttacgcac acaacgacat ccagatgacc 30 <210> 95 <211> 30 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 95 ggtcatctgg atgtcgttgt gtgcgtaaag 30 <210> 96 <211> 36 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 96 tggttccccg gctcgggagg cgacatccag atgacc 36 <210> 97 <211> 36 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 97 ggtcatctgg atgtcgcctc ccgagccggg gaacca 36 <210> 98 <211> 1464 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence of Construct A. <400> 98 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcagccaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440 cccggctcgc gatgcgacat ccag 1464 <210> 99 <211> 488 <212> PRT <213> Artificial <220> <223> Synthetic: partial amino acid sequence of Construct A. <400> 99 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Met 450 455 460 Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe 465 470 475 480 Pro Gly Ser Arg Cys Asp Ile Gln 485 <210> 100 <211> 1467 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence of construct B. <400> 100 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcagccaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440 ttccccggct cgcgatgcga catccag 1467 <210> 101 <211> 489 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence of construct A. <400> 101 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Ser 450 455 460 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 465 470 475 480 Phe Pro Gly Ser Arg Cys Asp Ile Gln 485 <210> 102 <211> 1467 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence in construct E. <400> 102 ccgggtaaaa ccattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcacacaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440 ttccccggct cgcgatgcga catccag 1467 <210> 103 <211> 489 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence from construct E. <400> 103 Pro Gly Lys Thr Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Ser 450 455 460 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 465 470 475 480 Phe Pro Gly Ser Arg Cys Asp Ile Gln 485 <210> 104 <211> 1458 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from construct H. <400> 104 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcgacgagtg gttccccggc 1440 tcgcgatgcg acatccag 1458 <210> 105 <211> 486 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence from construct H. <400> 105 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met 450 455 460 Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro Gly 465 470 475 480 Ser Arg Cys Asp Ile Gln 485 <210> 106 <211> 1443 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence for construct J. <400> 106 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcacacaaca tggacatgcg cgtgcccgcc cagtggttcc ccggctcgcg atgcgacatc 1440 cag 1443 <210> 107 <211> 481 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence from construct J. <400> 107 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met 450 455 460 Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys Asp Ile 465 470 475 480 Gln <210> 108 <211> 1398 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence for construct K. <400> 108 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcacacaacg acatccag 1398 <210> 109 <211> 466 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence for construct K. <400> 109 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Asp 450 455 460 Ile Gln 465 <210> 110 <211> 1464 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence for construct L. <400> 110 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60 ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120 agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180 gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240 aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300 ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360 gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420 gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480 gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540 gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600 gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660 aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720 gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780 tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840 tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900 ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960 ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020 tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080 attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140 aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200 ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260 aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320 gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380 gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440 cccggctcgg gaggcgacat ccag 1464 <210> 111 <211> 488 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence of construct L. <400> 111 Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn 1 5 10 15 Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile 20 25 30 Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu 35 40 45 Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys 50 55 60 Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly 65 70 75 80 Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr 85 90 95 Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val 100 105 110 Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg 115 120 125 Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu 130 135 140 Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro 145 150 155 160 Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr 165 170 175 Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu 180 185 190 Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys 195 200 205 Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu 210 215 220 Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met 225 230 235 240 Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu 245 250 255 Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly 260 265 270 Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr 275 280 285 Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys 290 295 300 Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe 305 310 315 320 Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile 325 330 335 Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu 340 345 350 Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly 355 360 365 Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu 370 375 380 Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp 385 390 395 400 Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys 405 410 415 Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile 420 425 430 Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp 435 440 445 Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met 450 455 460 Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe 465 470 475 480 Pro Gly Ser Gly Gly Asp Ile Gln 485 <210> 112 <211> 26 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 112 tgctttgcca agggtaccaa tgtttt 26 <210> 113 <211> 26 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 113 attatggacg acaacctggt tggcaa 26 <210> 114 <211> 59 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 114 ccgcagaaga gcctctccct gtctccgggt aaatgctttg ccaagggtac caatgtttt 59 <210> 115 <211> 62 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 115 ccgcagaaga gcctctccct gtctccgggt aaagggtgct ttgccaaggg taccaatgtt 60 tt 62 <210> 116 <211> 68 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 116 ccgcagaaga gcctctccct gtctccgggt aaatatgtcg ggtgctttgc caagggtacc 60 aatgtttt 68 <210> 117 <211> 65 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 117 cagcaggccc agcagctggg cgggcacgcg catgtccata ttatggacga caacctggtt 60 ggcaa 65 <210> 118 <211> 68 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 118 cagcaggccc agcagctggg cgggcacgcg catgtccatg caattatgga cgacaacctg 60 gttggcaa 68 <210> 119 <211> 74 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 119 cagcaggccc agcagctggg cgggcacgcg catgtccatt tctccgcaat tatggacgac 60 aacctggttg gcaa 74 <210> 120 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 120 ccactacacg cagaagagcc tctccctgtc tccgggtaaa 40 <210> 121 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 121 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat 40 <210> 122 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 122 atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40 <210> 123 <211> 41 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 123 tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41 <210> 124 <211> 9442 <212> DNA <213> Artificial <220> <223> Synthetic construct: nucleotide sequence of plasmid pTT3-D2E7 Heavy Chain - intein - D2E7 Light Chain. <400> 124 gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60 aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120 atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180 ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240 atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300 cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360 gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420 tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480 ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540 ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600 aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660 ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720 agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780 tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840 tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900 tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960 ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020 tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080 gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140 gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200 gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260 tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320 cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380 aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440 ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500 aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560 gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620 gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680 cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740 tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800 tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860 tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920 tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980 ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040 gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100 ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160 ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220 ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280 ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400 gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760 cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060 tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240 tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320 cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380 ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560 ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620 atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680 acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740 attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800 tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220 cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340 aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400 agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460 ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520 atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580 atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640 gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700 gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760 caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820 cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880 ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940 aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000 tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060 cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120 gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180 tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240 cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300 ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360 taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420 ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480 ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540 cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600 cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660 ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720 agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780 cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840 ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900 gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960 ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020 ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080 cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140 aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200 ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260 caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320 ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgctttgc 7380 caagggtacc aatgttttaa tggcggatgg gtctattgaa tgtattgaaa acattgaggt 7440 tggtaataag gtcatgggta aagatggcag acctcgtgag gtaattaaat tgcccagagg 7500 aagagaaact atgtacagcg tcgtgcagaa aagtcagcac agagcccaca aaagtgactc 7560 aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat gcgacccatg agttggttgt 7620 tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt aagggtgtcg aatattttga 7680 agttattact tttgagatgg gccaaaagaa agcccccgac ggtagaattg ttgagcttgt 7740 caaggaagtt tcaaagagct acccaatatc tgaggggcct gagagagcca acgaattagt 7800 agaatcctat agaaaggctt caaataaagc ttattttgag tggactattg aggccagaga 7860 tctttctctg ttgggttccc atgttcgtaa agctacctac cagacttacg ctccaattct 7920 ttatgagaat gaccactttt tcgactacat gcaaaaaagt aagtttcatc tcaccattga 7980 aggtccaaaa gtacttgctt atttacttgg tttatggatt ggtgatggat tgtctgacag 8040 ggcaactttt tcggttgatt ccagagatac ttctttgatg gaacgtgtta ctgaatatgc 8100 tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa gaaccacaag ttgccaaaac 8160 tgttaatttg tactctaaag ttgtcagagg taatggtatt cgcaataatc ttaatactga 8220 gaatccatta tgggacgcta ttgttggctt aggattcttg aaggacggtg tcaaaaatat 8280 tccttctttc ttgtctacgg acaatatcgg tactcgtgaa acatttcttg ctggtctaat 8340 tgattctgat ggctatgtta ctgatgagca tggtattaaa gcaacaataa agacaattca 8400 tacttctgtc agagatggtt tggtttccct tgctcgttct ttaggcttag tagtctcggt 8460 taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa cataaaatta gttatgctat 8520 ttatatgtct ggtggagatg ttttgcttaa cgttctttcg aagtgtgccg gctctaaaaa 8580 attcaggcct gctcccgccg ctgcttttgc acgtgagtgc cgcggatttt atttcgagtt 8640 acaagaattg aaggaagacg attattatgg gattacttta tctgatgatt ctgatcatca 8700 gtttttgctt gccaaccagg ttgtcgtcca taatatggac atgcgcgtgc ccgcccagct 8760 gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc gacatccaga tgacccagtc 8820 tccatcctcc ctgtctgcat ctgtagggga cagagtcacc atcacttgtc gggcaagtca 8880 gggcatcaga aattacttag cctggtatca gcaaaaacca gggaaagccc ctaagctcct 8940 gatctatgct gcatccactt tgcaatcagg ggtcccatct cggttcagtg gcagtggatc 9000 tgggacagat ttcactctca ccatcagcag cctacagcct gaagatgttg caacttatta 9060 ctgtcaaagg tataaccgtg caccgtatac ttttggccag gggaccaagg tggaaatcaa 9120 acgtacggtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc 9180 tggaactgcc tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca 9240 gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga 9300 cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga 9360 gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa 9420 gagcttcaac aggggagagt gt 9442 <210> 125 <211> 1386 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence in pTT3-HC-VMAint-LC-1aa. <400> 125 ccgggtaaag ggtgctttgc caagggtacc aatgttttaa tggcggatgg gtctattgaa 60 tgtattgaaa acattgaggt tggtaataag gtcatgggta aagatggcag acctcgtgag 120 gtaattaaat tgcccagagg aagagaaact atgtacagcg tcgtgcagaa aagtcagcac 180 agagcccaca aaagtgactc aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat 240 gcgacccatg agttggttgt tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt 300 aagggtgtcg aatattttga agttattact tttgagatgg gccaaaagaa agcccccgac 360 ggtagaattg ttgagcttgt caaggaagtt tcaaagagct acccaatatc tgaggggcct 420 gagagagcca acgaattagt agaatcctat agaaaggctt caaataaagc ttattttgag 480 tggactattg aggccagaga tctttctctg ttgggttccc atgttcgtaa agctacctac 540 cagacttacg ctccaattct ttatgagaat gaccactttt tcgactacat gcaaaaaagt 600 aagtttcatc tcaccattga aggtccaaaa gtacttgctt atttacttgg tttatggatt 660 ggtgatggat tgtctgacag ggcaactttt tcggttgatt ccagagatac ttctttgatg 720 gaacgtgtta ctgaatatgc tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa 780 gaaccacaag ttgccaaaac tgttaatttg tactctaaag ttgtcagagg taatggtatt 840 cgcaataatc ttaatactga gaatccatta tgggacgcta ttgttggctt aggattcttg 900 aaggacggtg tcaaaaatat tccttctttc ttgtctacgg acaatatcgg tactcgtgaa 960 acatttcttg ctggtctaat tgattctgat ggctatgtta ctgatgagca tggtattaaa 1020 gcaacaataa agacaattca tacttctgtc agagatggtt tggtttccct tgctcgttct 1080 ttaggcttag tagtctcggt taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa 1140 cataaaatta gttatgctat ttatatgtct ggtggagatg ttttgcttaa cgttctttcg 1200 aagtgtgccg gctctaaaaa attcaggcct gctcccgccg ctgcttttgc acgtgagtgc 1260 cgcggatttt atttcgagtt acaagaattg aaggaagacg attattatgg gattacttta 1320 tctgatgatt ctgatcatca gtttttgctt gccaaccagg ttgtcgtcca taattgcatg 1380 gacatg 1386 <210> 126 <211> 1398 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from pTT3-HC-VMAint-LC-3aa. <400> 126 ccgggtaaat atgtcgggtg ctttgccaag ggtaccaatg ttttaatggc ggatgggtct 60 attgaatgta ttgaaaacat tgaggttggt aataaggtca tgggtaaaga tggcagacct 120 cgtgaggtaa ttaaattgcc cagaggaaga gaaactatgt acagcgtcgt gcagaaaagt 180 cagcacagag cccacaaaag tgactcaagt cgtgaagtgc cagaattact caagtttacg 240 tgtaatgcga cccatgagtt ggttgttaga acacctcgta gtgtccgccg tttgtctcgt 300 accattaagg gtgtcgaata ttttgaagtt attacttttg agatgggcca aaagaaagcc 360 cccgacggta gaattgttga gcttgtcaag gaagtttcaa agagctaccc aatatctgag 420 gggcctgaga gagccaacga attagtagaa tcctatagaa aggcttcaaa taaagcttat 480 tttgagtgga ctattgaggc cagagatctt tctctgttgg gttcccatgt tcgtaaagct 540 acctaccaga cttacgctcc aattctttat gagaatgacc actttttcga ctacatgcaa 600 aaaagtaagt ttcatctcac cattgaaggt ccaaaagtac ttgcttattt acttggttta 660 tggattggtg atggattgtc tgacagggca actttttcgg ttgattccag agatacttct 720 ttgatggaac gtgttactga atatgctgaa aagttgaatt tgtgcgccga gtataaggac 780 agaaaagaac cacaagttgc caaaactgtt aatttgtact ctaaagttgt cagaggtaat 840 ggtattcgca ataatcttaa tactgagaat ccattatggg acgctattgt tggcttagga 900 ttcttgaagg acggtgtcaa aaatattcct tctttcttgt ctacggacaa tatcggtact 960 cgtgaaacat ttcttgctgg tctaattgat tctgatggct atgttactga tgagcatggt 1020 attaaagcaa caataaagac aattcatact tctgtcagag atggtttggt ttcccttgct 1080 cgttctttag gcttagtagt ctcggttaac gcagaacctg ctaaggttga catgaatggc 1140 accaaacata aaattagtta tgctatttat atgtctggtg gagatgtttt gcttaacgtt 1200 ctttcgaagt gtgccggctc taaaaaattc aggcctgctc ccgccgctgc ttttgcacgt 1260 gagtgccgcg gattttattt cgagttacaa gaattgaagg aagacgatta ttatgggatt 1320 actttatctg atgattctga tcatcagttt ttgcttgcca accaggttgt cgtccataat 1380 tgcggagaaa tggacatg 1398 <210> 127 <211> 1050 <212> DNA <213> Artificial <220> <223> Synthetic construct: engineered Synechococcus intein coding sequence. <400> 127 gggcgaattg ggtaccgaat tctgcctgtc cttcggcacc gagatcctga ccgtggagta 60 cccgcttaac ccatggctta agacggacag gaagccgtgg ctctaggact ggcacctcat 120 cggccctctg cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt 180 gccgggagac ggatagccgt tctagcacag gcttctctag ttgacgaggc acatgaggca 240 ggaccctgag ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca 300 cctgggactc ccggcccaca tatgagtccg gtagcgggtc accgtgctgg ccccgctcgt 360 ggaggtgctg gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg 420 cctccacgac ctcatgctcg acctcctgcc gaggcactag gcccggtgga ggctggtggc 480 gtttctgacc accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga 540 caaagactgg tggctgatag tcgacgaccg gtagctcctc tagaagcggg ccgtcgacct 600 cctgctgacc ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc 660 ggacgactgg gacctcttgt agttcgtctg gctcctccgg gacctgttgg tggccgacgg 720 tttccctctg ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct 780 aaagggagac gacctgcggc cgtggtagtt ctaccacttc cactagccgt ccgccaggga 840 gggcgtgcag cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa 900 cccgcacgtc gcctagaagc tgtagccgga cggagtcctg gtgttgaaag acgaccggtt 960 cggcgccatc gccgccaaca agcttgagct ccagcttttg ttcccgccgc ggtagcggcg 1020 gttgttcgaa ctcgaggtcg aaaacaaggg 1050 <210> 128 <211> 159 <212> PRT <213> Artificial <220> <223> Synthetic: intein encoded by engineered Synechococcus sequence. <400> 128 Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser 20 25 30 Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser 50 55 60 Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln 65 70 75 80 Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr 85 90 95 Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu 100 105 110 Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys Met Val Lys Val Ile 115 120 125 Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp Ile Gly Leu Pro 130 135 140 Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile Ala Ala Asn 145 150 155 <210> 129 <211> 61 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 129 ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcctgtcct tcggcaccga 60 g 61 <210> 130 <211> 65 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 130 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttggcggcg atggcgccgt 60 tggcc 65 <210> 131 <211> 64 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 131 ccactacacg cagaagagcc tctccctgtc tccgggtaaa tattgcctgt ccttcggcac 60 cgag 64 <210> 132 <211> 63 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 132 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat acagttggcg gcgatggcgc 60 cgt 63 <210> 133 <211> 70 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 133 ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt 60 cggcaccgag 70 <210> 134 <211> 70 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 134 ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt 60 cggcaccgag 70 <210> 135 <211> 8557 <212> DNA <213> Artificial <220> <223> Synthetic construct: nucleotide equence of plasmid pTT3-D2E7 Heavy Chain - Ssp-GA-intein - D2E7 Light Chain. <400> 135 gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60 aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120 atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180 ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240 atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300 cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360 gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420 tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480 ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540 ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600 aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660 ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720 agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780 tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840 tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900 tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960 ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020 tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080 gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140 gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200 gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260 tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320 cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380 aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440 ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500 aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560 gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620 gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680 cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740 tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800 tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860 tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920 tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980 ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040 gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100 ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160 ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220 ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280 ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400 gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760 cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060 tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240 tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320 cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380 ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560 ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620 atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680 acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740 attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800 tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220 cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340 aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400 agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460 ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520 atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580 atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640 gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700 gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760 caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820 cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880 ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940 aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000 tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060 cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120 gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180 tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240 cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300 ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360 taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420 ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480 ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540 cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600 cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660 ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720 agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780 cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840 ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900 gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960 ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020 ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080 cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140 aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200 ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260 caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320 ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcctgtc 7380 cttcggcacc gagatcctga ccgtggagta cggccctctg cctatcggca agatcgtgtc 7440 cgaagagatc aactgctccg tgtactccgt ggaccctgag ggccgggtgt atactcaggc 7500 catcgcccag tggcacgacc ggggcgagca ggaggtgctg gagtacgagc tggaggacgg 7560 ctccgtgatc cgggccacct ccgaccaccg gtttctgacc accgactatc agctgctggc 7620 catcgaggag atcttcgccc ggcagctgga cctgctgacc ctggagaaca tcaagcagac 7680 cgaggaggcc ctggacaacc accggctgcc tttccctctg ctggacgccg gcaccatcaa 7740 gatggtgaag gtgatcggca ggcggtccct gggcgtgcag cggatcttcg acatcggcct 7800 gcctcaggac cacaactttc tgctggccaa cggcgccatc gccgccaaca tggacatgcg 7860 cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat 7920 ccagatgacc cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac 7980 ttgtcgggca agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa 8040 agcccctaag ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt 8100 cagtggcagt ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga 8160 tgttgcaact tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac 8220 caaggtggaa atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga 8280 tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag 8340 agaggccaaa gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag 8400 tgtcacagag caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag 8460 caaagcagac tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag 8520 ctcgcccgtc acaaagagct tcaacagggg agagtgt 8557 <210> 136 <211> 501 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from pTT3-HC-Ssp-GA-int-LC-1aa. <400> 136 ccgggtaaat attgcctgtc cttcggcacc gagatcctga ccgtggagta cggccctctg 60 cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt ggaccctgag 120 ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca ggaggtgctg 180 gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg gtttctgacc 240 accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga cctgctgacc 300 ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc tttccctctg 360 ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct gggcgtgcag 420 cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa cggcgccatc 480 gccgccaact gtatggacat g 501 <210> 137 <211> 513 <212> DNA <213> Artificial <220> <223> Synthetic construct:: relevant portion of coding sequence from plasmid pTT3-HC-Ssp-GA-int-LC-3aa. <400> 137 ccgggtaaag ccgagtattg cctgtccttc ggcaccgaga tcctgaccgt ggagtacggc 60 cctctgccta tcggcaagat cgtgtccgaa gagatcaact gctccgtgta ctccgtggac 120 cctgagggcc gggtgtatac tcaggccatc gcccagtggc acgaccgggg cgagcaggag 180 gtgctggagt acgagctgga ggacggctcc gtgatccggg ccacctccga ccaccggttt 240 ctgaccaccg actatcagct gctggccatc gaggagatct tcgcccggca gctggacctg 300 ctgaccctgg agaacatcaa gcagaccgag gaggccctgg acaaccaccg gctgcctttc 360 cctctgctgg acgccggcac catcaagatg gtgaaggtga tcggcaggcg gtccctgggc 420 gtgcagcgga tcttcgacat cggcctgcct caggaccaca actttctgct ggccaacggc 480 gccatcgccg ccaactgttt caacatggac atg 513 <210> 138 <211> 11 <212> PRT <213> Pyrococcus sp. <400> 138 Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser 1 5 10 <210> 139 <211> 12 <212> PRT <213> Pyrococcus sp. <400> 139 His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys 1 5 10 <210> 140 <211> 214 <212> PRT <213> Artificial <220> <223> Synthetic construct: partial amino acid sequence encompassing cleavage sites in Hedgehog-antibody constructs. <400> 140 Cys Phe Thr Pro Glu Ser Thr Ala Leu Leu Glu Ser Gly Val Arg Lys 1 5 10 15 Pro Leu Gly Glu Leu Ser Ile Gly Asp Arg Val Leu Ser Met Thr Ala 20 25 30 Asn Gly Gln Ala Val Tyr Ser Glu Val Ile Leu Phe Met Asp Arg Asn 35 40 45 Leu Glu Gln Met Gln Asn Phe Val Gln Leu His Thr Asp Gly Gly Ala 50 55 60 Val Leu Thr Val Thr Pro Ala His Leu Val Ser Val Trp Gln Pro Glu 65 70 75 80 Ser Gln Lys Leu Thr Phe Val Phe Ala Asp Arg Ile Glu Glu Lys Asn 85 90 95 Gln Val Leu Val Arg Asp Val Glu Thr Gly Glu Leu Arg Pro Gln Arg 100 105 110 Val Val Lys Val Gly Ser Val Arg Ser Lys Gly Val Val Ala Pro Leu 115 120 125 Thr Arg Glu Gly Thr Ile Val Val Asn Ser Val Ala Ala Ser Cys Tyr 130 135 140 Ala Val Ile Asn Ser Gln Ser Leu Ala His Trp Gly Leu Ala Pro Met 145 150 155 160 Arg Leu Leu Ser Thr Leu Glu Ala Trp Leu Pro Ala Lys Glu Gln Leu 165 170 175 His Ser Ser Pro Lys Val Val Ser Ser Ala Gln Gln Gln Asn Gly Ile 180 185 190 His Trp Tyr Ala Asn Ala Leu Tyr Lys Val Lys Asp Tyr Val Leu Pro 195 200 205 Gln Ser Trp Arg His Asp 210 <210> 141 <211> 40 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 141 Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val 1 5 10 15 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 20 25 30 Asp Val Glu Ser Asn Pro Gly Pro 35 40 <210> 142 <211> 33 <212> PRT <213> Artificial <220> <223> Variant of 2A sequence. <400> 142 Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu 1 5 10 15 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 20 25 30 Pro <210> 143 <211> 20 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 143 atcgtggcgc cagctctgcg 20 <210> 144 <211> 20 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 144 gcaactggcg gccaccgagt 20 <210> 145 <211> 20 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 145 cgcatagcaa ctggcggcca 20 <210> 146 <211> 20 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 146 gttgtgggcg gccaccgagt 20 <210> 147 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 147 ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcttcacgc cggagagcac 60 <210> 148 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 148 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcactggctg ttgatcaccg 60 <210> 149 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 149 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat atcgtggcgc cagctctgcg 60 <210> 150 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 150 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcaactggcg gccaccgagt 60 <210> 151 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 151 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat cgcatagcaa ctggcggcca 60 <210> 152 <211> 60 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 152 gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttgtgggcg gccaccgagt 60 <210> 153 <211> 40 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 153 atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40 <210> 154 <211> 41 <212> DNA <213> Artificial <220> <223> Synthetic construct: oligonucleotide useful as a primer. <400> 154 tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41 <210> 155 <211> 8533 <212> DNA <213> Artificial <220> <223> Synthetic construct: nucleotide sequence of plasmid pTT3-D2E7 Heavy Chain - Hh-C17- D2E7 Light Chain. <400> 155 gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60 aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120 atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180 ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240 atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300 cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360 gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420 tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480 ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540 ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600 aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660 ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720 agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780 tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840 tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900 tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960 ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020 tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080 gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140 gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200 gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260 tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320 cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380 aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440 ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500 aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560 gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620 gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680 cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740 tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800 tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860 tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920 tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980 ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040 gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100 ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160 ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220 ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280 ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400 gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760 cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060 tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240 tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320 cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380 ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560 ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620 atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680 acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740 attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800 tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220 cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340 aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400 agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460 ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520 atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580 atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640 gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700 gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760 caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820 cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880 ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940 aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000 tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060 cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120 gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180 tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240 cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300 ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360 taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420 ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480 ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540 cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600 cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660 ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720 agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780 cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840 ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900 gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960 ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020 ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080 cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140 aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200 ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260 caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320 ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcttcac 7380 gccggagagc acagcgctgc tggagagtgg agtccggaag ccgctcggcg agctctctat 7440 cggagatcgt gttttgagca tgaccgccaa cggacaggcc gtctacagcg aagtgatcct 7500 cttcatggac cgcaacctcg agcagatgca aaactttgtg cagctgcaca cggacggtgg 7560 agcagtgctc acggtgacgc cggctcacct ggttagcgtt tggcagccgg agagccagaa 7620 gctcacgttt gtgtttgcgg atcgcatcga ggagaagaac caggtgctcg tacgggatgt 7680 ggagacgggc gagctgaggc cccagcgagt cgtcaaggtg ggcagtgtgc gcagtaaggg 7740 cgtggtcgcg ccgctgaccc gcgagggcac cattgtggtc aactcggtgg ccgccagttg 7800 ctatgcggtg atcaacagcc agtcgatgga catgcgcgtg cccgcccagc tgctgggcct 7860 gctgctgctg tggttccccg gctcgcgatg cgacatccag atgacccagt ctccatcctc 7920 cctgtctgca tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag 7980 aaattactta gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc 8040 tgcatccact ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga 8100 tttcactctc accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag 8160 gtataaccgt gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt 8220 ggctgcacca tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc 8280 ctctgttgtg tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt 8340 ggataacgcc ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga 8400 cagcacctac agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa 8460 agtctacgcc tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa 8520 caggggagag tgt 8533 <210> 156 <211> 447 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence of plasmid pTT3-HC-C17-sc-LC. <400> 156 ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60 ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120 tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180 ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240 cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300 gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360 agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420 tcggtggccg ccagttgcat ggacatg 447 <210> 157 <211> 447 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from plasmid pTT3-HC-C17-hn-LC. <400> 157 ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60 ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120 tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180 ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240 cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300 gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360 agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420 tcggtggccg cccacaacat ggacatg 447 <210> 158 <211> 660 <212> DNA <213> Artificial <220> <223> Synthetic construct: partial coding sequence from pTT3-HC-C25-Hint-LC. <400> 158 ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60 ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120 tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180 ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240 cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300 gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360 agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420 tcggtggccg ccagttgcta tgcggtgatc aacagccagt cgctggccca ctggggactg 480 gctcccatgc gcctgctgtc cacgctggag gcgtggctgc ccgccaagga gcagttgcac 540 agttcgccga aggtggtgag ctcggcgcag cagcagaatg gcatccattg gtatgccaat 600 gcgctctaca aggtcaagga ctacgttctg ccgcagagct ggcgccacga tatggacatg 660

Claims (70)

  1. 단일 개방 판독 프레임(sORF) 삽입체를 포함하는 발현벡터로서; 상기 sORF 삽입체는 제1의 폴리펩티드를 암호화하는 제1의 핵산 서열, 제1의 단백질 절단 부위를 암호화하는 제1의 개재(intervening) 핵산 서열, 및 제2의 폴리펩티드를 암호화하는 제2의 핵산 서열을 포함하고; 이때 상기 제1의 단백질 절단 부위를 암호화하는 상기 개재 핵산 서열은 상기 제1의 핵산 서열과 상기 제2의 핵산 서열 사이에 작동가능하게 위치하고, 상기 제1의 단백질 절단 부위에서 절단가능한 sORF 폴리펩티드를 발현할 수 있음을 특징으로 하는, 하나 이상의 재조합 단백질 산물을 생성하기 위한 발현 벡터.
  2. 제1항에 있어서, 제1의 단백질 절단 부위가 자가프로세싱 절단 부위를 포함하는 발현 벡터.
  3. 제1항 또는 제2항에 있어서, 자가프로세싱 절단 부위는 인테인(intein) 단편 또는 변형된 인테인 단편을 포함하고, 이때 변형된 인테인 단편은 절단이 일어나게 하지만 제1의 폴리펩티드를 제2의 폴리펩티드에 완전히 연결시키지 않는 발현 벡터.
  4. 제1항 또는 제2항에 있어서, 자가프로세싱 절단 부위는 헤지호그(hedgehog) 단편 또는 변형된 헤지호그 단편을 포함하고, 이때 변형된 헤지호그 단편은 제1의 폴리펩티드를 제2의 폴리펩티드로부터 절단되게 하는 발현 벡터.
  5. 제1항 내지 제4항 중의 어느 한 항에 있어서, 제1의 폴리펩티드 및 제2의 폴리펩티드가 다량체 어셈블리를 할 수 있는 발현 벡터.
  6. 제1항 내지 제5항 중의 어느 한 항에 있어서, 하나 이상의 제1의 폴리펩티드 및 제2의 폴리펩티드가 세포외 분비될 수 있는 발현 벡터.
  7. 제1항 내지 제6항 중의 어느 한 항에 있어서, 하나 이상의 제1의 폴리펩티드 및 제2의 폴리펩티드가 포유동물 기원인 발현 벡터.
  8. 제1항 내지 제7항 중의 어느 한 항에 있어서, 하나 이상의 제1의 폴리펩티드 및 제2의 폴리펩티드가 면역글로불린 중쇄 또는 이의 기능성 단편을 포함하는 발현 벡터.
  9. 제1항 내지 제8항 중의 어느 한 항에 있어서, 하나 이상의 제1의 폴리펩티드 및 제2의 폴리펩티드가 면역글로불린 경쇄 또는 이의 기능성 단편을 포함하는 발현 벡터.
  10. 제1항 내지 제9항 중의 어느 한 항에 있어서, 제1의 폴리펩티드는 면역글로불린 중쇄 또는 이의 기능성 단편을 포함하고 제2의 폴리펩티드는 면역글로불린 경쇄 또는 이의 기능성 단편을 포함하며, 이때 상기 제1 및 제2의 폴리펩티드는 임의의 순서로 있는 발현 벡터.
  11. 제1항 내지 제10항 중의 어느 한 항에 있어서, 제1의 폴리펩티드 및 제2의 폴리펩티드가 함께 다량체 어셈블리에서 결합하여 기능성 항체 또는 다른 항원 인식 분자를 형성할 수 있는 발현 벡터.
  12. 제1항 내지 제11항 중의 어느 한 항에 있어서, 제1의 폴리펩티드가 제2의 폴리펩티드의 상류에 있는 발현 벡터.
  13. 제1항 내지 제12항 중의 어느 한 항에 있어서, 제2의 폴리펩티드가 제1의 폴리펩티드의 상류에 있는 발현 벡터.
  14. 제1항 내지 제13항 중의 어느 한 항에 있어서, 제3의 폴리펩티드를 암호화하는 제3의 핵산 서열을 추가로 포함하고, 이때 상기 제3의 핵산 서열은 제2의 핵산 서열 뒤에 작동가능하게 위치하며, 또한 상기 제3의 서열은 독립적으로 제1 또는 제2의 핵산 서열과 동일하거나 상이할 수 있는 발현 벡터.
  15. 제14항에 있어서, 제1, 제2 및 제3의 폴리펩티드 중의 2개 이상이 함께 다량체 어셈블리에서 결합할 수 있는 발현 벡터.
  16. 제1항 내지 제15항 중의 어느 한 항에 있어서, 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하고, 이때 상기 제2의 개재 핵산 서열은 제1 및 제2의 핵산 서열 뒤에 작동가능하게 위치하며, 또한 상기 제2의 개재 서열은 제1의 개재 핵산 서열과 동일하거나 상이할 수 있는 발현 벡터.
  17. 제1항 내지 제16항 중의 어느 한 항에 있어서, 제3의 폴리펩티드를 암호화하는 제3의 핵산 서열 및 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하고, 이때 상기 제2의 개재 핵산 서열 및 제3의 핵산 서열은 이 순서로 제2의 핵산 서열 뒤에 작동가능하게 위치하는 발현 벡터.
  18. 제1항 내지 제17항 중의 어느 한 항에 있어서, 제3의 핵산 서열이 면역글로불린 중쇄, 경쇄, 또는 각각 이의 기능성 단편을 암호화하는 발현 벡터.
  19. 제14항 내지 제18항 중의 어느 한 항에 있어서, 제3의 핵산 서열이 면역글로불린 경쇄 또는 이의 기능성 단편을 암호화하는 발현 벡터.
  20. 제14항 내지 제18항 중의 어느 한 항에 있어서, 제3의 핵산 서열이 면역글로 불린 중쇄 또는 이의 기능성 단편을 암호화하는 발현 벡터.
  21. 제1항 내지 제20항 중의 어느 한 항에 있어서, 제1의 단백질 절단 부위를 암호화하는 제1의 개재 핵산 서열이 시그날 펩티드 절단 부위 또는 변형된 시그날 펩티드 절단 부위 서열을 암호화하는 시그날 펩티드 핵산을 포함하는 발현 벡터.
  22. 제1항 내지 제21항 중의 어느 한 항에 있어서, 제1의 핵산 서열 또는 제2의 핵산 서열 앞에 작동가능하게 위치한, 시그날 펩티드 절단 부위를 암호화하는 시그날 펩티드 핵산 서열을 추가로 포함하는 발현 벡터.
  23. 제1항 내지 제22항 중의 어느 한 항에 있어서, 각각 독립적으로 시그날 펩티드 절단 부위를 암호화하는 2개의 시그날 펩티드 핵산 서열을 추가로 포함하고, 이때 하나의 시그날 펩티드 핵산 서열은 제1의 폴리펩티드를 암호화하는 제1의 핵산 앞에 작동가능하게 위치하고 또다른 시그날 펩티드 핵산 서열은 제2의 폴리펩티드를 암호화하는 제2의 핵산 앞에 작동가능하게 위치하는 발현 벡터.
  24. 제21항 내지 제23항 중의 어느 한 항에 있어서, 시그날 펩티드 핵산 서열이 면역글로불린 경쇄 시그날 펩티드 절단 부위 또는 변형된 면역글로불린 경쇄 시그날 펩티드 절단 부위를 암호화하는 발현 벡터.
  25. 제24항에 있어서, 시그날 펩티드 핵산 서열은 변형된 또는 비변형 면역글로불린 경쇄 시그날 펩티드 절단 부위를 암호화하고, 이때 상기 변형된 부위는 절단을 달성할 수 있고 제1의 폴리펩티드, 제2의 폴리펩티드 및 제1 및 제2의 폴리펩티드의 어셈블리된 분자 중 하나 이상의 분비를 증가시킬 수 있으며; 또한 상기 시그날 펩티드 부위의 존재 하에서의 분비 수준은 상기 시그날 펩티드 부위의 부재 하에서의 분비 수준보다 약 10% 내지 약 100배 더 높은 발현 벡터.
  26. 제1항 내지 제3항 중의 어느 한 항에 있어서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열이 피로코쿠스 호리코시이(Pyrococcus horikoshii) Pho Pol I 서열, 사카로마이세스 세레비지아(Saccharomyces cerevisiae) VMA 서열, 시네코시스티스(Synechocystis) PCC6803 균주 DnaE 서열, 마이코박테리움 제노피(Mycobacterium xenopi) GyrA 서열, 피로코쿠스(Pyrococcus) 종 GB-D DNA 폴리머라제, A형 세균 인테인-유사 (BIL) 도메인, 및 B형 BIL로 이루어진 그룹으로부터 선택되는 인테인 또는 변형된 인테인 서열을 포함하는 발현 벡터.
  27. 제1항, 제2항 또는 제4항 중의 어느 한 항에 있어서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열은 헤지호그 계열 일원의 C-말단 자가프로세싱 도메인을 포함하고, 이때 헤지호그 계열 일원은 드로소필라(Drosophila), 마우스, 사람, 또는 다른 곤충 또는 동물 종 유래인 발현 벡터.
  28. 제1항, 제2항 또는 제4항 중의 어느 한 항에 있어서, 제1의 단백질 절단 부위를 암호화하는 개재 핵산 서열이 워트호그(warthog), 그라운드호그(groundhog), 또는 선충 기원의 다른 호그 함유 유전자 유래의 C-말단 자가프로세싱 도메인, 또는 입금편모충류(choanoflagellate) 유래의 호그렛(Hoglet) 도메인을 포함하는 발현 벡터.
  29. 제1항 내지 제28항 중의 어느 한 항에 있어서, 제1 및 제2의 폴리펩티드가, 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1, 인터루킨-12, 인터루킨-13, 인터루킨-18, 인터루킨-23, CXCL-13, GLP-1R 및 아밀로이드 베타로 이루어진 그룹으로부터 선택되는 항원에 결합하도록 지시된 항원 특이성을 갖는, 기능성 항체 또는 다른 항원 인식 분자를 포함하는 발현 벡터.
  30. 제1항 내지 제28항 중의 어느 한 항에 있어서, 제1 및 제2의 폴리펩티드가 D2E7, ABT-007, ABT-325, EL246 또는 ABT-874의 항체 유래의 면역글로불린 쇄의 쌍을 포함하는 발현 벡터.
  31. 제1항 내지 제28항 중의 어느 한 항에 있어서, 제1 및 제2의 폴리펩티드가 D2E7, ABT-007, ABT-325, EL246, ABT-874 또는 다른 항체의 유사한 단편 유래의 면역글로불린 중쇄 또는 면역글로불린 경쇄 단편으로부터 각각 독립적으로 선택되는 발현 벡터.
  32. 제1항 내지 제31항 중의 어느 한 항에 있어서, sORF 삽입체에 대한 프로모터 조절 요소를 추가로 포함하는 발현 벡터.
  33. 제32항에 있어서, 프로모터 조절 요소가 유도성이거나 구성적(constitutive)인 발현 벡터.
  34. 제32항에 있어서, 프로모터 조절 요소가 조직 특이적인 발현 벡터.
  35. 제32항에 있어서, 프로모터가 아데노바이러스 주요 후기 프로모터(major late promoter)를 포함하는 발현 벡터.
  36. 제1항 내지 제35항 중의 어느 한 항에 있어서, 제1의 단백질 절단 부위를 절단할 수 있는 프로테아제를 암호화하는 핵산을 추가로 포함하는 발현 벡터.
  37. 제36항에 있어서, 프로테아제를 암호화하는 핵산은 sORF 삽입체 내에 작동가능하게 위치하고; 발현 벡터는 프로테아제를 암호화하는 핵산과 하나 이상의 제1의 핵산 및 제2의 핵산 사이에 위치한 제2의 절단 부위를 암호화하는 추가적인 핵산을 추가로 포함하는 발현 벡터.
  38. 제1항 내지 제37항 중의 어느 한 항에 따른 벡터를 포함하는 숙주 세포.
  39. 제38항에 있어서, 원핵생물 세포인 숙주 세포.
  40. 제39항에 있어서, 에스케리키아 콜라이(Escherichia coli)인 숙주 세포.
  41. 제38항에 있어서, 진핵생물 세포인 숙주 세포.
  42. 제41항에 있어서, 진핵생물 세포가 원생생물 세포, 동물 세포, 식물 세포 및 진균 세포로 이루어진 그룹으로부터 선택되는 숙주 세포.
  43. 제42항에 있어서, 진핵생물 세포가 포유동물 세포, 조류 세포 및 곤충 세포로 이루어진 그룹으로부터 선택되는 동물세포인 숙주 세포.
  44. 제43항에 있어서, CHO 세포 또는 디하이드로폴레이트 리덕타제에 결함이 있는 CHO 세포인 숙주 세포.
  45. 제43항에 있어서, COS 세포인 숙주 세포.
  46. 제42항에 있어서, 효모 세포인 숙주 세포.
  47. 제46항에 있어서, 효모 세포가 사카로마이세스 세레비지아인 숙주 세포.
  48. 제43항에 있어서, 곤충 스포도프테라 프루기페르다(Spodoptera frugiperda) Sf9 세포인 숙주 세포.
  49. 제43항에 있어서, 사람 배아 신장 세포인 숙주 세포.
  50. 제38항에 따른 숙주 세포를 배양 배지 중에서 벡터 단백질이 발현되게 하는데 충분한 조건 하에서 배양함을 포함하여, 재조합 폴리단백질 또는 다수의 단백질을 생산하는 방법.
  51. 제50항에 있어서, 벡터 단백질을 회수하고/하거나 정제함을 추가로 포함하는 방법.
  52. 제50항 내지 제51항 중의 어느 한 항에 있어서, 다수의 단백질이 다량체 어셈블리가 가능한 방법.
  53. 제50항 내지 제52항 중의 어느 한 항에 있어서, 재조합 폴리단백질 또는 다수의 단백질이 생물학적으로 기능성인 단백질이고/이거나 치료학적 단백질인 방법.
  54. 제38항에 따른 숙주 세포를 배양 배지 중에서 면역글로불린 단백질 또는 이의 기능성 단편, 어셈블리된 항체, 또는 다른 항원 인식 분자를 생산하는데 충분한 조건 하에서 배양함을 포함하여, 면역글로불린 단백질 또는 이의 기능성 단편, 어셈블리된 항체, 또는 다른 항원 인식 분자를 생산하는 방법.
  55. 제50항 내지 제54항 중의 어느 한 항에 따른 방법에 따라 생산된 단백질.
  56. 제50항 내지 제55항 중의 어느 한 항에 따른 방법에 따라 생산된 폴리단백질.
  57. 제50항 내지 제56항 중의 어느 한 항에 따른 방법에 따라 생산된 어셈블리된 면역글로불린; 어셈블리된 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편.
  58. 제57항에 있어서, 종양 괴사 인자-α, 에리트로포이에틴 수용체, 인터루킨-18, EL/셀렉틴 또는 인터루킨-12에 대한 특이적 항원 결합을 달성하거나 이에 기여할 수 있는 능력을 갖는 면역글로불린; 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편.
  59. 제58항에 있어서, 면역글로불린이 D2E7이거나 이때 기능성 단편이 D2E7의 단편인, 면역글로불린 또는 이의 기능성 단편.
  60. 제55항 내지 제59항 중의 어느 한 항에 따른 단백질 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물.
  61. 제1항 또는 제2항에 있어서, 제1의 단백질 절단 부위가 세포 프로테아제 절단 부위 또는 바이러스 프로테아제 절단 부위를 포함하는 발현 벡터.
  62. 제1항 또는 제2항에 있어서, 제1의 단백질 절단 부위가 푸린; IPNV의 VP4; 담배 식각 바이러스(TEV; Tobacco Etch Virus) 프로테아제; 라이노바이러스(rhinovirus)의 3C 프로테아제; PC5/6 프로테아제; PACE 프로테아제; LPC/PC7 프로테아제; 엔테로키나제; 인자 Xa 프로테아제; 트롬빈; 게네나제 I; MMP 프로테아제; 터닙 모자이크 포티바이러스(turnip mosaic potyvirus)의 핵 포함 단백질 a(N1a); 뎅기(Dengue) 4형 플라비바이러스(flavivirus)의 NS2B/NS3, 황열 바이러스(yellow fever virus)의 NS3 프로테아제; 콜리플라워 모자이크 바이러스(cauliflower mosaic virus)의 ORF V; KEX2 프로테아제; CB2; 또는 2A에 의해 인식되는 부위를 포함하는 발현 벡터.
  63. 제1항 또는 제2항에 있어서, 제1의 단백질 절단 부위가 바이러스성 내부적으 로 절단가능한 시그날 펩티드 절단 부위인 발현 벡터.
  64. 제63항에 있어서, 바이러스성 내부적으로 절단가능한 시그날 펩티드 절단 부위가 C형 인플루엔자 바이러스, C형 간염 바이러스, 한타바이러스, 플라비바이러스 또는 루벨라 바이러스 유래의 부위를 포함하는 발현 벡터.
  65. 자가프로세싱 절단 서열, 시그날 펩티드 서열 또는 프로테아제 절단 부위에 의해 분리된, 베이트 단백질(bait protein) 부분 및 후보 프레이 단백질(prey protein) 부분을 포함하는 폴리단백질을 암호화하는 발현 벡터가 도입된 숙주 세포를 수득하는 단계; 및 상기 폴리단백질의 발현 및 상기 폴리단백질의 자가 프로세싱 또는 프로테아제 절단을 가능하게 하는 조건 하에서 상기 숙주 세포를 배양하는 단계를 포함하는, 베이트 단백질 및 후보 프레이 단백질을 포함하는 이중 하이브리드 시스템(two hybrid system)의 단백질을 발현시키기 위한 방법.
  66. 제65항에 있어서, 폴리단백질이 삼중 하이브리드 시스템의 절단가능한 구성요소를 추가로 포함하는 방법.
  67. 제1항 내지 제37항 및 제61항 내지 제64항 중의 어느 한 항에 있어서, 2A 서열을 함유하지 않는 발현 벡터.
  68. 제1항 또는 제2항에 있어서, 제1의 단백질 절단 부위가 FMDV 2A 서열; 또는 다른 피코르나바이러스과(Picornaviridae), 곤충 바이러스, C형 로타바이러스, 트리파노솜(trypanosome), 또는 써마토가 마리티마(Thermatoga maritima) 유래의 2A-유사 도메인을 포함하는 발현 벡터.
  69. 폴리단백질에 대한 암호화 서열을 포함하고, 이때 폴리단백질은 적어도 제1 및 제2의 단백질 단편을 포함하고, 상기 단백질 단편은 이들 사이의 단백질 절단 부위에 의해 분리되며, 단백질 절단 부위는 자가 프로세싱 펩티드 절단 서열, 시그날 펩티드 절단 서열 또는 프로테아제 절단 서열을 포함하고; 이때 상기 암호화 서열은 숙주 세포에서 발현가능하고 숙주 세포 내에서 절단됨을 특징으로 하는, 재조합 단백질을 발현시키기 위한 발현 벡터.
  70. 제1항 내지 제37항, 제61항 내지 제64항, 제67항 또는 제68항 중의 어느 한 항에 있어서, 상기 개재 핵산 서열이 추가적으로 태그(tag)를 암호화하는 발현 벡터.
KR1020087001691A 2005-07-21 2006-07-21 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 KR20080031024A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US70185505P 2005-07-21 2005-07-21
US60/701,855 2005-07-21

Publications (1)

Publication Number Publication Date
KR20080031024A true KR20080031024A (ko) 2008-04-07

Family

ID=37683887

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087001691A KR20080031024A (ko) 2005-07-21 2006-07-21 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법

Country Status (16)

Country Link
US (3) US20070065912A1 (ko)
EP (4) EP1910550A4 (ko)
JP (2) JP2009508470A (ko)
KR (1) KR20080031024A (ko)
CN (1) CN101595228A (ko)
AU (1) AU2006272706A1 (ko)
BR (1) BRPI0613784A2 (ko)
CA (1) CA2615983A1 (ko)
IL (1) IL188841A0 (ko)
MX (1) MX2008000985A (ko)
NO (1) NO20080882L (ko)
RU (1) RU2478709C2 (ko)
SG (1) SG164383A1 (ko)
TW (1) TW200745332A (ko)
WO (1) WO2007014162A2 (ko)
ZA (1) ZA200800207B (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112891A2 (en) * 2010-03-12 2011-09-15 Boad Of Supervisors Of Louisana State University And Agricultural And Mechanical College Plant defensive peptides
US8945876B2 (en) 2011-11-23 2015-02-03 University Of Hawaii Auto-processing domains for polypeptide expression
CN110714020A (zh) * 2019-05-22 2020-01-21 北京理工大学 一种高效简便纯化蛋白的方法

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005017149A1 (en) * 2003-06-03 2005-02-24 Cell Genesys, Inc. Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site
US20050136035A1 (en) * 2003-06-03 2005-06-23 Derek Ko Cell specific replication-competent viral vectors comprising a self processing peptide cleavage site
US7714119B2 (en) * 2004-07-13 2010-05-11 Biosante Pharmaceuticals, Inc. AAV vector compositions and methods for enhanced expression of immunoglobulins using the same
CN100460508C (zh) * 2004-11-03 2009-02-11 马延高 人胰岛素基因在甲醇酵母中的分泌表达方法
NZ555907A (en) 2004-11-16 2009-12-24 Aeras Global Tb Vaccine Found Multivalent vaccines comprising recombinant viral vectors
US7632509B2 (en) * 2005-07-19 2009-12-15 Biosante Pharmaceuticals, Inc. Methods to express recombinant proteins from lentiviral vectors
US20070292922A1 (en) * 2006-03-31 2007-12-20 Cell Genesys, Inc. Regulated expression of recombinant proteins from adeno-associated viral vectors
SI3339445T1 (sl) 2006-09-08 2020-12-31 Abbvie Bahamas Ltd. Beljakovine za vezavo interlevkin-13
US9043994B2 (en) * 2007-03-13 2015-06-02 Massachusetts Institute Of Technology Cre-lox based gene knockdown constructs and methods of use thereof
US8168760B2 (en) * 2007-03-29 2012-05-01 Abbott Laboratories Crystalline anti-human IL-12 antibodies
JP2008307007A (ja) 2007-06-15 2008-12-25 Bayer Schering Pharma Ag 出生後のヒト組織由来未分化幹細胞から誘導したヒト多能性幹細胞
EP2047858A1 (en) * 2007-10-10 2009-04-15 Institut National De La Sante Et De La Recherche Medicale (Inserm) Combination products for treating cancer
AU2015202051B2 (en) * 2007-10-15 2017-12-07 Chugai Seiyaku Kabushiki Kaisha Method for production of antibody
MX2010004007A (es) 2007-10-15 2010-06-15 Chugai Pharmaceutical Co Ltd Metodo para la produccion de un anticuerpo.
WO2009073805A2 (en) * 2007-12-04 2009-06-11 Verdezyne, Inc. Aglycosylated therapeutic antibodies and therapeutic antibody-encoding nucleotide sequences
JP2011507507A (ja) * 2007-12-21 2011-03-10 フジフィルム・マニュファクチュアリング・ヨーロッパ・ベスローテン・フエンノートシャップ マルチマー性前駆体のinvivoタンパク質分解的プロセシングによる関心対象のタンパク質の分泌収量の改善
NZ600979A (en) * 2008-01-15 2014-01-31 Abbott Lab Improved mammalian expression vectors and uses thereof
US9758794B2 (en) 2008-04-22 2017-09-12 Rutgers, The State University Of New Jersey HCV E2 construct compositions and methods
CA2722423A1 (en) * 2008-04-22 2009-10-29 Rutgers, The State University Hcv e2 construct compositions and methods
CA2695522C (en) * 2008-05-02 2019-01-15 Kyoto University Method of nuclear reprogramming
WO2010006059A1 (en) 2008-07-08 2010-01-14 Abbott Laboratories Prostaglandin e2 binding proteins and uses thereof
CA2758964A1 (en) * 2009-04-16 2010-10-21 Abbott Biotherapeutics Corp. Anti-tnf-.alpha. antibodies and their uses
WO2010138555A2 (en) * 2009-05-26 2010-12-02 University Of Florida Research Foundation, Inc. Small peptide expression system in mammalian cells
US20110045534A1 (en) * 2009-08-20 2011-02-24 Cell Signaling Technology, Inc. Nucleic Acid Cassette For Producing Recombinant Antibodies
AU2010313395A1 (en) 2009-10-30 2012-05-10 Abbvie Inc. sORF constructs and multiple gene expression
CA2819552C (en) 2010-12-09 2023-09-26 Institut Pasteur Mgmt-based method for obtaining high yield of recombinant protein expression
CN103857411A (zh) 2011-07-13 2014-06-11 阿布维公司 使用抗il-13抗体治疗哮喘的方法和组合物
CN103917656B (zh) * 2011-10-25 2016-09-28 味之素株式会社 蛋白质的分泌产生方法
JP6279466B2 (ja) * 2012-04-27 2018-02-14 Jcrファーマ株式会社 新規な発現ベクター
CN104853782A (zh) 2012-12-13 2015-08-19 宾夕法尼亚大学理事会 Dna抗体构建体及其使用方法
WO2015089492A2 (en) * 2013-12-13 2015-06-18 The Trustees Of The University Of Pennsylvania Dna antibody constructs and method of using same
US9550986B2 (en) 2012-12-21 2017-01-24 Abbvie Inc. High-throughput antibody humanization
CN103898141B (zh) * 2012-12-27 2016-06-15 深圳先进技术研究院 人源化抗体表达载体及其构建方法
EP2956480B1 (en) * 2013-02-13 2019-09-04 Laboratoire Français du Fractionnement et des Biotechnologies Highly galactosylated anti-tnf-alpha antibodies and uses thereof
CA2940513C (en) 2013-03-11 2023-08-15 University Of Florida Research Foundation, Inc. Delivery of card protein as therapy for ocular inflammation
US10273520B2 (en) * 2013-04-03 2019-04-30 Wan Keung Raymond Wong Means and methods for hyper-production of authentic human basic fibroblast growth factor in Escherichia coli
WO2014161405A1 (en) * 2013-04-03 2014-10-09 Gene-Vinate Limited Means and method for expression of authentic human epidermal growth factor and/or basic fibrolast growth factor in cytoplasm and/or culture medium of escherichia coli
WO2015012924A2 (en) 2013-04-29 2015-01-29 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and use thereof
WO2015050959A1 (en) 2013-10-01 2015-04-09 Yale University Anti-kit antibodies and methods of use thereof
EP3107939B1 (en) 2014-02-19 2020-06-17 University of Florida Research Foundation, Inc. Delivery of nrf2 as therapy for protection against reactive oxygen species
ES2911714T3 (es) 2014-03-11 2022-05-20 Univ Florida Proteína M013 expresada por AAV como un terapéutico antiinflamatorio para su uso en un método de tratamiento de enfermedad ocular inflamatoria
RU2601126C2 (ru) * 2014-09-17 2016-10-27 Федеральное государственное бюджетное учреждение "Государственный научный центр Институт иммунологии" Федерального медико-биологического агентства России Способ получения биологически активных пептидов
US11278619B2 (en) * 2014-12-01 2022-03-22 The Trustees Of The University Of Pennsylvania DNA antibody constructs and method of using same
GB201507108D0 (en) * 2015-04-27 2015-06-10 Ucl Business Plc Nucleic acid construct
GB201507104D0 (en) * 2015-04-27 2015-06-10 Ucl Business Plc Nucleic acid construct
DK3303395T3 (da) 2015-05-29 2020-01-27 Abbvie Inc Anti-cd40-antistoffer og anvendelser deraf
JP7098519B2 (ja) 2015-10-08 2022-07-11 ザ ガバナーズ オブ ザ ユニバーシティ オブ アルバータ C型肝炎ウイルスe1/e2ヘテロダイマー及びそれを生成する方法
BR112018009064A8 (pt) * 2015-11-17 2019-02-26 Jiangsu Hengrui Medicine Co anticorpo de pd-l1, fragmento de ligação ao antígeno do mesmo e aplicação médica do mesmo
RU2619217C1 (ru) * 2015-12-04 2017-05-12 Федеральное государственное бюджетное учреждение "Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов" (ФГБУ "ГосНИИгенетика") Температурочувствительный мутантный интеин для нерастворимой экспрессии предшественника целевого белка
AU2017214692B2 (en) 2016-02-06 2021-11-04 Epimab Biotherapeutics, Inc. Fabs-in-tandem immunoglobulin and uses thereof
EP3445396A4 (en) * 2016-04-22 2020-03-11 Integrated Research Associates, LLC IMPROVED PROCESS FOR PRODUCING VIRUS-LIKE PARTICLES
WO2017198562A1 (en) * 2016-05-19 2017-11-23 Siemens Healthcare Gmbh Method of producing domains of protein
US10493172B2 (en) 2016-06-02 2019-12-03 California Institute Of Technology Gas-filled structures and related compositions, methods and systems to image a target site
WO2018013939A1 (en) * 2016-07-14 2018-01-18 Scholar Rock, Inc. Tgfb antibodies, methods, and uses
US10955496B2 (en) 2016-07-28 2021-03-23 California Institute Of Technology Gas-filled structures and related compositions, methods and systems for magnetic resonance imaging
US11118210B2 (en) 2016-07-28 2021-09-14 California Institute Of Technology Genetically engineered gas vesicle gene clusters, genetic circuits, vectors, prokaryotic cells, compositions, methods and systems for contrast-enhanced imaging
TWI672317B (zh) * 2016-08-16 2019-09-21 英屬開曼群島商岸邁生物科技有限公司 單價不對稱串聯Fab雙特異性抗體
KR101948390B1 (ko) * 2016-11-21 2019-02-15 충북대학교 산학협력단 자가절단 단백질을 이용한 목적단백질의 제조 방법
JP7274417B2 (ja) 2016-11-23 2023-05-16 イミュノア・セラピューティクス・インコーポレイテッド 4-1bb結合タンパク質及びその使用
US11964006B2 (en) 2017-09-16 2024-04-23 City Of Hope Multivalent Epstein-Barr virus-like particles and uses thereof
EP3694869A4 (en) * 2017-10-12 2021-11-24 The Jackson Laboratory TRANSGENIC SELECTION METHODS AND COMPOSITIONS
CN111902535A (zh) * 2018-03-19 2020-11-06 勃林格殷格翰动物保健(中国)有限公司 能够稳定地表达靶蛋白的重组病毒
CN116144706A (zh) 2018-08-13 2023-05-23 根路径基因组学公司 成对的二分免疫受体多核苷酸的高通量克隆及其应用
GB201816873D0 (en) * 2018-10-17 2018-11-28 Imperial Innovations Ltd Fusion protein
WO2020086408A1 (en) * 2018-10-26 2020-04-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services A high-yield perfusion-based transient gene expression bioprocess
WO2020146367A1 (en) 2019-01-07 2020-07-16 California Institute Of Technology Burst ultrasound reconstruction with signal templates and related methods and systems
US11761008B2 (en) 2019-01-07 2023-09-19 California Institute Of Technology Gas vesicle expression systems, gas vesicle constructs and related genetic circuits, vectors, mammalian cells, hosts, compositions, methods and systems
US20220143174A1 (en) * 2019-02-22 2022-05-12 City Of Hope Multivalent kaposi sarcoma-associated herpesvirus-like particles and uses thereof
US11446523B2 (en) 2019-03-28 2022-09-20 California Institute Of Technology Compositions, methods and systems for gas vesicle based cavitation
SG11202110956RA (en) 2019-04-05 2021-10-28 Rootpath Genomics Inc Compositions and methods for t-cell receptor gene assembly
CN112175927B (zh) * 2019-07-02 2023-04-18 上海科技大学 一种碱基编辑工具及其用途
CN110669740B (zh) * 2019-07-16 2021-10-08 伍泽堂 溶瘤病毒及其应用和治疗癌症的药物
CN115397848A (zh) 2020-02-05 2022-11-25 拉利玛生物医药公司 Tat肽结合蛋白及其用途
EP4284936A1 (en) * 2021-01-26 2023-12-06 Kriya Therapeutics, Inc. Vector constructs for delivery of nucleic acids encoding therapeutic anti-tnf antibodies and methods of using the same
WO2024097763A1 (en) * 2022-11-01 2024-05-10 Memorial Sloan-Kettering Cancer Center Intein-based sorting system and modular chimeric polypeptides
CN115947830B (zh) * 2022-12-27 2023-09-12 优洛生物(上海)有限公司 一种经改造的抗体、其制备方法及其用途
CN116970631B (zh) * 2023-09-19 2024-01-05 江西赛基生物技术有限公司 一种重组蛋白的编码基因、载体、细胞及制备方法

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6455275B1 (en) 1980-02-25 2002-09-24 The Trustees Of Columbia University In The City Of New York DNA construct for producing proteinaceous materials in eucaryotic cells
ZA811895B (en) 1980-04-07 1982-04-28 Univ California Expression of hormone genomic clones
NZ199391A (en) 1981-01-02 1985-12-13 Genentech Inc Chimeric polypeptides comprising a proinsulin sequence,and preparation by recombinant dna technique;production of human insulin
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4937190A (en) * 1987-10-15 1990-06-26 Wisconsin Alumni Research Foundation Translation enhancer
DE3885431D1 (de) * 1987-12-23 1993-12-09 Boehringer Ingelheim Int Expression der viral kodierten Protease P2A des HRV2.
US5648254A (en) 1988-01-15 1997-07-15 Zymogenetics, Inc. Co-expression in eukaryotic cells
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US5162601A (en) 1989-11-22 1992-11-10 The Upjohn Company Plant potyvirus expression vector with a gene for protease
US5519164A (en) 1990-02-01 1996-05-21 Hoechst Aktiengesellschaft Expression of a multigene RNA having self-splicing activity
US5633282A (en) * 1990-05-25 1997-05-27 British Technology Group Limited Inhibition of viral infection
US5637481A (en) 1993-02-01 1997-06-10 Bristol-Myers Squibb Company Expression vectors encoding bispecific fusion proteins and methods of producing biologically active bispecific fusion proteins in a mammalian cell
ATE213779T1 (de) 1991-08-07 2002-03-15 W French Anderson Interne ribosom eintrittsstellen enthaltene retrovirale vektoren
DE4228457A1 (de) 1992-08-27 1994-04-28 Beiersdorf Ag Herstellung von heterodimerem PDGF-AB mit Hilfe eines bicistronischen Vektorsystems in Säugerzellen
DE4228458A1 (de) 1992-08-27 1994-06-01 Beiersdorf Ag Multicistronische Expressionseinheiten und deren Verwendung
US5496714A (en) * 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
US5834247A (en) * 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
DE69419721T2 (de) 1993-01-12 2000-04-27 Biogen Inc Rekombinante anti-vla4 antikörpermoleküle
US5532142A (en) 1993-02-12 1996-07-02 Board Of Regents, The University Of Texas System Method of isolation and purification of fusion polypeptides
US6133028A (en) * 1993-05-28 2000-10-17 Transgene S.A. Defective adenoviruses and corresponding complementation lines
DE4319708A1 (de) 1993-06-10 1994-12-15 Beiersdorf Ag Multicistronische Expression rekombinanter Gene in Bakterienzellen
US5834256A (en) * 1993-06-11 1998-11-10 Cell Genesys, Inc. Method for production of high titer virus and high efficiency retroviral mediated transduction of mammalian cells
GB9326271D0 (en) 1993-12-23 1994-02-23 Zeneca Ltd Expression of self-processing polyprotein in transgenic plants
US5643745A (en) * 1994-02-03 1997-07-01 University Of Hawaii Heterologous dimeric proteins produced in heterokaryons
WO1995021249A1 (en) 1994-02-03 1995-08-10 The Scripps Research Institute A cassette to accumulate multiple proteins through synthesis of a self-processing polypeptide
DE69535178T2 (de) 1994-06-10 2006-12-14 Genvec, Inc. Adenoviren-vektor systeme und zelllinien
FR2722208B1 (fr) * 1994-07-05 1996-10-04 Inst Nat Sante Rech Med Nouveau site interne d'entree des ribosomes, vecteur le contenant et utilisation therapeutique
US5955072A (en) 1994-07-13 1999-09-21 Sankyo Company, Limited Expression systems utilizing autolyzing fusion proteins and a reducing polypeptide
EP0787185A2 (en) 1994-10-20 1997-08-06 MorphoSys AG Targeted hetero-association of recombinant proteins to multi-functional complexes
US5872005A (en) 1994-11-03 1999-02-16 Cell Genesys Inc. Packaging cell lines for adeno-associated viral vectors
US20020168342A1 (en) 1994-11-03 2002-11-14 Cell Genesys, Inc. Novel adenoviral vectors, packaging cell lines, recombinant adenoviruses and methods
AT403167B (de) 1994-11-14 1997-11-25 Immuno Ag Selektion und expression von fremdproteinen mittels eines selektions-amplifikations-systems
US6638762B1 (en) * 1994-11-28 2003-10-28 Genetic Therapy, Inc. Tissue-vectors specific replication and gene expression
US6281332B1 (en) * 1994-12-02 2001-08-28 The Johns Hopkins University School Of Medicine Hedgehog-derived polypeptides
IL116816A (en) 1995-01-20 2003-05-29 Rhone Poulenc Rorer Sa Cell for the production of a defective recombinant adenovirus or an adeno-associated virus and the various uses thereof
US5912167A (en) 1995-06-06 1999-06-15 Wisconsin Alumni Research Foundation Autocatalytic cleavage site and use thereof in a protein expression vector
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US6040183A (en) * 1995-06-07 2000-03-21 University Of North Carloina At Chapel Hill Helper virus-free AAV production
US6090382A (en) 1996-02-09 2000-07-18 Basf Aktiengesellschaft Human antibodies that bind human TNFα
DK0929578T3 (da) 1996-02-09 2003-08-25 Abbott Lab Bermuda Ltd Humane antistoffer, der binder human TNFalfa
EP0803573A1 (en) 1996-04-25 1997-10-29 Gesellschaft für Biotechnologische Forschung mbH (GBF) Polycistronic expression construct with cytokines for multivalent vaccines
ATE359372T1 (de) 1996-07-22 2007-05-15 Us Gov Health & Human Serv Vektoren zur inhibierung von viralem und tumorwachstum
US6962708B1 (en) * 1997-02-28 2005-11-08 Acambis, Inc. Chimeric flavivirus vaccines
US6849428B1 (en) * 1997-03-05 2005-02-01 New England Biolabs, Inc. Intein-mediated protein ligation of expressed proteins
US6548286B1 (en) 1997-04-14 2003-04-15 Cell Genesys, Inc. Methods for increasing the efficiency of recombinant AAV product
US6933378B2 (en) * 1997-05-30 2005-08-23 Joseph Atabekov Methods for coexpression of more than one gene in eukaryotic cells
FR2782325B1 (fr) * 1998-08-12 2002-05-24 Proteus Procede d'identification de sequences polynucleotidiques et/ou des proteines correspondantes a partir d'un echantillon d'acides nucleiques
US20030099932A1 (en) 1998-05-12 2003-05-29 Lorens James B. Retroviral vectors with separation sequences
US7001733B1 (en) 1998-05-12 2006-02-21 Rigel Pharmaceuticals, Inc. Methods and compositions for screening for modulations of IgE synthesis, secretion and switch rearrangement
GB9810999D0 (en) 1998-05-21 1998-07-22 Goken Joop Materials and methods relating to the expression of genes
US6537806B1 (en) 1998-06-02 2003-03-25 University Of Washington Compositions and methods for treating diabetes
US7001745B1 (en) * 1998-09-30 2006-02-21 New England Biolabs, Inc. Intein mediated peptide ligation
JP2002532066A (ja) * 1998-11-16 2002-10-02 ジェンウェイ バイオテック, インコーポレイテッド 鳥類におけるポリヌクレオチドワクチンを用いる抗体の産生
EP1165757A1 (en) * 1999-03-05 2002-01-02 Maxygen, Inc. Encryption of traits using split gene sequences
AU783294B2 (en) 1999-03-24 2005-10-13 Board Of Regents, The University Of Texas System Linear and circular expression elements
US6933362B1 (en) * 1999-08-17 2005-08-23 Rensselaer Polytechnic Institute Genetic system and self-cleaving inteins derived therefrom, bioseparations and protein purification employing same, and methods for determining critical, generalizable amino acid residues for varying intein activity
AU6781700A (en) * 1999-08-17 2001-03-13 Health Research Institute Genetic system and self-cleaving inteins derived therefrom, bioseparations and protein purification employing same, and methods for determining critical, generalizable amino acid residues for varying intein activity
DE60024659T2 (de) 1999-10-13 2006-08-17 Immunex Corp., Thousand Oaks Vektoren und verfahren für rekombinante proteinexpression
AU2748701A (en) * 1999-10-29 2001-06-06 Kosan Biosciences, Inc. Rapamycin analogs
US6665567B2 (en) * 2000-01-14 2003-12-16 Rainer R. Iraschko Optical-ring integer linear program formulation
DE60140996D1 (de) 2000-02-11 2010-02-25 Metabolix Inc Intein enthaltende multigen-expressionskonstrukte
EP1266012A2 (en) 2000-03-17 2002-12-18 Incyte Genomics, Inc. Proteases
US6692736B2 (en) 2000-03-24 2004-02-17 Cell Genesys, Inc. Cell-specific adenovirus vectors comprising an internal ribosome entry site
US6908751B2 (en) 2000-04-26 2005-06-21 Zymogenetics, Inc. Methods for enhancing the expression of a protein of interest by recombinant host cells
US6544780B1 (en) 2000-06-02 2003-04-08 Genphar, Inc. Adenovirus vector with multiple expression cassettes
US6852510B2 (en) 2000-07-03 2005-02-08 Gala Design Inc Host cells containing multiple integrating vectors
US20040235173A1 (en) 2000-07-03 2004-11-25 Gala Design, Inc. Production of host cells containing multiple integrating vectors by serial transduction
US7419829B2 (en) 2000-10-06 2008-09-02 Oxford Biomedica (Uk) Limited Vector system
US6911311B2 (en) * 2001-01-04 2005-06-28 Myriad Genetics, Inc. Method of detecting protein-protein interactions
US20040191786A1 (en) * 2001-02-16 2004-09-30 Yue David T. Three cube fret method (3-fret) for detecting fluorescence energy transfer
NZ527590A (en) 2001-03-09 2005-12-23 Genentech Inc Process for production of polypeptides
FI116851B (fi) 2001-05-03 2006-03-15 Fit Biotech Oyj Plc Ilmentämisvektori, sen käyttöjä ja menetelmä sen valmistamiseksi sekä sitä sisältäviä tuotteita
US7871814B2 (en) 2001-05-10 2011-01-18 The Regents Of The University Of California Recombinant bicistronic flaviviruses and methods of use thereof
US20040180415A1 (en) * 2001-05-15 2004-09-16 Tchaga Grigoriy S. Methods and compositions for protein purification
US7052905B1 (en) 2001-08-13 2006-05-30 University Of Kentucky Research Foundation Methods and composition for expressing multiple genes in plants by alternate splicing of a polycistronic message
EP1288891A1 (en) 2001-08-27 2003-03-05 Hewlett-Packard Company Process and apparatus for displaying data in a specific area of the display in a computer or in an interactive terminal under control of the LAN card and independently on the operating system
ITMI20012110A1 (it) 2001-10-12 2003-04-12 Keryos Spa Vettori multi-cistronici utilizzabili in protocolli di trsferimento genico
WO2003040168A2 (en) * 2001-11-06 2003-05-15 Enanta Pharmaceuticals, Inc. Methods and compositions for identifying peptide aptamers capable of altering a cell phenotype
US20030157641A1 (en) 2001-11-16 2003-08-21 Idec Pharmaceuticals Corporation Polycistronic expression of antibodies
CA2485837A1 (en) 2002-05-24 2003-12-04 Yuannan Xia Methods and dna constructs for high yield production of polypeptides
AU2003239895C1 (en) 2002-05-24 2010-01-07 Medtronic, Inc. Methods and DNA constructs for high yield production of polypeptides
AU2003279240A1 (en) * 2002-06-21 2004-01-06 Genetix Pharmaceuticals, Inc. Methods for purifying viral particles for gene therapy
US20040235011A1 (en) * 2002-06-26 2004-11-25 Cooper Richard K. Production of multimeric proteins
US20050112095A1 (en) 2002-07-09 2005-05-26 Tsu-An Hsu Internal ribosome entry sites for recombinant protein expression
CN1263860C (zh) 2002-09-30 2006-07-12 华南农业大学 多基因载体的构建方法与应用
US20050147962A1 (en) * 2002-11-19 2005-07-07 Wagstrom Christopher R. Display of dimeric proteins on phage
DK1573058T3 (da) 2002-12-18 2012-01-16 Chromagenics Bv Fremgangsmåde til forbedring af proteinproduktion
ES2322267T3 (es) * 2003-04-09 2009-06-18 Genentech, Inc. Terapia de una enfermedad autoinmunologica en un paciente que presenta una respuesta inadecuada a un inhibidor de tnf-alfa.
JP2007502623A (ja) * 2003-05-09 2007-02-15 リサーチ ディベロップメント ファウンデーション 膜タンパク質におけるフリンプロテアーゼ開裂部位の挿入およびその使用法
WO2005017149A1 (en) 2003-06-03 2005-02-24 Cell Genesys, Inc. Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site
US20050136035A1 (en) 2003-06-03 2005-06-23 Derek Ko Cell specific replication-competent viral vectors comprising a self processing peptide cleavage site
US7485291B2 (en) * 2003-06-03 2009-02-03 Cell Genesys, Inc. Compositions and methods for generating multiple polypeptides from a single vector using a virus derived peptide cleavage site, and uses thereof
JP4637838B2 (ja) * 2003-08-05 2011-02-23 アルマック サイエンシズ (スコットランド) リミテッド ライゲーション法
US7326567B2 (en) 2003-11-12 2008-02-05 Schering Corporation Plasmid system for multigene expression
EP1708741B1 (en) 2003-12-24 2016-03-30 Aduro Biotech Recombinant nucleic acid molecules encoding fusion proteins comprising antigens and bacterial secretory signal polypeptides, expression cassettes, and bacteria, and methods of use thereof
US20050221429A1 (en) 2004-01-16 2005-10-06 Cardinal Health Pts, Llc Host cells containing multiple integrating vectors comprising an amplifiable marker
EP2133428A1 (en) 2004-03-09 2009-12-16 Eidgenössische Technische Hochschule Zürich New baculovirus vectors for improved protein production
KR100484653B1 (ko) 2004-05-06 2005-04-20 주식회사 대웅 원핵세포에서 활성형의 가용성 단백질을 제조하는 방법 및 이를 위한 폴리시스트론 벡터
WO2005123915A1 (en) 2004-06-21 2005-12-29 Novozymes A/S Stably maintained multiple copies of at least two orf in the same orientation
US7714119B2 (en) * 2004-07-13 2010-05-11 Biosante Pharmaceuticals, Inc. AAV vector compositions and methods for enhanced expression of immunoglobulins using the same
BRPI0517380A (pt) 2004-11-08 2008-10-07 Chromagenics Bv molécula de dna, cassete de expressão, célula hospedeira, e, métodos para gerar uma célula hospedeira que expressa um polipeptìdeo de interesse e para produzir um polipeptìdeo de interesse
EP2106446A4 (en) * 2007-01-10 2010-06-16 Univ Saskatchewan STABILIZATION OF CYCLIC PEPTIDE STRUCTURES

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112891A2 (en) * 2010-03-12 2011-09-15 Boad Of Supervisors Of Louisana State University And Agricultural And Mechanical College Plant defensive peptides
WO2011112891A3 (en) * 2010-03-12 2011-12-22 Boad Of Supervisors Of Louisana State University And Agricultural And Mechanical College Plant defensive peptides
US8945876B2 (en) 2011-11-23 2015-02-03 University Of Hawaii Auto-processing domains for polypeptide expression
CN110714020A (zh) * 2019-05-22 2020-01-21 北京理工大学 一种高效简便纯化蛋白的方法
CN110714020B (zh) * 2019-05-22 2021-08-03 北京理工大学 一种高效简便纯化蛋白的方法

Also Published As

Publication number Publication date
NO20080882L (no) 2008-04-21
JP2012235782A (ja) 2012-12-06
CA2615983A1 (en) 2007-02-01
MX2008000985A (es) 2008-04-07
SG164383A1 (en) 2010-09-29
US20130243789A1 (en) 2013-09-19
US20070065912A1 (en) 2007-03-22
JP2009508470A (ja) 2009-03-05
EP2468881A3 (en) 2012-08-15
TW200745332A (en) 2007-12-16
BRPI0613784A2 (pt) 2011-02-01
US20110034368A1 (en) 2011-02-10
CN101595228A (zh) 2009-12-02
EP2468768A2 (en) 2012-06-27
ZA200800207B (en) 2009-01-28
RU2008106611A (ru) 2009-08-27
EP2468768A3 (en) 2012-10-31
EP1910550A2 (en) 2008-04-16
WO2007014162A2 (en) 2007-02-01
EP2484774A3 (en) 2012-11-14
EP2468881A2 (en) 2012-06-27
WO2007014162A3 (en) 2009-05-07
AU2006272706A1 (en) 2007-02-01
EP1910550A4 (en) 2009-11-04
EP2484774A2 (en) 2012-08-08
IL188841A0 (en) 2008-04-13
RU2478709C2 (ru) 2013-04-10

Similar Documents

Publication Publication Date Title
KR20080031024A (ko) 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법
CN101553506B (zh) Lingo结合分子及其制药用途
DK2692865T3 (en) Transponeringsmedieret identification of specific binding proteins, or functional
CN101287498A (zh) Psma抗体-药物缀合物
KR20050044856A (ko) 항체의 폴리시스트론 발현
KR102584628B1 (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
CN110023500A (zh) 作为选择标记的减毒谷氨酰胺合成酶
US20240207318A1 (en) Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
CN107207603A (zh) 趋化因子‑免疫球蛋白融合多肽,其组合物、制备方法以及用途
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN112877292A (zh) 产生人抗体的细胞
KR20230019156A (ko) 유전자 삽입을 위한 다수의 도크들이 있는 세포주
KR20240021906A (ko) 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터
CA2522166C (en) Lambda integrase mutein for use in recombination
KR20240022571A (ko) Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E601 Decision to refuse application