KR20130094830A

KR20130094830A - 재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터

Info

Publication number: KR20130094830A
Application number: KR1020137011512A
Authority: KR
Inventors: 아시니 파르크; 아룬 싱; 산지브 쿠마르 멘디라타; 아지트 케이 굽타; 만시 자크하드
Original assignee: 카딜라 핼쓰캐어 리미티드
Priority date: 2010-10-08
Filing date: 2011-10-10
Publication date: 2013-08-26
Also published as: CA2813903A1; WO2012046255A8; EP2625277B1; NZ609903A; AU2011311189A1; JP5888616B2; AU2011311189B2; KR101607734B1; EP2625277A2; ZA201302939B; EA201390461A1; JP2013541953A; WO2012046255A3; AR083376A1; BR112013008459A2; US20130244280A1; WO2012046255A2

Abstract

본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터(promoter operably linked to gene of interest), TPL 및 VA 유전자 I 및 II, 매트릭스 부착 영역(MARs)/SARs, 항생물질 마커를 포함하는, 단백질들 및 펩티드들의 생산을 위한 발현 벡터에 관한 것이다. 상기 벡터는 적절한 숙주 세포에서 트랜스펙션된다.

Description

재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터{EXPRESSION VECTOR FOR HIGH LEVEL EXPRESSION OF RECOMBINANT PROTEINS}

본 발명은, 재조합 치료 단백질(recombinant therapeutic proteins)의 높은 레벨 발현을 위한 신규한 발현 벡터에 관한 것이다. 특히, 본 발명은, 재조합 단백질을 코딩하는 유전자 서열 및 매트릭스 부착 영역(matrix attachment region)과 같은 적어도 하나의 실시가능하게 결합된 발현 증진 요소(at least one operably linked expression enhancing element)를 갖는 발현 벡터를 나타낸 것이다. 상기 벡터는, 그 밖의 조절 인자를 더 포함할 수도 있다. 다른 실시형태에서, 본 발명은 상기 발현 벡터로 트렌스펙션된 포유동물 세포를 포함한다(the invention comprises mammalian cells transfected with the said expression vector).

치료 단백질의 증가된 요구는 주로, 소분자 기초 약물(small molecule based drugs)과 비교하여, 독성의 명확한 위험을 현저하게 감소시키는, 이들의 일반적인 매우 특정한 목표의 행동 때문이다(The increased demand of therapeutic proteins is primarily due to their generally highly specific target of action which results in significantly reduced and well-defined risk of toxicity compared to small molecule based drugs). 모든 이러한 환자-우호적인 특성(patient-friendly qualities)을 가짐에도 불구하고, 대부분의 치료 단백질은, 이들은 엄청난 비용을 지속적으로 유지하여야 하기 때문에, 전 세계에서 대부분의 사람에게 접근하기 어려운 상태로 있다. 따라서, 삶의 질을 현저하게 개선시키는, 에리스로포이에틴, 다베포이에틴(Darbepoietin), TNKase, 에타너셉트(Etanercept), 성선자극호르몬(Gonadotropins)와 같은 그 밖의 중요한 약물 또는 인명구조(life saving), 및 리툭시맙(Rituximab), 트라스투주맙(Trastuzumab) 및 그 밖의 치료 모노클론 항체(other therapeutic monoclonal antibodies) 등과 같은 많은 항-암 모노클로날 약물은, 매우 작은 퍼센트의 사람에 의해서만 제공되는 반면에, 전 세계에 대다수의 아픈 사람들은 이들을 제공받지 못한다. 따라서, 이러한 약물의 비용을 낮추는 것에 대한 필요가 시급하다.

이러한 높은 비용의 높은 요소(A large component of this high cost)는, 이들의 낮은 생산 산출량(their low production yields) 때문에 발생되는 이들의 제조와 관련되어 있다. 클론(clone)의 생산 산출량은, 배양 조건[배지 구성요소(media components), 온도, pH etc.] 및 다운스트림 정제 과정(downstream purification process)과 같은 외부의 요소, 및 벡터의 선별과 같은 내부의 요소 및 프로모터, 전사(transcription) 또는 번역 증진 요소(translation enhancing elements) 등과 같은 이의 조절 요소(its regulatory elements) 및 이들의 적절한 방향(their appropriate orientation) 및 또한 적절한 숙주 세포의 선택과 같은 몇 가지 요소의 선택에 달려있다. 포유동물 세포는, 이가 글리코실화의 천연의 능력(natural capacity)을 가짐으로써, 재조합 치료의 단백질의 높은 발현을 수득하기 위한 가장 유망한 발현 시스템이다. 또한, 이러한 발현 시스템에서, 번역 후 변형(post-translational modifications)이 인간 세포 발현 단백질에서 발견되는 것과 유사하게 할 가능성이 많고, 따라서 생리적인 활동성(physiological activity)을 만들게 한다. 그러나, 진핵생물의 세포에서의 발현 레벨은, 또 다른 내부의 인자(another internal factor), 즉 숙주 세포의 게놈에서 흥미있는 유전자를 포함하는 재조합 발현 구조물(recombinant expression construct)의 통합 부위(integration site)에 따라 매우 좌우된다.

원하는 단백질을 코딩하는 흥미있는 유전자를 포함하는 재조합 발현 플라스미드는, 원하는 재조합 단백질을 발현하는, 안정된 CHO 트랜스펙턴트(stable CHO transfectants) 또는 그 밖의 포유동물 트랜스펙턴트를 생성하는데 일상적으로 사용된다. 진핵생물 과발현(eukaryotic overexpression)을 위한 이상적인 시스템은, 강하고, 안정적이거나 또는 장기간 발현을 가능하게 하는 위치에서의 타겟 세포(target cell)의 게놈에서의 발현 카세트의 통합(integration of the expression cassette)을 가질 수 있다. 그러나, 가장 현재의 방법은, 숙주 세포의 게놈 내로 플라스미드 DNA의 임의적인 통합(random integration)만을 달성한다. 상기 발현 레벨이, 이러한 트랜스펙션 공정(transfection process)에서 발생된 클론 집단(clonal populations)에서의 매우 가변적임을 상기 문헌으로부터 분명하다(Brian K Lucas et al., Nucleic Acids Research, 1996, Vol. 24, No. 9 , R.T. Schimke et al., Br. J. Cancer (1985), 51, 459-465, Wurtele H, et al., Gene Ther. 2003 Oct;10(21):1791-9. Biotechnol Prog. 2000 Sep-Oct;16(5):710-5, Yoshikawa T et al., Biotechnol Prog. 2000 Sep-Oct;16(5):710-5., Kim NS, et al., Biotechnol Prog. 2001 Jan-Feb;17(1):69-75). 또한, 높은 레벨로 원하는 재조합 단백질을 발현시킬 수 있는, 안정되게 통합된 재조합 유전자를 운반하는 형질주입종(transfectomas carrying the stably integrated recombinant gene)의 빈도는 매우 낮다.

일반적으로, 다수의 안정되게 트랜스펙션된 세포는, 높은 레벨로 상기 재조합 단백질을 발현하는 클론을 확인하기 위해 스크린되어야 한다(a large number of stably transfected cells must be screened to identify clones which express the recombinant proteins at high levels). 포유동물 게놈은 매우 크고, 이의 오직 0.1 % 만이 전사적으로 활성 서열(transcriptionally)을 포함하는 바와 같이, 이는 통합 부위의 유전적인 환경(the genomic environment of the integration site)의 효과 때문일 것으로 주로 여겨진다(Little (1993) Nature 366:204). 통합에 발현에 영향을 미치는 통합(integration influencing expression)의 부위의 이러한 현상을 "위치 효과(position effect)"라고 한다. 위치 효과는, 하기의 메커니즘의 어떠한 것 또는 모두로 인하여, 양성적인 또는 음성적인 방식(positive or negative manner)으로 통합된 유전자의 발현 레벨을 조절한다 - 1) 통합된 유전자의 발현을 조절하는데 참여할 수도 있는, 통합의 부위 근처에 조절하는 요소(regulatory elements)의 존재, 2) 통합의 부위에서 염색질 구조(chromatin structure), 3) 통합의 부위에서 DNA 메틸화 활성도(methylation activity). 위치 효과의 음성적인 영향은, DNA 메틸화 또는 히스톤 탈아세틸(histone deacetylation)을 통해 유전자 발현억제(gene silencing)로서 엄격할 수 있다(The negative impact of position effect can be as harsh as gene silencing via DNA methylation or histone deacetylation).

따라서, CHO 세포의 게놈 내로 임의적인 플라스미드 통합의 기술이, 높은 레벨의 유전자 발현시킬 수 있는 전사적으로 활성 구역(transcriptionally active zone) 내로 재조합 유전자의 삽입을 항상 야기할 것임은, 아주 가능성이 적은 일이다. 이는, 높은 발현 클론(high expressing clone)을 발견하도록 선별되는데 필요한 클론의 수가 매우 클 것임을 의미한다.

임의적인 통합(random integration)과 관련된 문제점을 극복하기 위해, 게놈에서 부위 특이적인 방식으로 원하는 유전자를 통합하기 위한 시스템의 발견은 문헌에 기재되어 있고, 제한된 성공(limited success)과 함께 사용되고 있다. 예를 들어, 몇몇 그룹은, 게놈의 전사적으로 활성 부위에서 흥미있는 유전자의 부위-특이적인 재조합 매개 도입(site-specific recombination mediated introduction)을 위한 특정한 효소를 사용한다. Cre 및 FLP와 같은 재조합효소는 동일한 타겟 부위(the same target sites)와 통합(integration) 및 절단(excision) 둘 다를 수행한다(Sauer, B. (1994) Curr Opin. Biotechnol., 5, 521-527, Sternberg et al, J Mol Biol, 1981,150,467-486, Broach et al, Cell, 1980,21,501-508). 그러나, 이러한 재조합효소가 포유동물 세포에서의 효과적인 통합을 수행할지라도, 이들이 매개하는 순 통합 빈도(net integration frequency)는 과도한 반작용(excessive back reaction) 때문에 매우 낮다. 따라서, 안정적이고 높은 발현의 문제는 해결되어야할 것으로 여전히 남아있다.

전통적으로, 안정된 높게 생산하는 세포주를 성취하기 위해, 메토트렉세이트(MTX) 매개된 유전자 확대 과정(methotrexate mediated gene amplification process)과 같은 유전자 복제 수를 증가시키는 방법이 일반적으로 사용된다. 트랜스펙션은, 원하는 표현형을 갖는 단일 세포 클론의 광범위한 검색이 따른다(Transfection is followed by extensive search of single cell clones having the desired phenotype). 또한, 메토트렉세이트의 레벨은, 각각의 증가 레벨(each increment level)에서 안정화되기 위해 세포를 위한 충분한 시간이 주어지면서, 소폭 증가로(in small increments) 일반적으로 증가된다. 따라서, 트랜스펙션된 포유동물 세포로부터 발현을 증가시키는 이러한 과정은 시간 소모가 크고, 노동 집약적이다.

진핵생물의 유전자의 전사는, 여러 가지의 cis- 및 trans-작용하는 조절 요소(cis- and trans-acting regulatory elements)에 의해 조절된다(Dillon et.al., (1993) Trends Genet. 9:134). 가장 특징지어진 cis- 요소 중 두 가지는, 프로모터 및 인핸서(enhancers)이다. 프로모터는, 상기 유전자의 코딩 서열(coding sequence)에 대한 5' 가까이의 DNA 서열이다(Promoters are DNA sequences immediately 5' to the coding sequence of the gene). 이들은, 기본적인 전사 장치(basic transcription apparatus)를 형성하는, 트랜스-작용하는 전사 인자(trans-acting transcription factors)를 위한 다수의 결합 부위를 포함한다. 유리하게, 인핸서(enhancers)는 또한, 트랜스-작용하는 전사 인자를 위한 다수의 결합 부위로 구성되어 있지만, 코팅 서열의 업스트림 또는 다운스트림에서 멀리 또는 인트론 내 조차도 발견될 수 있다. 이러한 요소는, 방향 독립 방식(orientation independent manner)으로 또한 작용할 수 있다. 프로모터 및 인핸서의 활성도는, 일시적인 발현 시스템(transient expression systems)에서 검출될 수 있고, 이들은, 조직 특이적이거나 또는 조직 특이적이지 않을 수도 있는 요소를 포함한다.

본 발명의 발명자는, 높은 발현 레벨의 재조합 단백질을 성취하기 위해, a) CMV 프로모터, b) 인트론, c) TPL, d) VA 유전자 및 e) 소의 성장 호르몬 폴리아데닐화 서열(bovine growth hormone polyadenylation sequence)와 같은 조절 요소의 병용 효과(combined effect)를, 이들의 출원 WO2007017903에 이미 기재되어 있다.

cis-작용하는 조절 요소의 그 밖의 카테고리는, 염색질 구조(chromatin structure)를 조절하는 것으로 여겨지는 것이고, 유전자자리 조절 영역(locus control regions, LCRs)[Grosveld et.al., (1987) Cell 51:975], 매트릭스 부착 영역(matrix attachment regions, MARs)[Phi-Van et.al., (1990) Mol. Cell. Biol. 10:2302], 스캐폴드 부착 영역(scaffold attachment regions, SARs)[Gasser and Laemmli (1987) Trens Genet. 3:16], 인슐레이터 요소(insulator elements)[Kellum and Schedl (1991) Cell 64:941] 및 핵 매트릭스-관련 DNAs(Nuclear matrix-Associating DNAs)[Bode J et.al., (1992) Science 255:195]을 포함한다.

MARs 및 SARs는, 이들은 긴 거리(long distances) 상에서 작용할 수 있으므로 유사한 인핸서(similar enhancers)이지만, 이들의 효과가 안정적으로 형질전환된 세포주(stably transformed cell lines) 또는 형질전환 동물(transgenic animal)에서만 검출할 수 있으므로 유일하다. LCRs는, 이들은 위치 및 방향 의존적이고, 조직 특이적인 방식으로 활동성이 있으므로, 다른 타입의 인핸서와 또한 다르다.

SARs/MARs 요소는, 위치 효과의 문제점을 제거하고, 발현 구조(expression construct)에서의 매우 유효한 유전자를 제공하는데 사용되고 있다. 이들은, 인근의 숙주 세포 염색질 요소(neighbouring host cell chromatin elements)가 전이유전자 발현(transgene expression)에 영향을 미치는 것을 예방한다.

MARs는, 유효하게 번역된 유전자를 둘러싸는 영역(regions surrounding actively transcribed genes)으로부터 분리되지만, 또한 동원체(centromere) 및 텔로미어 영역(telomeric regions)으로부터 분리된다. 그들은, 전사 활성도(transcription activity)를 조절함으로써 원하는 유전자의 발현을 증가시킨다.

초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, 마우스 T 세포 수용체 TCRα, 랫 유전자자리 조절 부위(Rat locus control region), β-글로빈 MAR, 아폴리포단백질 B SAR 요소 등과 같은 몇몇의 상이한 MARs/SARs는, 존재하는 문헌에서 상이한 종 및 상이한 고도로 발현된 유전자(different highly expressed genes)로부터 보고되고 있다. 대부분의 이러한 요소는, CHO 세포에서 원하는 유전자의 발현 레벨에서의 향상을 조정하기 위해 낮게 나타난다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 대조적으로, 닭 라이소자임 MAR(Chicken Lysozyme MAR, cLysMAR)은, MAR 요소가 부재한 경우의 대조군과 비교한 바와 같이, 5 내지 6 배 보다 높은 발현 레벨(5 to 6 fold higher expression levels)을 나타낸다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 또한, 동일한 MARs가 발현 카세트의 측면에 배치된 양쪽에 사용된 경우, 발현 레벨에서의 4 내지 5배의 추가적인 증가가 관찰된다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 따라서, 이는, cLysMAR이 선행 기술에서 보고된 가장 촉망받는 요소임을 명확하다. cLysMAR는, 닭 라이소자임 유전자의 먼 업스트림에 위치한다(cLysMAR is localized far upstream of the chicken lysozyme gene)(Phi-Van and Stratling, EMBO, 7,3, pp 655-64,1988). 형질전환된 동물 세포주에서, 이러한 MAR은, 전이유전자 발현의 전체적인 레벨을 증가시키고, 보고 유전자(reporter gene) 주위에 위치한 경우, 이의 위치 의존적인 가변성(position dependent variability)을 감소시키는 것으로 나타내었다(Stief et al., Nature, 341, pp 343-345, 1989). 이러한 효과는, 전이유전자 발현의 조직 특이성(McKnight et al., 1992) 뿐만 아니라 이종의 프로모터 및 세포까지 미치는 것으로 발견되었다(Phi-Van et al., Molecular and Cellular Biology, 10,5 pp 2302-2307, 1990).

US7422874에는, β 갈락토시다아제 보고 유전자(β galactosidase reporter gene), scu-PA 유전자 및 TGF-β SRII 유전자의 발현을 증가시키기 위해, PMS 벡터 구조에서, 조절 요소 - pSV-gal 또는 pCMV-gal 프로모터, MCS 부위 및 전사의 종결 부위(transcriptional termination site)와 결합하여, β-글로빈 MAR의 사용에 대해 기재되어 있다. 그들은, 88 %의 클론(clones)에서의 β 갈락토시다아제를 위한 20 ug/백만 세포의 중간의 발현 레벨(moderate expression levels)을 수득할 수 있었다. 이들은 또한, MARs를 제외한 상기 벡터로서 동일한 조절 요소로 구성된 대조군 벡터 구조와 비교하여, 4 배 이상의 발현 레벨을 갖는 scu-PA를 위한 클론을 생성할 수 있었다. 유전자 증폭(gene amplification)을 위한 MARs 및 DHFR 시스템이 TGF-β SRII의 발현에 함께 사용된 경우, 이들은, 트랜스펙션 후에 100 ng/million cells/day 및 1 uM MTX 까지 MTX 매개된 유전자 증폭의 몇 회 후에, 10 ug/million cells/day을 생산하는 기본적인 클론을 생산될 수 있었다. 그러나, 이러한 특허에서 수득된 발현 레벨은, TNKase, 다베포이에틴, 및 단일클론 항체와 같은 생물치료 단백질(biotherapeutics proteins)에 대해 오늘날 상업적으로 실현가능하지 않다.

US7371542는, LTBR-Fc[림프독소 베타 수용체-IgG Fc 융합 단백질(Lymphotoxin beta receptor - IgG Fc Fusion protein)]의 발현을 증가시키도록, 발현 벡터 구조에서 조절 요소 - CMV 프로모터, 인트론, Ori P 및 Poly A와 함께 β IFN S/MAR의 용도에 대해 기재되어 있고, MARs를 제외한 상기 벡터와 같은 동일한 조절 요소로 구성되는 대조군 벡터와 비교하여, CHO 세포에서 발현 레벨에서 4.5 배 향상이 달성되었다. 그들은 또한, 발현 벡터에서 β IFN S/MAR의 용도가 벡터 pCEP-LTBR-Fc를 사용하여 293 EBNA 세포에서 6.3 배 발현 레벨을 증가시킴을 발견하였다. 그러나, 상기 발현 레벨은 여전히 매우 낮다(20 mg/L in 5 days). 상기 벡터

pCB_SM1_LTBR-Fc는, 9 일에 40 mg/L의 생산성을 갖는 293 EBNA 세포에서 클론을 제공할 수 있었다. 그러나, 이러한 특허에서 수득된 생산성 레벨은, 이러한 생물치료 분자(biotherapeutic molecules)에 바람직한 레벨에 훨씬 못 미친다.

US5731178은, 프로모터 및 인핸서를 포함하는 벡터 구조에서 cLysMARs을 사용함으로써 원하는 유전자의 증진된 발현에 대해 기재되어 있다. 그들은, mar 요소가 인핸서 및 프로모터로 단지 구성된 대조군 구조 상에서 인핸서 및 프로모터 요소와 함께 사용된 경우, 안정된 트랜스펙션에서 cLysMAR 요소의 사용이 10 배 이상으로 보고 유전자 CAT 활성도를 개선시킬 수 있으나, MAR 요소가 이 자체로 어떠한 주요한 영향을 나타낼 수 없음을, 나타낸다.

Poljak et al.,(1994) Nucleic Acid Res., 22(21):4386-94)는, cLysMAR이 SV40 프로모터 및 인핸서와 결합되어 사용된 경우, 약 15 배로 CAT 보고 유전자의 발현에서의 증가를 보고하였다. 이 자체로 cLysMAR은 원하는 유전자의 발현을 증가시키는데 매우 좋지 못함, 더 정확히 말하면 이는 조금의 감소를 나타냄을 발견하였다.

따라서, 상기의 예는, 본 분야의 숙련자에게 알려진 표준 조절 요소(standard regulatory elements)를 포함하는 상기 대조군 벡터 구조가 높은 발현을 뒷받침하기에 본래 충분하지 않는 사실을 보여준다. 그리고, 추가적으로 MARs/SARs와 함께 결합 후에도, 상기 발현 레벨은, 재조합 치료법(recombinant therapeutics)의 실행 가능한 생산을 위해 상업적으로 요구된 이러한 것들로 증가되지 않는다. 따라서, 요소의 유일한 조합(unique combination)은, 원하는 발현 레벨을 성취하기 위해 여전히 요구된다.

따라서, 이는, 점점 더 많은 입수가능한 이들을 제조하기 위해, 치료 단백질의 발현을 추가적으로 증가시키도록, 산업에서의 중요한 필요가 존재함이, 명확해진다. 따라서, 하나는, 상이한 종류의 타겟 유전자와 함께 증가된 발현을 제공하도록, 합성 방식(synergistica fashion)에서의 MARs와 함께 작용할 수 있는, 상기 발현 벡터에서의 요소의 조합(combination)을 위한 필요를 느끼게 한다. 본 발명의 발명자는, 조절 요소의 유일한 조합의 공동의 작용(concerted action)이, 시간 절약 방식(time saving manner)에서의 재조합 단백질의 최적의 발현을 위해 필수적임을, 이후로 입증되고 있다.

US7129062에는, 재조합 단백질의 발현 - 약 20 배의 anti Rhesus D IgG 및 루시페라아제(luciferase)-을 증가시키기 위해, 하나의 벡터는 흥미있는 유전자를 포함하고,두 번째의 것은 cLysMARs를 포함하는, 2 개 이상의 연결되지 않는 벡터(more than 2 unlinked vectors)의 공동-트랜스펙션(co-transfection)에 대해 기재되어 있고, 이들은 이러한 공동 트렌스펙션 전략을 사용하여 200 mg/L에서 인간 항 Rhesus D IgG(human anti Rhesus D IgG)를 또한 생산할 수 있었다. 그러나, 이는 문헌(DNA Cloning: Mammalian systems;　By David M. Glover, B. D. Hames)에서 널리 보고되어 있고, 또한, 공동트랜스펙션이, 트랜스펙션된 개체수에서의 가변성(variability) 및 이종혼성(heterogeneity)을 증가시킴을 우리의 경험에서도 또한 알 수 있었다. 게다가, 본 발명은, 단일 트랜스펙션(single transfection)을 사용하여 원하는 산출량을 획득하였다.

US20080102523에서는, SV40 프로모터-인핸서 및/또는 CMV 프로모터, ori site 및 폴리 A 영역으로 이루어진 상기 대조군 벡터 구조와 비교한 바와 같이, 3 배의 베터-갈락토시다아제 및 6 배의 면역글로불린의 발현을 증가시키기 위해 β-글로빈 MAR의 용도에 대해 기재되어 있다. 상기 특허 출원서는, β-글로빈 MAR 조절 요소의 도움 뿐만 아니라 MTX 매개된 유전자 증폭 둘 다를 통해 발현에서의 보통의 증가(moderate increase) 만을 성취하고, 이로 인하여 전체 과정이 지루하고, 시간 소비적으로 만들 수 있다. 이는, 본 발명자는, 조절 요소의 이들의 유일한 조합과 함께 및 MTX-DHFR 선택 방법과 같은 어떠한 길고 지루한 방법의 사용 없이, 높은 발현을 성취하는 것이 현재의 발명과 대조적이다.

US5888774에는, 인간 아폴리포단백질 B SAR 요소(human apolipoprotein B SAR element)를 이용하여 높은 발현의 에리스로포이에틴에 대해 기재되어 있고, EPO/million cells/24 Hrs의 1500 내지 1700 IU의 발현이 보고되어 있다. 본 발명자에 의해 소유된 WO 2007017903에는, US5888774에서 보고된 수치보다 현저하게 더 높은, 2366 내지 3549 IU/10⁶ cells/24 Hrs 또는 18.2 내지 27.3 ㎍/10⁶ cells/24 Hrs와 동등한, 168 hrs 배양에서, 11,830 IU/ml(91 ㎍/ml)의 발현 레벨에서 재조합 인간 에리스로포이에틴을 생산하기 위한 방법에 대해 기재되어 있다. 그리고, 본 발명은, 몇몇의 치료상의 단백질을 위해, WO2007017903의 벡터 상에 현저하게 발현 레벨을 추가적으로 증가시킨다.

따라서, 진핵생물의 숙주 세포의 생산성을 추가적으로 증가시키기 위해, 신규한 발현 벡터를 개발하는 것을 여전히 원하고 있다. 놀랍게도, 지난 수십 년간 이러한 분야에서 생성된 지식의 엄청난 양에도 불구하고, 오늘날 본 분야에서 알려진 숙련자가, 단순하게 선택할 수 없고, 상당한 높은 발현을 제공하는 발현 벡터를 디자인하도록, 내부의 인자 또는 조절 요소의 조합을 선택한다. 추가적으로, 높은 발현 벡터를 생성하기 위한 적절한 요소의 조합은, 터를 사용하여 흥미있는 원하는 유전자의 높은 발현이 오직 하나의 요소에 기인하지 않을 수 없고, 그러나 적절한 요소의 조합이 안정된 높게 발현하는 세포 주를 얻기 위해 바람직하지 않기 때문에, 본 분야의 숙련자에 의해 일상적으로 추정되지 않을 것이다. 따라서, 이러한 본 발명은, 예를 들어, 이의 안정성을 증가시키고, 번역 효율성(translation efficiency)을 증가시킴으로써, mRNA 분자의 생명을 확장시키는, 증가된 전사에 의해 mRNA 레벨을 증가시키는데 있어서, 다중 역할(multiple roles)을 갖는, CMV 프로모터, 인트론, TPL, 및 VA 유전자와 같은, 그 밖의 조절 요소와 함께, 닭 라이소자임 MAR 요소[chicken lysozyme MAR element(s)]와 같은 발현 증진시키는 요소를 포함하는 신규한 발현 벡터를 제공함으로써 이러한 문제를 해결책을 제공하고, 따라서, 상기 트랜스펙션된 포유동물 숙주 세포에서의 재조합 단백질의 높고 안정된 발현을 유도하는 공동의 방식(synergistic manner)을 작용한다. cis 또는 trans 방향에서의 cLysMAR의 측면의 발현 카세트로 이루어진(consisting of the expression cassette flanked by cLysMAR in a cis or trans orientation), 본 발명의 상기 발현 벡터에서의 이러한 요소의 조합은, 트랜스펙션된 세포주에서의 치료 단백질의 안정되고, 높은 발현을 결과적으로 야기한다.

본 발명의 목적

본 발명은, 포유동물 세포에서의 흥미있는 단백질의 발현 효율성을 증가시키는 발현 벡터를 제공한다.

하나의 실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터(a promoter operably linked to the gene of interest), 발현 증진 요소, 그 밖의 조절 요소, 즉, TPL, VA I 및 II 유전자 또는 이의 변이체, 번역 종결자(translation terminator) 및 항생물질 마커(antibiotic marker)를 포함하는 신규한 발현 벡터를 제공하고, 상기 발현 증진 요소는 염색질 부착 영역(chromatin attachment region)이다.

하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 함께, 클로닝 부위에 실시가능하게 결합된 프로모터(promoter operably linked to cloning sites), 흥미있는 유전자, 번역 종결자, TPL, VA I 및 II 유전자, 적절한 항생물질 마커를 포함한다.

대체적인 실시형태(alternate embodiment)에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs으로부터 선택된 발현 증진 요소(expression enhancing elements)와 함께, 클론 부위에 실사가능하게 결합된 프로모터(promoter operably linked to cloning sites), 흥미있는 유전자, BGH와 같은 번역 종결자, 인트론, 적절한 마커 및 선택적으로 내부의 리보솜 결합 부위를 포함한다.

하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs으로부터 선택된 발현 증진 요소와 함께, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, TPL, VA I 및 II 유전자, 인트론, 적절한 항생물질 마커 및 임의적으로 내부의 리보좀 결합 부위를 포함한다.

또 다른 실시형태에서, 본 발명은, 본 발명의 실시형태에 따라 상기 발현 벡터로 트렌스펙션된, 포유동물 숙주 세포에서의 흥미있는 유전자를 발현시키기 위한 방법을 제공한다.

도 1은, pZRCII의 벡터 그림(vector diagram)을 나타낸 것이다.
도 2는, pZRC III의 벡터 그림을 나타낸 것이다.
도 3은, pZRC III-TNK-Hyg의 벡터 그림을 나타낸 것이다.
도 4는, pZRC III-Darbe-Hyg의 벡터 그림을 나타낸 것이다.
도 5는, pZRC III- Etanercept-Hyg의 벡터 그림을 나타낸 것이다.
도 6은, pZRC III- FSHα-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 7은, pZRC III- FSHβ-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 8 은, pZRC III- TNK-Puro의 벡터 그림을 나타낸 것이다.
도 9는, pZRC III-DARBE- Puro의 벡터 그림을 나타낸 것이다.
도 10은, pZRC III- FSHα- IRES- FSHβ-Puro 벡터의 벡터 그림을 나타낸 것이다.
도 11은, pZRC III- FSHα- IRES- FSH β-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 12는, pZRC III- FSHβ- IRES- FSHα-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 13은, pZRC III-Etanercept- Neo의 벡터 그림을 나타낸 것이다.
도 14는, pZRC III-TNK-Neo의 벡터 그림을 나타낸 것이다.

정의

염색질 부착 영역은, 단백질성 핵 매트릭스(proteinaceous nuclear matrix)와 함께 이들의 상호작용을 통해, DNA의 위상학적으로 강요된 루프(topologically constrained loops)를 형성하는 염색질의 구조 성분(structural components of chromatin)이다.

사용된 약어:

CMV --- 거대세포 바이러스(Cytomegalovirus)

TPL --- 삼부 리더(Tripartite Leader)

VA 유전자 또는 VA I 및 II 유전자 --- 바이러스 관련된 RNA 유전자 I 및 II(Virus associated RNA genes I and II)

BGH ---소의 성장 호르몬(Bovine growth hormone)

본 발명은, 포유동물 숙주 세포에서 의미 있는 치료학적 단백질 및 펩티드의 발현의 효율성을 증가시키는 신규한 발현 벡터를 제공한다. 상기 신규한 벡터는, 증가된 전사(transcription)의 장점을 첨가하면서, 위치 효과(position effect)와 연관된 문제점을 추가적으로 제거하고, 번역(translation)이 조절 요소의 유일한 조합과 함께 성취된다.

하나의 실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터, 발현 증진 요소, PL, VAI 및 II 유전자 또는 이의 변이체, 번역 종결자 및 항생물질 마커를 포함하는 신규한 발현 벡터를 제공하고, 상기 발현 부착 요소는, 염색질 부착 영역이다. 염색질 부착 영역은 MARs 및 SARs로부터 선택된 것이다.

실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터, TPL 및 VA 유전자 I 및 II, 매트릭스 부착 영역(matrix attachment regions)(MARs)/SARs, 번역 종결자(translation terminator), 항생물질 마커를 포함하는 단백질 및 펩티드의 생산을 위한 발현 벡터를 제공한다.

대체적인 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, 인트론, 적절한 항생물질 마커, 및 임의적으로 MARs 및/또는 SARs으로부터 선택된 발현 증진 요소(expression enhancing elements)와 함께 내부의 리보솜 결합 부위를 포함한다.

하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, TPL, VA I 및 II 유전자, 인트론, 적절한 항생물질 마커 및 MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 함께 임의적으로 내부의 리보솜 결합을 포함한다.

본 발명의 실시형태에 따라, 상기 프로모터는, CMV 프로머터, SV40 프로모터, 아데노바이러스 프로머터(adenovirus promoter), 베타 액틴 프로모터(Beta actin promoter), 금속티오닌 프로모터(metallothionin promoters) 또는 그 밖의 원핵세포(prokaryotic) 또는 진핵생물의 바이러스 프로모터(eukaryotic virus promoters)로 이루어진 군으로부터 선택된 것이다. 바람직한 실시형태에서, CMV 프로머터가 사용된다.

상기 프로모터는 유전자의 가까이에 일반적으로 위치하고, 이는, 동일한 가닥 및 즉, 상기 전사가닥(sense strand)의 5' 영역을 향하는, 업스트림(upstream)에서 조절되고, 이는 전사를 촉진시킨다.

본 발명의 실시형태에 따라, 상기 클론 부위는, AatI, AatII, Acc113I, Acc16I, Acc65I, AccIII, AclNI, AseI, AsnI, Asp718I, BalI, BamHI, BanI, BanII, BbeI, BbiII, BbsI, BbuI, Bbv16II, BclI, BcoI, BglI, BglII, BlnI, Bsh1365I, BsiEI, BsiHKAI, BsiI, BspEIBspHI, BstZI, CciNI, Cfr10I, Cfr42I, Cfr9I, CfrI, Csp45I, DrdI, DsaIEaeI, EagI, Eam1104I, Eco47III, Eco52I, Eco57I, Eco88I, Eco91I, EcoICRI, EcoO109I, EcoRI, EcoT14I, FriOI, FseI, FspI, HaeII, Hin1I, HincII, HindII, KasI, Ksp632I, KspI, KpnI, LspI, MamI, MflI, MluNI, MroI, MroNI, MspA1I, NaeI, NarI, NcoI, NdeI, NgoAIV, NheI, NotI, NspBII, NspI, NspV, PacI, PaeI, PflMI, PinAI, Ple19I, Pme55I, PmeI, Ppu10I, PpuMI, PshBI, Psp124BI, Psp5II, PspAI, PspALI, PspEI, PstI, PstNHI, PvuI, PvuII, SacI, SacII, ScaI, SfcI, SfiI, SpeI, SphI, Van91I, VneI, XhoI, XhoII, XmaI, XmaIII, Zsp2I로부터 선택될 수 있지만, 이로 제한되지 않는다.

본 발명의 실시형태에 따라, 상기 번역 종결자는, 소 성장 호르몬, 아데노바이러스 및 진핵생물 바이러스 번역 종결자 서열로 이루어진 군으로부터 선택된 것이다. 바람직한 실시형태에서, 상기 번역 종결자는 BGH Poly A이다.

추가적인 실시형태에서, 상기 내부의 리보좀 결합 부위(internal ribosomal binding sites)는, 피코르나바이러스 IRES(Picornavirus IRES), 아프타바이러스 IRES(Aphthovirus IRES), 간염 A IRES(Hepatitis A IRES), 간염 C IRES, 페스티바이러스 IRES(Pestivirus IRES), 뇌심근염 바이러스 IRES로부터 선택된 것이고, 바람직하게 뇌심근염 바이러스 IRES이다.

본 발명의 실시형태에 따라, 매트릭스 부착 영역과 같은 발현 증진 요소는, 닭 라이소자임 MAR, 초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, 마우스 T 세포 수용체 TCRa, 랫 유전자자리 대조 영역(rat locus control region), 및 β-글로불린 MAR, 및 아폴리포 단백질 B SAR 요소로부터 선택된 것이다.

바람직한 실시형태에서, 닭 라이소자임 MAR(Sequence id 5)은, 5' 측면 서열(5' flanking sequence) 또는 3' 측면 서열에서 복제된다(cloned). 가장 바람직한 실시형태에서, 닭 라이소자임 MAR은, 전사의 조립(transcriptional assembly)의 5' 및 3' 측면 서열 둘 다에서 클론된다.

본 발명에서, 흥미있는 유전자는, 본 분야에서 알려진 방법에 따라 발현 벡터에서 클론된다(SAMBROOK, J.; FRITSCH, E.F. and MANIATIS, T. Molecular Cloning: a laboratory manual. 2^nd ed. N.Y., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, 1989. 1659). 본 발명의 실시형태에 따라, 흥미있는 유전자는, 조직 플라스미노겐 활성인자, TNK-TPA, 다베포이에틴, 에리스로포이에틴, 인슐린, GCSF, 인터류킨, 종양 괴사 인자, 인터페론, TNFR-IgGFc, 리툭시맙, 베바시주맙, 아달리무맙, 트라스투주맙[지네릭 네임(generic names)]과 같은 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 증식 인자, FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, MYT-2, NF-κB 억제 인자 NRF, AML1/RUNX1, Gtx 호메오도메인 단백질과 같은 전사 인자, 진핵생물 개시 인자 4G(elF4G)a, 진핵생물 개시 인자 4Gl(elF4Gl)a, 사멸 관련 단백질 5(DAP5)와 같은 번역 인자, c-myc, L-myc, Pim-1, 단백질 키나아제 p58PITSLRE, p53과 같은 종양유전자, 여포 자극 호르몬, 융모성 생식선 자극호르몬, 인간 황체형성 호르몬 등으로부터 선택된 생식선 자극 호르몬과 같은 호르몬, 및 면역글로불린 중쇄 결합 단백질(BiP), 열 충격 단백질 70, 미토콘드리아의 H+-ATP 생성효소의 β-서브유닛(subunit), 오르니틴 탈카르복실화효소, 코넥신 32 및 43, HIF-1a, APC 로부터 선택된, 단백질들 및 펩티드들 및 이의 기능적인 유사체들을 코딩할 수도 있다(According to an embodiment of the present invention the gene of interest may encode suitable proteins and peptides and functional analogues thereof selected from tissue plasminogen activator, TNK-TPA, Darbepoietin, Erythropoietin, Insulin, GCSF, Interleukin, Tumor necrosis factor, Interferon, TNFR-IgGFc, Monoclonal antibodies such as Rituximab, Bevacizumab, Adalimumab, Trastuzumab (generic names) and their fragments like Fc region, Fab, GLP-I, GLP-II, IGF-I, IGF-II, Platelet derived growth factor, FVII, FVIII, FIV and FXIII, exendin-3, exendin 4, transcription factors like MYT-2, NF-?B repressing factor NRF, AML1/RUNX1, Gtx homeodomain protein, translation factors like Eukaryotic initiation factor 4G (elF4G)a, Eukaryotic initiation factor 4Gl (elF4Gl)a, Death associated protein 5 (DAP5), oncogene like c-myc, L-myc, Pim-1, Protein kinase p58PITSLRE, p53 hormones such as gonadotropic hormones selected from Follicle stimulating hormone, Human Chorionic Gonadotropin, Human Leutinizing Hormone, etc. and immunoglobulin heavy chain binding protein (BiP), Heat shock protein 70, β-subunit of mitochondrial H+-ATP synthase, Ornithine decarboxylase, connexins 32 and 43, HIF-1a, APC). 이에 따라서, 기능적인 유사체(functional analogues)는, 이의 천연 단백질 및 펩티드와 유사하거나 또는 동일한 기능을 갖는 단백질 또는 펩티드를 의미한다.

본 발명에 따라, 발현 벡터 구조는, 실시가능하게 결합된 프로모터, 클론 부위(cloning sites), 흥미있는 유전자, 전사 종결자, 인트론, 적절한 항생물질 마커, TPL, VA 유전자 I 및 II을 추가적으로 포함하는 발현 조립(expression assembly)을 포함한다. 이러한 발현 벡터는, 서열 id no. 4(6)에 나타낸 pZRCII로서 나타낸다. 또 다른 실시형태에서, 매트릭스 부착 영역(Matrix attachment region, MAR) 또는 SARs, 바람직하게 MAR과 같은 발현 증진 요소의 유전자 서열은 추가적으로 pZRCII에서 클론된다. 이는 새로운 발현 벡터는, 서열 id no 6에 나타낸 pZRCIII로서 나타낸다. 매트릭스 부착 영역은 pZRCIII의 5' 또는 3' 측면 영역(5' or 3' flanking region)에서 클론된다. 바람직한 실시형태에서, 매트릭스 부착 영역은, pZRCIII의 5' 및 3' 측면 영역에서 클론된다. 본 발명의 pZRCIII 구조는, 현저하게 흥미있는 유전자의 발현을 증진시킬 뿐만 아니라, 트랜스펙션 효율성을 개선시키는 것으로서, 선행 기술에 알려진 벡터를 넘어 향상된 것이다. 본 벡터 구조 pZRCIII는 모든 단백질 및 펩티드의 발현에 적합하다.

발현 벡터 pZRCIII에서 적절한 항생물질 마커는, 카나마이신(kanamycine), 히그로마이신 퓨로마이신(hygromycin puromycin), 및 DHFR로부터 선택된 것이다. 또 다른 실시형태에서, 상기 발현 벡터 pZRCIII는,임의적으로 DHFR 및/또는 내부의 리보솜의 결합 부위(internal ribosomal binding site, IRES)의 유전자 서열을 운반한다(carries).

하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 결합하여, 클론 부위, 흥미있는 유전자, 번역 종결자, TPL(Seq ID no. 2), VA I 및 II 유전자(Seq ID no. 3), 적절한 항생물질 마커를 포함한다.

또 다른 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 결합하여, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, 번역 종결자, 인트론(Seq ID no. 1), 적절한 마커 및 임의적으로 내부의 리보좀 결합 부위를 포함한다.

단백질 및 펩티드의 원하는 발현의 생산을 위한 발현 벡터는, 적절한 요소를 포함하지만, 3 가지 요소, 즉 프로모터의 3' 말단에서의 아데노바이러스성 삼부 리 더 서열(Adenoviral Tripartite leader sequence), 아데노바이러스 주요한 최근의 전사물(adenovirus major late transcript)의 5' 제공 부위(5' donor site) 및 TPL의 3' 말단에 위치하는 마우스 면역글로불린의 3' 절단 부위(3' splice site)(Seq ID no. 2)를 포함하는 혼성 (키메라) 인트론[hybrid (chimeric) intron], 아데노바이러스성 VA RNA I 및 II 유전자(Seq ID no. 3)로 한정하는 것은 아니다. 매트릭스 부착 영역은, Mlu I에서 5' 측면 서열(5' flanking sequence) 또는 BGH 폴리 A 서열의 말단에서 3' 측면 서열(3' flanking sequence)에서 클론된다. 매트릭스 부착 영역의 방향(orientation)은 선택적이다. 게다가, 본 발명의 MARs 요소는, 아세노바이러스성 삼부 리더 서열, 혼성 (키메라) 인트론, TPL (Seq ID no. 2) 및 아데노바이러스성 VA RNA I 및 II 유전자(Seq ID no. 3)와 결합하여, 상승 작용에 의해 원하는 유전자의 발현을 증진시킬 뿐 아니라, 트랜스펙션 효율 및 원하는 클론의 수를 증가시킨다.

바람직한 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진시키는 요소(expression enhancing elements)와 결합하여, 클론 부위에 실시가능하게 결합된 프로모터, 흥미로운 유전자, 전사 종결자, TPL(Seq ID no. 2), VA I 및 II 유전자(Seq ID no. 3), 인트론(Seq ID no. 1), 적절한 마커 및 임의적으로 내부의 리소좀 결합을 포함한다. 실시형태에서, 상기 발현 벡터는, 흥미있는 유전자에 실시가능하게 결합된 프로모터 또는 이의 변이체, VA I 및 II 유전자 또는 이의 변이체, TPL 또는 이의 변이체, 키메라 인트론(Chimeric Intron) 또는 이의 변이체, 항생물질 마커, 매트릭스 부착 영역, 임의적으로 내부의 리보솜 결합 부위, 소의 성장 호르몬 폴리아데닐화(Bovine growth harmone polyadenylation)를 포함한다.

하나의 실시형태에서, 흥미있는-히그로마이신 벡터의 PZRCIII-유전자는, CMV 프로모터에 의해 유도된 흥미있는 유전자와 실시가능하게 결합된 서열 id no 5에 나타낸 cLysMARs(cLysMARs setforth the in sequence id no 5 operably linked with gene of interest driven by a CMV promoter), TPL, 서열 id no 1에 나타낸 키메라 인트론(chimeric intron), 서열 id no.3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화(polyadenylation) 및 다수의 클론 부위(multiple cloning sites)를 포함한다. 다수의 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 발현 카세트 외부에 위치하는 VA 유전자 및 발현 카세트에서 CMV 프로모터, TPL, 키메라 인트론(chimeric intron)과 같은 그 밖의 조절 요소와 함께, 상기 발현 카세트의 업스트림(upstream) 및 다운스트림(downstream) 둘 다에서 닭 라이소자임 MAR 요소를 갖는 벡터의 다수의 클론부위(multiple cloning site) 내로 클론된 융합 단백질 에타너셉트(fusion protein Etanercept)(TNFR-Fc)의 화학적으로 합성된 유전자와 유사한 다수의 클론 부위에서 클론될 수 있다. 상기 벡터는, 트랜스팩턴트의 선별을 위한 히그로마이신 저항성 유전자를 갖는다(The vector has a hygromycin resistance gene for selection of transfectants). 본 발명의 이러한 양상에 따라 제조된 벡터 구조의 예로서, pZRCIII-에타너셉트에타너셉트(etanerceptetanercept)-히그로마이신 벡터가 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5656이다.

또 다른 실시형태에서, 흥미있는-네오마시니 벡터의 PZRCIII-유전자는, CMV 프로모터와 실시가능하게 결합된 서열 id no 5에 나타낸 C-Lys-MARs, TPL, 서열 id no 1에 나타낸 키메릭 인트론(chimeric intron), 서열 id no. 3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화(BGH polyadenylation) 및 다수 클론 부위를 포함한다. 다수 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 상기 발현 카세트에서 CMV 프로모터, TPL, 키메릭 인트론과 같은 그 밖의 조절 요소 및 발현 카세트 외부에 위치한 VA 유전자(VA genes placed outside the expression cassette)와 결합하여, 상기 발현 카세트의 업스트림 및 다운스트림 둘 다에서 닭 리소자임 MAR 요소를 갖는 벡터의 다수의 클론 부위 내로 클론된 융합 단백질 에타너셉트(TNFR-Fc)의 화학적으로 합성된 유전자와 같은 다수 클론 부위에서 클론될 수 있다. 상기 벡터는 트랜스펙턴트(transfectants)의 선별을 위해 히그로마이신(네오마이신) 저항성 유전자를 갖는다.

본 발명의 이러한 양상에 따라 제조된 벡터 구조의 예로서, pZRCIII-에타너셉트-네오마이신 벡터는 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5657이다.

다른 실시형태에서, 흥미있는-IRES-히그로마이신 벡터(interest-IRES-Hygromycin vector)의 PZRCIII-유전자는, CMV 프로모터에 실시가능하게 결합된 서열 id no 5 에 나타낸 cLysMARs, TPL, 서열 id no 1에 나타낸 키메릭 인트론, 서열 id no. 3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화 및 다수의 클론 부위를 포함한다. 다수의 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 발현 카세트에서 CMV 프로모터, TPL, 키메릭 인트론과 같은 그 밖의 조절 요소 및 상기 발현 카세트의 외부에 위치한 VA 유전자와 함께, 벡터의 다중 클론 부위 내로 클론된 FSH α 및 FSH β 서브유닛(subunits) 및 발현 카세트의 업스트림 및 다운스트림 둘 다에서 닭 라이소자임 MAR 요소를 갖는, IRES에 의해 각각 실시가능하게 결합된 둘 다 FSH α 및 FSH β 서브유닛 둘 다의 화학적으로 합성된 유전자와 같은 다수 클론 부위에서 클론될 수 있다. 상기 벡터는 트랜스펙턴트의 선별을 위해 히그로마이신 저항성 유전자를 갖는다. 본 발명의 이러한 측면에 따라 제조된 벡터 구조의 예로서, pZRCIII FSH α-IRES-FSH β 히그로마이신 벡터는 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5655이다.

실시형태에서, 본 분야의 숙련자에게 알려진 방법에 의해 포유동물 숙주 세포로 트랜스펙션된다. 포유동물 숙주 세포는, 단백질의 상업적인 생산을 위해 널리 알려진, CHO[중국 햄스터 난소(Chinese hamster ovary)] 세포주, BHK[어린 햄스터 신장(Baby hamster kidney)] 세포주 등으로부터 선택될 수도 있다. 또 다른 실시형태에서, 상기 트랜스펙션된 숙주 세포는, 흥미있는 유전자의 추가적인 발현을 증가시키도록, 카나마이신, 히그로마이신, 퓨로마이신으로부터 선택된 적절한 항생물질을 포함하는 상이한 벡터로 추가적으로 트랜스펙션된다.

하나의 실시형태에서, 상기 트랜스펙션된 세포주는, 히그로마이신, 퓨로마이신, 카나마이신, G418 또는 그 밖의 항생물질을 사용함으로써 선택된 CHO K1 이다.

게다가, 상기 트랜스펙션된 세포주는, 만약 상기 발현 벡터가 DHFR의 유전자를 운반한다면, 예를 들어, 메토트렉세이트, DHFR 선택 배지를 사용함으로써 선택된다. 이러한 선택은, 상기 트랜스펙션된 세포주에서 선택 압력에서 점진적으로 증가에 의존한다(Kaufman and Sharp, 1982; Schimke et al., 1982).

또 다른 실시형태에서, 상기 트랜스펙션된 세포주는, 발현 벡터가 글루타민 합성효소(Glutamine synthetase)의 유전자를 운반하는 바와 같이, 글루타민 합성효소(GS) 선택 배지, 예를 들어 메티오닌 술폭시민(methionine sulphoximine)(MSX)에서 선택된다.

이런 이유로, 본 발명은, 현저하게 전사 및 번역을 증가시키고, 또한 유전자 통합의 위치 효과를 억제하는, 조절 요소(regulatory elements)의 유일한 조합(unique combination)을 포함하는 신규한 발현 벡터를 제공하고, 따라서 상기 재조합 단백질의 안정되고, 높은 발현에 대한 상승 효과(synergistic effect)를 제공한다. 게다가, 이는, 많은 수의 클론의 노동 집약적인 선별이 일반적인 요소(typical element)의 존재에서 급격히 감소되는 바와 같은, 시간 효과적인 방식에서의 산업적인 규모에서의 치료학적 단백질 및 펩티드, 모노클로날 항체의 생산을 제공한다. 게다가, 본 발현 벡터는, 안정되고 일시적인 발현 둘 다에 사용될 수 있다.

본 발명은, 실시예의 도움과 함께 추가적으로 설명된다. 실시예는, 설명적인 목적을 위해서만 나타낸 것이고, 본 발명은 이들만으로 제한되는 것은 아니다.

실시예 1. pZRC III 벡터의 구성

모든 조절 요소, 즉 TPL, VA, CMV 프로모터, 키메릭 인트론 및 BGH 폴리아데닐환 및 종결 서열(termination sequences)과 함께 전체의 전사 조립(whole transcription assembly)은 독일 GeneART에서 화학적으로 합성된, 특허 출원 WO2007017903에 기재되어 있다. 클로닝 벡터 pMK (GeneART, Germany)에서 클론된 이러한 전체 조립(this whole assembly)(GeneART, Germany)은, pZRC II (도 1, Seq ID No. 4)라고 부른다. 닭 라이소자임 MAR DNA 단편(Seq ID No 5)(Phi-Van, L. and Stratling,W.H, Biochemistry 35 (33), 10735-10742 (1996))은 화학적으로 합성되고, 클로닝 벡터(cloning vector)에서 클론된다. 두 개의 닭 라이소자임 MAR 단편은, 상기 벡터 내로 이미 예비-디자인된(pre-designed) SacI 및 MluI 부위를 사용하여, pZRC II 벡터에서 발현 카세트의 어느 한 쪽에서의 측면(flanks)으로서 삽입된다. SacI 오버행(SacI overhang)은, SacI 부위를 갖는 프라이머를 사용하여 PCR에 의해 닭 라이소자임 MAR 단편에 첨가되었다. 명확하게, 40 사이클의 PCR 증폭(amplification)은, 50 mM Tris-Cl(pH 8.3), 2.5 mM MgCl₂, 각각 250 μM의 4 dNTPs 및 Pfu 중합효소의 5 유닛을 포함하는 50 ㎕의 부피에서의 유전자 특이적인 올리고뉴클레오티드 프라이머(gene specific oligonucleotide primers)의 100 피코몰(100 picomoles)을 사용하여 실행하였다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃[변성(denaturation)], 30 sec 동안 62 ℃[어닐링(annealing)] 및 2 min 동안 72 ℃[확장(extension)]으로 이루어져 있다. PCR 반응의 증폭된 생산물은, 1 % 아가로스 겔(Agarose gel)에서 용해된다(resolved). 대략 1664 염기쌍 크기(approx 1664 base pairs size)의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. 이러한 정제된 DNA 단편은, Sac I(MBI Fermentas, USA)와 함께 상기 정제된 PCR 생산물 및 벡터 둘 다의 제한 절단(restriction digestion) 후에 pZRC II 벡터 내로 연결되었다(ligated). 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 수득된 형질전환체(transformant)는 카나마이신 저항을 기초로 기록된다. 적은 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 닭 라이소자임 MAR 단편의 존재를 위해 분석된다. pZRC II 벡터에서 정확한 통합(correct integration)을 갖는 것으로 발현된 하나의 이러한 플라스미드는 pZRC II 1MAR (Sac) 매개 벡터[pZRC II 1MAR (Sac) intermediate vector]로 명명되었다.

또 다른 닭 라이소자임 MAR 단편에 Mlu I 오버행(Mlu I overhang)을 첨가하기 위해, 이를, 50 mM Tris-Cl (pH8.3), 2.5 mM MgCl₂, 4 dNTPs의 250 μM 각각 및 5 units의 Pfu 중합효소를 포함하는 50 ㎕의 부피에서 유전자 특이적인 올리고뉴클레오티드 프라이머의 100 피코몰(picomoles)을 사용하여 PCR 증폭의 40 사이클을 하였다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃(변성), 30 sec 동안 62 ℃(어닐링) 및 2 min 동안 72 ℃(확장)으로 이루어져 있다. PCR 반응의 증폭된 생산물은 1 % 아가로스 겔에 용해시켰다. 대략 1664 염기쌍 크기(approx 1664 base pairs size)의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. 이러한 정제된 DNA 단편은, Mlu I(MBI Fermentas, USA)와 함께 상기 정제된 PCR 생산물 및 벡터 둘 다의 제한 절단(restriction digestion) 후에 pZRC II-1MAR(Sac) 벡터 내로 연결되었다. 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformant)는 카나마이신 저항을 기초로 기록된다. 약 10 개의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 MluI 위치에서 닭 라이소자임 MAR 단편의 존재를 위해 분석되었다. pZRC II-1MAR(Sac) 벡터에서 MluI 부위에서 cLysMAR의 정확한 통합을 갖는 것으로 발견된 하나의 이러한 플라스미드는 pZRC III로 명명된다(도 2, Seq ID no 6).

실시예 2. pZRC III - TNK 벡터의 구조

테넥테플라즈(Tenecteplase)(TNKase 또는 TNK-TPA) 유전자(Seq ID No7)는 화학적으로 합성되고, 클로닝 벡터 pMK (Geneart, Germany) 내로 클론된다. pZRC II 벡터에서 TNK 유전자를 클론하기 위해, 첫 번째 EcoR I 및 Not I 오버행은 50 mM Tris-Cl (pH8.3), 2.5 mM MgCl₂, 4 dNTPs의 250 μM 각각 및 5 units의 Pfu 중합효소를 포함하는 50 ㎕의 부피에서 상기 제한 부위를 포함하는 특이적인 올리고뉴클레오티드 프라이머의 100 피코몰(picomoles)을 사용하여 PCR 증폭의 40 사이클을 사용하여 TNK 유전자 내로 포함되었다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃(변성), 30 sec 동안 62 ℃(어닐링) 및 2 min 동안 72 ℃(확장)에서의 배양(incubation)으로 이루어져 있다. PCR 반응의 증폭된 생산물은 1 % 아가로스 겔에 용해시켰다. 크기에서 대략 1710 염기쌍의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. TNK의 이러한 정제된 DNA 단편은 EcoR I 및 Not I으로 절단되고, EcoR I 및 Not I (MBI Fermentas, USA)과 함께 절단된 pZRC III 벡터(실시예 1에 기재되어 있음) 내로 연결된다(ligated). 상기 연결 생산물(ligation product)은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformant)는 카나마이신 저항의 기초로 기록된다. 약 10 개의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 소화에 의해 TNK 단편의 존재를 위해 분석되었다. pZRC III 벡터에서 통합된 TNK 유전자를 갖는, 하나의 이러한 플라스미드는, pZRC III-TNK로 명명된다.

실시예 3. pZRC III - TNK - Hyg 벡터의 구조

히그로마이신 저항성 유전자로 조절된 종결자 및 SV40 프로모터를 갖고 대략 1550 염기쌍의 히그로마이신 전사 조립(Hygromycin transcription assembly)은 Pfu 중합효소(MBI Fermentas, USA)를 사용하여 뭉툭하게 절단되고(blunt ended), 그리고 난 다음에 Kpn I (MBI Fermentas, USA)로 미리 절단된, pZRC III-TNK 벡터 내로 연결되고, Pfu 중합효소를 사용하여 무디게 만들었다(blunted). 연결 생산물(ligation product)을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 히그로마이신 저항 유전자의 존재에 대해 분석되었다. pZRC III-TNK 에 연결된 히그로마이신 전사 조립(Hygromycin transcription assembly)을 갖는 하나의 이러한 플라스미드가 pZRC III-TNK-Hyg 벡터로 명명되었다(도 3, Seq ID No.8). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 TNK 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(ABI)를 사용하여 DNA를 시퀀싱하였다(This vector was then subjected to DNA sequencing using automated DNA sequencer to verify the sequence of the cloned TNK gene).

실시예 4. pZRC III - Darbe - Hyg 벡터의 구조

pZRC - EPO (WO2007017903)는, TA 벡터 pTZ57R (MBI Fermentas)에서 클론된 다음에, pTZ57R-Darbe로 명명된, 대략 600 bp의 다베포이에틴 유전자 단편(Darbepoetin gene fragment)(Seq ID No.9 및 이에 상응하는 DNA 서열 ID 21)을 수득하기 위해, 에리스로포이에틴 유전자의 부위 지정 돌연변이(site directed mutagenesis)를 수행하기 위한 주형(template)으로서 사용된다.

pZRC III-TNK-Hyg는, TNK 유전자를 제거하기 위해 Xho I 및 Not I으로 절단시키고, 남아있는 높은 분자량 DNA(remaining high molecular weight DNA)는 다베포이에틴 유전자 삽입물(Darbepoetin gene insert)과 함께 연결을 위해 벡터로서 사용된다. pTZ57R-Darbe는 대략 600 bp 다베포이에틴 유전자 단편을 겔 분리하기 위해 Xho I 및 Not I 으로 절단되었다. 벡터 및 삽입물 둘 다의 연결을 실행하고, 상기 연결 생산물을 E. coli Top 10F'에서 변형되고, 형질전환체는 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 다베포이에틴 유전자(Darbepoetin gene)의 존재에 대해 분석되었다. 연결된 다베포이에틴 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-Darbe-Hyg 벡터로 명명된다(도 4, Seq ID No. 10). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 다베포이에틴 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 DNA를 시퀀싱하였다

실시예 5. pZRC III - Etanercept - Hyg 벡터의 구조

벡터 pZRC III- Darbe-Hyg는, 대략 600 bp의 다베포이에틴 유전자를 제거하고, 대략 9430 bp의 벡터 골격(vector backbone)을 생성하기 위해, Xho I 및 Not I 효소(MBI Fermentas)로 절단되었다. 대략 1481 bp의 화학적으로 합성된, CHO 코돈 최적화된, 에타너셉트 유전자(Etanercept gene)(Seq ID No. 11 및 이에 상응하는 DNA 서열 ID 22)는, 삽입물을 수득하기 위해, Xho I 및 Not I (MBI Fermentas)를 사용하여 상기 클로닝 벡터로부터 분리된다. 벡터 및 삽입물 둘 다의 연결이 실행되고, 연결 생산물(ligation product)은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 에타너셉트 유전자의 존재에 대해 분석되었다. 연결된 에타너셉타 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-Etanercept-Hyg 벡터로 명명되었다(도 5, Seq ID No. 12). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 에타너셉타 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 DNA를 시퀀싱하였다.

실시예 6. pZRC III - FSH α- IRES - FSH β- Hyg 벡터의 구조

a) pZRC III - FSH α - Hyg 벡터의 구조

대략 9430 bp의 벡터 골격(vector backbone)은, 대략 600 bp의 다베포이에틴 유전자를 제거하기 위해, Xho I 및 Not I (MBI Fermentas)로 pZRC III- Darbe-Hyg 벡터로 절단시킴으로써 생산된다. 대략 359 bp의 FSH 알파 서브유닛(FSH alpha subunit)의 화학적으로 합성된 유전자(Seq ID No. 13 이에 상응하는 DNA 서열 ID 23)는, 효소 Xho I 및 Not I(MBI Fermentas)를 사용하여, 진아트 클로닝 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-FSH α-Hyg 벡터로 명명된다.

b) pZRC III - FSH α- IRES - FSH β- Hyg 벡터의 구조

벡터 pZRC III-FSH α-Hyg는, 대략 9790 bp의 상기 벡터 골격을 생성하기 위해, Not I(MBI Fermentas)로 절단되었다. 대략 591 bp의 IRES 유전자 단편(Seq ID No. 14)은, 첫 번째 삽입물을 수득하기 위해, 효소 Not I 및 Xma I(MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 401 bp의 FSH 베타 서브유닛(Seq ID No. 15 이에 상응하는 DNA 서열 ID 24)의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xma I 및 Not I (MBI Fermentas)를 사용하여 진아트 클론 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 상기 2 개의 삽입물을 융합시키고, 상기 융합된 유전자 생산물을 상기 벡터와 함께 연결시켰다. 상기 연결 생산물을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. IRES 및 FSH 베타 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Hyg 벡터로 명명된다(도 6, Seq ID No. 16). 그리고 난 다음에, 이러한 벡터를, FSHα 및 FSHβ 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(ABI)를 사용하여 DNA를 시퀀싱하였다. 상기 클론도니 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.

실시예 7. pZRC III - FSH β- IRES - FSH α- Hyg 벡터의 구조

a) pZRC III - FSH β - Hyg 벡터의 구조

벡터 pZRC III- FSHα-IRES-FSHβ-Hyg는, FSHα, IRES 및 FSHβ 유전자의 제거 후에, 대략 9430 bp의 벡터 골격을 생성하기 위해, Xho I 및 Not I (MBI Fermentas)로 절단되었다. 대략 401 bp의 FSH 베타 서브유닛의 화학적으로 합성된 유전자는, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생성물을 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 베타 서브유닛을 갖는 하나의 이러한 플라스미드는 pZRC III-FSH β-Hyg 벡터로 명명된다.

b) pZRC III - FSH β- IRES - FSH α- Hyg 벡터 의 구조

벡터 pZRC III- FSH β-Hyg는, 대략 9790 bp의 상기 벡터 골격을 생성하기 위해 Not I (MBI Fermentas)로 절단된다. 대략 591 bp의 IRES 유전자 단편은, 첫 번째 삽입물(IRES)를 수득하기 위해, 효소 Not I 및 Xho I (MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 359 bp의 FSH 알파 서브유닛의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA로부터 분리된다. 이는 상기 벡터 및 2 개의 삽입물의 세 조각 연결이 뒤따른다(This was followed by three piece ligation of the vector and the 2 inserts). 상기 연결 생산물(ligation product)을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 연결된 IRES 및 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III FSH β- IRES - FSH α- Hyg 벡터로 명명된다(도 7). 상기 클론된 유전자의 서열은, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 확인되었다.

실시예 10. pZRC III - TNK - 퓨로마이신 벡터의 구조

SV40 프로모터 및 종결자 조절된 퓨로마이신 저항 유전자를 갖고, BamH1 호환가능한 말단을 운반하는 크기로 대략 1110 염기쌍의 퓨로마이신 전사 조립은 BamH I(MBI Fermentas, USA)로 또한 절단된 pZRC III-TNK 벡터 내로 연결된다(The Puromycin transcription assembly of approx 1110 base pairs in size having the SV40 Promoter and terminator controlled Puromycin resistance gene and carrying BamH1 compatible ends ligated into pZRC III-TNK vector which was also digested with BamH I). 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 퓨로마이신 단편의 존재를 위해 분석된다. pZRC III- TNK 벡터에서 연결된 퓨로마이신 전사 조립을 갖는 하나의 이러한 플라스미드는, pZRC III- TNK-Puro 벡터로 명명된다(도 8, Seq ID No. 17). 상기 클론된 TNK 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.

실시예 11. pZRC III - 다베포이에틴 - Puro 벡터( pZRC III - Darbepoetin - Puro vector)의 구조

pZRC III-TNK-Puro는, TNK 유전자 단편을 제거하기 위해 Xho I 및 Not I (MBI Fermentas)로 절단된다. pTZ57R-Darbe는, 대략 600 bp 다베포이에틴 유전자 단편을 겔 분리하기 위해 Xho I 및 Not I으로 절단된다. 벡터 및 삽입물 둘 다의 연결을 하였다. 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 다베포이에틴 유전자 단편의 존재에 대해 분석되었다. 하나의 이러한 플라스미드는 pZRC III-Darbe-Puro 벡터로 명명된 연결된 다베포이에틴 유전자를 갖는 것이다(도 9, Seq ID No. 18). 상기 클론된 다베포이에틴 유전자의 서열은, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용함으로써 확인된다.

실시예 12. pZRC III - FSH α- IRES - FSH β- Puro 벡터의 구조

pZRC III- FSHα-IRES-FSHβ-Puro 벡터로부터의 히그로마이신 카세트가 제거되고, 특정한 올리고뉴클레오티드 프라이머(specific oligonucleotide primers)와 함께 PCR 반응을 사용하여, pZRC III-Darbe-Puro로부터 확장된 퓨로마이신 저항 유전자 통제된 종결자 및 SV40 프라이머를 갖는 크기에서 대략 1110 염기쌍의 퓨로마이신 전사 조절로 교체된다(Hygromycin cassette from pZRC III- FSHα-IRES-FSHβ-Puro vector was removed and replaced with the Puromycin transcription assembly of approx. 1110 base pairs in size having the SV40 Promoter and terminator controlled Puromycin resistance gene amplified from pZRC III-Darbe-Puro using a PCR reaction with specific oligonucleotide primers). 상기 수득된 PCR 생산물은 특정한 엔도뉴클레아제(specific endonucleases)를 사용하여 절단되고, 벡터 골격과 함께 추가적인 연결에 사용된다. 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 퓨로마이신 저항 유전자의 존재에 대해 분석되었다. 상기 연결된 퓨로마이신 저항 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Puro 벡터로 명명된다(도 10).

실시예 13. pZRC III - FSH α- IRES - FSH β- 네오 벡터의 구조

벡터 pZRC III- FSHα- IRES- FSHβ-Puro는, 퓨로마이신 저항 유전자의 제거 후에, 대략 9980 bp의 벡터 골격을 생산하기 위해, Pac I 및 Bam HI (MBI Fermentas)로 절단된다. 대략 1518 bp의 네오마이신 저항 유전자는, pcDNA 3.1 (Invitrogen) 플라스미드로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 네오마이신 저항 유전자의 존재에 대해 분석되었다. 연결된 네오마이신 저항 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Neo 벡터로 명명된다(도 11). FSHα, IRES 및 FSHβ 유전자의 서열은 자동화된 DNA 서열기(ABI)를 사용함으로써 확인된다.

실시예 14. pZRC III - FSH β- IRES - FSH α- Neo 벡터의 구조

a) pZRC III - FSH β - Neo 벡터의 구조

벡터 pZRC III- FSHα- IRES-FSH β-Neo는, FSHα, IRES 및 FSH β 유전자의 제거 후에, 대략 9400 bp의 상기 벡터 골격을 생성하기 위해, Xho I 및 Not I (MBI Fermentas)로 절단된다. 대략 401 bp의 FSH 베타 서브유닛의 화학적으로 합성된 유전자는, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 베타 서브유닛을 갖는 하나의 이러한 플라스미드는 pZRC III- FSH β-Neo 벡터로 명명된다.

b) pZRC III FSH β- IRES - FSH α- Neo 벡터 의 구조

벡터 pZRC III- FSH β-Neo는 대략 9800 bp의 상기 벡터 골격을 생성하기 위해, Not I (MBI Fermentas)로 절단된다. 대략 591 bp의 IRES DNA단편은, 첫 번째 삽입물을 수득하기 위해, 효소 Not I 및 Xho I(MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 359 bp의 FSH 알파 서브유닛의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 벡터 pMA(Geneart vector pMA)로부터 분리된다. 이는 상기 벡터 및 2 개의 삽입물의 세 개의 조각의 연결이 뒤따른다. 그리고 난 다음에, 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 IRES 및 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, 수득된 pZRC III FSH β- IRES - FSH α- Neo 벡터로 명명되었다(도 12). 상기 클론된 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인된다.

실시예 17. pZRC III - Etanercept - Neo 벡터의 구조

벡터 pZRC III- FSHα-IRES- FSHβ-Neo는, FSHα, IRES 및 FSHβ 유전자를 제거하고, 에타너셉트 유전자(Etanercept gene)를 클로닝하기 위해 사용될 수 있도록, 대략 9400 bp의 상기 벡터 골격을 수득하기 위해, Xho I 및 Not I (MBI Fermentas) 효소와 함께 절단되었다. 에타너셉트의 대략1481 bp 유전자는, 상기 삽입물을 수득하기 위해, Xho I 및 Not I(MBI Fermentas) 효소를 사용하여 벡터 pZRC III-Etanercept-Hyg 로부터 분리되었다. 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 에타너셉트 유전자의 존재에 대해 분석되었다. 통합된 에타너셉트 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III-Etanercept-Neo 벡터로 명명된다(도 13, Seq ID No. 19). 상기 클론된 에타너셉트 유전자의 서열은 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.

실시예 18. pZRC III - TNK - Neo 벡터의 구조

벡터 pZRC III-Etanercept-Neo는, 대략 1481 에타너셉트 유전자(Etanercept gene)를 제거하고, 대략 9400 bp의 벡터 구조를 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)로 절단된다. 대략 1692 bp의 TNK 유전자의 삽입물은, Xho I 및 Not I 효소(MBI Fermentas)로 상기 벡터 pZRC III - TNK - Hyg를 절단한 후에 수득되었다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 TNK 유전자의 존재에 대해 분석되었다. 상기 연결된 TNK 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-TNK-Neo 벡터로 명명된다(도 14). 상기 클론된 TNK 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.

실시예 19. 에타너셉트의 발현

Set Ⅰ - pZRC III - Etanercept - Hyg 벡터를 사용하여 CHO - K1 -S 세포주에서 안정된 트랜스펙션

Freestyle^TM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된, PowerCHO2 CD 배지[화학적 규명된 배지(chemically defined medium), Lonza]에서 일상적으로 배양된다. 세포는, 습기가 있는 인큐베이터(humidified incubator)에서 5% CO2 및 37 ℃에서 교반(agitation)(120 rpm) 하에서 유지시켰다. 세포를 매일 3rd/4th 일마다 계수하였고, 완전한 배지 교환이 제공되었다. 트랜스펙션은 네온 트랜스펙션 시스템(Neon Transfection system)(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포를 신선한 배지 내로 통과되었고, 트랜스펙션을 위해 사용전에 적어도 하나의 더블링을 가능하게 한다(and allowed at least one doubling before use for transfection). 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당으로서, Sgs I (Asc I) linearised pZRC III-Etanercept-Hyg 플라스미드를 사용하여 수행되었다. 트랜스펙션 후에, 상기 세포는, 1 mL의 예비-항온된 배양 배지(pre-warmed culture medium)를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포를, 습기가 있는 인큐베이터(humidified incubator)에서 5 % CO2, 37 ℃ 에서 유지시켰다. 그 다음날에, 미니폴 생성(minipool generation)을 위해, 트랜스펙션된 개채군(transfected population)을, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에 평편시켰다(plated). 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액(supernatant)은 ELISA에 의한 생산물 형성 분석(product formation analysis)을 위해 제거되었다. 상기 선택된 높게 발현하는 미니폴(The selected high expressing minipools)은 24 웰 플레이트로 이동시킨 다음에, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 미니폴(High expressing minipools)은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 디미팅 희석(single cell dimiting dilution)을 수행하기 위해 선택되었다. 약 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은, 24 웰 플레이트로 이동시키고, 그런 다음에 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동시켰고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션(re transfections)을 위해 선택된다.

Set Ⅱ - pZRC III - Etanercept - Neo 벡터 를 사용하여 Set Ⅰ 로부터 수득된 클론의 안정된 재트랜스펙션

높게 발현되는 클론은, Set I 트랜스펙션에서, 동일한 방법에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-Etanercept-Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군(transfected population)은, 4 mM 글루타민, 600 ㎍/ml의 히그로마이신, 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다(plated). 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그 다음에, 상기 선택된 높게 발현하는 미니폴은, 24 웰 플레이트에 이동된 다음에, 4 mM 글루타민 및 상기 항생물질 압력(antibiotic pressures)으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 생산하는 미니폴은, 4 mM 글루타민으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정하는 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30일 후에 또 다시, 96웰 플레이트로부터 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트에 이동시킨 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 재트랜스펙션된 클론(High expressing retransfected clones)은, 패드 배치 모드(fed batch mode)에서의 진탕 튜브(shake tubes)에서의 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 120 rpm, 37 ℃, 5 % CO₂에서, 진탕기(shaker)에서 스핀 튜브(spin tubes)에서의 이러한 선택된 클론을 사용하여 실행되었다. 클론은, 12 일에 대략 700 mg/l 내지 1000 mg/1의 범위에서의 생산 레벨로 수득되었다.

실시예 20. TNK 의 발현

Set Ⅰ - pZRC III - TNK - Hyg 벡터를 사용한 CHO - K1 -S 세포주에서 안정된 트랜스펙션

Freestyle^TM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양된다. 세포는, 습기가 있는 인큐베이터에서 5% CO2, 및 37 ℃에서 교반(agitation)(120 rpm) 하에서 유지된다. 세포를 3rd/4th 일마다 계수하였고, 완전한 배지 교환(complete medium exchange)을 제공하였다. 트랜스펙션은 네오 트랜스펙션 시스템(Neon Transfection system)(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포는 신선한 배지 내로 통과되었고, 트랜스펙션을 위해 사용 전에 적어도 하나의 더블링(at least one doubling)을 가능하게 한다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III-TNK-Hyg 플라스미드를 사용하여 실행하였다. 트랜스펙션 후에, 상기 세포는 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동시켰다. 세포는, 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 일에, 미니폴 생성(minipool generation)을 위해, 트랜스펙션된 개체군은 4 mM 글루타민 및 500 ㎍/ml의 히그로마이신으로 보충된, PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 미니폴은, 24 웰 플레이트에 이동시킨 다음에, 그 다음에 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 미니폴은, 4 mM 글루타민 및 500 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza) PowerCHO2 CD 배지에서 96 웰 플레이트에서 단일 세포 디미팅 희석(single cell dimiting dilution)을 수행하기 위해 선택되었다. 약 15 내지 30 일 후에, 96웰 플레이트로부터의 상청액을 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동된 다음에, 6 웰 플레이트로 이동된 다음에, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석하였다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션을 위해 선택되었다. 높게 발현하는 클론은, 피드 배치 모드(fed batch mode)에서 진탕 튜브(shake tubes)에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO₂ , 37 ℃, 230 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브(spin tubes)에서 10 ml 배지에서 이러한 선택된 클론을 사용하여 실행되었다. 클론은 9 일에 150 mg/l의 생산 레벨을 수득하였다.

Set Ⅱa - pZRC III - TNK - Puro 벡터를 사용하여 Set I로부터 수득된 클론의 안정된 재- 트랜스펙션

높게 발현하는 클론은, Set I 트랜스펙션에서 동일한 절차에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-TNK-Puro 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민, 500 ㎍/ml의 히그로마이신, 및 3 ug/ml의 퓨로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그리고 난 다음에 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생성되는 미니폴은, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 20 일 후에, 96웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동된 다음에, 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO₂, 37 ℃, 120 rpm에서 진탕기(Kuhner-Germany)에서의 스핀 튜브(spin tubes)에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 11 일에 290 mg/l의 생산 레벨을 산출되었다.

Set Ⅱb - pZRC III - TNK - Neo 벡터를 사용하여 Set I로부터 수득된 클론의 안정된 재- 트랜스펙션

높게 생성하는 클론(High producing clones)은, Set I 트랜스펙션에서 동일한 절차에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-TNK-Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민, 600 ㎍/ml의 히그로마이신 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되엇다. 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동된 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되고, 상기 언급된 항생물질 압력(the mentioned antibiotic pressures) 및 발현 레벨은 ELISA에 의한 각각의 레벨에서 분석되었다. 높게 생성하는 미니폴은, 4 mM 글루타민으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또 다시, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동시킨 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5% CO₂, 37 ℃, 120 rpm 에서 진탕기(Kuhner-Germany)에서의 스핀 튜브(spin tubes)에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 10 일에 390 mg/l의 생산 레벨로 산출되었다.

실시예 21. pZRC III - Darbe - Hyg 벡터를 사용한 다베포이에틴의 발현

Set Ⅰ - pZRC III - Darbe - Hyg 벡터를 사용하여 CHO - K1 -S 세포주에서의 안정된 트랜스펙션

Freestyle^TM CHO-K1-S 세포는 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양되었다. 세포는, 습기가 있는 인큐베이터에서 5 % CO2 및 37 ℃에서 교반(120 rpm) 하에서 유지시켰다. 세포를 매 3rd/4th 일에 계수하고, 완전한 배지 교환을 제공하였다. 트랜스펙션은 네오 트랜스펙션 시스템(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포를 신선한 배지 내로 통과시키고, 트랜스펙션을 위해 사용 전에 적어도 하나 더블링(at least one doubling)을 가능하게 하였다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III-Darbe-Hyg 플라스미드를 사용하여 수행되었다. DNA의 트랜스펙션 후에, 상기 세포는, 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포는 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 20일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에 상기 선택된 높게 발현되는 미니폴은 24 웰 플레이트에 이동되고, 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 두 개의 높게 발현하는 미니폴은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 ProCHO5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또 다시, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생성물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동되고, 그리고 난 다음에 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 상기 생성물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5% CO2, 37 ℃, 230 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브(spin tubes)에서 10 ml 배지에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 11 일에 340 mg/l의 생산 레벨을 산출되었다.

실시예 22. FSH 의 발현

Set Ⅰ - pZRC III - FSH α- IRES - FSH β- Hyg 벡터를 사용하여 CHO - K1 -S 세포주에서 안정된 트랜스펙션

Freestyle^TM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양되었다. 세포를 습기가 있는 인큐베이터에서 5 % CO2, 및 37 ℃에서 교반(120 rpm) 하에서 유지시켰다. 세포를 매 3rd/4th 일마다 계수하였고, 완전한 배지 교환이 제공되었다. 트랜스펙션은 네오 트랜스펙션 시스템(Invitrogen)을 사용하여 실행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포는 신선한 배지 내로 통과하고, 트랜스펙션을 위해 사용 전에 적어도 하나의 더블링(at least one doubling)을 가능하게 한다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III - FSH α- IRES - FSH β- Hyg _플라스미드를 사용하여 실행되었다. 트랜스펙션 후에, 상기 세포는 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포는 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되었고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 미니폴은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석을 수행하기 위해 선택되었다. 15 내지 30 일 후에, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 그리고 난 다음에 24 웰 플레이트로 이동되고, 그리고 난 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션(retransfections)을 위해 선택되었다.

Set Ⅱ - pZRC III - FSH α- IRES - FSH β- Neo 벡터를 사용하여 Set Ⅰ 로부터 수득된 클론의 안정된 재- 트랜스펙션

클론은, Set I 트랜스펙션으로서 상기 동일한 방법에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III - FSH α- IRES - FSH β- Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은 4 mM 글루타민, 600 ㎍/ml의 히그로마이신, 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그리고 난 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생성하는 재트랜스펙션된 미니폴은, 4 mM 글루타민 및 언급된 항생물질 압력으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또다시, 96 웰 플레이트로부터 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은, 24 웰 플레이트로 이동된 다음에, 4 mM 글루타민 및 언급된 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은 즉, 피드 배치 모드(fed batch mode)에서 진탕 튜브에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO₂, 37 ℃, 120 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브에서 이러한 선택된 클론을 사용하여 실행되었다. 생산 레벨은, 상이한 클론과 함께 10 일에 대략 20 mg/l 내지 50 mg/l의 범위로 수득되었다.

SEQUENCE LISTING <110> CADILA HEALTHCARE LIMITED <120> A NOVEL EXPRESSION VECTOR FOR HIGH LEVEL EXPRESSION OF RECOMBINANT PROTEINS <130> 2806-MUM-10 <150> IN: 2806/MUM/2010 <151> 2010-10-08 <160> 24 <170> PatentIn version 3.5 <210> 1 <211> 324 <212> DNA <213> Artificial <220> <223> Chimeric INTRON <400> 1 aattaattcg ctgtctgcga gggccagctg ttggggtgag tactccctct caaaagcggg 60 catgacttct gcgctaagat tgtcagtttc caaaaacgag gaggatttga tattcacctg 120 gcccgcggtg atgcctttga gggtggccgc gtccatctgg tcagaaaaga caatcttttt 180 gttgtcaagc ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac 240 atccactttg cctttctctc cacaggtgtc cactcccagg tccaactgca ggtcgagcat 300 gcatctaggg cgcccgcact agag 324 <210> 2 <211> 395 <212> DNA <213> Artificial <220> <223> TPL <400> 2 gtttagtgaa ccgtcagatc ctcttccgca tcgctgtctg cgagggccag ctgttggggt 60 gagtactccc tctcaaaagc gggcatgact tctgcgctaa gaatgtcagt ttccaaaaac 120 gaggaggatt tgatattcac tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 180 ggtcagaaaa gacaatcttt ttgttgtcaa gcttccttga tgatgtcata cttatcctgt 240 cccttttttt tccacagctc gcggttgagg acaaactctt cgcggtcttt ccagtactct 300 tggatcggaa acccgtcggc ctccgaacgg tactccgcca ccgagggacc tgagcgagtc 360 cgcatcgacc ggatcggaaa acctctcgac gtacc 395 <210> 3 <211> 627 <212> DNA <213> Artificial <220> <223> VA I & II Genes <400> 3 ggtacctcgg gacgctctgg ccggtgaggc gtgcgcagtc gttgacgctc tagaccgtgc 60 aaaaggagag cctgtaagcg ggcactcttc cgtggtctgg tggataaatt cgcaagggta 120 tcatggcgga cgaccggggt tcgaaccccg gatccggccg tccgccgtga tccatgcggt 180 taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acgggggagc gctccttttg 240 gcttccttcc aggcgcggcg gctgctgcgc tagctttttt ggccactggc cgcgcgcggc 300 gtaagcggtt aggctggaaa gcgaaagcat taagtggctc gctccctgta gccggagggt 360 tattttccaa gggttgagtc gcaggacccc cggttcgagt ctcgggccgg ccggactgcg 420 gcgaacgggg gtttgcctcc ccgtcatgca agaccccgct tgcaaattcc tccggaaaca 480 gggacgagcc ccttttttgc ttttcccaga tgcatccggt gctgcggcag atgcgccccc 540 ctcctcagca gcggcaagag caagagcagc ggcagacatg cagggcaccc tccccttctc 600 ctaccgcgtc aggaggggca acatccg 627 <210> 4 <211> 4584 <212> DNA <213> Artificial <220> <223> pZRC II <400> 4 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 tacctcggga cgctctggcc ggtgaggcgt gcgcagtcgt tgacgctcta gaccgtgcaa 1980 aaggagagcc tgtaagcggg cactcttccg tggtctggtg gataaattcg caagggtatc 2040 atggcggacg accggggttc gaaccccgga tccggccgtc cgccgtgatc catgcggtta 2100 ccgcccgcgt gtcgaaccca ggtgtgcgac gtcagacaac gggggagcgc tccttttggc 2160 ttccttccag gcgcggcggc tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt 2220 aagcggttag gctggaaagc gaaagcatta agtggctcgc tccctgtagc cggagggtta 2280 ttttccaagg gttgagtcgc aggacccccg gttcgagtct cgggccggcc ggactgcggc 2340 gaacgggggt ttgcctcccc gtcatgcaag accccgcttg caaattcctc cggaaacagg 2400 gacgagcccc ttttttgctt ttcccagatg catccggtgc tgcggcagat gcgcccccct 2460 cctcagcagc ggcaagagca agagcagcgg cagacatgca gggcaccctc cccttctcct 2520 accgcgtcag gaggggcaac atccgacgcg ttgacattga ttattgacta gttattaata 2580 gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact 2640 tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat 2700 gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 2760 tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 2820 tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg 2880 ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg 2940 gttttggcag tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct 3000 ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa 3060 atgtcgtaac aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt 3120 ctatataagc agagctggtt tagtgaaccg tcagatcctc ttccgcatcg ctgtctgcga 3180 gggccagctg ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagaa 3240 tgtcagtttc caaaaacgag gaggatttga tattcactgg cccgcggtga tgcctttgag 3300 ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct tccttgatga 3360 tgtcatactt atcctgtccc ttttttttcc acagctcgcg gttgaggaca aactcttcgc 3420 ggtctttcca gtactcttgg atcggaaacc cgtcggcctc cgaacggtac tccgccaccg 3480 agggacctga gcgagtccgc atcgaccgga tcggaaaacc tctcgacgta ccaattaatt 3540 cgctgtctgc gagggccagc tgttggggtg agtactccct ctcaaaagcg ggcatgactt 3600 ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg 3660 tgatgccttt gagggtggcc gcgtccatct ggtcagaaaa gacaatcttt ttgttgtcaa 3720 gcttgaggtg tggcaggctt gagatctggc catacacttg agtgacaatg acatccactt 3780 tgcctttctc tccacaggtg tccactccca ggtccaactg caggtcgagc atgcatctag 3840 ggcgcccgca ctagaggctc gaggaattcc ccggggatat cgtttaaacc cacgatcgtg 3900 gaagcggccg cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 3960 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 4020 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 4080 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 4140 gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 4200 ggagctcatg gcgcgcctag gccttgacgg ccttccttca attcgcccta tagtgagtcg 4260 tattacgtcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 4320 tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 4380 ggcccgcacc gaaacgccct tcccaacagt tgcgcagcct gaatggcgaa tgggagcgcc 4440 ctgtagcggc cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 4500 atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 4560 aaaatattaa cgcttacaat ttag 4584 <210> 5 <211> 1668 <212> DNA <213> Artificial <220> <223> CLysMAR <400> 5 gcatccataa tataactgta ccaggttttg gtttattaca tgtgactgac ggcttcctat 60 gcgtgctcag aaaacggcag ttgggcactg cactgcccgg tgatggtgcc acggtggctc 120 ctgccgcctt ctttgatatt cactctgttg tatttcatct cttgttgccg atgaaaggat 180 ataacagtct ctgaggaaat acttggtatt tcttctgatc agcgttttta taagtaatgt 240 tgaatattgg ataaggctgt gtgtcctttg tcttgggaga caaagcccac agcaggtggt 300 ggttgggtgg tggcagctca gtgacaggag aggttttttt gcctgttttt tttgttgttt 360 ttttttttta agtaaggtgt tcttttttct tagtaaaatt tctactggac tgtatgtttt 420 gacaggtcag aaacatttct tcaaaagaag aaccttttgg aaactgtaca gcccttttct 480 ttcattccct ttttgctttc tgtgccaatg cctttggttc tgattgcatt atggaaaacg 540 ttgatcggaa cttgaggttt ttatttatag tgtggcttga aagcttggat agctgttgtt 600 acatgagata ccttattaag tttaggccag cttgatgctt tatttttttt cctttgaagt 660 agtgagcgtt ctctggtttt tttcctttga aactggcgag gcttagattt ttctaatggg 720 attttttacc tgatgatcta gttgcatacc caaatgcttg taaatgtttt cctagttaac 780 atgttgataa cttcggattt acatgttgta tatacttgtc atctgtgttt ctagtaaaaa 840 tatatggcat ttatagaaat acgtaattcc tgatttcctt ttttttttat ctctatgctc 900 tgtgtgtaca ggtcaaacag acttcactcc tatttttatt tatagaattt tatatgcagt 960 ctgtcgttgg ttcttgtgtt gtaaggatac agccttaaat ttcctagagc gatgctcagt 1020 aaggcgggtt gtcacatggg ttcaaatgta aaacgggcac gtttgctgct gccttcccag 1080 atccaggaca ctaaactgct tctgcaactg aggtataaat cgcttcagat cccaggaagt 1140 gtagatccac gtgcatattc ttaaagaaga atgaatactt tctaaaatat gttggcatag 1200 gaagcaagct gcatggattt atttgggact taaattattt tggtaacgga gtgcataggt 1260 tttaaacaca gttgcagcat gctaacgagt cacagcattt atgcagaagt gatgcctgtt 1320 gcagctgttt acggcactgc cttgcagtga gcattgcaga taggggtggg gtgctttgtg 1380 tcgtgttggg acacgctgcc acacagccac ctcccgaaca tatctcacct gctgggtact 1440 tttcaaacca tcttagcagt agtagatgag ttactatgaa acagagaagt tcctcagttg 1500 gatattctca tgggatgtct tttttcccat gttgggcaaa gtatgataaa gcatctctat 1560 ttgtaaatta tgcacttgtt agttcctgaa tcctttctat agcaccactt attgcagcag 1620 gtgtaggctc tggtgtggcc tgtgtctgtg cttcaatctt ttaagctt 1668 <210> 6 <211> 7932 <212> DNA <213> Artificial <220> <223> pZRC III <400> 6 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 tacctcggga cgctctggcc ggtgaggcgt gcgcagtcgt tgacgctcta gaccgtgcaa 1980 aaggagagcc tgtaagcggg cactcttccg tggtctggtg gataaattcg caagggtatc 2040 atggcggacg accggggttc gaaccccgga tccggccgtc cgccgtgatc catgcggtta 2100 ccgcccgcgt gtcgaaccca ggtgtgcgac gtcagacaac gggggagcgc tccttttggc 2160 ttccttccag gcgcggcggc tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt 2220 aagcggttag gctggaaagc gaaagcatta agtggctcgc tccctgtagc cggagggtta 2280 ttttccaagg gttgagtcgc aggacccccg gttcgagtct cgggccggcc ggactgcggc 2340 gaacgggggt ttgcctcccc gtcatgcaag accccgcttg caaattcctc cggaaacagg 2400 gacgagcccc ttttttgctt ttcccagatg catccggtgc tgcggcagat gcgcccccct 2460 cctcagcagc ggcaagagca agagcagcgg cagacatgca gggcaccctc cccttctcct 2520 accgcgtcag gaggggcaac atccgacgcg tgcatccata atataactgt accaggtttt 2580 ggtttattac atgtgactga cggcttccta tgcgtgctca gaaaacggca gttgggcact 2640 gcactgcccg gtgatggtgc cacggtggct cctgccgcct tctttgatat tcactctgtt 2700 gtatttcatc tcttgttgcc gatgaaagga tataacagtc tctgaggaaa tacttggtat 2760 ttcttctgat cagcgttttt ataagtaatg ttgaatattg gataaggctg tgtgtccttt 2820 gtcttgggag acaaagccca cagcaggtgg tggttgggtg gtggcagctc agtgacagga 2880 gaggtttttt tgcctgtttt ttttgttgtt tttttttttt aagtaaggtg ttcttttttc 2940 ttagtaaaat ttctactgga ctgtatgttt tgacaggtca gaaacatttc ttcaaaagaa 3000 gaaccttttg gaaactgtac agcccttttc tttcattccc tttttgcttt ctgtgccaat 3060 gcctttggtt ctgattgcat tatggaaaac gttgatcgga acttgaggtt tttatttata 3120 gtgtggcttg aaagcttgga tagctgttgt tacatgagat accttattaa gtttaggcca 3180 gcttgatgct ttattttttt tcctttgaag tagtgagcgt tctctggttt ttttcctttg 3240 aaactggcga ggcttagatt tttctaatgg gattttttac ctgatgatct agttgcatac 3300 ccaaatgctt gtaaatgttt tcctagttaa catgttgata acttcggatt tacatgttgt 3360 atatacttgt catctgtgtt tctagtaaaa atatatggca tttatagaaa tacgtaattc 3420 ctgatttcct ttttttttta tctctatgct ctgtgtgtac aggtcaaaca gacttcactc 3480 ctatttttat ttatagaatt ttatatgcag tctgtcgttg gttcttgtgt tgtaaggata 3540 cagccttaaa tttcctagag cgatgctcag taaggcgggt tgtcacatgg gttcaaatgt 3600 aaaacgggca cgtttgctgc tgccttccca gatccaggac actaaactgc ttctgcaact 3660 gaggtataaa tcgcttcaga tcccaggaag tgtagatcca cgtgcatatt cttaaagaag 3720 aatgaatact ttctaaaata tgttggcata ggaagcaagc tgcatggatt tatttgggac 3780 ttaaattatt ttggtaacgg agtgcatagg ttttaaacac agttgcagca tgctaacgag 3840 tcacagcatt tatgcagaag tgatgcctgt tgcagctgtt tacggcactg ccttgcagtg 3900 agcattgcag ataggggtgg ggtgctttgt gtcgtgttgg gacacgctgc cacacagcca 3960 cctcccgaac atatctcacc tgctgggtac ttttcaaacc atcttagcag tagtagatga 4020 gttactatga aacagagaag ttcctcagtt ggatattctc atgggatgtc ttttttccca 4080 tgttgggcaa agtatgataa agcatctcta tttgtaaatt atgcacttgt tagttcctga 4140 atcctttcta tagcaccact tattgcagca ggtgtaggct ctggtgtggc ctgtgtctgt 4200 gcttcaatct tttaagctta cgcgttgaca ttgattattg actagttatt aatagtaatc 4260 aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 4320 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 4380 tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 4440 gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 4500 cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 4560 tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 4620 gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 4680 cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 4740 taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 4800 aagcagagct ggtttagtga accgtcagat cctcttccgc atcgctgtct gcgagggcca 4860 gctgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agaatgtcag 4920 tttccaaaaa cgaggaggat ttgatattca ctggcccgcg gtgatgcctt tgagggtggc 4980 cgcgtccatc tggtcagaaa agacaatctt tttgttgtca agcttccttg atgatgtcat 5040 acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt 5100 tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac 5160 ctgagcgagt ccgcatcgac cggatcggaa aacctctcga cgtaccaatt aattcgctgt 5220 ctgcgagggc cagctgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc 5280 taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc 5340 ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga 5400 ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgcctt 5460 tctctccaca ggtgtccact cccaggtcca actgcaggtc gagcatgcat ctagggcgcc 5520 cgcactagag gctcgaggaa ttccccgggg atatcgttta aacccacgat cgtggaagcg 5580 gccgcccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5640 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5700 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5760 caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 5820 tctatggctt ctgaggcgga aagaaccagc tggggctcta gggggtatcc ccacggagct 5880 cgcatccata atataactgt accaggtttt ggtttattac atgtgactga cggcttccta 5940 tgcgtgctca gaaaacggca gttgggcact gcactgcccg gtgatggtgc cacggtggct 6000 cctgccgcct tctttgatat tcactctgtt gtatttcatc tcttgttgcc gatgaaagga 6060 tataacagtc tctgaggaaa tacttggtat ttcttctgat cagcgttttt ataagtaatg 6120 ttgaatattg gataaggctg tgtgtccttt gtcttgggag acaaagccca cagcaggtgg 6180 tggttgggtg gtggcagctc agtgacagga gaggtttttt tgcctgtttt ttttgttgtt 6240 tttttttttt aagtaaggtg ttcttttttc ttagtaaaat ttctactgga ctgtatgttt 6300 tgacaggtca gaaacatttc ttcaaaagaa gaaccttttg gaaactgtac agcccttttc 6360 tttcattccc tttttgcttt ctgtgccaat gcctttggtt ctgattgcat tatggaaaac 6420 gttgatcgga acttgaggtt tttatttata gtgtggcttg aaagcttgga tagctgttgt 6480 tacatgagat accttattaa gtttaggcca gcttgatgct ttattttttt tcctttgaag 6540 tagtgagcgt tctctggttt ttttcctttg aaactggcga ggcttagatt tttctaatgg 6600 gattttttac ctgatgatct agttgcatac ccaaatgctt gtaaatgttt tcctagttaa 6660 catgttgata acttcggatt tacatgttgt atatacttgt catctgtgtt tctagtaaaa 6720 atatatggca tttatagaaa tacgtaattc ctgatttcct ttttttttta tctctatgct 6780 ctgtgtgtac aggtcaaaca gacttcactc ctatttttat ttatagaatt ttatatgcag 6840 tctgtcgttg gttcttgtgt tgtaaggata cagccttaaa tttcctagag cgatgctcag 6900 taaggcgggt tgtcacatgg gttcaaatgt aaaacgggca cgtttgctgc tgccttccca 6960 gatccaggac actaaactgc ttctgcaact gaggtataaa tcgcttcaga tcccaggaag 7020 tgtagatcca cgtgcatatt cttaaagaag aatgaatact ttctaaaata tgttggcata 7080 ggaagcaagc tgcatggatt tatttgggac ttaaattatt ttggtaacgg agtgcatagg 7140 ttttaaacac agttgcagca tgctaacgag tcacagcatt tatgcagaag tgatgcctgt 7200 tgcagctgtt tacggcactg ccttgcagtg agcattgcag ataggggtgg ggtgctttgt 7260 gtcgtgttgg gacacgctgc cacacagcca cctcccgaac atatctcacc tgctgggtac 7320 ttttcaaacc atcttagcag tagtagatga gttactatga aacagagaag ttcctcagtt 7380 ggatattctc atgggatgtc ttttttccca tgttgggcaa agtatgataa agcatctcta 7440 tttgtaaatt atgcacttgt tagttcctga atcctttcta tagcaccact tattgcagca 7500 ggtgtaggct ctggtgtggc ctgtgtctgt gcttcaatct tttaagcttg agctcatggc 7560 gcgcctaggc cttgacggcc ttccttcaat tcgccctata gtgagtcgta ttacgtcgcg 7620 ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 7680 tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 7740 aacgcccttc ccaacagttg cgcagcctga atggcgaatg ggagcgccct gtagcggcca 7800 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 7860 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 7920 cttacaattt ag 7932 <210> 7 <211> 562 <212> PRT <213> Artificial <220> <223> TNK <400> 7 Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly 1 5 10 15 Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Phe Arg Arg 20 25 30 Gly Ala Arg Ser Tyr Gln Val Ile Cys Arg Asp Glu Lys Thr Gln Met 35 40 45 Ile Tyr Gln Gln His Gln Ser Trp Leu Arg Pro Val Leu Arg Ser Asn 50 55 60 Arg Val Glu Tyr Cys Trp Cys Asn Ser Gly Arg Ala Gln Cys His Ser 65 70 75 80 Val Pro Val Lys Ser Cys Ser Glu Pro Arg Cys Phe Asn Gly Gly Thr 85 90 95 Cys Gln Gln Ala Leu Tyr Phe Ser Asp Phe Val Cys Gln Cys Pro Glu 100 105 110 Gly Phe Ala Gly Lys Cys Cys Glu Ile Asp Thr Arg Ala Thr Cys Tyr 115 120 125 Glu Asp Gln Gly Ile Ser Tyr Arg Gly Asn Trp Ser Thr Ala Glu Ser 130 135 140 Gly Ala Glu Cys Thr Asn Trp Gln Ser Ser Ala Leu Ala Gln Lys Pro 145 150 155 160 Tyr Ser Gly Arg Arg Pro Asp Ala Ile Arg Leu Gly Leu Gly Asn His 165 170 175 Asn Tyr Cys Arg Asn Pro Asp Arg Asp Ser Lys Pro Trp Cys Tyr Val 180 185 190 Phe Lys Ala Gly Lys Tyr Ser Ser Glu Phe Cys Ser Thr Pro Ala Cys 195 200 205 Ser Glu Gly Asn Ser Asp Cys Tyr Phe Gly Asn Gly Ser Ala Tyr Arg 210 215 220 Gly Thr His Ser Leu Thr Glu Ser Gly Ala Ser Cys Leu Pro Trp Asn 225 230 235 240 Ser Met Ile Leu Ile Gly Lys Val Tyr Thr Ala Gln Asn Pro Ser Ala 245 250 255 Gln Ala Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Gly 260 265 270 Asp Ala Lys Pro Trp Cys His Val Leu Lys Asn Arg Arg Leu Thr Trp 275 280 285 Glu Tyr Cys Asp Val Pro Ser Cys Ser Thr Cys Gly Leu Arg Gln Tyr 290 295 300 Ser Gln Pro Gln Phe Arg Ile Lys Gly Gly Leu Phe Ala Asp Ile Ala 305 310 315 320 Ser His Pro Trp Gln Ala Ala Ile Phe Ala Ala Ala Ala Ala Ser Pro 325 330 335 Gly Glu Arg Phe Leu Cys Gly Gly Ile Leu Ile Ser Ser Cys Trp Ile 340 345 350 Leu Ser Ala Ala His Cys Phe Gln Glu Arg Phe Pro Pro His His Leu 355 360 365 Thr Val Ile Leu Gly Arg Thr Tyr Arg Val Val Pro Gly Glu Glu Glu 370 375 380 Gln Lys Phe Glu Val Glu Lys Tyr Ile Val His Lys Glu Phe Asp Asp 385 390 395 400 Asp Thr Tyr Asp Asn Asp Ile Ala Leu Leu Gln Leu Lys Ser Asp Ser 405 410 415 Ser Arg Cys Ala Gln Glu Ser Ser Val Val Arg Thr Val Cys Leu Pro 420 425 430 Pro Ala Asp Leu Gln Leu Pro Asp Trp Thr Glu Cys Glu Leu Ser Gly 435 440 445 Tyr Gly Lys His Glu Ala Leu Ser Pro Phe Tyr Ser Glu Arg Leu Lys 450 455 460 Glu Ala His Val Arg Leu Tyr Pro Ser Ser Arg Cys Thr Ser Gln His 465 470 475 480 Leu Leu Asn Arg Thr Val Thr Asp Asn Met Leu Cys Ala Gly Asp Thr 485 490 495 Arg Ser Gly Gly Pro Gln Ala Asn Leu His Asp Ala Cys Gln Gly Asp 500 505 510 Ser Gly Gly Pro Leu Val Cys Leu Asn Asp Gly Arg Met Thr Leu Val 515 520 525 Gly Ile Ile Ser Trp Gly Leu Gly Cys Gly Gln Lys Asp Val Pro Gly 530 535 540 Val Tyr Thr Lys Val Thr Asn Tyr Leu Asp Trp Ile Arg Asp Asn Met 545 550 555 560 Arg Pro <210> 8 <211> 11138 <212> DNA <213> Artificial <220> <223> pZRC III- TNK- Hyg <400> 8 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160 aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220 cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280 cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340 ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400 agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460 cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520 ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580 atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640 acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700 ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760 atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820 ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880 acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940 atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000 gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060 tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120 ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180 acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240 gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300 tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360 agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420 ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480 ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540 cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600 gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660 cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720 cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780 aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840 tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900 ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960 gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020 agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080 caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140 ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200 gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260 tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320 ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380 cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440 ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500 tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560 gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620 gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680 tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740 tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800 gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860 gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920 tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980 tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040 aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100 agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160 ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220 cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280 aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340 acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400 gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460 gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520 cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580 gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640 ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700 cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760 cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940 ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000 gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060 tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120 atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180 cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240 agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300 ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360 gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420 ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480 ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540 gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600 ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660 cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720 cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780 ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840 caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900 gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960 gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020 cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080 ggaattccac catggacgcc atgaagcggg gactgtgctg tgtgctgctg ctgtgtggcg 7140 ccgtgttcgt gtcccctagc caggaaatcc acgcccggtt cagaaggggc gccaggtcct 7200 accaagttat ctgccgggac gaaaagaccc agatgatcta ccagcagcac cagtcctggc 7260 tgcggcccgt gctgcggtcc aaccgggtgg agtactgctg gtgcaactcc ggcagagccc 7320 agtgccactc cgtgcctgtg aagtcctgct ccgagcctag atgcttcaac ggcggcacct 7380 gtcagcaggc cctgtacttc tccgacttcg tgtgccagtg ccctgagggc ttcgccggca 7440 agtgctgcga gatcgacacc cgggccacct gttacgagga ccagggcatc tcctaccggg 7500 gcaactggtc taccgccgag tctggcgccg agtgcaccaa ctggcagtcc tccgccctgg 7560 cccagaagcc ttactctggc agacggcctg acgccatcag actgggcctg ggcaaccaca 7620 actactgccg gaaccctgac cgggactcca agccttggtg ctacgtgttc aaggccggca 7680 agtactcctc cgagttctgc tccacccctg cctgctctga gggcaactcc gactgctact 7740 tcggcaacgg ctccgcctac agaggcaccc actccctgac cgagtccggc gcctcttgcc 7800 tgccttggaa ctccatgatc ctgatcggca aggtgtacac cgcccagaac ccttccgctc 7860 aggccctggg actcggaaag cacaattatt gtcgcaatcc cgacggcgac gccaaacctt 7920 ggtgtcacgt gctgaagaac cggcggctga catgggaata ctgcgacgtg ccttcctgct 7980 ctacctgcgg cctgcggcag tactcccagc ctcagttccg gatcaagggc ggcctgttcg 8040 ccgatatcgc ctcccaccct tggcaggccg ccatcttcgc cgctgctgcc gcttctcctg 8100 gcgagagatt cctgtgcggc ggcatcctga tctccagctg ctggattctg tctgccgccc 8160 actgcttcca ggaacggttc cctcctcacc acctgaccgt gatcctgggc cggacctaca 8220 gagtcgtgcc cggcgaggaa gaacagaaat tcgaggtgga gaagtatatc gtgcacaaag 8280 agttcgacga cgacacctac gacaacgata tcgccctgct gcagctgaag tccgactcct 8340 ccagatgcgc ccaggaatcc tccgtcgttc ggaccgtgtg tctgccacct gccgacctgc 8400 agctgcctga ctggaccgag tgcgagctgt ccggctacgg caagcacgag gccctgtccc 8460 ccttctactc cgagcggctg aaagaagctc atgtacggct gtacccctct agccggtgca 8520 cctcccagca tctgctgaac cggaccgtga ccgacaacat gctgtgtgcc ggcgacacca 8580 gatctggcgg ccctcaggcc aacctgcacg acgcctgcca gggcgatagt ggcggacctc 8640 tcgtgtgcct caacgacggc aggatgaccc tcgtgggcat catctcttgg ggcctgggct 8700 gtggccagaa agacgtgcct ggcgtgtaca ccaaagtgac caactacctg gactggatca 8760 gggacaacat gcggccttga tgagcggccg cccgctgatc agcctcgact gtgccttcta 8820 gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 8880 ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 8940 attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 9000 gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga accagctggg 9060 gctctagggg gtatccccac ggagctcgca tccataatat aactgtacca ggttttggtt 9120 tattacatgt gactgacggc ttcctatgcg tgctcagaaa acggcagttg ggcactgcac 9180 tgcccggtga tggtgccacg gtggctcctg ccgccttctt tgatattcac tctgttgtat 9240 ttcatctctt gttgccgatg aaaggatata acagtctctg aggaaatact tggtatttct 9300 tctgatcagc gtttttataa gtaatgttga atattggata aggctgtgtg tcctttgtct 9360 tgggagacaa agcccacagc aggtggtggt tgggtggtgg cagctcagtg acaggagagg 9420 tttttttgcc tgtttttttt gttgtttttt ttttttaagt aaggtgttct tttttcttag 9480 taaaatttct actggactgt atgttttgac aggtcagaaa catttcttca aaagaagaac 9540 cttttggaaa ctgtacagcc cttttctttc attccctttt tgctttctgt gccaatgcct 9600 ttggttctga ttgcattatg gaaaacgttg atcggaactt gaggttttta tttatagtgt 9660 ggcttgaaag cttggatagc tgttgttaca tgagatacct tattaagttt aggccagctt 9720 gatgctttat tttttttcct ttgaagtagt gagcgttctc tggttttttt cctttgaaac 9780 tggcgaggct tagatttttc taatgggatt ttttacctga tgatctagtt gcatacccaa 9840 atgcttgtaa atgttttcct agttaacatg ttgataactt cggatttaca tgttgtatat 9900 acttgtcatc tgtgtttcta gtaaaaatat atggcattta tagaaatacg taattcctga 9960 tttccttttt tttttatctc tatgctctgt gtgtacaggt caaacagact tcactcctat 10020 ttttatttat agaattttat atgcagtctg tcgttggttc ttgtgttgta aggatacagc 10080 cttaaatttc ctagagcgat gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa 10140 cgggcacgtt tgctgctgcc ttcccagatc caggacacta aactgcttct gcaactgagg 10200 tataaatcgc ttcagatccc aggaagtgta gatccacgtg catattctta aagaagaatg 10260 aatactttct aaaatatgtt ggcataggaa gcaagctgca tggatttatt tgggacttaa 10320 attattttgg taacggagtg cataggtttt aaacacagtt gcagcatgct aacgagtcac 10380 agcatttatg cagaagtgat gcctgttgca gctgtttacg gcactgcctt gcagtgagca 10440 ttgcagatag gggtggggtg ctttgtgtcg tgttgggaca cgctgccaca cagccacctc 10500 ccgaacatat ctcacctgct gggtactttt caaaccatct tagcagtagt agatgagtta 10560 ctatgaaaca gagaagttcc tcagttggat attctcatgg gatgtctttt ttcccatgtt 10620 gggcaaagta tgataaagca tctctatttg taaattatgc acttgttagt tcctgaatcc 10680 tttctatagc accacttatt gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt 10740 caatctttta agcttgagct catggcgcgc ctaggccttg acggccttcc ttcaattcgc 10800 cctatagtga gtcgtattac gtcgcgctca ctggccgtcg ttttacaacg tcgtgactgg 10860 gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 10920 cgtaatagcg aagaggcccg caccgaaacg cccttcccaa cagttgcgca gcctgaatgg 10980 cgaatgggag cgccctgtag cggccactca accctatctc ggtctattct tttgatttat 11040 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 11100 acgcgaattt taacaaaata ttaacgctta caatttag 11138 <210> 9 <211> 193 <212> PRT <213> Artificial <220> <223> Darbepoetin <400> 9 Met Gly Val His Glu Cys Pro Ala Trp Leu Trp Leu Leu Leu Ser Leu 1 5 10 15 Leu Ser Leu Pro Leu Gly Leu Pro Val Leu Gly Ala Pro Pro Arg Leu 20 25 30 Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu Leu Glu Ala Lys Glu 35 40 45 Ala Glu Asn Ile Thr Thr Gly Cys Asn Glu Thr Cys Ser Leu Asn Glu 50 55 60 Asn Ile Thr Val Pro Asp Thr Lys Val Asn Phe Tyr Ala Trp Lys Arg 65 70 75 80 Met Glu Val Gly Gln Gln Ala Val Glu Val Trp Gln Gly Leu Ala Leu 85 90 95 Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu Leu Val Asn Ser Ser 100 105 110 Gln Val Asn Glu Thr Leu Gln Leu His Val Asp Lys Ala Val Ser Gly 115 120 125 Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu Gly Ala Gln Lys Glu 130 135 140 Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala Pro Leu Arg Thr Ile 145 150 155 160 Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr Ser Asn Phe Leu 165 170 175 Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys Arg Thr Gly Asp 180 185 190 Arg <210> 10 <211> 10023 <212> DNA <213> Artificial <220> <223> pZRC III- DARBE- Hyg <400> 10 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160 aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220 cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280 cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340 ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400 agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460 cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520 ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580 atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640 acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700 ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760 atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820 ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880 acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940 atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000 gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060 tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120 ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180 acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240 gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300 tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360 agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420 ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480 ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540 cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600 gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660 cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720 cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780 aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840 tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900 ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960 gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020 agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080 caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140 ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200 gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260 tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320 ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380 cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440 ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500 tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560 gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620 gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680 tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740 tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800 gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860 gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920 tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980 tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040 aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100 agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160 ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220 cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280 aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340 acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400 gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460 gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520 cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580 gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640 ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700 cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760 cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940 ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000 gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060 tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120 atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180 cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240 agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300 ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360 gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420 ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480 ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540 gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600 ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660 cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720 cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780 ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840 caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900 gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960 gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020 cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080 gccaccatgg gggtgcacga atgtcctgcc tggctgtggc ttctcctgtc cctgctgtcg 7140 ctccctctgg gcctcccagt cctgggcgcc ccaccacgcc tcatctgtga cagccgagtc 7200 ctggagaggt acctcttgga ggccaaggag gccgagaata tcacgacggg ctgtaatgaa 7260 acctgcagct tgaatgagaa tatcactgtc ccagacacca aagttaattt ctatgcctgg 7320 aagaggatgg aggtcgggca gcaggccgta gaagtctggc agggcctggc cctgctgtcg 7380 gaagctgtcc tgcggggcca ggccctgttg gtcaactctt cccaggtgaa cgagaccctg 7440 cagctgcatg tggataaagc cgtcagtggc cttcgcagcc tcaccactct gcttcgggct 7500 ctgggagccc agaaggaagc catctcccct ccagatgcgg cctcagctgc tccactccga 7560 acaatcactg ctgacacttt ccgcaaactc ttccgagtct actccaattt cctccgggga 7620 aagctgaagc tgtacacagg ggaggcctgc aggacagggg acagatgagc ggccgcccgc 7680 tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7740 ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7800 gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7860 aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct 7920 tctgaggcgg aaagaaccag ctggggctct agggggtatc cccacggagc tcgcatccat 7980 aatataactg taccaggttt tggtttatta catgtgactg acggcttcct atgcgtgctc 8040 agaaaacggc agttgggcac tgcactgccc ggtgatggtg ccacggtggc tcctgccgcc 8100 ttctttgata ttcactctgt tgtatttcat ctcttgttgc cgatgaaagg atataacagt 8160 ctctgaggaa atacttggta tttcttctga tcagcgtttt tataagtaat gttgaatatt 8220 ggataaggct gtgtgtcctt tgtcttggga gacaaagccc acagcaggtg gtggttgggt 8280 ggtggcagct cagtgacagg agaggttttt ttgcctgttt tttttgttgt tttttttttt 8340 taagtaaggt gttctttttt cttagtaaaa tttctactgg actgtatgtt ttgacaggtc 8400 agaaacattt cttcaaaaga agaacctttt ggaaactgta cagccctttt ctttcattcc 8460 ctttttgctt tctgtgccaa tgcctttggt tctgattgca ttatggaaaa cgttgatcgg 8520 aacttgaggt ttttatttat agtgtggctt gaaagcttgg atagctgttg ttacatgaga 8580 taccttatta agtttaggcc agcttgatgc tttatttttt ttcctttgaa gtagtgagcg 8640 ttctctggtt tttttccttt gaaactggcg aggcttagat ttttctaatg ggatttttta 8700 cctgatgatc tagttgcata cccaaatgct tgtaaatgtt ttcctagtta acatgttgat 8760 aacttcggat ttacatgttg tatatacttg tcatctgtgt ttctagtaaa aatatatggc 8820 atttatagaa atacgtaatt cctgatttcc tttttttttt atctctatgc tctgtgtgta 8880 caggtcaaac agacttcact cctattttta tttatagaat tttatatgca gtctgtcgtt 8940 ggttcttgtg ttgtaaggat acagccttaa atttcctaga gcgatgctca gtaaggcggg 9000 ttgtcacatg ggttcaaatg taaaacgggc acgtttgctg ctgccttccc agatccagga 9060 cactaaactg cttctgcaac tgaggtataa atcgcttcag atcccaggaa gtgtagatcc 9120 acgtgcatat tcttaaagaa gaatgaatac tttctaaaat atgttggcat aggaagcaag 9180 ctgcatggat ttatttggga cttaaattat tttggtaacg gagtgcatag gttttaaaca 9240 cagttgcagc atgctaacga gtcacagcat ttatgcagaa gtgatgcctg ttgcagctgt 9300 ttacggcact gccttgcagt gagcattgca gataggggtg gggtgctttg tgtcgtgttg 9360 ggacacgctg ccacacagcc acctcccgaa catatctcac ctgctgggta cttttcaaac 9420 catcttagca gtagtagatg agttactatg aaacagagaa gttcctcagt tggatattct 9480 catgggatgt cttttttccc atgttgggca aagtatgata aagcatctct atttgtaaat 9540 tatgcacttg ttagttcctg aatcctttct atagcaccac ttattgcagc aggtgtaggc 9600 tctggtgtgg cctgtgtctg tgcttcaatc ttttaagctt gagctcatgg cgcgcctagg 9660 ccttgacggc cttccttcaa ttcgccctat agtgagtcgt attacgtcgc gctcactggc 9720 cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc 9780 agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg aaacgccctt 9840 cccaacagtt gcgcagcctg aatggcgaat gggagcgccc tgtagcggcc actcaaccct 9900 atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 9960 aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac gcttacaatt 10020 tag 10023 <210> 11 <211> 489 <212> PRT <213> Artificial <220> <223> Etanercept <400> 11 Met Ala Pro Val Ala Val Trp Ala Ala Leu Ala Val Gly Leu Glu Leu 1 5 10 15 Trp Ala Ala Ala His Ala Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr 20 25 30 Ala Pro Glu Pro Gly Ser Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln 35 40 45 Thr Ala Gln Met Cys Cys Ser Lys Cys Ser Pro Gly Gln His Ala Lys 50 55 60 Val Phe Cys Thr Lys Thr Ser Asp Thr Val Cys Asp Ser Cys Glu Asp 65 70 75 80 Ser Thr Tyr Thr Gln Leu Trp Asn Trp Val Pro Glu Cys Leu Ser Cys 85 90 95 Gly Ser Arg Cys Ser Ser Asp Gln Val Glu Thr Gln Ala Cys Thr Arg 100 105 110 Glu Gln Asn Arg Ile Cys Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu 115 120 125 Ser Lys Gln Glu Gly Cys Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg 130 135 140 Pro Gly Phe Gly Val Ala Arg Pro Gly Thr Glu Thr Ser Asp Val Val 145 150 155 160 Cys Lys Pro Cys Ala Pro Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr 165 170 175 Asp Ile Cys Arg Pro His Gln Ile Cys Asn Val Val Ala Ile Pro Gly 180 185 190 Asn Ala Ser Met Asp Ala Val Cys Thr Ser Thr Ser Pro Thr Arg Ser 195 200 205 Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Val Ser Thr Arg Ser 210 215 220 Gln His Thr Gln Pro Thr Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser 225 230 235 240 Phe Leu Leu Pro Met Gly Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly 245 250 255 Asp Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro 260 265 270 Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys 275 280 285 Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val 290 295 300 Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr 305 310 315 320 Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu 325 330 335 Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His 340 345 350 Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys 355 360 365 Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln 370 375 380 Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met 385 390 395 400 Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro 405 410 415 Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn 420 425 430 Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu 435 440 445 Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val 450 455 460 Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln 465 470 475 480 Lys Ser Leu Ser Leu Ser Pro Gly Lys 485 <210> 12 <211> 10911 <212> DNA <213> Artificial <220> <223> pZRC III - Etanercept - Hyg <400> 12 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160 aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220 cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280 cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340 ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400 agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460 cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520 ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580 atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640 acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700 ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760 atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820 ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880 acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940 atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000 gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060 tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120 ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180 acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240 gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300 tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360 agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420 ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480 ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540 cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600 gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660 cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720 cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780 aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840 tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900 ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960 gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020 agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080 caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140 ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200 gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260 tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320 ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380 cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440 ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500 tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560 gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620 gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680 tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740 tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800 gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860 gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920 tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980 tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040 aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100 agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160 ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220 cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280 aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340 acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400 gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460 gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520 cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580 gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640 ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700 cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760 cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940 ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000 gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060 tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120 atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180 cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240 agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300 ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360 gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420 ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480 ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540 gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600 ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660 cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720 cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780 ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840 caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900 gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960 gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020 cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080 gccatggctc cagtggctgt gtgggctgct ctggctgtgg gcctggaact gtgggccgct 7140 gctcacgctc tgcctgctca ggtggccttc accccttatg cccctgagcc tggctccacc 7200 tgcaggctgc gggagtacta cgaccagacc gcccagatgt gctgctccaa gtgctctcct 7260 ggccagcacg ccaaggtgtt ctgcaccaag acctccgaca ccgtgtgcga ctcttgcgag 7320 gactccacct acacccagct ctggaactgg gtgcccgagt gcctgtcctg cggctccaga 7380 tgctcctccg accaggtgga gacacaggcc tgtacacggg agcagaatcg gatttgcaca 7440 tgcaggcctg gctggtactg cgccctgtcc aagcaggaag gatgcaggct gtgcgcccct 7500 ctgaggaagt gcagacctgg cttcggcgtg gctaggcctg gcaccgagac atccgacgtc 7560 gtgtgcaagc cttgtgcccc tggcaccttc tccaacacca catcctccac cgacatctgc 7620 cggcctcacc agatctgcaa cgtggtggcc atccctggca acgccagcat ggacgccgtg 7680 tgcacctcca cctcccccac cagatctatg gcccctggcg ccgtgcatct gcctcagcct 7740 gtgtccaccc ggtcccagca tacccagcct acacctgagc cctctaccgc cccttctacc 7800 tccttcctgc tgcctatggg cccttctcct ccagctgagg gctctaccgg cgacgagcct 7860 aagtcctgcg acaagaccca cacctgtccc ccctgccctg cccctgaact gctgggaggc 7920 cccagcgtgt tcctgttccc cccaaagccc aaggacaccc tgatgatctc ccggaccccc 7980 gaagtgacct gcgtggtggt ggacgtgtcc cacgaggacc ctgaagtgaa gttcaattgg 8040 tacgtggacg gcgtggaagt gcacaacgcc aagaccaagc ccagagagga acagtacaac 8100 tccacctacc gggtggtgtc cgtgctgacc gtgctgcacc aggactggct gaacggcaaa 8160 gagtacaagt gcaaggtgtc caacaaggct ctgcctgccc ccatcgaaaa gaccatctcc 8220 aaggccaagg gccagccccg cgagcctcag gtgtacaccc tgcctccttc ccgggaggag 8280 atgaccaaga accaggtgtc cctgacctgt ctggtcaagg gcttctaccc ctccgatatc 8340 gccgtggaat gggagtccaa cggacagccc gagaacaact acaagaccac cccccctgtg 8400 ctggactccg acggctcatt cttcctgtac tccaagctga ccgtggacaa gtcccggtgg 8460 cagcagggca acgtgttctc ctgctccgtg atgcacgagg ccctgcacaa ccactacacc 8520 cagaagagct tatccctgtc tcctggcaag tgataagcgg ccgcccgctg atcagcctcg 8580 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 8640 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 8700 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 8760 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 8820 agaaccagct ggggctctag ggggtatccc cacggagctc gcatccataa tataactgta 8880 ccaggttttg gtttattaca tgtgactgac ggcttcctat gcgtgctcag aaaacggcag 8940 ttgggcactg cactgcccgg tgatggtgcc acggtggctc ctgccgcctt ctttgatatt 9000 cactctgttg tatttcatct cttgttgccg atgaaaggat ataacagtct ctgaggaaat 9060 acttggtatt tcttctgatc agcgttttta taagtaatgt tgaatattgg ataaggctgt 9120 gtgtcctttg tcttgggaga caaagcccac agcaggtggt ggttgggtgg tggcagctca 9180 gtgacaggag aggttttttt gcctgttttt tttgttgttt ttttttttta agtaaggtgt 9240 tcttttttct tagtaaaatt tctactggac tgtatgtttt gacaggtcag aaacatttct 9300 tcaaaagaag aaccttttgg aaactgtaca gcccttttct ttcattccct ttttgctttc 9360 tgtgccaatg cctttggttc tgattgcatt atggaaaacg ttgatcggaa cttgaggttt 9420 ttatttatag tgtggcttga aagcttggat agctgttgtt acatgagata ccttattaag 9480 tttaggccag cttgatgctt tatttttttt cctttgaagt agtgagcgtt ctctggtttt 9540 tttcctttga aactggcgag gcttagattt ttctaatggg attttttacc tgatgatcta 9600 gttgcatacc caaatgcttg taaatgtttt cctagttaac atgttgataa cttcggattt 9660 acatgttgta tatacttgtc atctgtgttt ctagtaaaaa tatatggcat ttatagaaat 9720 acgtaattcc tgatttcctt ttttttttat ctctatgctc tgtgtgtaca ggtcaaacag 9780 acttcactcc tatttttatt tatagaattt tatatgcagt ctgtcgttgg ttcttgtgtt 9840 gtaaggatac agccttaaat ttcctagagc gatgctcagt aaggcgggtt gtcacatggg 9900 ttcaaatgta aaacgggcac gtttgctgct gccttcccag atccaggaca ctaaactgct 9960 tctgcaactg aggtataaat cgcttcagat cccaggaagt gtagatccac gtgcatattc 10020 ttaaagaaga atgaatactt tctaaaatat gttggcatag gaagcaagct gcatggattt 10080 atttgggact taaattattt tggtaacgga gtgcataggt tttaaacaca gttgcagcat 10140 gctaacgagt cacagcattt atgcagaagt gatgcctgtt gcagctgttt acggcactgc 10200 cttgcagtga gcattgcaga taggggtggg gtgctttgtg tcgtgttggg acacgctgcc 10260 acacagccac ctcccgaaca tatctcacct gctgggtact tttcaaacca tcttagcagt 10320 agtagatgag ttactatgaa acagagaagt tcctcagttg gatattctca tgggatgtct 10380 tttttcccat gttgggcaaa gtatgataaa gcatctctat ttgtaaatta tgcacttgtt 10440 agttcctgaa tcctttctat agcaccactt attgcagcag gtgtaggctc tggtgtggcc 10500 tgtgtctgtg cttcaatctt ttaagcttga gctcatggcg cgcctaggcc ttgacggcct 10560 tccttcaatt cgccctatag tgagtcgtat tacgtcgcgc tcactggccg tcgttttaca 10620 acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 10680 tttcgccagc tggcgtaata gcgaagaggc ccgcaccgaa acgcccttcc caacagttgc 10740 gcagcctgaa tggcgaatgg gagcgccctg tagcggccac tcaaccctat ctcggtctat 10800 tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 10860 taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaattta g 10911 <210> 13 <211> 116 <212> PRT <213> Artificial <220> <223> FSH alpha <400> 13 Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser 1 5 10 15 Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro 20 25 30 Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro 35 40 45 Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro 50 55 60 Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu 65 70 75 80 Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly 85 90 95 Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr 100 105 110 Tyr His Lys Ser 115 <210> 14 <211> 599 <212> DNA <213> Artificial <220> <223> IRES <400> 14 gcggccgcgc cgcactagag gaattccgcc cctctccccc cccccctaac gttactggcc 60 gaagccgctt ggaataaggc cggtgtgcgt ttgtctatat gttattttcc accatattgc 120 cgtcttttgg caatgtgagg gcccggaaac ctggccctgt cttcttgacg agcattccta 180 ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag 240 ttcctctgga agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga 300 accccccacc tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg 360 caaaggcggc acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat 420 ggctctcctc aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta 480 tgggatctga tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa 540 aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataa 599 <210> 15 <211> 129 <212> PRT <213> Artificial <220> <223> FSH beta <400> 15 Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile 1 5 10 15 Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys 20 25 30 Glu Glu Cys Arg Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly 35 40 45 Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys 50 55 60 Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg 65 70 75 80 Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val 85 90 95 Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys 100 105 110 Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys 115 120 125 Glu <210> 16 <211> 10801 <212> DNA <213> Artificial <220> <223> pZRC III- FSH alpha- IRES- FSH beta- Hyg <400> 16 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160 aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220 cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280 cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340 ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400 agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460 cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520 ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580 atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640 acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700 ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760 atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820 ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880 acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940 atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000 gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060 tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120 ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180 acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240 gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300 tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360 agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420 ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480 ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540 cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600 gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660 cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720 cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780 aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840 tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900 ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960 gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020 agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080 caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140 ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200 gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260 tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320 ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380 cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440 ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500 tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560 gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620 gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680 tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740 tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800 gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860 gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920 tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980 tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040 aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100 agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160 ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220 cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280 aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340 acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400 gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460 gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520 cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580 gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640 ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700 cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760 cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940 ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000 gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060 tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120 atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180 cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240 agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300 ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360 gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420 ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480 ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540 gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600 ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660 cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720 cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780 ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840 caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900 gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960 gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020 cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080 gccaccatgg actactaccg gaagtacgcc gccatcttcc tggtgaccct gtccgtgttc 7140 ctgcacgtgc tgcactctgc ccctgacgtg caggactgcc ctgagtgcac cctgcaggaa 7200 aacccattct tcagccagcc tggcgcccct atcctgcagt gcatgggctg ctgcttctcc 7260 agagcctacc ctacccctct gcggtccaag aaaaccatgc tggtgcagaa aaacgtgacc 7320 tccgagtcta cctgctgcgt ggccaagtcc tacaacagag tgaccgtgat gggcggcttc 7380 aaggtggaga accacaccgc ctgccactgc tctacctgct actaccacaa gtcctgatga 7440 gcggccgcgc cgcactagag gaattccgcc cctctccccc cccccctaac gttactggcc 7500 gaagccgctt ggaataaggc cggtgtgcgt ttgtctatat gttattttcc accatattgc 7560 cgtcttttgg caatgtgagg gcccggaaac ctggccctgt cttcttgacg agcattccta 7620 ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag 7680 ttcctctgga agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga 7740 accccccacc tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg 7800 caaaggcggc acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat 7860 ggctctcctc aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta 7920 tgggatctga tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa 7980 aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataac 8040 ccgggccacc atgaagaccc tgcagttctt cttcctgttc tgctgctgga aggccatctg 8100 ctgcaactct tgcgagctga ccaacatcac aatcgccatc gagaaagagg aatgccggtt 8160 ctgcatctcc atcaacacca cttggtgcgc cggctactgc tacacccgcg acctggtgta 8220 caaggaccct gcccggccta agatccagaa aacctgcacc ttcaaagaac tggtgtacga 8280 gacagtgcgg gtgccaggct gcgctcacca cgccgactcc ctgtacacct accctgtggc 8340 cacccagtgc cactgcggca agtgcgactc cgactccacc gactgtaccg tgcggggcct 8400 gggcccttct tactgctcct tcggcgagat gaaggaatga tgaccagcgg ccgcccgctg 8460 atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 8520 ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 8580 atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 8640 gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc 8700 tgaggcggaa agaaccagct ggggctctag ggggtatccc cacggagctc gcatccataa 8760 tataactgta ccaggttttg gtttattaca tgtgactgac ggcttcctat gcgtgctcag 8820 aaaacggcag ttgggcactg cactgcccgg tgatggtgcc acggtggctc ctgccgcctt 8880 ctttgatatt cactctgttg tatttcatct cttgttgccg atgaaaggat ataacagtct 8940 ctgaggaaat acttggtatt tcttctgatc agcgttttta taagtaatgt tgaatattgg 9000 ataaggctgt gtgtcctttg tcttgggaga caaagcccac agcaggtggt ggttgggtgg 9060 tggcagctca gtgacaggag aggttttttt gcctgttttt tttgttgttt ttttttttta 9120 agtaaggtgt tcttttttct tagtaaaatt tctactggac tgtatgtttt gacaggtcag 9180 aaacatttct tcaaaagaag aaccttttgg aaactgtaca gcccttttct ttcattccct 9240 ttttgctttc tgtgccaatg cctttggttc tgattgcatt atggaaaacg ttgatcggaa 9300 cttgaggttt ttatttatag tgtggcttga aagcttggat agctgttgtt acatgagata 9360 ccttattaag tttaggccag cttgatgctt tatttttttt cctttgaagt agtgagcgtt 9420 ctctggtttt tttcctttga aactggcgag gcttagattt ttctaatggg attttttacc 9480 tgatgatcta gttgcatacc caaatgcttg taaatgtttt cctagttaac atgttgataa 9540 cttcggattt acatgttgta tatacttgtc atctgtgttt ctagtaaaaa tatatggcat 9600 ttatagaaat acgtaattcc tgatttcctt ttttttttat ctctatgctc tgtgtgtaca 9660 ggtcaaacag acttcactcc tatttttatt tatagaattt tatatgcagt ctgtcgttgg 9720 ttcttgtgtt gtaaggatac agccttaaat ttcctagagc gatgctcagt aaggcgggtt 9780 gtcacatggg ttcaaatgta aaacgggcac gtttgctgct gccttcccag atccaggaca 9840 ctaaactgct tctgcaactg aggtataaat cgcttcagat cccaggaagt gtagatccac 9900 gtgcatattc ttaaagaaga atgaatactt tctaaaatat gttggcatag gaagcaagct 9960 gcatggattt atttgggact taaattattt tggtaacgga gtgcataggt tttaaacaca 10020 gttgcagcat gctaacgagt cacagcattt atgcagaagt gatgcctgtt gcagctgttt 10080 acggcactgc cttgcagtga gcattgcaga taggggtggg gtgctttgtg tcgtgttggg 10140 acacgctgcc acacagccac ctcccgaaca tatctcacct gctgggtact tttcaaacca 10200 tcttagcagt agtagatgag ttactatgaa acagagaagt tcctcagttg gatattctca 10260 tgggatgtct tttttcccat gttgggcaaa gtatgataaa gcatctctat ttgtaaatta 10320 tgcacttgtt agttcctgaa tcctttctat agcaccactt attgcagcag gtgtaggctc 10380 tggtgtggcc tgtgtctgtg cttcaatctt ttaagcttga gctcatggcg cgcctaggcc 10440 ttgacggcct tccttcaatt cgccctatag tgagtcgtat tacgtcgcgc tcactggccg 10500 tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 10560 cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgaa acgcccttcc 10620 caacagttgc gcagcctgaa tggcgaatgg gagcgccctg tagcggccac tcaaccctat 10680 ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10740 tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaattta 10800 g 10801 <210> 17 <211> 10710 <212> DNA <213> Artificial <220> <223> pZRC III- TNK- Puro <400> 17 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 taccggatct gcgatctgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 1980 cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatcg ctgactaatt 2040 ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca gaagtagtga 2100 ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gcattccggt actgttggta 2160 aagccaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtccccc 2220 gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 2280 acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 2340 ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 2400 cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 2460 tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 2520 ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg 2580 gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 2640 ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 2700 tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 2760 gtgcctgatc tagctagagt cggggcggcc ggccgcttcg agcagacatg ataagataca 2820 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 2880 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2940 acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 3000 agtaaaacct ctacaaatgt ggtaaaatcg ataaggatcc tcgggacgct ctggccggtg 3060 aggcgtgcgc agtcgttgac gctctagacc gtgcaaaagg agagcctgta agcgggcact 3120 cttccgtggt ctggtggata aattcgcaag ggtatcatgg cggacgaccg gggttcgaac 3180 cccagatccg gccgtccgcc gtgatccatg cggttaccgc ccgcgtgtcg aacccaggtg 3240 tgcgacgtca gacaacgggg gagcgctcct tttggcttcc ttccaggcgc ggcggctgct 3300 gcgctagctt ttttggccac tggccgcgcg cggcgtaagc ggttaggctg gaaagcgaaa 3360 gcattaagtg gctcgctccc tgtagccgga gggttatttt ccaagggttg agtcgcagga 3420 cccccggttc gagtctcggg ccggccggac tgcggcgaac gggggtttgc ctccccgtca 3480 tgcaagaccc cgcttgcaaa ttcctccgga aacagggacg agcccctttt ttgcttttcc 3540 cagatgcatc cggtgctgcg gcagatgcgc ccccctcctc agcagcggca agagcaagag 3600 cagcggcaga catgcagggc accctcccct tctcctaccg cgtcaggagg ggcaacatcc 3660 gacgcgtgca tccataatat aactgtacca ggttttggtt tattacatgt gactgacggc 3720 ttcctatgcg tgctcagaaa acggcagttg ggcactgcac tgcccggtga tggtgccacg 3780 gtggctcctg ccgccttctt tgatattcac tctgttgtat ttcatctctt gttgccgatg 3840 aaaggatata acagtctctg aggaaatact tggtatttct tctgatcagc gtttttataa 3900 gtaatgttga atattggata aggctgtgtg tcctttgtct tgggagacaa agcccacagc 3960 aggtggtggt tgggtggtgg cagctcagtg acaggagagg tttttttgcc tgtttttttt 4020 gttgtttttt ttttttaagt aaggtgttct tttttcttag taaaatttct actggactgt 4080 atgttttgac aggtcagaaa catttcttca aaagaagaac cttttggaaa ctgtacagcc 4140 cttttctttc attccctttt tgctttctgt gccaatgcct ttggttctga ttgcattatg 4200 gaaaacgttg atcggaactt gaggttttta tttatagtgt ggcttgaaag cttggatagc 4260 tgttgttaca tgagatacct tattaagttt aggccagctt gatgctttat tttttttcct 4320 ttgaagtagt gagcgttctc tggttttttt cctttgaaac tggcgaggct tagatttttc 4380 taatgggatt ttttacctga tgatctagtt gcatacccaa atgcttgtaa atgttttcct 4440 agttaacatg ttgataactt cggatttaca tgttgtatat acttgtcatc tgtgtttcta 4500 gtaaaaatat atggcattta tagaaatacg taattcctga tttccttttt tttttatctc 4560 tatgctctgt gtgtacaggt caaacagact tcactcctat ttttatttat agaattttat 4620 atgcagtctg tcgttggttc ttgtgttgta aggatacagc cttaaatttc ctagagcgat 4680 gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa cgggcacgtt tgctgctgcc 4740 ttcccagatc caggacacta aactgcttct gcaactgagg tataaatcgc ttcagatccc 4800 aggaagtgta gatccacgtg catattctta aagaagaatg aatactttct aaaatatgtt 4860 ggcataggaa gcaagctgca tggatttatt tgggacttaa attattttgg taacggagtg 4920 cataggtttt aaacacagtt gcagcatgct aacgagtcac agcatttatg cagaagtgat 4980 gcctgttgca gctgtttacg gcactgcctt gcagtgagca ttgcagatag gggtggggtg 5040 ctttgtgtcg tgttgggaca cgctgccaca cagccacctc ccgaacatat ctcacctgct 5100 gggtactttt caaaccatct tagcagtagt agatgagtta ctatgaaaca gagaagttcc 5160 tcagttggat attctcatgg gatgtctttt ttcccatgtt gggcaaagta tgataaagca 5220 tctctatttg taaattatgc acttgttagt tcctgaatcc tttctatagc accacttatt 5280 gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt caatctttta agcttacgcg 5340 ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat tagttcatag 5400 cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 5460 caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 5520 gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 5580 tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 5640 ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 5700 attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 5760 gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 5820 ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 5880 aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctggtt tagtgaaccg 5940 tcagatcctc ttccgcatcg ctgtctgcga gggccagctg ttggggtgag tactccctct 6000 caaaagcggg catgacttct gcgctaagaa tgtcagtttc caaaaacgag gaggatttga 6060 tattcactgg cccgcggtga tgcctttgag ggtggccgcg tccatctggt cagaaaagac 6120 aatctttttg ttgtcaagct tccttgatga tgtcatactt atcctgtccc ttttttttcc 6180 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 6240 cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 6300 tcggaaaacc tctcgacgta ccaattaatt cgctgtctgc gagggccagc tgttggggtg 6360 agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 6420 aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 6480 ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 6540 catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 6600 ggtccaactg caggtcgagc atgcatctag ggcgcccgca ctagaggctc gaggaattcc 6660 accatggacg ccatgaagcg gggactgtgc tgtgtgctgc tgctgtgtgg cgccgtgttc 6720 gtgtccccta gccaggaaat ccacgcccgg ttcagaaggg gcgccaggtc ctaccaagtt 6780 atctgccggg acgaaaagac ccagatgatc taccagcagc accagtcctg gctgcggccc 6840 gtgctgcggt ccaaccgggt ggagtactgc tggtgcaact ccggcagagc ccagtgccac 6900 tccgtgcctg tgaagtcctg ctccgagcct agatgcttca acggcggcac ctgtcagcag 6960 gccctgtact tctccgactt cgtgtgccag tgccctgagg gcttcgccgg caagtgctgc 7020 gagatcgaca cccgggccac ctgttacgag gaccagggca tctcctaccg gggcaactgg 7080 tctaccgccg agtctggcgc cgagtgcacc aactggcagt cctccgccct ggcccagaag 7140 ccttactctg gcagacggcc tgacgccatc agactgggcc tgggcaacca caactactgc 7200 cggaaccctg accgggactc caagccttgg tgctacgtgt tcaaggccgg caagtactcc 7260 tccgagttct gctccacccc tgcctgctct gagggcaact ccgactgcta cttcggcaac 7320 ggctccgcct acagaggcac ccactccctg accgagtccg gcgcctcttg cctgccttgg 7380 aactccatga tcctgatcgg caaggtgtac accgcccaga acccttccgc tcaggccctg 7440 ggactcggaa agcacaatta ttgtcgcaat cccgacggcg acgccaaacc ttggtgtcac 7500 gtgctgaaga accggcggct gacatgggaa tactgcgacg tgccttcctg ctctacctgc 7560 ggcctgcggc agtactccca gcctcagttc cggatcaagg gcggcctgtt cgccgatatc 7620 gcctcccacc cttggcaggc cgccatcttc gccgctgctg ccgcttctcc tggcgagaga 7680 ttcctgtgcg gcggcatcct gatctccagc tgctggattc tgtctgccgc ccactgcttc 7740 caggaacggt tccctcctca ccacctgacc gtgatcctgg gccggaccta cagagtcgtg 7800 cccggcgagg aagaacagaa attcgaggtg gagaagtata tcgtgcacaa agagttcgac 7860 gacgacacct acgacaacga tatcgccctg ctgcagctga agtccgactc ctccagatgc 7920 gcccaggaat cctccgtcgt tcggaccgtg tgtctgccac ctgccgacct gcagctgcct 7980 gactggaccg agtgcgagct gtccggctac ggcaagcacg aggccctgtc ccccttctac 8040 tccgagcggc tgaaagaagc tcatgtacgg ctgtacccct ctagccggtg cacctcccag 8100 catctgctga accggaccgt gaccgacaac atgctgtgtg ccggcgacac cagatctggc 8160 ggccctcagg ccaacctgca cgacgcctgc cagggcgata gtggcggacc tctcgtgtgc 8220 ctcaacgacg gcaggatgac cctcgtgggc atcatctctt ggggcctggg ctgtggccag 8280 aaagacgtgc ctggcgtgta caccaaagtg accaactacc tggactggat cagggacaac 8340 atgcggcctt gatgagcggc cgcccgctga tcagcctcga ctgtgccttc tagttgccag 8400 ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 8460 gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 8520 ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 8580 gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg 8640 gggtatcccc acggagctcg catccataat ataactgtac caggttttgg tttattacat 8700 gtgactgacg gcttcctatg cgtgctcaga aaacggcagt tgggcactgc actgcccggt 8760 gatggtgcca cggtggctcc tgccgccttc tttgatattc actctgttgt atttcatctc 8820 ttgttgccga tgaaaggata taacagtctc tgaggaaata cttggtattt cttctgatca 8880 gcgtttttat aagtaatgtt gaatattgga taaggctgtg tgtcctttgt cttgggagac 8940 aaagcccaca gcaggtggtg gttgggtggt ggcagctcag tgacaggaga ggtttttttg 9000 cctgtttttt ttgttgtttt ttttttttaa gtaaggtgtt cttttttctt agtaaaattt 9060 ctactggact gtatgttttg acaggtcaga aacatttctt caaaagaaga accttttgga 9120 aactgtacag cccttttctt tcattccctt tttgctttct gtgccaatgc ctttggttct 9180 gattgcatta tggaaaacgt tgatcggaac ttgaggtttt tatttatagt gtggcttgaa 9240 agcttggata gctgttgtta catgagatac cttattaagt ttaggccagc ttgatgcttt 9300 attttttttc ctttgaagta gtgagcgttc tctggttttt ttcctttgaa actggcgagg 9360 cttagatttt tctaatggga ttttttacct gatgatctag ttgcataccc aaatgcttgt 9420 aaatgttttc ctagttaaca tgttgataac ttcggattta catgttgtat atacttgtca 9480 tctgtgtttc tagtaaaaat atatggcatt tatagaaata cgtaattcct gatttccttt 9540 tttttttatc tctatgctct gtgtgtacag gtcaaacaga cttcactcct atttttattt 9600 atagaatttt atatgcagtc tgtcgttggt tcttgtgttg taaggataca gccttaaatt 9660 tcctagagcg atgctcagta aggcgggttg tcacatgggt tcaaatgtaa aacgggcacg 9720 tttgctgctg ccttcccaga tccaggacac taaactgctt ctgcaactga ggtataaatc 9780 gcttcagatc ccaggaagtg tagatccacg tgcatattct taaagaagaa tgaatacttt 9840 ctaaaatatg ttggcatagg aagcaagctg catggattta tttgggactt aaattatttt 9900 ggtaacggag tgcataggtt ttaaacacag ttgcagcatg ctaacgagtc acagcattta 9960 tgcagaagtg atgcctgttg cagctgttta cggcactgcc ttgcagtgag cattgcagat 10020 aggggtgggg tgctttgtgt cgtgttggga cacgctgcca cacagccacc tcccgaacat 10080 atctcacctg ctgggtactt ttcaaaccat cttagcagta gtagatgagt tactatgaaa 10140 cagagaagtt cctcagttgg atattctcat gggatgtctt ttttcccatg ttgggcaaag 10200 tatgataaag catctctatt tgtaaattat gcacttgtta gttcctgaat cctttctata 10260 gcaccactta ttgcagcagg tgtaggctct ggtgtggcct gtgtctgtgc ttcaatcttt 10320 taagcttgag ctcatggcgc gcctaggcct tgacggcctt ccttcaattc gccctatagt 10380 gagtcgtatt acgtcgcgct cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 10440 tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 10500 cgaagaggcc cgcaccgaaa cgcccttccc aacagttgcg cagcctgaat ggcgaatggg 10560 agcgccctgt agcggccact caaccctatc tcggtctatt cttttgattt ataagggatt 10620 ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 10680 tttaacaaaa tattaacgct tacaatttag 10710 <210> 18 <211> 9595 <212> DNA <213> Artificial <220> <223> pZRC III- DARBE- Puro <400> 18 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920 taccggatct gcgatctgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 1980 cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatcg ctgactaatt 2040 ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca gaagtagtga 2100 ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gcattccggt actgttggta 2160 aagccaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtccccc 2220 gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 2280 acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 2340 ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 2400 cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 2460 tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 2520 ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg 2580 gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 2640 ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 2700 tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 2760 gtgcctgatc tagctagagt cggggcggcc ggccgcttcg agcagacatg ataagataca 2820 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 2880 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2940 acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 3000 agtaaaacct ctacaaatgt ggtaaaatcg ataaggatcc tcgggacgct ctggccggtg 3060 aggcgtgcgc agtcgttgac gctctagacc gtgcaaaagg agagcctgta agcgggcact 3120 cttccgtggt ctggtggata aattcgcaag ggtatcatgg cggacgaccg gggttcgaac 3180 cccagatccg gccgtccgcc gtgatccatg cggttaccgc ccgcgtgtcg aacccaggtg 3240 tgcgacgtca gacaacgggg gagcgctcct tttggcttcc ttccaggcgc ggcggctgct 3300 gcgctagctt ttttggccac tggccgcgcg cggcgtaagc ggttaggctg gaaagcgaaa 3360 gcattaagtg gctcgctccc tgtagccgga gggttatttt ccaagggttg agtcgcagga 3420 cccccggttc gagtctcggg ccggccggac tgcggcgaac gggggtttgc ctccccgtca 3480 tgcaagaccc cgcttgcaaa ttcctccgga aacagggacg agcccctttt ttgcttttcc 3540 cagatgcatc cggtgctgcg gcagatgcgc ccccctcctc agcagcggca agagcaagag 3600 cagcggcaga catgcagggc accctcccct tctcctaccg cgtcaggagg ggcaacatcc 3660 gacgcgtgca tccataatat aactgtacca ggttttggtt tattacatgt gactgacggc 3720 ttcctatgcg tgctcagaaa acggcagttg ggcactgcac tgcccggtga tggtgccacg 3780 gtggctcctg ccgccttctt tgatattcac tctgttgtat ttcatctctt gttgccgatg 3840 aaaggatata acagtctctg aggaaatact tggtatttct tctgatcagc gtttttataa 3900 gtaatgttga atattggata aggctgtgtg tcctttgtct tgggagacaa agcccacagc 3960 aggtggtggt tgggtggtgg cagctcagtg acaggagagg tttttttgcc tgtttttttt 4020 gttgtttttt ttttttaagt aaggtgttct tttttcttag taaaatttct actggactgt 4080 atgttttgac aggtcagaaa catttcttca aaagaagaac cttttggaaa ctgtacagcc 4140 cttttctttc attccctttt tgctttctgt gccaatgcct ttggttctga ttgcattatg 4200 gaaaacgttg atcggaactt gaggttttta tttatagtgt ggcttgaaag cttggatagc 4260 tgttgttaca tgagatacct tattaagttt aggccagctt gatgctttat tttttttcct 4320 ttgaagtagt gagcgttctc tggttttttt cctttgaaac tggcgaggct tagatttttc 4380 taatgggatt ttttacctga tgatctagtt gcatacccaa atgcttgtaa atgttttcct 4440 agttaacatg ttgataactt cggatttaca tgttgtatat acttgtcatc tgtgtttcta 4500 gtaaaaatat atggcattta tagaaatacg taattcctga tttccttttt tttttatctc 4560 tatgctctgt gtgtacaggt caaacagact tcactcctat ttttatttat agaattttat 4620 atgcagtctg tcgttggttc ttgtgttgta aggatacagc cttaaatttc ctagagcgat 4680 gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa cgggcacgtt tgctgctgcc 4740 ttcccagatc caggacacta aactgcttct gcaactgagg tataaatcgc ttcagatccc 4800 aggaagtgta gatccacgtg catattctta aagaagaatg aatactttct aaaatatgtt 4860 ggcataggaa gcaagctgca tggatttatt tgggacttaa attattttgg taacggagtg 4920 cataggtttt aaacacagtt gcagcatgct aacgagtcac agcatttatg cagaagtgat 4980 gcctgttgca gctgtttacg gcactgcctt gcagtgagca ttgcagatag gggtggggtg 5040 ctttgtgtcg tgttgggaca cgctgccaca cagccacctc ccgaacatat ctcacctgct 5100 gggtactttt caaaccatct tagcagtagt agatgagtta ctatgaaaca gagaagttcc 5160 tcagttggat attctcatgg gatgtctttt ttcccatgtt gggcaaagta tgataaagca 5220 tctctatttg taaattatgc acttgttagt tcctgaatcc tttctatagc accacttatt 5280 gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt caatctttta agcttacgcg 5340 ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat tagttcatag 5400 cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 5460 caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 5520 gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 5580 tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 5640 ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 5700 attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 5760 gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 5820 ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 5880 aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctggtt tagtgaaccg 5940 tcagatcctc ttccgcatcg ctgtctgcga gggccagctg ttggggtgag tactccctct 6000 caaaagcggg catgacttct gcgctaagaa tgtcagtttc caaaaacgag gaggatttga 6060 tattcactgg cccgcggtga tgcctttgag ggtggccgcg tccatctggt cagaaaagac 6120 aatctttttg ttgtcaagct tccttgatga tgtcatactt atcctgtccc ttttttttcc 6180 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 6240 cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 6300 tcggaaaacc tctcgacgta ccaattaatt cgctgtctgc gagggccagc tgttggggtg 6360 agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 6420 aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 6480 ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 6540 catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 6600 ggtccaactg caggtcgagc atgcatctag ggcgcccgca ctagaggctc gagccaccat 6660 gggggtgcac gaatgtcctg cctggctgtg gcttctcctg tccctgctgt cgctccctct 6720 gggcctccca gtcctgggcg ccccaccacg cctcatctgt gacagccgag tcctggagag 6780 gtacctcttg gaggccaagg aggccgagaa tatcacgacg ggctgtaatg aaacctgcag 6840 cttgaatgag aatatcactg tcccagacac caaagttaat ttctatgcct ggaagaggat 6900 ggaggtcggg cagcaggccg tagaagtctg gcagggcctg gccctgctgt cggaagctgt 6960 cctgcggggc caggccctgt tggtcaactc ttcccaggtg aacgagaccc tgcagctgca 7020 tgtggataaa gccgtcagtg gccttcgcag cctcaccact ctgcttcggg ctctgggagc 7080 ccagaaggaa gccatctccc ctccagatgc ggcctcagct gctccactcc gaacaatcac 7140 tgctgacact ttccgcaaac tcttccgagt ctactccaat ttcctccggg gaaagctgaa 7200 gctgtacaca ggggaggcct gcaggacagg ggacagatga gcggccgccc gctgatcagc 7260 ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 7320 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 7380 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 7440 ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 7500 ggaaagaacc agctggggct ctagggggta tccccacgga gctcgcatcc ataatataac 7560 tgtaccaggt tttggtttat tacatgtgac tgacggcttc ctatgcgtgc tcagaaaacg 7620 gcagttgggc actgcactgc ccggtgatgg tgccacggtg gctcctgccg ccttctttga 7680 tattcactct gttgtatttc atctcttgtt gccgatgaaa ggatataaca gtctctgagg 7740 aaatacttgg tatttcttct gatcagcgtt tttataagta atgttgaata ttggataagg 7800 ctgtgtgtcc tttgtcttgg gagacaaagc ccacagcagg tggtggttgg gtggtggcag 7860 ctcagtgaca ggagaggttt ttttgcctgt tttttttgtt gttttttttt tttaagtaag 7920 gtgttctttt ttcttagtaa aatttctact ggactgtatg ttttgacagg tcagaaacat 7980 ttcttcaaaa gaagaacctt ttggaaactg tacagccctt ttctttcatt ccctttttgc 8040 tttctgtgcc aatgcctttg gttctgattg cattatggaa aacgttgatc ggaacttgag 8100 gtttttattt atagtgtggc ttgaaagctt ggatagctgt tgttacatga gataccttat 8160 taagtttagg ccagcttgat gctttatttt ttttcctttg aagtagtgag cgttctctgg 8220 tttttttcct ttgaaactgg cgaggcttag atttttctaa tgggattttt tacctgatga 8280 tctagttgca tacccaaatg cttgtaaatg ttttcctagt taacatgttg ataacttcgg 8340 atttacatgt tgtatatact tgtcatctgt gtttctagta aaaatatatg gcatttatag 8400 aaatacgtaa ttcctgattt cctttttttt ttatctctat gctctgtgtg tacaggtcaa 8460 acagacttca ctcctatttt tatttataga attttatatg cagtctgtcg ttggttcttg 8520 tgttgtaagg atacagcctt aaatttccta gagcgatgct cagtaaggcg ggttgtcaca 8580 tgggttcaaa tgtaaaacgg gcacgtttgc tgctgccttc ccagatccag gacactaaac 8640 tgcttctgca actgaggtat aaatcgcttc agatcccagg aagtgtagat ccacgtgcat 8700 attcttaaag aagaatgaat actttctaaa atatgttggc ataggaagca agctgcatgg 8760 atttatttgg gacttaaatt attttggtaa cggagtgcat aggttttaaa cacagttgca 8820 gcatgctaac gagtcacagc atttatgcag aagtgatgcc tgttgcagct gtttacggca 8880 ctgccttgca gtgagcattg cagatagggg tggggtgctt tgtgtcgtgt tgggacacgc 8940 tgccacacag ccacctcccg aacatatctc acctgctggg tacttttcaa accatcttag 9000 cagtagtaga tgagttacta tgaaacagag aagttcctca gttggatatt ctcatgggat 9060 gtcttttttc ccatgttggg caaagtatga taaagcatct ctatttgtaa attatgcact 9120 tgttagttcc tgaatccttt ctatagcacc acttattgca gcaggtgtag gctctggtgt 9180 ggcctgtgtc tgtgcttcaa tcttttaagc ttgagctcat ggcgcgccta ggccttgacg 9240 gccttccttc aattcgccct atagtgagtc gtattacgtc gcgctcactg gccgtcgttt 9300 tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 9360 cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgaaacgccc ttcccaacag 9420 ttgcgcagcc tgaatggcga atgggagcgc cctgtagcgg ccactcaacc ctatctcggt 9480 ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 9540 gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttag 9595 <210> 19 <211> 10869 <212> DNA <213> Artificial <220> <223> pZRC III- Etanercept- Neo <400> 19 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180 gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240 gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300 acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360 cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420 cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480 atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540 aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600 tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660 tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720 tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780 atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840 atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900 gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740 attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800 ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860 gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaactgt 1920 ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 1980 aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag 2040 gcagaagtat gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc 2100 cgcccatccc gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa 2160 ttttttttat ttatgcagag gccgaggccg cctctgcctc tgagctattc cagaagtagt 2220 gaggaggctt ttttggaggc ctaggctttt gcaaaaagct cccgggagct tgtatatcca 2280 ttttcggatc tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat 2340 tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 2400 agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 2460 tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 2520 tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 2580 cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 2640 ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 2700 atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 2760 ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 2820 cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga 2880 cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 2940 tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 3000 atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 3060 ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagcgg 3120 gactctgggg ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 3180 ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 3240 gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 3300 tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 3360 tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 3420 ggatcctcgg gacgctctgg ccggtgaggc gtgcgcagtc gttgacgctc tagaccgtgc 3480 aaaaggagag cctgtaagcg ggcactcttc cgtggtctgg tggataaatt cgcaagggta 3540 tcatggcgga cgaccggggt tcgaacccca gatccggccg tccgccgtga tccatgcggt 3600 taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acgggggagc gctccttttg 3660 gcttccttcc aggcgcggcg gctgctgcgc tagctttttt ggccactggc cgcgcgcggc 3720 gtaagcggtt aggctggaaa gcgaaagcat taagtggctc gctccctgta gccggagggt 3780 tattttccaa gggttgagtc gcaggacccc cggttcgagt ctcgggccgg ccggactgcg 3840 gcgaacgggg gtttgcctcc ccgtcatgca agaccccgct tgcaaattcc tccggaaaca 3900 gggacgagcc ccttttttgc ttttcccaga tgcatccggt gctgcggcag atgcgccccc 3960 ctcctcagca gcggcaagag caagagcagc ggcagacatg cagggcaccc tccccttctc 4020 ctaccgcgtc aggaggggca acatccgacg cgtgcatcca taatataact gtaccaggtt 4080 ttggtttatt acatgtgact gacggcttcc tatgcgtgct cagaaaacgg cagttgggca 4140 ctgcactgcc cggtgatggt gccacggtgg ctcctgccgc cttctttgat attcactctg 4200 ttgtatttca tctcttgttg ccgatgaaag gatataacag tctctgagga aatacttggt 4260 atttcttctg atcagcgttt ttataagtaa tgttgaatat tggataaggc tgtgtgtcct 4320 ttgtcttggg agacaaagcc cacagcaggt ggtggttggg tggtggcagc tcagtgacag 4380 gagaggtttt tttgcctgtt ttttttgttg tttttttttt ttaagtaagg tgttcttttt 4440 tcttagtaaa atttctactg gactgtatgt tttgacaggt cagaaacatt tcttcaaaag 4500 aagaaccttt tggaaactgt acagcccttt tctttcattc cctttttgct ttctgtgcca 4560 atgcctttgg ttctgattgc attatggaaa acgttgatcg gaacttgagg tttttattta 4620 tagtgtggct tgaaagcttg gatagctgtt gttacatgag ataccttatt aagtttaggc 4680 cagcttgatg ctttattttt tttcctttga agtagtgagc gttctctggt ttttttcctt 4740 tgaaactggc gaggcttaga tttttctaat gggatttttt acctgatgat ctagttgcat 4800 acccaaatgc ttgtaaatgt tttcctagtt aacatgttga taacttcgga tttacatgtt 4860 gtatatactt gtcatctgtg tttctagtaa aaatatatgg catttataga aatacgtaat 4920 tcctgatttc cttttttttt tatctctatg ctctgtgtgt acaggtcaaa cagacttcac 4980 tcctattttt atttatagaa ttttatatgc agtctgtcgt tggttcttgt gttgtaagga 5040 tacagcctta aatttcctag agcgatgctc agtaaggcgg gttgtcacat gggttcaaat 5100 gtaaaacggg cacgtttgct gctgccttcc cagatccagg acactaaact gcttctgcaa 5160 ctgaggtata aatcgcttca gatcccagga agtgtagatc cacgtgcata ttcttaaaga 5220 agaatgaata ctttctaaaa tatgttggca taggaagcaa gctgcatgga tttatttggg 5280 acttaaatta ttttggtaac ggagtgcata ggttttaaac acagttgcag catgctaacg 5340 agtcacagca tttatgcaga agtgatgcct gttgcagctg tttacggcac tgccttgcag 5400 tgagcattgc agataggggt ggggtgcttt gtgtcgtgtt gggacacgct gccacacagc 5460 cacctcccga acatatctca cctgctgggt acttttcaaa ccatcttagc agtagtagat 5520 gagttactat gaaacagaga agttcctcag ttggatattc tcatgggatg tcttttttcc 5580 catgttgggc aaagtatgat aaagcatctc tatttgtaaa ttatgcactt gttagttcct 5640 gaatcctttc tatagcacca cttattgcag caggtgtagg ctctggtgtg gcctgtgtct 5700 gtgcttcaat cttttaagct tacgcgttga cattgattat tgactagtta ttaatagtaa 5760 tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 5820 gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 5880 tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 5940 cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 6000 gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 6060 tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt 6120 tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac 6180 cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt 6240 cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat 6300 ataagcagag ctggtttagt gaaccgtcag atcctcttcc gcatcgctgt ctgcgagggc 6360 cagctgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc taagaatgtc 6420 agtttccaaa aacgaggagg atttgatatt cactggcccg cggtgatgcc tttgagggtg 6480 gccgcgtcca tctggtcaga aaagacaatc tttttgttgt caagcttcct tgatgatgtc 6540 atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 6600 tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtactccg ccaccgaggg 6660 acctgagcga gtccgcatcg accggatcgg aaaacctctc gacgtaccaa ttaattcgct 6720 gtctgcgagg gccagctgtt ggggtgagta ctccctctca aaagcgggca tgacttctgc 6780 gctaagattg tcagtttcca aaaacgagga ggatttgata ttcacctggc ccgcggtgat 6840 gcctttgagg gtggccgcgt ccatctggtc agaaaagaca atctttttgt tgtcaagctt 6900 gaggtgtggc aggcttgaga tctggccata cacttgagtg acaatgacat ccactttgcc 6960 tttctctcca caggtgtcca ctcccaggtc caactgcagg tcgagcatgc atctagggcg 7020 cccgcactag aggctcgagc catggctcca gtggctgtgt gggctgctct ggctgtgggc 7080 ctggaactgt gggccgctgc tcacgctctg cctgctcagg tggccttcac cccttatgcc 7140 cctgagcctg gctccacctg caggctgcgg gagtactacg accagaccgc ccagatgtgc 7200 tgctccaagt gctctcctgg ccagcacgcc aaggtgttct gcaccaagac ctccgacacc 7260 gtgtgcgact cttgcgagga ctccacctac acccagctct ggaactgggt gcccgagtgc 7320 ctgtcctgcg gctccagatg ctcctccgac caggtggaga cacaggcctg tacacgggag 7380 cagaatcgga tttgcacatg caggcctggc tggtactgcg ccctgtccaa gcaggaagga 7440 tgcaggctgt gcgcccctct gaggaagtgc agacctggct tcggcgtggc taggcctggc 7500 accgagacat ccgacgtcgt gtgcaagcct tgtgcccctg gcaccttctc caacaccaca 7560 tcctccaccg acatctgccg gcctcaccag atctgcaacg tggtggccat ccctggcaac 7620 gccagcatgg acgccgtgtg cacctccacc tcccccacca gatctatggc ccctggcgcc 7680 gtgcatctgc ctcagcctgt gtccacccgg tcccagcata cccagcctac acctgagccc 7740 tctaccgccc cttctacctc cttcctgctg cctatgggcc cttctcctcc agctgagggc 7800 tctaccggcg acgagcctaa gtcctgcgac aagacccaca cctgtccccc ctgccctgcc 7860 cctgaactgc tgggaggccc cagcgtgttc ctgttccccc caaagcccaa ggacaccctg 7920 atgatctccc ggacccccga agtgacctgc gtggtggtgg acgtgtccca cgaggaccct 7980 gaagtgaagt tcaattggta cgtggacggc gtggaagtgc acaacgccaa gaccaagccc 8040 agagaggaac agtacaactc cacctaccgg gtggtgtccg tgctgaccgt gctgcaccag 8100 gactggctga acggcaaaga gtacaagtgc aaggtgtcca acaaggctct gcctgccccc 8160 atcgaaaaga ccatctccaa ggccaagggc cagccccgcg agcctcaggt gtacaccctg 8220 cctccttccc gggaggagat gaccaagaac caggtgtccc tgacctgtct ggtcaagggc 8280 ttctacccct ccgatatcgc cgtggaatgg gagtccaacg gacagcccga gaacaactac 8340 aagaccaccc cccctgtgct ggactccgac ggctcattct tcctgtactc caagctgacc 8400 gtggacaagt cccggtggca gcagggcaac gtgttctcct gctccgtgat gcacgaggcc 8460 ctgcacaacc actacaccca gaagagctta tccctgtctc ctggcaagtg ataagcggcc 8520 gcccgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 8580 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 8640 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 8700 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 8760 atggcttctg aggcggaaag aaccagctgg ggctctaggg ggtatcccca cggagctcgc 8820 atccataata taactgtacc aggttttggt ttattacatg tgactgacgg cttcctatgc 8880 gtgctcagaa aacggcagtt gggcactgca ctgcccggtg atggtgccac ggtggctcct 8940 gccgccttct ttgatattca ctctgttgta tttcatctct tgttgccgat gaaaggatat 9000 aacagtctct gaggaaatac ttggtatttc ttctgatcag cgtttttata agtaatgttg 9060 aatattggat aaggctgtgt gtcctttgtc ttgggagaca aagcccacag caggtggtgg 9120 ttgggtggtg gcagctcagt gacaggagag gtttttttgc ctgttttttt tgttgttttt 9180 tttttttaag taaggtgttc ttttttctta gtaaaatttc tactggactg tatgttttga 9240 caggtcagaa acatttcttc aaaagaagaa ccttttggaa actgtacagc ccttttcttt 9300 cattcccttt ttgctttctg tgccaatgcc tttggttctg attgcattat ggaaaacgtt 9360 gatcggaact tgaggttttt atttatagtg tggcttgaaa gcttggatag ctgttgttac 9420 atgagatacc ttattaagtt taggccagct tgatgcttta ttttttttcc tttgaagtag 9480 tgagcgttct ctggtttttt tcctttgaaa ctggcgaggc ttagattttt ctaatgggat 9540 tttttacctg atgatctagt tgcataccca aatgcttgta aatgttttcc tagttaacat 9600 gttgataact tcggatttac atgttgtata tacttgtcat ctgtgtttct agtaaaaata 9660 tatggcattt atagaaatac gtaattcctg atttcctttt ttttttatct ctatgctctg 9720 tgtgtacagg tcaaacagac ttcactccta tttttattta tagaatttta tatgcagtct 9780 gtcgttggtt cttgtgttgt aaggatacag ccttaaattt cctagagcga tgctcagtaa 9840 ggcgggttgt cacatgggtt caaatgtaaa acgggcacgt ttgctgctgc cttcccagat 9900 ccaggacact aaactgcttc tgcaactgag gtataaatcg cttcagatcc caggaagtgt 9960 agatccacgt gcatattctt aaagaagaat gaatactttc taaaatatgt tggcatagga 10020 agcaagctgc atggatttat ttgggactta aattattttg gtaacggagt gcataggttt 10080 taaacacagt tgcagcatgc taacgagtca cagcatttat gcagaagtga tgcctgttgc 10140 agctgtttac ggcactgcct tgcagtgagc attgcagata ggggtggggt gctttgtgtc 10200 gtgttgggac acgctgccac acagccacct cccgaacata tctcacctgc tgggtacttt 10260 tcaaaccatc ttagcagtag tagatgagtt actatgaaac agagaagttc ctcagttgga 10320 tattctcatg ggatgtcttt tttcccatgt tgggcaaagt atgataaagc atctctattt 10380 gtaaattatg cacttgttag ttcctgaatc ctttctatag caccacttat tgcagcaggt 10440 gtaggctctg gtgtggcctg tgtctgtgct tcaatctttt aagcttgagc tcatggcgcg 10500 cctaggcctt gacggccttc cttcaattcg ccctatagtg agtcgtatta cgtcgcgctc 10560 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 10620 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgaaac 10680 gcccttccca acagttgcgc agcctgaatg gcgaatggga gcgccctgta gcggccactc 10740 aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 10800 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt 10860 acaatttag 10869 <210> 20 <211> 1710 <212> DNA <213> Artificial <220> <223> TNK ( DNA sequence corresponding to Seq ID No. 7) <400> 20 gaattccacc atggacgcca tgaagcgggg actgtgctgt gtgctgctgc tgtgtggcgc 60 cgtgttcgtg tcccctagcc aggaaatcca cgcccggttc agaaggggcg ccaggtccta 120 ccaagttatc tgccgggacg aaaagaccca gatgatctac cagcagcacc agtcctggct 180 gcggcccgtg ctgcggtcca accgggtgga gtactgctgg tgcaactccg gcagagccca 240 gtgccactcc gtgcctgtga agtcctgctc cgagcctaga tgcttcaacg gcggcacctg 300 tcagcaggcc ctgtacttct ccgacttcgt gtgccagtgc cctgagggct tcgccggcaa 360 gtgctgcgag atcgacaccc gggccacctg ttacgaggac cagggcatct cctaccgggg 420 caactggtct accgccgagt ctggcgccga gtgcaccaac tggcagtcct ccgccctggc 480 ccagaagcct tactctggca gacggcctga cgccatcaga ctgggcctgg gcaaccacaa 540 ctactgccgg aaccctgacc gggactccaa gccttggtgc tacgtgttca aggccggcaa 600 gtactcctcc gagttctgct ccacccctgc ctgctctgag ggcaactccg actgctactt 660 cggcaacggc tccgcctaca gaggcaccca ctccctgacc gagtccggcg cctcttgcct 720 gccttggaac tccatgatcc tgatcggcaa ggtgtacacc gcccagaacc cttccgctca 780 ggccctggga ctcggaaagc acaattattg tcgcaatccc gacggcgacg ccaaaccttg 840 gtgtcacgtg ctgaagaacc ggcggctgac atgggaatac tgcgacgtgc cttcctgctc 900 tacctgcggc ctgcggcagt actcccagcc tcagttccgg atcaagggcg gcctgttcgc 960 cgatatcgcc tcccaccctt ggcaggccgc catcttcgcc gctgctgccg cttctcctgg 1020 cgagagattc ctgtgcggcg gcatcctgat ctccagctgc tggattctgt ctgccgccca 1080 ctgcttccag gaacggttcc ctcctcacca cctgaccgtg atcctgggcc ggacctacag 1140 agtcgtgccc ggcgaggaag aacagaaatt cgaggtggag aagtatatcg tgcacaaaga 1200 gttcgacgac gacacctacg acaacgatat cgccctgctg cagctgaagt ccgactcctc 1260 cagatgcgcc caggaatcct ccgtcgttcg gaccgtgtgt ctgccacctg ccgacctgca 1320 gctgcctgac tggaccgagt gcgagctgtc cggctacggc aagcacgagg ccctgtcccc 1380 cttctactcc gagcggctga aagaagctca tgtacggctg tacccctcta gccggtgcac 1440 ctcccagcat ctgctgaacc ggaccgtgac cgacaacatg ctgtgtgccg gcgacaccag 1500 atctggcggc cctcaggcca acctgcacga cgcctgccag ggcgatagtg gcggacctct 1560 cgtgtgcctc aacgacggca ggatgaccct cgtgggcatc atctcttggg gcctgggctg 1620 tggccagaaa gacgtgcctg gcgtgtacac caaagtgacc aactacctgg actggatcag 1680 ggacaacatg cggccttgat gagcggccgc 1710 <210> 21 <211> 601 <212> DNA <213> Artificial <220> <223> Darbepoetin (DNA sequence corresponding to Seq ID No. 9) <400> 21 ctcgagccac catgggggtg cacgaatgtc ctgcctggct gtggcttctc ctgtccctgc 60 tgtcgctccc tctgggcctc ccagtcctgg gcgccccacc acgcctcatc tgtgacagcc 120 gagtcctgga gaggtacctc ttggaggcca aggaggccga gaatatcacg acgggctgta 180 atgaaacctg cagcttgaat gagaatatca ctgtcccaga caccaaagtt aatttctatg 240 cctggaagag gatggaggtc gggcagcagg ccgtagaagt ctggcagggc ctggccctgc 300 tgtcggaagc tgtcctgcgg ggccaggccc tgttggtcaa ctcttcccag gtgaacgaga 360 ccctgcagct gcatgtggat aaagccgtca gtggccttcg cagcctcacc actctgcttc 420 gggctctggg agcccagaag gaagccatct cccctccaga tgcggcctca gctgctccac 480 tccgaacaat cactgctgac actttccgca aactcttccg agtctactcc aatttcctcc 540 ggggaaagct gaagctgtac acaggggagg cctgcaggac aggggacaga tgagcggccg 600 c 601 <210> 22 <211> 1489 <212> DNA <213> Artificial <220> <223> Etanercept (DNA sequence corresponding to Seq ID No. 11) <400> 22 ctcgagccat ggctccagtg gctgtgtggg ctgctctggc tgtgggcctg gaactgtggg 60 ccgctgctca cgctctgcct gctcaggtgg ccttcacccc ttatgcccct gagcctggct 120 ccacctgcag gctgcgggag tactacgacc agaccgccca gatgtgctgc tccaagtgct 180 ctcctggcca gcacgccaag gtgttctgca ccaagacctc cgacaccgtg tgcgactctt 240 gcgaggactc cacctacacc cagctctgga actgggtgcc cgagtgcctg tcctgcggct 300 ccagatgctc ctccgaccag gtggagacac aggcctgtac acgggagcag aatcggattt 360 gcacatgcag gcctggctgg tactgcgccc tgtccaagca ggaaggatgc aggctgtgcg 420 cccctctgag gaagtgcaga cctggcttcg gcgtggctag gcctggcacc gagacatccg 480 acgtcgtgtg caagccttgt gcccctggca ccttctccaa caccacatcc tccaccgaca 540 tctgccggcc tcaccagatc tgcaacgtgg tggccatccc tggcaacgcc agcatggacg 600 ccgtgtgcac ctccacctcc cccaccagat ctatggcccc tggcgccgtg catctgcctc 660 agcctgtgtc cacccggtcc cagcataccc agcctacacc tgagccctct accgcccctt 720 ctacctcctt cctgctgcct atgggccctt ctcctccagc tgagggctct accggcgacg 780 agcctaagtc ctgcgacaag acccacacct gtcccccctg ccctgcccct gaactgctgg 840 gaggccccag cgtgttcctg ttccccccaa agcccaagga caccctgatg atctcccgga 900 cccccgaagt gacctgcgtg gtggtggacg tgtcccacga ggaccctgaa gtgaagttca 960 attggtacgt ggacggcgtg gaagtgcaca acgccaagac caagcccaga gaggaacagt 1020 acaactccac ctaccgggtg gtgtccgtgc tgaccgtgct gcaccaggac tggctgaacg 1080 gcaaagagta caagtgcaag gtgtccaaca aggctctgcc tgcccccatc gaaaagacca 1140 tctccaaggc caagggccag ccccgcgagc ctcaggtgta caccctgcct ccttcccggg 1200 aggagatgac caagaaccag gtgtccctga cctgtctggt caagggcttc tacccctccg 1260 atatcgccgt ggaatgggag tccaacggac agcccgagaa caactacaag accacccccc 1320 ctgtgctgga ctccgacggc tcattcttcc tgtactccaa gctgaccgtg gacaagtccc 1380 ggtggcagca gggcaacgtg ttctcctgct ccgtgatgca cgaggccctg cacaaccact 1440 acacccagaa gagcttatcc ctgtctcctg gcaagtgata agcggccgc 1489 <210> 23 <211> 365 <212> DNA <213> Artificial <220> <223> FSH alpha (DNA sequence corresponding to Seq ID No. 13) <400> 23 ctcgagccac catggactac taccggaagt acgccgccat cttcctggtg accctgtccg 60 tgttcctgca cgtgctgcac tctgcccctg acgtgcagga ctgccctgag tgcaccctgc 120 aggaaaaccc attcttcagc cagcctggcg cccctatcct gcagtgcatg ggctgctgct 180 tctccagagc ctaccctacc cctctgcggt ccaagaaaac catgctggtg cagaaaaacg 240 tgacctccga gtctacctgc tgcgtggcca agtcctacaa cagagtgacc gtgatgggcg 300 gcttcaaggt ggagaaccac accgcctgcc actgctctac ctgctactac cacaagtcct 360 gatga 365 <210> 24 <211> 415 <212> DNA <213> Artificial <220> <223> FSH beta (DNA sequence corresponding to Seq ID No. 15) <400> 24 cccgggccac catgaagacc ctgcagttct tcttcctgtt ctgctgctgg aaggccatct 60 gctgcaactc ttgcgagctg accaacatca caatcgccat cgagaaagag gaatgccggt 120 tctgcatctc catcaacacc acttggtgcg ccggctactg ctacacccgc gacctggtgt 180 acaaggaccc tgcccggcct aagatccaga aaacctgcac cttcaaagaa ctggtgtacg 240 agacagtgcg ggtgccaggc tgcgctcacc acgccgactc cctgtacacc taccctgtgg 300 ccacccagtg ccactgcggc aagtgcgact ccgactccac cgactgtacc gtgcggggcc 360 tgggcccttc ttactgctcc ttcggcgaga tgaaggaatg atgaccagcg gccgc 415

Claims

흥미있는 유전자에 실시가능하게 결합된 프로모터, 발현 증진 요소(expression enhancement elements), TPL, VA I 및 II 유전자 또는 이의 변이체들, 번역 종결자(translation terminator) 및 항생물질 마커(antibiotic marker)를 포함하는 발현 벡터로서, 상기 발현 증진 요소는 염색질 부착 영역(chromatin attachment region)인, 발현 벡터.
제1항에 있어서,
a) 인트론 또는 이의 변이체들
b) 임의적으로 내부의 리보솜의 결합 부위(Internal ribosomal binding site) 또는 이의 변이체들,
을 더 포함하는, 발현 벡터.
제1항에 있어서,
상기 염색질 부착 영역은, 적절한 매트릭스 부착 영역(matrix attachment region)인, 발현 벡터.
제1항에 있어서,
상기 염색질 부착 영역은, 적절한 스캐폴드 부착 영역(scaffold attachment region)인, 발현 벡터.
제3항에 있어서,
상기 매트릭스 부착 영역은, 초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, cLysMARs, 마우스 T 세포 수용체 TCRα, 랫 유전자자리 조절 부위(Rat locus control region), β-글로빈 MAR로부터 선택된, 발현 벡터.
제3항 또는 제5항에 있어서,
상기 매트릭스 부착 영역은 cLysMARs인, 발현 벡터.
제5항에 있어서,
상기 cLysMARs는, 서열 id no. 5 에 나타낸 뉴클레오티드 서열을 갖는, 발현 벡터.
제1항에 있어서,
상기 프로모터는, CMV 프로모터, SV40 프로모터, 아데노바이러스 프로모터, 베타 액틴 프로모터(Beta actin promoter), 메탈로티오닌 프로모터(metallothionin Promoters), 또는 그 밖의 원핵세포 또는 진핵세포 바이러스 프로모터로 이루어진 군으로부터 선택된, 발현 벡터. 바람직하게 CMV 프로모터.
제2항에 있어서,
상기 내부의 리보솜의 결합 부위는 뇌심근염 바이러스 IRES인, 발현 벡터.
제2항 및 제9항에 있어서,
상기 내부의 리보솜의 결합 부위는 서열 id no. 14에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
제1항에 있어서,
상기 VA I 및 II 유전자는, 서열 id no. 3에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
제1항에 있어서,
상기 TPL은, 서열 id no. 2에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
제2항에 있어서,
상기 키메라 인트론(chimeric Intron)은 서열 id no. 1에 나타낸 뉴클레오티드 서열을 갖는, 발현 벡터.
제1항에 있어서,
흥미있는 유전자는, 조직 플라스미노겐 활성인자(tissue plasminogen activator), TNK-TPA, 다베포이에틴(Darbepoietin), 에리스로포이에틴(Erythropoietin), 인슐린, GCSF, 인터류킨(Interleukin), 종양 괴사 인자(Tumor necrosis factor), 인터페론(Interferon), TNFR-IgGFc, 리툭시맙(rituximab), 베바시주맙(bevacizumab), 아달리무맙(adalimumab), 트라스투주맙(trastuzumab)으로부터 선택된 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 증식 인자(Platelet derived growth factor), FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, MYT-2, NF-κB 억제 인자 NRF, AML1/RUNX1, Gtx 호메오도메인 단백질과 같은 전사 인자, 진핵생물 개시 인자 4G(elF4G)a(Eukaryotic initiation factor 4G(elF4G)a), 진핵생물 개시 인자 4Gl(elF4Gl)a, 사멸 관련 단백질 5(Death associated protein 5, DAP5)로부터 선택된 번역 인자(translation factor), c-myc, L-myc, Pim-1, 단백질 키나아제 p58PITSLRE, p53과 같은 종양유전자, 여포 자극 호르몬(Follicle stimulating hormone), 융모성 생식선 자극호르몬(Human Chorionic Gonadotropin), 인간 황체형성 호르몬(Human Luteinizing Hormone)으로부터 선택된 생식선 자극 호르몬으로부터 선택된 호르몬, 및 면역글로불린 중쇄 결합 단백질(immunoglobulin heavy chain binding protein, BiP), 열 충격 단백질 70(Heat shock protein 70), 미토콘드리아의 H+-ATP 생성효소의 β-서브유닛(subunit), 오르니틴 탈카르복실화효소(Ornithine decarboxylase), 코넥신 32 및 43(connexins 32 and 43), HIF-1a, APC 로부터 선택된, 단백질 및 펩티드 및 이의 유사체를 코딩하는, 발현 벡터.
제1항에 있어서,
상기 항생물질 마커는, 카나마이신(kanamycin), 퓨로마이신(puromycin), 히그로마이신(hygromycin) 및 네오마이신(neomycin)으로부터 선택된, 발현 벡터.
제1항 내지 제15항 중 어느 한 항에 있어서,
상기 cLysMARs은 상기 발현 카세트(expression cassette)의 어느 한 쪽의 측면(flank)에서 클론되는, 발현 벡터.
제1항 및 제2항 중 어느 한 항에 있어서,
a) 프로모터 또는 이의 변이체,
b) VA I 및 II 유전자 또는 이의 변이체,
c) TPL 또는 이의 변이체,
d) 키메라 인트론(chimeric Intron) 또는 이의 변이체,
e) 항생물질 마커,
f) 매트릭스 부착 영역,
g) 임의적으로 내부의 리보솜의 결합 부위,
h) 소 성장 호르몬 폴리아데닐화 서열
에 실시가능하게 결합된 흥미있는 유전자를 포함하는, 발현 벡터.
제1항 내지 제17항 중 어느 한 항에 있어서,
접근 번호(accession number) MTCC 5655를 갖는, 발현 벡터.
제1항 내지 제18항 중 어느 한 항에 있어서,
접근 번호 MTCC 5656을 갖는, 발현 벡터.
제1항 내지 제19항 중 어느 한 항에 있어서,
접근 번호 MTCC 5657을 갖는, 발현 벡터.
제1항 내지 제20항 중 어느 한 항의 벡터로 형질전환된 숙주 세포.
제20항에 있어서,
CHO 또는 BHK 세포주 또는 이들의 유도체들(derivatives)로부터 선택된, 숙주 세포.
a) 제1항 내지 제22항 중 어느 한 항의 발현 벡터를 구성하고;
b) 흥미있는 단백질 또는 펩티드를 발현시키는 적절한 숙주 세포에서 상기 발현 벡터의 형질전환(transformation);
을 포함하는, 단백질들 및 펩티드들 및 이의 변이체들의 생산을 위한 방법.
a) 제1항 내지 제23항 중 어느 한 항의 발현 벡터를 구성하고;
b) 적절한 숙주 세포에서 상기 발현 벡터의 트랜스펙션(transfection);
c) 흥미있는 단백질 또는 펩티드를 발현하는 적절한 트랜스펙션된 숙주 세포를 선별하고;
d) 단계 (c)에서 선별된 적절한 숙주 세포는 제1항 내지 제23항 중 어느 한 항의 발현 벡터로 더 재트랜스펙션되고(retransfected);
e) 흥미있는 단백질 또는 펩티드를 발현하는 적절한 재트랜스펙션된 숙주 세포;
를 포함하는, 단백질들 및 펩티드들 및 이의 변이체들의 생산을 위한 방법.
제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5655를 갖는, 방법.
제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5656을 갖는, 방법.
제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5657을 갖는, 방법.
제23항 및 제24항에 있어서,
상기 단백질 및 펩티드는, 조직 플라스미노겐 활성인자, TNK-TPA, 다베포이에틴, 에리스로포이에틴, 인슐린, GCSF, 인터류킨, 종양 괴사 인자, 인터페론, TNFR-IgGFc, 리툭시맙, 베바시주맙, 아달리무맙, 트라스투주맙과 같은 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 성장 인자(Platelet derived growth factor), FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, 여포 자극 호르몬, 융모성 생식선 자극호르몬, 인간 황체형성 호르몬으로부터 선택된 생식선 자극 호르몬과 같은 호르몬으로부터 선택된, 방법.