KR101202498B1

KR101202498B1 - 폴리펩티드 생성 세포

Info

Publication number: KR101202498B1
Application number: KR1020087027867A
Authority: KR
Inventors: 조세프 엔들; 에르하르트 코페츠키; 올리버 플로에트너; 우르술라 슈바르쯔; 게오르그 티에펜탈러
Original assignee: 에프. 호프만-라 로슈 아게
Priority date: 2006-05-17
Filing date: 2007-05-15
Publication date: 2012-11-16
Also published as: ES2543629T3; EP2027273B1; EP2208792A3; US20090311725A1; MX2008013514A; EP2208792B1; AU2007251766B2; AU2007251766A1; BRPI0712073B1; CA2651478A1; JP2009537124A; EP2208792A2; US20130109058A1; CN101410525A; CN101410525B; BRPI0712073B8; US8541204B2; KR20090003327A; IL193721A0; ES2573027T3

Abstract

본 발명은 a) 인 프레임 번역 정지 코돈(in frame translational stop codon) 없이 이종 폴리펩티들 코딩하는 제1 핵산, b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, c) i) 경막 도메인의 적어도 단편 또는 ii) GPI-고착자(anchor)에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산에 관한 것이다.

Description

폴리펩티드 생성 세포{POLYPEPTIDE PRODUCING CELLS}

본 발명은 폴리펩티드 제조 분야에 관한 것이다. 본원은 택일적으로 스플라이싱될 수 있는(alternatively spliceable) 핵산을 포함하는 핵산; 이 핵산을 포함하는 세포; 이종 폴리펩티드를 코딩하는 제1 핵산, 택일적으로 스플라이싱될 수 있는 핵산을 포함하는 제2 핵산, 및 경막 도메인의 적어도 단편 또는 글리코실포스파티딜이노시톨(GPI)-고착자(anchor)에 대한 신호 펩티드를 코딩하는 제3 핵산을 포함하는 핵산을 사용하여 이종 폴리펩티드를 발현하는 세포를 단리하는 방법; 및 이종 폴리펩티드의 제조 방법을 개시한다.

재조합 폴리펩티드의 제조를 위한 발현 시스템은 당업계에 잘 공지되어 있고 예컨대, 문헌(Marino, M.H., Biopharm. 2 (1989) 18-33; Goeddel, D.V., et al, Methods Enzymol. 185 (1990) 3-7; Wurm, F., and Bernard, A., Curr. Opin. Biotechnol. 10 (1999) 156-160)에 기재되어 있다. 약학 분야에서 사용되는 폴리펩티드 및 단백질의 제조를 위해, 바람직하게는 포유동물 숙주 세포, 예컨대, CHO 세포, BHK 세포, NS0 세포, Sp2/0 세포, COS 세포, HEK 세포 등이 사용된다. 폴리펩티드를 코딩하는 핵산은 바람직하게는 핵산, 예컨대, 발현 벡터 내에 포함되어 숙주 세포 내로 도입된다. 발현 벡터의 필수 요소들은 예를 들어, 대장균(Escherichia coli)의 경우 복제 기점 및 선별 마커, 진핵 선별 마커, 및 프로모터, 구조 유전자 및 전사 종결서열(폴리아데닐화 신호를 포함함)를 각각 포함하는, 원하는 구조 유전자(들)의 발현을 위한 하나 이상의 발현 카세트를 포함하는 원핵 플라스미드 증폭 단위체이다. 포유동물 세포에서의 일시적인 발현의 경우, 포유동물 세포의 복제 기점, 예컨대, SV40 Ori 또는 EBV의 OriP가 포함될 수 있다. 기본(constitutive) 프로모터 또는 유도성 프로모터를 프로모터로서 선택할 수 있다. 최적화된 전사를 위해서는, 코작(Kozak) 서열이 5' 비번역 영역(5' UTR) 내에 포함될 수 있다. mRNA 프로세싱, 특히 전사 종결 및 전구-메신저 RNA(전구-mRNA) 스플라이싱의 경우, 구조 유전자의 구성(엑손-인트론-구성)에 따라 mRNA 스플라이싱 신호 및 폴리아데닐화 신호가 포함될 수 있다.

유전자의 발현은 일시적 또는 영구적 발현으로서 수행된다. 원하는 폴리펩티드는 폴리펩티드가 세포로부터 세포외 배지로 수송/분비되는 데 필수적인 N-말단 연장부(extension)(신호 서열로도 공지되어 있음)를 포함하는 분비 폴리펩티드 또는 세포질 폴리펩티드일 수 있다.

폴리펩티드의 대규모 제조를 위해서는, 고 생산성 세포주가 확립되어야 한다. 숙주 세포주, 예컨대, CHO 세포, BHK 세포, NS0 세포, Sp2/0 세포, COS 세포, HEK 세포의 형질감염 후, 일반적으로 상이한 특성을 가진 다수의 클론이 수득되는데, 이는 예를 들어, 일시적으로 형질감염되거나 안정하게 삽입된 플라스미드로부터 발현된 폴리펩티드의 다양성 때문이다. 선별을 위해서는, 세포 내로 도입된 핵산이 선별 마커, 예컨대, 독성 물질에 대한 내성을 부여하는 유전자를 추가로 보유한다.

형질감염 후, 적절한 선별 배지에서의 생장에 의해 고 생산성 클론이 단리되어야 한다. 이것은 시간이 소요되고 결과적으로 비용이 소요된다. 이 문제점을 해결하기 위해 여러 방법이 개발되어 왔다.

이 방법들 중 하나는 유전자 증폭이다. 유전자 증폭에서, 디하이드로폴레이트 리덕테이즈(dihydrofolate reductase; DHFR)가 결핍된 세포를, DHFR 단백질의 발현을 위한 제1 발현 카세트 및 원하는 이종 폴리펩티드의 발현을 위한 제2 발현 카세트를 포함하는 벡터/플라스미드로 형질감염시킨다. 글라이신, 하이포잔틴 및 티미딘이 고갈된 배양 배지를 사용함으로써 선별 생장 조건을 확립한다. 증폭을 위해서는, DHFR 억제제인 메토트렉세이트(MTX)를 첨가한다(Kaufman, R.J., et al., J. Mol. Biol. 159 (1982) 601-621; 미국 특허 제4,656,134호).

별법으로, 레포터 분자, 예컨대, 클로람페니콜-아세틸-트랜스퍼레이즈, 루시퍼레이즈, 녹색 형광 단백질 또는 베타-갈락토시데이즈를, 고 생산성 세포주로 발현시키고자 하는 이종 폴리펩티드에 융합하여 간접적인 선별 마커로서 사용할 수 있다. 선별은 첨가된 외래 기질 또는 보조인자의 존재 하에 일어난다.

고 생산성 클론을 확인하는 추가 방법은 선별 마커 유전자, 및 내부 리보좀 도입 부위(IRES)를 통해 이종 폴리펩티드를 코딩하는 구조 유전자의 연결된 전사이다. 이러한 방법을 이용하여 이종 폴리펩티드의 발현을 선별 마커의 발현과 상호관련지을 수 있다.

인간 면역글로불린은 전문화된 림프구, 즉 B 세포에 의해 생산된다. 이 세포는 면역글로불린(sIg)을 분비할 뿐만 아니라 그의 외부 세포막 상에 원형질-막-결합 면역글로불린(mIg)로서 면역글로불린을 제시한다. 이 mIg는 면역반응의 개시에 있어서 중요한 역할을 수행한다. 제시된 mIg는 그의 상응하는 항원의 세포 수용체 기능을 가진다.

1980년부터 sIg 및 mIg의 유래를 다루는 논문들이 공개되었다. 문헌(Early, P., et al., Cell 20 (1980) 313-319)에는 마우스에서 면역글로불린의 중쇄를 코딩하는 mRNA의 2가지 유형이 단일 면역글로불린 μ-유전자의 동일한 일차 전사체로부터 유래한다고 기재되어 있다. sIg 및 mIg 형태의 형성은 중쇄 전구-mRNA의 택일적 스플라이싱으로부터 기인한다. sIg 이소폼(isoform)의 경우, 면역글로불린의 도메인을 코딩하는 모든 엑손, 및 C-말단 도메인을 코딩하는 엑손 다음에 위치한 인트론이 mRNA에 존재하고, 인트론 내 정지 코돈의 다운스트림에 위치한 폴리아데닐화 신호가 일차 전사체의 절단 및 폴리아데닐화를 위해 사용된다. mIg 이소폼의 경우, 분비된 형태의 C-말단 도메인(즉, C_H3 또는 C_H4)을 코딩하는 엑손 다음에 위치한 택일적 5' 스플라이스 공여 부위가 경막 도메인을 코딩하는 엑손 M1 및 M2의 다운스트림과 불변 영역을 연결한다. 이 경우, sIg 형태의 인접한 인트론 내 폴리아데닐화 신호뿐만 아니라 말단 아미노산, 분비된 형태의 정지 코돈을 코딩하는 서열이 인트론과 함께 스플라이싱에 의해 제거된다.

예를 들어, sIg 중쇄 형태를 코딩하는 mRNA와 mIg 중쇄 형태를 코딩하는 mRNA의 비는 10:1 내지 100:1이다. 이 비는 주로 전구-mRNA 스플라이싱 과정 동안 확립된다. 번역 및 번역-후 조절 기작은 적은 정도로만 기여한다(예컨대, 문헌(S. D., et al., Immun. Cell Biol. 79 (2001) 472-481) 참조).

세포의 원형질-막에 결합된 면역글로불린은 그의 분비된 유사체와 동일한 아미노산 서열 및 2차 구조를 가진다. 차이는 경막 도메인을 포함하는 sIg의 중쇄의 C-말단 연장부이다. 이 경막 도메인은 일반적으로 약 40 내지 약 75개 아미노산 잔기 길이를 가진다. 뮤린 및 인간 면역글로불린의 경우, 경막 도메인은 하기 3개의 상이한 구조 영역으로 더 분류될 수 있다: 13 내지 67개 아미노산 잔기로 이루어진 N-말단 세포외 영역, 25개 아미노산 잔기로 이루어진 중심 보존 경막 스트레치, 및 3 내지 28개 아미노산 잔기로 이루어진 C-말단 세포질 영역(Major, J.G., et al., Mol. Immunol. 33 (1996) 179-187).

증폭가능한 선별 유전자, 형광 단백질 유전자, 및 전사와 번역 연결을 최적화하는 방식으로 원하는 생성물을 코딩하는 유전자를 포함하는 발현 벡터가 국제특허출원 공개 제WO 01/04306호에 기재되어 있다. 국제특허출원 공개 제WO 01/38557호에는 2가지 이상의 원하는 펩티드 또는 단백질을 발현하는 세포를 확인하기 위한 다중 형질전환/형질감염 세포의 검색 방법이 기재되어 있다. 이 2가지 펩티드/단 백질은 IRES를 통해 형광 마커 유전자에 연결된다.

영상화 마커 형질전환유전자(transgene)를 포함하는 형질전환 동물 및 세포는 미국 특허출원 공개 제2003/0033616호에 기재되어 있다. 미국 특허출원 공개 제2005/0032127호에는 온화한 조건 하에 형광-현미경 검출 방법을 이용하여 세포 또는 세포 배양물의 혼합물로부터 단일 생존 세포를 특이적 생산 능력에 대해 비-침윤적으로 선별하는 방법이 기재되어 있다. 분비 단백질을 생성하는 세포를 확인하고 단리하는 방법은 미국 특허출원 공개 제2002/0168702호에 기재되어 있다.

햄스터 프로모터에 기능적으로 연결되어 있는, 원하는 단백질을 코딩하는 유전자, 형광 단백질을 코딩하는 유전자, 및 바람직하게는 증폭될 수 있는 선별 마커 유전자로 이루어진 발현 벡터가 미국 특허출원 공개 제2004/0148647호에 기재되어 있다.

도 1: sIgG/mIgG 발현 벡터 pmIgG-A(A), sIgG/mIgG 발현 벡터 pmIgGΔ-A(B) 및 sIgG 발현 벡터 pIgG-A(C)의 플라스미드 카드. 도시된 벡터 요소들은 상세히 후술되어 있다.

도 2: 감마 (γ) 쇄 발현 카세트의 엑손 인트론 구조의 개략적 도시.

A: 발현 벡터 pmIgG-A 내의 감마 1 쇄 불변 영역의 구조. 약 7.2 kb DNA 단편이 흑색 선으로 표시되어 있다. 엑손은 전술한 명칭이 기재되어 있는 투명한 상 자로 표시되어 있다. IgG의 분비 형태[p(A)_s] 및 막 결합 형태[p(A)_M]의 폴리아데닐화 신호의 위치는 흑색 막대로 표시되어 있다. 인트론과 3' 비번역 영역(3' UTR)의 번호는 도표 아래에 표시되어 있다. 인트론 6 내 SphI 제한 부위 및 3' UTR(가로 내) 내 돌연변이된 SphI의 상대적인 위치가 표시되어 있다.

B: A에서 도시된 발현 벡터 pmIgGΔ-A 내 약 4.8 kb 하이브리드 γ1 - γ3 - γ4 쇄 불변 영역의 구조. 도표는 3개의 면역글로불린 중쇄 γ 유전자 좌위(IGHGl, IGHG3 및 IGHG4)로부터 유래된 영역도 보여준다.

도 3: mIgG를 발현하는 클론 내에서 IgG 분비와 세포 표면 신호의 상관관계. 플라스미드 pmIgG-A(좌측), pmIgGΔ-A(중앙) 또는 대조군인 pIgG-A(우측)로 형질감염된 Sp2/0-Agl4 세포의 6개 독립 클론을 소정의 조건 하에 48시간 동안 배양한다. 원형질막에 결합된 IgG의 양의 척도인, 유세포분류(flow cytometry)에서의 평균 형광 강도는 회색 막대로 표시되어 있다. 상응하는 세포 배양물 상청액 중의 분비 IgG의 농도는 흑색 다이아몬드로 표시되어 있다.

도 4: FACS밴티지(FACSVantage) 유세포분류기 상에서의 세포 분류에 사용되는 전형적인 FL1/FSC 도트 플롯(BD). 게이트 R1은 상기 FSC/SSC 도트 플롯에 의해 게이팅된 도시된 생존 세포 집단의 5.7%를 포함한다. R1에 속하는 세포는 분류 과정 동안 수거된다.

도 5: 비생성속도의 측정. 클론 5B11, 9B3 및 J5-H3을 스피너 플라스크 내에서 92시간 동안 배양하였다.

A: 세포 생장. 스피너 배양 개시 후 표시된 시점에서 각 클론의 세포수를 CASY 세포 계수기로 측정하였다.

B: (A에서와 같이) 표시된 시점에서, 세포 배양물 상청액 중의 IgG 농도를 단백질 A 친화 크로마토그래피로 측정하였다. C: 비생성속도. 막대 차트는 첫 69시간 내에서의 세포수 및 IgG 측정치로부터 계산된 각 클론에 대한 평균 비생성속도를 보여준다(표 2를 참조하고 보다 상세한 사항은 본문을 참조함). 표준 편차는 오차 막대로 표시되어 있다.

도 6: 면역형광 현미경. 분비 sIgG 및 막 결합 mIgG를 분비하는 클론 5B11(사진 1 및 4), 분비 sIgG만을 발현하는 클론 J5-H3(사진 2 및 5), 또는 형질감염되지 않은 Sp2/0-Agl4 세포(사진 3 및 6)를 세포 표면 상의 IgG(사진 1 내지 3) 또는 세포내 IgG(사진 4 내지 6)에 대해 표지하고, 액시오포토(Axiophot) 형광 현미경에서 사진을 기록하였다.

도 7: 노던 블롯에 의한 mRNA의 분석.

A: 프로브 A(레인 1 내지 3) 또는 프로브 B(레인 4 내지 6)로 표지된 [(α-³²P]와 혼성화된 노던 블롯의 오토래디오그래피(autoradiography). 각 레인에서, 클론 5B11(레인 1 및 4), 클론 J5-H3(클론 2 및 5) 또는 형질감염되지 않은 Sp2/0-Agl4 세포(레인 3 및 6)로부터 단리된 10 ㎍의 전체 RNA를 변성 아가로스 겔 전기영동으로 분리하고 나일론 막으로 옮겼다.

B: 막 결합 mIgG 또는 분비 sIgG의 중쇄를 코딩하는 2가지 mRNA 이소폼의 개 략적 도시. 엑손은 박스로 표시되어 있다. 프로브 A 및 B에 상보적인 영역은 흑색 막대로 표시되어 있다.

도 8: IgG 중쇄 이소폼의 면역블롯 분석. 클론 5B11(레인 1 및 4), 클론 J5-H3(클론 2 및 5) 또는 형질감염되지 않은 Sp2/0-Agl4 세포(레인 3 및 6)를 알칼리성 카보네이트 추출법(실시예 참조)에 따라 추출하였다. 내재(integral) 막 단백질을 함유하는 막 분획의 면역글로불린(레인 1 내지 3), 또는 세포의 가용성 내용물을 주로 함유하는 SN 분획의 면역글로불린(레인 4 내지 6)을 단백질 A 침강 분석으로 정제하고 변성 SDS 폴리아크릴아미드 겔 전기영동으로 분리하였다. 호스라디쉬 퍼록시데이즈에 커플링된 이차 항체를 사용한 블롯팅 및 표지 후, 중쇄를 화학발광 반응으로 가시화하였다. 분비된 sIgG 중쇄(sIgG HC) 및 막 결합 mIgG 중쇄(mIgG HC)가 표시되어 있다. 하부 패널은 상부 패널에서의 블롯 절편의 단시간 노출을 표시한다.

도 9: 노던 블롯에 의한 mRNA의 분석. 도 7B에 나타낸 바와 같은, [α-³²P]로 표지된 프로브 A(좌측 패널) 또는 프로브 B(우측 패널)와 혼성화된 노던 블롯의 오토래디오그래피. 각 레인에서, 클론 1A1, 1B6, 1C5 또는 1D1로부터 단리된 10 ㎍의 전체 RNA(레인 1 내지 4), 및 클론 1D6, 2D6, KO2 또는 KO6으로부터 단리된 10 ㎍의 전체 RNA(레인 6 내지 9)를 변성 아가로스 겔 전기영동으로 분리하고 나일론 막으로 옮겼다. 클론 "27"은 sIgG만을 발현하고 대조군용으로 추가되었다(레인 5 및 10). mIgG 및 sIgG 이소폼의 중쇄 mRNA가 표시되어 있다.

도 10: sIgG/IgG-GPI 발현 벡터 pIgG-GPI-B의 플라스미드 카드.

본 발명은

a) 인 프레임 번역 정지 코돈(in frame translation stop codon) 없이 이종 단백질 폴리펩티드를 코딩하는 제1 핵산,

b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위에 의해 종결되는 제2 핵산, 및

c) i) 경막 도메인의 적어도 단편 또는 ii) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산

을 5'에서 3' 방향으로 포함하는 핵산을 포함한다.

본 발명의 추가 측면은 본 발명의 핵산을 포함하는 진핵세포에 적합한 벡터 및 본 발명에 따른 하나 이상의 핵산을 포함하는 진핵세포이다.

또한, 본 발명은 이종 폴리펩티드를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 이종 폴리펩티드 및 원형질막-결합 이종 폴리펩티드를 생성하는, 단계; 및

c) 원형질막-결합 이종 폴리펩티드를 가진 세포를 이종 폴리펩티드를 발현하는 세포로서 선별하는 단계

를 포함하는 방법을 포함한다.

한 실시양태에서, 본 발명의 방법은 면역글로불린을 발현하는 진핵세포를 선별하는 방법으로서,

a) i) 인 프레임 번역 정지 코돈 없이 적어도 면역글로불린 중쇄의 단편을 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 중쇄 및 원형질막-결합 면역글로불린 중쇄를 생성하는, 단계; 및

c) 원형질막-결합 면역글로불린 중쇄를 가진 세포를 면역글로불린을 발현하는 세포로서 선별하는 단계

를 포함하는 방법이다.

또한, 본 발명은

a) 진핵세포를 제공하고,

b) 본 발명에 따른 핵산으로 상기 진핵세포를 형질감염시키고,

c) 상기 핵산의 발현에 적합한 조건 하에 형질감염 세포를 배양하고,

d) 상기 형질감염 세포의 배양 배지 또는 세포질로부터 폴리펩티드를 회수함으로써 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 제조하는 방법을 포함한다.

또한, 본 발명은

a) 제1 다중 클로닝 부위,

b) 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산으로서, i) 번역 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 전구-mRNA 프로세싱 동안 기본적으로 제거되지 않는 핵산,

c) 제2 다중 클로닝 부위

를 5'에서 3' 방향으로 포함하는 핵산을 포함한다.

또한, 본 발명은 본 발명에 따른, 기본적으로 제거되지 않은 핵산을 포함하는 벡터를 포함한다.

본 발명은 이종 폴리펩티드 또는 단백질을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드 또는 단백질을 코딩하는 제1 핵산, ii) 5' 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드 또는 단백질로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 이종 폴리펩티드 또는 단백질 및 원형질막-결합 이종 폴리펩티드 또는 단백질을 생성하는, 단계; 및

c) 원형질막-결합 이종 폴리펩티드 또는 단백질을 가진 세포를 이종 폴리펩티드 또는 단백질을 발현하는 세포로서 선별하는 단계

를 포함한다.

본 발명을 실시하기에 유용한 방법 및 기법은 예컨대, 문헌(Ausubel, F.M. (ed.), Current Protocols in Molecular Biology, Volumes I to III (1997); Glover, N.D., and Hames, B.D., ed., DNA Cloning: A Practical Approach, Volumes I and II (1985), Oxford University Press; Freshney, R.I. (ed.), Animal Cell Culture - a practical approach, IRL Press Limited (1986); Watson, J.D., et al., Recombinant DNA, Second Edition, CHSL Press (1992); Winnacker, EX., From Genes to Clones; N.Y., VCH Publishers (1987); Celis, J., ed., Cell Biology, Second Edition, Academic Press (1998); Freshney, R.I., Culture of Animal Cells: A Manual of Basic Technique, second edition, Alan R. Liss, Inc., N.Y. (1987))에 기재되어 있다.

재조합 DNA 기법을 이용하여 한 폴리펩티드의 무수한 유도체를 생성할 수 있다. 이러한 유도체는 예를 들어, 치환, 변경, 교환, 결실 또는 삽입에 의해 개개의 또는 여러 아미노산 위치 내에서 변형될 수 있다. 변형 또는 유도체화는 예를 들어, 부위 지정 돌연변이유발을 이용하여 수행할 수 있다. 이러한 변형은 당업자에 의해 용이하게 수행될 수 있다(예를 들어, 문헌(Sambrook, J., et al., Molecular Cloning: A laboratory manual (1999) Cold Spring Harbor Laboratory Press, New York, USA; Hames, B.D., and Higgins, S.G., Nucleic acid hybridization - a practical approach (1985) IRL Press, Oxford, England).

본 발명의 범위 내에서, 사용된 용어들 중 일부는 하기와 같이 정의된다.

본 명세서에서 사용된 "핵산"은 폴리뉴클레오티드 분자, 예를 들어, DNA 및/또는 RNA 유형을 지칭한다. 이 폴리뉴클레오티드 분자는 천연 발생 폴리뉴클레오티드 분자 또는 합성 폴리뉴클레오티드 분자, 또는 하나 이상의 천연 발생 폴리뉴클레오티드 분자 또는 이의 단편과 하나 이상의 합성 폴리뉴클레오티드 분자의 조합물일 수 있다. 이 정의는 하나 이상의 뉴클레오티드가 예를 들어, 돌연변이유발에 의해 변경되거나, 결실되거나 또는 추가된 천연 발생 폴리뉴클레오티드 분자도 포함한다. 핵산은 단리된 상태일 수 있거나, 또 다른 핵산, 예를 들어, 발현 벡터 또는 진핵 숙주세포의 염색체 내에 삽입되어 있을 수 있다. 마찬가지로, 핵산은 개별 뉴클레오티드로 이루어진 그의 핵산 서열을 특징으로 한다. 상응하는 코딩 핵산으로부터 아미노산 서열을 유추하는 것 및 코딩된 아미노산 서열로부터 상응하는 핵산을 유도하는 것도 당업계에 공지되어 있다. 따러서, 아미노산 서열도 그의 핵산을 특징으로 한다. 핵산도 상응하는 아미노산 서열에 의해 주어진다.

본원에서 상호교환적으로 사용되는 표현 "플라스미드" 또는 "벡터"는 예를 들어, 형질감염 플라스미드뿐만 아니라 셔틀 및 발현 플라스미드를 포함한다. 전형적으로, 플라스미드는 박테리아 내에서의 플라스미드의 복제를 위한 복제 기점(예를 들어, ColE1 및 oriP 복제 기점) 및 선별 마커(예를 들어, 앰피실린 또는 테트라사이클린 내성 유전자)도 포함할 것이다.

"발현 카세트"는 적어도 세포 내에 포함된 구조 유전자를 발현시키는 데 필요한 조절 요소들을 보유하는 구축물을 지칭한다. 경우에 따라, 발현된 폴리펩티드 또는 단백질의 분비를 가능하게 하는 추가 요소가 포함된다.

"유전자"는 폴리펩티드 또는 단백질의 발현에 필요한, 예컨대, 염색체 또는 플라스미드 상의 절편을 지칭한다. 코딩 영역 외에, 유전자는 프로모터, 하나 이상의 인트론 및/또는 엑손, 및 하나 이상의 종결서열을 비롯한 다른 기능적 요소들을 포함한다.

본원에서 사용된 용어 "구조 유전자"는 신호 서열은 가지고 있지 않지만 개재(intervening) 인트론을 가진 유전자의 코딩 영역, 즉 엑손을 지칭한다.

"선별 마커"는 상응하는 선별제의 존재 또는 부재 하에 그 유전자를 보유하는 세포가 특이적으로 선별될 수 있게 하는 유전자를 지칭한다. 유용한 양성 선별 마커는 항생제 내성 유전자이다. 이 선별 마커는 상응하는 항생제의 존재 하에 그 유전자로 형질전환된 숙주 세포가 양성적으로 선별될 수 있게 하고, 비-형질전환된 숙주 세포는 선별 배양 조건 하에, 즉 선별 배지 중의 선별제의 존재 하에 생장하거나 생존할 수 없을 것이다. 선별 마커는 양성, 음성 또는 이기능성 선별 마커일 수 있다. 양성 선별 마커는 그 마커를 보유하는 세포에 대한 선별을 허용하는 반면, 음성 선별 마커는 그 마커를 보유하는 세포가 선별적으로 제거될 수 있게 한다. 전형적으로, 선별 마커는 숙주 세포에서 동화 또는 이화 결함에 대한 약물 또는 보충제에 대한 내성을 부여할 것이다. 진핵세포에서 유용한 선별 마커는 예를 들어, 아미노글리코사이드 포스포트랜스퍼레이즈(APH), 예컨대, 히그로마이신 포스포트랜스퍼레이즈(hyg), 네오마이신 및 G418 APH, DHFR, 싸이미딘 카이네이즈(tk), 글루타민 신쎄테이즈(GS), 아스파라진 신쎄테이즈, 트립토판 신쎄테이즈(선별제 인돌), 히스티디놀 데히드로게네이즈(선별제 히스티디놀 D)에 대한 유전자, 및 퓨로마이신, 블레오마이신, 플레오마이신, 클로람페니콜, 제오신 및 마이코페놀산에 대한 내성을 코딩하는 유전자를 포함한다. 추가 마커 유전자는 국제특허출원 공개 제WO 92/08796호 및 제WO 94/28143호에 기재되어 있다.

본원에서 사용된 "조절 요소"는 원하는 구조 유전자를 포함하는, 유전자의 전사 및/또는 번역에 필요한 시스 및/또는 트랜스로 존재하는 뉴클레오티드 서열을 지칭한다. 전사 조절 요소는 통상적으로 발현될 유전자 서열의 프로모터 업스트림, 전사 개시 및 종결 부위, 및 폴리아데닐화 신호 서열을 포함한다. 용어 "전사 개시 부위"는 일차 전사체, 즉 전구-mRNA로 전사될, 제1 핵산에 상응하는 유전자 내 뉴클레오티드를 지칭하고, 전사 개시 부위는 프로모터 서열과 중첩될 수 있다. 용어 "전사 종결 부위"는 RNA 폴리머레이즈로 하여금 전사를 종결시키게 하는, 통상적으로 전사될 원하는 유전자의 3' 말단에 존재하는 뉴클레오티드 서열을 지칭한다. 폴리아데닐화 신호 서열 또는 폴리-A 추가 신호는 진핵세포 mRNA의 3' 말단에 있는 특정 부위에서 절단하는 것, 및 핵 내에서 약 100 내지 200개의 아데닌 뉴클레오티드로 이루어진 서열(폴리A 꼬리)을 절단된 3' 말단에 전사 후 추가하는 것에 대한 신호를 제공한다. 폴리아데닐화 신호 서열은 절단 부위로부터 약 10 내지 30개의 뉴클레오티드 업스트림에 위치한 컨센서스 서열 AATAAA를 포함할 수 있다.

번역 조절 요소는 번역 개시 코돈(AUG) 및 정지 코돈(TAA, TAG 또는 TGA)을 포함한다. IRES는 일부 구축물에 포함될 수 있다.

"프로모터"는 작동가능하게 연결되어 있는 유전자 또는 핵산 서열의 전사를 조절하는 폴리뉴클레오티드 서열을 지칭한다. 프로모터는 RNA 폴리머라제 결합 및 전사 개시를 위한 신호를 포함한다. 사용된 프로모터는 선별된/작동가능하게 연결된 서열의 발현이 고려되는 숙주 세포의 세포 유형에서 기능성을 가질 것이다. 다양한 공급원으로부터 유래된 기본 프로모터, 유도성 프로모터 및 억제가능성 프로모터를 비롯한 매우 많은 프로모터가 당업계에 잘 공지되어 있고 (진뱅크(GenBank)와 같은 데이타베이스에서 확인될 수 있으며, (예를 들어, ATCC와 같은 기탁기관 및 다른 상업적 또는 개별적 공급원으로부터의) 클로닝된 폴리뉴클레오티드로서 또는 클로닝된 폴리뉴클레오티드 내의 프로모터로서 입수될 수 있다. "프로모터"는 구조 유전자의 전사를 지시하는 뉴클레오티드 서열을 포함한다. 전형적으로, 프로모터는 구조 유전자의 전사 개시 부위에 근접해 있는, 유전자의 5' 비-코딩 또는 UTR에 위치되어 있다. 전사 개시에서 작용하는 프로모터 내의 서열 요소들은 종종 컨센서스 뉴클레오티드 서열을 특징으로 한다. 이 프로모터 요소들은 RNA 폴리머레이즈 결합 부위, TATA 서열, CAAT 서열, 분화-특이적 요소(DSE; McGehee, R.E. Jr., et al., Mol. Endocrinol. 7 (1993) 551-60), 사이클릭 AMP 반응 요소(CRE), 혈청 반응 요소(SRE; Treisman, R., Seminars in Cancer Biol. 1 (1990) 47-58), 글루코코르티코이드 반응 요소(GRE), 및 다른 전사 인자들에 대한 결합 부위, 예컨대, CRE/ATF(O'Reilly, M.A., et al., J. Biol. Chem. 267 (1992) 19938-43), AP2(Ye, J., et al., J. Biol. Chem. 269 (1994) 25728-34), SP1, cAMP 반응 요소 결합 단백질(CREB; Loeken, M.R., Gene Expr. 3 (1993) 253-64) 및 옥타머 인자(예컨대, 일반적으로, 문헌(Watson et al., eds., Molecular Biology of the Gene, 4th ed., The Benjamin/Cummings Publishing Company, Inc. (1987), and Lemaigre, F.P. and Rousseau, G.G., Biochem. J. 303 (1994) 1-14) 참조)를 포함한다. 프로모터가 유도성 프로모터인 경우, 전사 속도는 유도제에 반응하여 증가한다. 대조적으로, 전사 속도는 프로모터가 기본 프로모터인 경우 유도제에 의해 조절되지 않는다. 억제가능한 프로모터도 공지되어 있다. 예를 들어, c-fos 프로모터는 성장 호르몬과 세포 표면 상의 성장 호르몬 수용체의 결합 시 특이적으로 활성화된다. 테트라사이클린(Tet)에 의해 조절되는 발현은 예를 들어, CMV 프로모터 및 이것 다음에 위치한 2개의 Tet-오퍼레이터 부위로 이루어진 인공 하이브리드 프로모터에 의해 달성될 수 있다. Tet-억제자(repressor)는 상기 2개의 Tet-오퍼레이터 부위에 결합하여 전사를 차단한다. 유도제인 테트라사이클린의 첨가 시, Tet-억제자는 Tet-오퍼레이터 부위로부터 방출되고 전사가 진행된다(Gossen, M. and Bujard, H. PNAS 89 (1992) 5547-5551). 메탈로싸이오네인 및 열 충격 프로모터를 비롯한 다른 유도성 프로모터의 경우, 예를 들어, 상기 문헌(Sambrook et al.) 및 문헌(Gossen et al., Curr. Opin. Biotech. 5 (1994) 516-520)을 참조한다. 고수준 발현을 위한 강력한 프로모터로서 확인된 진핵세포 프로모터 중에는 SV40 초기 프로모터, 아데노바이러스 주요 후기 프로모터, 마우스 메탈로싸이오네인-I 프로모터, 라우스 육종 바이러스 장 말단 반복부, 차이니스 햄스터 연장 인자 1 알파(CHEF-I, 예를 들어, 미국 특허 제5,888,809호 참조), 인간 EF-1 알파, 유비퀴틴 및 인간 사이토메갈로바이러스 즉각 초기 프로모터(CMV IE)가 있다.

"프로모터"는 기본 프로모터 또는 유도성 프로모터일 수 있다. 인핸서(enhancer)(즉, 프로모터에 작용하여 전사를 증가시키는 시스-작용 DNA 요소)가 프로모터와 함께 작용하여 프로모터만을 사용하여 얻는 발현 수준을 증가시키는 데 필요할 수 있고 전사 조절 요소로서 포함될 수 있다. 종종, 프로모터를 포함하는 폴리뉴클레오티드 절편도 인핸서 서열을 포함할 것이다(예를 들어, CMV 또는 SV40).

"작동가능하게 연결된"은 둘 이상의 요소들의 병렬배치를 지칭하는데, 이때 상기 요소들이 그들의 의도된 방식으로 작용할 수 있는 관계로 배치되어 있다. 예를 들어, 프로모터 및/또는 인핸서는 이것이 연결된 코딩 서열의 전사를 제어하거나 조절하도록 시스로 작용하는 경우 코딩 서열에 작동가능하게 연결되어 있다. 반드시는 아니지만 일반적으로, "작동가능하게 연결된" DNA 서열은 인접하여 위치하고, 필요한 경우 2개의 단백질 코딩 영역, 예컨대, 분비 리더와 폴리펩티드, 폴리펩티드와 경막 도메인, 폴리펩티드와 GPI-고착자에 대한 신호 펩티드, 또는 폴리펩티드와 번역 정지 코돈을 인접된 리딩 프레임으로 연결한다. 그러나, 작동가능하게 연결된 프로모터가 일반적으로 코딩 서열의 업스트림에 위치되어 있다 하더라도, 상기 프로모터가 반드시 상기 코딩 서열에 인접하여 위치할 필요는 없다. 인핸서는 인접하여 위치될 필요가 없다. 인핸서는 이것이 코딩 서열의 전사를 증가시키는 경우 코딩 서열에 작동가능하게 연결되어 있다. 작동가능하게 연결된 인핸서는 코딩 서열의 업스트림에, 코딩 서열의 내에 또는 코딩 서열의 다운스트림에 위치되어 있고 프로모터로부터 상당히 멀리 떨어져 위치되어 있다. 폴리아데닐화 신호는 전사가 코딩 서열을 통과하여 폴리아데닐화 서열로 진행되도록 상기 폴리아데닐화 신호가 코딩 서열의 다운스트림 말단에 위치된 경우 상기 코딩 서열에 작동가능하게 연결되어 있다. 연결은 당업계에 공지되어 있는 재조합 방법, 예를 들어, PCR 방법의 이용 및/또는 편리한 제한 부위에서의 결찰(ligation)에 의해 달성된다. 편리한 제한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커를 통상적인 관행에 따라 사용한다.

본원에서 사용된 용어 "전구-mRNA의 생성"은 DNA가 그의 상보적 전구-mRNA로 전사되는 과정을 지칭한다. 진핵생물 DNA는 엑손(코딩)으로 지칭되는 코딩 영역 및 인트론(비-코딩)으로 지칭되는 비-코딩 영역으로 이루어져 있다. DNA가 그의 상보적 전구-mRNA로 전사되는 과정에서, 엑손 및 인트론의 게놈 구성이 유지된다.

본원에서 사용된 용어 "전구-mRNA의 프로세싱"은 전사-후 변형 과정을 지칭한다. 이 단계에서, 전구-mRNA의 인트론은 스플라이싱되고, 즉 전구-mRNA로부터 제거되고, 프로세싱된 mRNA의 5' 말단은 캡핑되며, 3' 폴리아데닐화가 일어난다. 최종 핵, 즉 성숙 mRNA가 이 단계에서 수득된다.

본원에서 사용된 용어 "경막 도메인"은 DNA 수준에서 하나 이상의 엑손에 의해 코딩되며 세포외 영역, 경막 영역 및 세포내 영역을 포함하는 폴리펩티드 또는 단백질을 지칭한다. 경막 도메인은 일반적으로 3개의 상이한 구조적 영역, 즉 N-말단 세포외 영역, 중심 보존 경막 스트레치 및 C-말단 세포질 영역을 포함한다. 한 실시양태에서, 경막 도메인은 세포외 영역 및 경막 영역을 N-말단에서 C-말단 방향으로 포함한다. 경막 도메인은 세포내 또는 세포질 영역을 추가로 포함할 수 있다.

본원에서 사용된 용어 "경막 도메인의 단편"은 세포막에 걸쳐 있는, 즉 세포막 내에 위치된 경막 도메인의 일부, 즉 경막 스트레치를 지칭한다.

용어 "택일적으로 스플라이싱될 수 있는 핵산"은 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산을 지칭한다. 이 핵산은 번역 정지 코돈 및 폴리아데닐화 신호를 함유한다. 이 택일적으로 스플라이싱될 수 있는 핵산은 상응하는 전구-mRNA로부터 기본적으로 스플라이싱되어 제거되지 않는 비-코딩 영역, 예컨대, 면역글로불린 중쇄 C_H3 또는 C_H4 도메인을 코딩하는 엑손 다음에 오는 인트론을 포함한다. 택일적으로 스플라이싱될 수 있는 핵산의 5' 스플라이스 공여 부위에서 일어나는 "택일적 스플라이싱 이벤트"는 택일적으로 스플라이싱될 수 있는 핵산이 전구-mRNA로부터 스플라이싱되어 제거되는지 아니면 적어도 부분적으로 유지되어 성숙(프로세싱된) mRNA에 포함되는지를 결정하는 이벤트이다.

본원에서 사용된 용어 "택일적 스플라이싱" 및 이의 문법적 등가 용어는 하나 이상의 인트론의 상이한 프로세싱으로 인해 단일 전구-mRNA로부터 상이한 성숙 mRNA가 얻어질 수 있으므로 폴리펩티드의 상이한 이소폼이 발현될 수 있다. 본 발명의 한 실시양태에서, 생성된 전구-mRNA의 단일, 즉 하나의 인트론만이 택일적으로 스플라이싱될 수 있다. 또 다른 실시양태에서, 제2 핵산이 택일적으로 스플라이싱될 수 있다. 추가 실시양태서, 제2 핵산은 택일적으로 스플라이싱될 수 있는 인트론을 포함한다. 상이한 프로세싱은 "예/아니요" 결정이고, 즉 택일적 스플라이싱 과정에서 프로세싱될 인트론, 즉 "택일적으로 스플라이싱될 수 있는 핵산"이 적어도 부분적으로 보유되거나 스플라이싱될 수 있다. 이것은 상이한 엑손이 뒤따르게 하는 분지점 기작(branching point mechanism)으로서 이해되서는 안된다. 사실상, 택일적으로 스플라이싱될 수 있는 핵산이 스플라이싱되거나 성숙 mRNA에서 적어도 부분적으로 유지되는 기작이다. 이 기작을 이용함으로써, 택일적으로 스플라이싱될 수 있는 핵산이 보유되거나 제거되고, 이에 따라 핵산 내에 포함된 인 프레임 번역 정지 코돈이 보유되거나 제거된다.

택일적 스플라이싱은 진핵세포에서 중요한 조절 기작이다. 택일적 스플라이싱을 이용함으로써, 동일한 DNA에 의해 코딩된 복수의 상이한 단백질을 생성시키는 동일한 전구-mRNA로부터 성숙 mRNA 내의 엑손의 상이한 조합물이 수득될 수 있다.

본원에서 사용된 용어 "발현"은 세포 내에서 일어나는 전사 및/또는 번역 과정을 지칭한다. 세포 내에서의 원하는 생성물의 전사 수준은 세포 내에 존재하는 상응하는 mRNA의 양을 기초로 하여 측정할 수 있다. 예를 들어, 선택된 서열로부터 전사된 mRNA는 PCR 또는 노던 혼성화에 의해 정량될 수 있다(문헌(Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)) 참조). 폴리펩티드는 다양한 방법, 예컨대, ELISA, 폴리펩티드의 생물학적 활성 분석, 또는 상기 활성과 무관한 분석법의 이용, 예컨대, 웨스턴 블롯팅, SDS 폴리아크릴아미드 겔 전기영동, NMR 또는 방사성면역분석, 예컨대, 폴리펩티드를 인식하여 이것에 결합하는 항체의 사용에 의해 정량될 수 있다(상기 문헌(Sambrook et al., 1989) 참조).

"숙주 세포"는 폴리펩티드 또는 단백질을 코딩하는 이종 핵산이 도입될 세포를 지칭한다. 숙주 세포는 플라스미드의 증식을 위해 사용되는 원핵세포, 및 이종 핵산의 발현을 위해 사용되는 진핵세포 둘다를 포함한다. 바람직하게는, 진핵세포는 포유동물 세포이다. 바람직하게는, 포유동물 세포는 CHO 세포, BHK 세포, NSO 세포, Sp2/0 세포, COS 세포, HEK 세포이다.

"폴리펩티드"는 천연적으로 생성되든 합성되든 관계없이 펩티드 결합에 의해 연결된 아미노산들로 이루어진 중합체이다. 약 20개 미만의 아미노산 잔기들로 이루어진 폴리펩티드는 "펩티드"로 지칭될 수 있는 반면, 100개 초과의 아미노산 잔기들로 이루어지거나 2개 이상의 폴리펩티드 쇄로 이루어진 폴리펩티드는 "단백질"로 지칭될 수 있다.

"단백질"은 100개 이상의 아미노산으로 이루어진 하나 이상의 폴리펩티드 쇄를 포함하거나 2개 이상의 폴리펩티드 쇄를 포함하는 거대분자이다.

폴리펩티드 및 단백질은 비-펩티드성 성분들, 예컨대, 탄수화물 기, 금속 이온, 지질, 카복실산 에스터 또는 이들의 조합물도 포함할 수 있다. 비-펩티드성 치환체가 폴리펩티드 또는 단백질을 생성하는 세포에 의해 추가될 수 있고 세포의 유형에 따라 달라질 수 있다. 폴리펩티드 및 단백질은 이들의 아미노산 골격 구조 면에서 본원에서 정의되고, 탄수화물 기와 같은 추가는 일반적으로 요구되지 않지만 그럼에도 불구하고 존재할 수 있다.

"이종 DNA" 또는 "이종 핵산"은 소정의 숙주 세포 내에 천연적으로 존재하지 않는 DNA 분자 또는 핵산, 또는 DNA 분자의 집단 또는 핵산의 집단을 지칭한다. 특정 숙주 세포에 대해 이종성을 나타내는 DNA 분자는 숙주 DNA가 비-숙주 DNA(즉, 외래 DNA)와 조합되는 한 숙주 세포 종으로부터 유래된 DNA(즉, 내재 DNA)를 함유할 수 있다. 예를 들어, 프로모터를 포함하는 숙주 DNA 절편과 작동가능하게 연결된 폴리펩티드를 코딩하는 비-숙주 DNA 절편을 함유하는 DNA 분자는 이종 DNA 분자인 것으로 간주된다. 반대로, 이종 DNA는 외래 프로모터와 작동가능하게 연결된 내재 구조 유전자를 포함할 수 있다.

비-숙주, 즉 이종 핵산에 의해 코딩된 펩티드 또는 폴리펩티드는 "이종" 펩티드 또는 폴리펩티드이다.

본원에서 사용된 용어 "생물학적 활성 폴리펩티드"는 인공 생물학적 시스템에 투여된 경우, 예컨대, 세포주 및 바이러스를 사용한 생체분석에서 사용된 경우, 또는 조류 및 인간을 비롯한 포유동물을 포함하나 이들로 한정되지 않는 동물에 생체내 투여된 경우 생물학적 효과를 초래하는 유기 분자, 예를 들어, 생물학적 거대분자, 예컨대, 펩티드, 단백질, 당단백질, 뉴클레오단백질, 뮤코단백질, 지단백질, 합성 폴리펩티드 또는 단백질을 지칭한다. 이 생물학적 효과는 효소 억제 또는 활성화, 결합 부위 또는 주변에서의 수용체 또는 리간드와의 결합, 또는 신호 유발 또는 신호 조절일 수 있으나 이들로 한정되지 않는다. 한 실시양태에서, 상기 생물학적 활성 폴리펩티드는 면역글로불린, 면역글로불린 단편, 면역글로불린 접합체 및 항융합원성(antifusogenic) 펩티드로 이루어진 군으로부터 선택된다. 생물학적 활성 분자는 예를 들어, 호르몬; 사이토카인; 인터류킨; 면역글로불린; 항융합원성 펩티드; 성장 인자; 수용체 리간드, 작용제 또는 길항제; 세포독성제; 항바이러스제; 조영제; 효소 억제제; 효소 활성화제 또는 효소 활성 조절제, 예컨대, 알로스테릭 물질; 및 이들의 접합체이나, 이들로 한정되지 않는다.

본원에서 사용된 용어 "아미노산"은 핵산에 의해 직접 코딩되거나 전구체로서 코딩될 수 있는 알라닌(3문자 코드: Ala, 일문자 코드: A), 아르기닌(Arg, R), 아스파라긴(Asn, N), 아스파르트산(Asp, D), 시스테인(Cys, C), 글루타민(Gln, Q), 글루탐산(Glu, E), 글리신(Gly, G), 히스티딘(His, H), 이소류신(Ile, I), 류신(Leu, L), 라이신(Lys, K), 메티오닌(Met, M), 페닐알라닌(Phe, F), 프롤린(Pro, P), 세린(Ser, S), 쓰레오닌(Thr, T), 트립토판(Trp, W), 티로신(Tyr, Y) 및 발린(Val, V)을 포함하는 일군의 카복시 α-아미노산을 지칭한다.

"클로닝 벡터"는 숙주 세포 내에서 자가 복제할 수 있는 능력을 가진 핵산, 예컨대, 플라스미드, 코스미드, 파지미드 또는 박테리아 인공 염색체(BAC)이다. 클로닝 벡터는 전형적으로 벡터의 필수적인 생물학적 기능을 상실하지 않으면서 결정가능한 방식으로 핵산의 삽입을 가능하게 하는 하나 또는 소수의 제한 엔도뉴클레이즈 인식 부위뿐만 아니라 클로닝 벡터로 형질전환된 세포의 확인 및 선별에 사용하기에 적합한 선별 마커를 코딩하는 뉴클레이티드 서열을 포함한다. 선별 마커는 전형적으로 테트라사이클린, 네오마이신, G418 또는 앰피실린 내성을 부여하는 유전자를 포함한다.

"발현 벡터"는 숙주 세포 내에서 발현시킬 이종 폴리펩티드 또는 단백질을 코딩하는 핵산이다. 전형적으로, 발현 벡터는 예를 들어, 대장균의 경우 원핵 복제 기점 및 선별 마커, 진핵 선별 마커, 및 프로모터, 구조 유전자 및 전사 종결인자(폴리아데닐화 신호를 포함함)를 각각 포함하는, 원하는 구조 유전자(들)의 발현을 위한 하나 이상의 발현 카세트를 포함하는 원핵 플라스미드 증폭 단위체이다. 유전자 발현은 통상적으로 프로모터의 조절 하에 놓여지고, 이러한 구조 유전자는 프로모터와 "작동가능하게 연결된" 상태에 있다고 기술된다. 유사하게, 조절 요소와 코어 프로모터는 조절 요소가 코어 프로모터의 활성을 조절하는 경우 작동가능하게 연결되어 있다.

"폴리시스트론(polycistronic) 전사 단위체"는 하나 초과의 구조 유전자가 동일한 프로모터의 조절 하에 놓여 있는 전사 단위체이다.

"단리된 폴리펩티드" 또는 "단리된 단백질"은 오염 세포 성분들을 본질적으로 보유하지 않는, 예컨대, 탄수화물, 지질 또는 다른 단백질성 불순물에 공유 결합되어 있지 않을뿐만 아니라 천연 상태의 폴리펩티드 또는 단백질과 결합된 비-단백질성 불순물을 실질적으로 보유하지 않는 폴리펩티드 또는 단백질이다. 전형적으로, 단리된 폴리펩티드/단백질 제제는 고도로 정제된 형태의, 즉 약 80% 이상, 약 90% 이상, 약 95% 이상, 95% 초과 또는 99% 초과의 순도를 가진 폴리펩티드/단백질을 함유한다. 특정 제제가 단리된 폴리펩티드 또는 단백질을 함유한다는 것을 보여주는 한 방법은 상기 제제의 소듐 도데실 설페이트(SDS)-폴리아크릴아미드 겔 전기영동 및 겔의 코마시에 브릴리언트 블루(Coomassie Brilliant Blue) 염색 후에 단일 밴드가 나타나는지를 확인하는 방법이다. 그러나, 용어 "단리된"은 택일적인 물리학적 형태, 예컨대, 이량체 또는 택일적으로 글리코실화된 또는 유도체화된 형태의 동일한 폴리펩티드 또는 단백질의 존재를 배제하지 않는다.

본원에서 사용된 용어 "면역글로불린"은 면역글로불린 유전자에 의해 실질적으로 코딩된 하나 이상의 폴리펩티드로 이루어진 단백질을 지칭한다. 이 정의는 변이체, 예컨대, 돌연변이 형태, 즉 하나 이상의 아미노산의 치환, 결실 및 삽입을 가진 형태, 말단이 절단된 형태 및 융합된 형태를 포함한다. 인식된 면역글로불린 유전자는 여러 불변 영역 유전자 및 다수의 면역글로불린 가변 영역 유전자를 포함한다. 면역글로불린은 예를 들어, Fv, Fab 및 F(ab)₂뿐만 아니라 단일쇄(scFv)를 비롯한 다양한 형태로 존재할 수 있다(예를 들어, (Huston, J.S., et al., PNAS USA 85 (1988) 5879-5883; Bird, R.E., et al., Science 242 (1988) 423-426; and, in general, Hood et al., Immunology, Benjamin N.Y., 2nd edition (1984) and Hunkapiller, T., and Hood, L., Nature 323 (1986) 15-16) 참조).

면역글로불린의 중쇄 폴리펩티드 및 경쇄 폴리펩티드가 모두 존재하는 경우 이들은 불변 영역(일반적으로, 카복시 말단 부분)을 각각 포함할 수 있다. 중쇄의 불변 영역은 i) Fc 수용체를 보유하는 세포, 예컨대, 대식세포, 또는 ii) 브람벨(Brambell) 수용체로도 공지되어 있는 신생아 Fc 수용체(FcRn)를 보유하는 세포와 항체의 결합을 매개한다. 또한, 중쇄의 불변 영역은 보편적인 보체 시스템의 인자들, 예컨대, 요소 C1q를 비롯한 일부 인자들과의 결합을 매개한다. 나아가, 경막 도메인은 면역글로불린 중쇄의 C-말단 불변 도메인, 즉 C_H3 또는 C_H4 도메인 다음에 위치할 수 있다. 이 경막 도메인은 원형질막-결합 면역글로불린, 면역글로불린 단편 또는 면역글로불린-융합 폴리펩티드의 형성을 가능하게 한다.

면역글로불린의 중쇄 폴리펩티드 및 경쇄 폴리펩티드가 모두 존재하는 경우 이들은 가변 도메인(일반적으로 아미노 말단 부분)을 포함할 수 있다. 면역글로불린 경쇄 또는 중쇄의 가변 도메인은 여러 절편, 즉 4개의 골격 영역(FR) 및 3개의 초가변 영역(CDR)을 포함한다.

용어 "의 적어도 단편"은 전장 핵산 또는 전장 폴리펩티드의 부분, 즉 전장 핵산, 폴리펩티드 또는 도메인의 20% 이상, 40% 이상, 60% 이상 또는 80% 이상을 지칭한다. 예를 들어, "면역글로불린 C_H3 또는 C_H4 도메인의 적어도 단편을 코딩하는 핵산"은 전장 면역글로불린 C_H3 또는 C_H4 도메인을 코딩하는 핵산의 부분, 즉 전장 면역글로불린 C_H3 또는 C_H4 도메인을 코딩하는 핵산의 20% 이상, 40% 이상, 60% 이상 또는 80% 이상을 지칭한다. 한 실시양태에서, 면역글로불린 중쇄의 단편은 면역글로불린 중쇄의 C-말단 단편이다.

용어 "인 프레임 번역 정지 코돈"은 핵산의 선행 코딩 영역에 대해 리딩 프레임의 프레임이동(frameshift) 없이 핵산의 후속 코딩 영역, 즉 번역 과정 동안에 코딩 영역을 종결시키는 번역 정지 코돈(TAA, TAG 또는 TGA)을 지칭한다. 인 프레임 번역 정지 코돈은 핵산의 선행 코딩 영역과 작동가능하게 연결되어 있다.

용어 "인 프레임 번역 정지 코돈 없이"는 지정된 핵산 내 번역 정지 코돈(TAA, TAG 또는 TGA)의 부재, 및/또는 핵산의 코딩 영역 내에서 또는 말단에서 발견될 수 있으나 1 또는 2개의 염기쌍 이동으로 인해 프로세싱된 mRNA의 번역 과정 동안에 인식되지 않아(즉, 아웃-오브-프레임, 작동가능하게 연결되지 않음) 번역 과정에서 코딩 영역을 종결시키지 않는 번역 정지 코돈의 존재를 지칭한다.

본원에서 사용된 "전사 종결서열"은 mRNA 합성의 종결을 위한 신호를 RNA 폴리머레이즈에게 제공하는 길이 50 내지 750 bp의 DNA 서열이다. 특히 강력한 프로모터를 사용하는 경우 RNA 폴리머레이즈가 전사 종결서열을 통과하여 판독하는 것을 방지하기 위해서는 발현 카세트의 3' 말단에 매우 효율적인 (강력한) 종결서열을 위치시키는 것이 바람직하다. 비효율적인 전사 종결서열은 원치않는, 예를 들어, 플라스미드에 의해 코딩된 유전자 발현의 원일일 수 있는 오페론-유사 mRNA의 형성을 초래할 수 있다.

본원에서 사용된 용어 "전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않은" 및 "(상응하는) 전구-mRNA로부터 기본적으로 스플라이싱되어 제거되지 않은"은 전구-mRNA 프로세싱 과정 동안에 예기치 않게 일어나지 않는 스플라이싱 과정(즉, 특정 인트론의 핵산은 종종 전구-mRNA 프로세싱 과정 동안에 제거됨)을 지칭한다. 그 결과, 2개의 상이한 성숙 mRNA가 수득되는데, 하나는 인트론의 적어도 일부를 갖고 나머지 하나는 인트론을 갖지 않는다.

본원에서 사용된 용어 "GPI-고착자"는 폴리펩티드 또는 단백질의 C-말단에 부착된 번역-후 변형을 지칭한다. "GPI-고착자"는 하나 이상의 에탄올아민 포스페이트 잔기, 트리만노사이드, 글루코스아민 잔기 및 이노시톨 인지질을 포함하는 모핵 구조를 가진다. 이러한 모핵 구조에도 불구하고, GPI-고착자는 통상적으로 일부 미세불균질성(microheterogeniety)을 보유하므로 GPI-고착자를 가진 단백질은 통상적으로 상이한 측쇄 변형을 가진 동일한 모핵 구조의 균질한 GPI-고착자를 가진 단백질들의 혼합물이다.

용어 "GPI-고착자에 대한 신호 펩티드"는 GPI-고착자가 부착될 1개의 아미노산, 임의적 성분인 스페이서 펩티드 및 소수성 펩티드로 이루어진 폴리펩티드 또는 단백질의 C-말단 아미노산 서열을 지칭한다. 이 신호 펩티드 중 거의 모두, 즉 임의적 성분인 스페이서 펩티드 및 소수성 펩티드는 효소 GPI-트랜스아미네이즈에 의해 번역 후에 제거되고, GPI-고착자의 모핵 에탄올아민 포스페이트의 아미노 기와 GPI-고착자가 부착된 아민산 사이의 결합이 형성된다.

이종 핵산으로 형질감염시킨 후, 이종 핵산에 의해 코딩된 이종 폴리펩티드를 발현하는 세포가 선별되어야 한다. 선별을 위해 마커를 사용한다. 상기 마커는 성공적으로 형질전환되어 있고 세포의 선별 및 단리를 용이하게 하는 세포 집단 내의 세포를 지칭한다. 상이한 마커, 예컨대, 선별 마커 또는 녹색 형광 단백질(GFP)과 같은 검출 표지가 사용될 수 있다.

세포의 선별은 일단계 또는 다단계로 수행될 수 있다. 일/다단계 과정에서, 제1 선별은 예를 들어, 선별 마커, 예컨대, 검출 마커의 역치 수준을 기초로 하여 수행할 수 있다. 예를 들어, 유세포분류에 의한 (예컨대, FACS - 형광 활성화 세포 분류에 의한) 선별의 경우, 형광 역치 수준은 설정되고 이 역치 수준을 초과하는 형광도를 가진 세포가 선별된다. 샘플 집단의 형광 강도의 상위 1 내지 15%(즉, 가장 강한 검출 표지를 가진 세포의 15%), 상위 1 내지 10%, 상위 1 내지 5%, 상위 5 내지 10% 또는 상위 5 내지 6%가 모아질 수 있다. 세포의 선별을 위한 별법은 예를 들어, 단백질 A 또는 특이적 면역글로불린으로 코팅된 자기 비드와의 면역학적 결합이다. 세포의 선별된 패널은 예를 들어, 단일 세포 접종(seeding), 배양 및 ELISA 분석(효소-결합 면역흡착 분석); 제한 희석 클로닝, 수일 동안 선별 배지 중에서 선별 배양 조건 하의 배양에 의한 증폭 및 추가 FACS 선별; 예를 들어, 선행 FACS 선별에서 검출된 형광 강도에 기초할 수 있는 보다 높은 역치 수준을 가진 추가 FACS 선별; 또는 면역침전 방법(예컨대, 국제특허출원 공개 제WO 2005/020924호 참조)에 의한 추가 선별 단계를 위한 기초 집단으로서 얻어질 수 있다. 본 발명에 따라 세포를 선별하는 것은 유세포분류, ELISA, 면역침전, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 또는 면역학적 결합을 이루어진 군으로부터 선택된 방법을 수행한 후, 단일 세포 접종 및 배양, 제한 희석 및 배양에 의한 증폭으로 이루어진 군으로부터 선택된 방법을 수행함으로써 실시될 수 있다. 한 실시양태에서, 본 발명에 따른 세포의 선별은 본 발명에 따라 세포를 선별하는 것은 유세포분류, ELISA, 면역침전, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 또는 면역학적 결합을 이루어진 군으로부터 선택된 방법을 수행한 다음, FACS, 면역침강, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 및 ELISA로 이루어진 군으로부터 선택된 방법을 수행함으로써 실시될 수 있다.

당업계에 공지되어 있는 형질감염 방법 및 벡터의 효율이 매우 높아 다수의 형질감염 세포가 수득되기 때문에, 형질감염 세포의 발현 수율과 마커의 검출된 "강도"의 상관관계를 허용할 수도 있는 마커가 바람직하다. 따라서, 원하는 이종 폴리펩티드의 발현을 마커의 발현과 상호관련시키는 것이 편리하다.

본 발명은 스플라이싱 방법, 즉 택일적 스플라이싱을 이용하여 동일한 핵산, 즉 동일한 발현 카세트로부터 이종 폴리펩티드 및 마커를 발현시킴으로써, 예를 들어, IRES를 전혀 사용하지 않는다. 본 발명에서 마커는 발현된 이종 폴리펩티드의 원형질막-결합 형태이다. 본 발명에서, 선별 마커는 N-말단 부분으로서 이종 폴리펩티드를 포함하고 C-말단 부분으로서 경막 도메인 또는 GPI-고착자의 적어도 단편을 포함한다. 따라서, 생성된 이종 폴리펩티드와 선별 마커의 세포외 부분, 즉 검출되는 선별 마커의 부분이 동일하다.

본 발명은 이종 폴리펩티드를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

를 포함하는 방법을 포함한다.

DNA의 전사 과정 동안에 소위 전구-mRNA인 한 카피의 DNA가 수득된다. 이 전구-mRNA는 기질 DNA와 동일한 구성을 가진다. 상기 전구-mRNA는 게놈 인트론-엑손-구성을 가진다. 엑손만이 코딩된 폴리펩티드의 아미노산 서열의 정보를 함유한다. 따라서, 인트론은 번역 전에 전구-mRNA로부터 제거되어야 한다. 이 과정은 RNA-스플라이싱으로 지칭된다.

"스플라이싱될 수 있는 핵산"은 적어도 5' 스플라이스 공여 부위, 3' 스플라이스 수용 부위, 및 통상적으로 상기 수용 부위의 20 내지 50개 염기 업스트림에 위치한 소위 분지점을 특징으로 한다. 이 구조는 RNA 스플라이싱 과정 동안에 5' 스플라이스 공여 부위에서 3' 스플라이스 수용 부위로 핵산이 인식되어 전구-mRNA로부터 제거되는 것에 영향을 미친다. 스플라이싱 단계 동안에 폴리펩티드 또는 단백질이 번역되는 성숙 mRNA가 생성된다. 본 발명의 한 실시양태에서, 하나 이상의 핵산, 바람직하게는 제2 핵산은 추가 조절 요소, 예컨대, 인 프레임 정지 코돈 및 폴리아데닐화 신호를 함유하는 스플라이싱될 수 있는 핵산이다.

그러나, 스플라이싱 과정이 유일한 방법은 아니다. 예를 들어, 인트론은 전구-mRNA 프로세싱 과정 동안에 전구-mRNA로부터 제거되지 않고 성숙 mRNA 내로 적어도 부분적으로 포함되어 있다. 인 프레임 정지 코돈이 "포함되거나 포함되지 않는" 인트론에 존재하는 경우, 번역은 이 정지 코돈에서 정지하고 코딩된 폴리펩티드의 변이체가 생성된다.

인트론의 인식 및 제거는 종종 전구-mRNA 내의 추가 시스-작용 요소들에 의해 조절된다. 이 요소들은 이들의 기능 및 위치로 인해 엑손 스플라이스 인핸서(ESE), 엑손 스플라이스 침묵자(silencer)(ESS), 인트론 스플라이스 인핸서(ISE) 또는 인트론 스플라이스 침묵자(ISS)로 지칭된다(Black, D. L., Annu Rev Biochem 72 (2003) 291-336).

대부분의 진핵 유전자의 게놈 DNA는 인트론-엑손-구성을 가진다. 예를 들어, 면역글로불린 중쇄의 분비된 형태의 C-말단 도메인(즉, C_H3 또는 C_H4 도메인)을 코딩하는 엑손 내에 5' 스플라이스 공여 부위가 존재한다.

이 스플라이스 공여 부위가 중쇄 전구-mRNA의 프로세싱에 효과적이지 않은 경우, 이 엑손 후에 위치하는, 정지 코돈 및 폴리아데닐화 신호를 포함하는 인트론은 성숙 mRNA 내에 적어도 부분적으로 보유된다. 그 후, mRNA는 C_H3 또는 C_H4 도메인으로 종결되는 면역글로불린 중쇄로 번역되고 가용성 면역글로불린을 대표한다. 이것은 면역글로불린 분비 세포 내에서의 면역글로불린 중쇄 유전자에 대한 주요 프로세싱 경로이다.

이 스플라이스 공여 부위가 면역글로불린 중쇄 전구-mRNA의 프로세싱에 효과적인 경우, 연속적인 인트론이 제거됨으로써 정지 코돈이 제거된다. 따라서, 번역이 면역글로불린 중쇄의 C-말단 도메인 다음에서 정지되지 않는다. 게다가, 계속해서 스플라이싱되면서 번역이 경막 도메인을 코딩하는 엑손까지 연속된다. 면역글로불린 중쇄의 이 주요 프로세싱 경로는 면역글로불린 생성 세포의 세포 표면 상에 제시된 원형질막-결합 면역글로불린 형태를 생성시킨다.

이 과정은 "택일적 스플라이싱"으로 지칭되고 이 과정에서 제거되거나 제거되지 않는 핵산(즉, 인트론)은 "택일적으로 스플라이싱될 수 있는 핵산"으로 지칭된다.

이종 폴리펩티드 또는 단백질을 코딩하는 핵산이 경막 도메인의 적어도 단편을 코딩하는 핵산, 또는 택일적으로 스플라이싱될 수 있는 핵산을 통해 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산에 연결되어 있는 경우, 즉 택일적으로 스플라이싱될 수 있는 핵산이 상기 두 핵산 사이에 위치되어 이들 3개의 핵산이 작동가능하게 연결되어 있는 경우, 이종 폴리펩티드 또는 단백질의 2개 변이체인 가용성 변이체(즉, 폴리펩티드 또는 단백질만을 포함하는 변이체) 및 원형질막-결합 변이체(즉, 폴리펩티드 또는 단백질, 또는 이들 둘다 및 경막 도메인 또는 GPI-고착자를 포함하는 변이체)가 발현된다.

한 실시양태에서, 형질감염된 핵산은 발현 카세트에 포함되어 있다. 한 실시양태에서, 제1 핵산은 그의 3' 말단에서 인 프레임 번역 정지 코돈을 갖지 않는다. 또 다른 실시양태에서, 제1 핵산, 제2 핵산 및 제3 핵산은 작동가능하게 연결되어 있다. 한 실시양태에서, 제3 핵산은 경막 도메인의 적어도 단편을 코딩한다. 또 다른 실시양태에서, 경막 도메인의 단편은 경막 영역이다. 한 실시양태에서, 제3 핵산은 GPI-고착자에 대한 신호 펩티드를 코딩한다. 본 발명의 한 실시양태에서, 제1 핵산에 의해 코딩된 폴리펩티드는 면역글로불린 중쇄, 면역글로불린 경쇄, 생물학적 활성 폴리펩티드, 이들의 단편, 및 이들의 융합 폴리펩티드를 포함하는 군으로부터 선택된다. 본 발명의 한 실시양태에서, 제1 핵산에 의해 코딩된 폴리펩티드는 면역글로불린 중쇄, 면역글로불린 경쇄, 이들의 단편 및 이들의 융합체를 포함하는 군으로부터 선택된다. 한 실시양태에서, 제3 핵산은 면역글로불린 경막 도메인의 적어도 단편을 코딩한다.

보다 상세하게, 본 발명은 면역글로불린 중쇄를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

c) 원형질막-결합 면역글로불린 중쇄를 가진 세포를 면역글로불린 중쇄를 발현하는 세포로서 선별하는 단계

를 포함하는 방법이다.

한 실시양태에서, 본 방법은 면역글로불린을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) 면역글로불린 경쇄에 대한 제1 발현 카세트, 및

i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 제2 발현 카세트

를 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 및 원형질막-결합 면역글로불린을 생성하는, 단계; 및

c) 원형질막-결합 면역글로불린을 가진 세포를 면역글로불린을 발현하는 세포로서 선별하는 단계

를 포함하는 방법이다.

한 실시양태에서, 본 발명은 면역글로불린을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은

a) 2개의 핵산으로 진핵세포를 동시에 또는 순차적으로 형질감염시키는 단계로서, 이때 하나의 핵산이 면역글로불린 경쇄에 대한 발현 카세트를 포함하고 나머지 하나의 핵산이 i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 발현 카세트를 포함하는, 단계;

를 포함하는 방법이다.

한 실시양태에서, 제3 핵산에 의해 코딩된 경막 도메인은 면역글로불린 경막 도메인이다. 본 발명의 한 실시양태에서, 제2 핵산은 1개의 5' 스플라이스 공여 부위 및 1개의 3' 스플라이스 수용 부위만을 포함한다. 본 발명의 또 다른 실시양태에서, 제2 핵산은 면역글로불린 중쇄 C_H3 또는 C_H4 도메인을 코딩하는 엑손 다음에 위치한 천연 발생 면역글로불린 중쇄 인트론으로서, 이때 50개 이상의 연속 뉴클레오티드가 상기 인트론에서 결실되어 있다.

예를 들어, 진핵세포 내에서 면역글로불린 중쇄를 재조합 발현시키고자 하는 경우, 게놈 인트론-엑손-구성을 가지거나 코딩 영역만을 포함하는 핵산, 즉 cDNA가 사용된다. 두 경우에서, 핵산은 면역글로불린 중쇄의 C-말단 도메인을 코딩하는 엑손 다음의 정지 코돈으로 종결된다. 그 후, 게놈 구성에서 택일적으로 스플라이싱될 수 있는 핵산 및 경막 도메인을 포함하는 후속 인트론 및 엑손이 제거된다. 따라서, 이러한 핵산을 사용하는 경우 가용성 면역글로불린 중쇄만이 수득된다.

면역글로불린 또는 이의 단편의 재조합 발현의 경우, 면역글로불린 중쇄 유전자의 게놈 구성이 적어도 부분적으로 보유되고, 즉 C-말단 도메인을 코딩하는 엑손(즉, 택일적으로 스플라이싱될 수 있는 핵산) 및 경막 도메인을 코딩하는 후속 엑손 다음에 인트론이 보유되는 경우, 택일적 스플라이싱이 가능하다. 택일적 스플라이싱 이벤트에 있어서, C_H3 또는 C_H4 도메인 코딩 엑손의 3' 말단 코돈 및 정지 코돈이 인트론 서열로서 또는 인트론 서열과 함께 제거되고, 추가로 유지된 엑손에 의해 코딩 영역, 즉 리딩 프레임이 그의 3' 말단에서 연장되어 있는 상이한 성숙 mRNA가 생성된다. 이 mRNA는 추가 3' 엑손에 의해 코딩된 추가 경막 도메인 또는 이의 단편을 포함하는 C-말단 연장 면역글로불린 중쇄로 번역된다. 이 연장된 면역글로불린 중쇄는 원형질막-결합 면역글로불린을 발생시키는 면역글로불린의 조립 과정 동안에 도입된다. 놀랍게도 본 발자들은 본 발명에 따른 핵산을 사용하여 이종 폴리펩티드를 생성하는 형질감염 세포를 선별할 수 있음을 발견하였다. 이 방법은 일반적으로 적용될 수 있고 면역글로불린으로 한정되지 않는다. 이 방법을 실시하기 위해, 인 프레임 정지 코돈 없이 이종 폴리펩티드를 재조합 발현하기 위한 핵산은 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 면역글로불린으로부터 유래된 택일적으로 스플라이싱될 수 있는 핵산에 인 프레임으로 작동가능하게 연결되어야 한다. 후속 제3 핵산도 변경시킬 수 있고 경막 도메인 또는 이의 단편을 코딩하는 임의의 핵산뿐만 아니라 GPI-고착자에 대한 신호 펩티드를 코딩하는 임의의 핵산으로부터 선택될 수 있다. 이 요소들, 즉 폴리펩티드를 코딩하는 핵산, 택일적으로 스플라이싱될 수 있는 핵산, 및 경막 도메인 또는 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산이 상이한 유전자 및 상이한 유기체로부터 선택되어 조합될 수 있다. 유일한 필요조건은 상기 3개의 핵산이 택일적으로 스플라이싱될 수 있는 핵산 내 번역 정지 코돈이 폴리펩티드를 코딩하는 핵산의 리딩 프레임과 인 프레임으로 위치하게 하는 방식, 즉 상기 번역 정지 코돈이 리보좀에 의해 인식되어 번역이 종결되게 하는 방식으로 조합된다는 것이다.

일반적으로, 가용성 형태의 이종 폴리펩티드의 C-말단의 부분은 택일적 스플라이싱을 이용하여 전구-mRNA로부터 인트론의 일부로서 제거하거나 제거하지 않을 수 있다. 상기 부분은 3' 말단 코돈, 3' UTR, 정지 코돈 및 분비된 형태의 폴리아데닐화 신호를 포함하거나 포함하지 않는다. 그러므로, 5' 스플라이스 공여 부위로 시작되고 제거되거나 제거되지 않는 3' 스플라이스 수용 부위로 종결되는 핵산은 택일적으로 프로세싱되지 않은 변이체의 C-말단과 중첩되거나 중첩될 수 있다.

그러므로, 면역글로불린 중쇄 유전자의 적어도 부분적으로 보유된 게놈 구성을 가진 본 발명에 따른 핵산을 사용하여 이종 폴리펩티드의 2개의 변이체, 즉 짧은 가용성 변이체 및 긴 원형질막-결합 변이체를 수득할 수 있다.

제1 핵산이 면역글로불린 중쇄를 코딩하는 한 실시양태에서, 제1 핵산은 게놈 수준으로 구성된 면역글로불린 중쇄 유전자의 모든 엑손 및 모두는 아니지만 1개의 인트론을 포함한다. 한 실시양태에서, 제3 핵산은 경막 도메인의 단편 또는 GPI-고착자에 대한 신호 펩티드를 코딩함으로써 경막 도메인의 단편이 단일 엑손에 의해 코딩된다. 또 다른 실시양태에서, 경막 도메인은 M1-M2-엑손-융합체, 즉 게놈 수준의 개재 인트론을 갖지 않는 단일 엑손에 의해 코딩된 면역글로불린 경막 도메인이다. 한 실시양태에서, 면역글로불린 경막 도메인은 cDNA에 의해 코딩된다.

면역글로불린 중쇄 유전자의 적어도 부분적으로 보유된 전체 게놈 구성을 가진 핵산을 숙주 세포 내로 도입함으로써, 한편으로 가용성 이종 폴리펩티드를 발현하고 다른 한편으로 원형질막-결합 이종 폴리펩티드를 발현하는 세포를 수득한다. 예를 들어, 2개의 면역글로불린 변이체를 수득하기 위해, 즉 택일적 스플라이싱을 가능하게 하기 위해, 면역글로불린 중쇄 유전자의 전체 게놈 구성, 즉 모든 인트론 및 엑손을 유지할 필요는 없다. 단지 택일적 스플라이스 부위를 기능성 형태로 유지하는 것만이 요구된다. "기능성 스플라이스 부위"는 5' 스플라이스 공여 부위 및 3' 스플라이스 수용 부위를 포함하는 핵산 서열이므로 전구-mRNA로부터 개재 핵산 서열이 제거될 수 있게 한다. 인트론의 인식 및 제거는 종종 전구-mRNA 상의 추가 시스-작용 요소에 의해 조절된다. 이 요소들은 이들의 기능 및 위치 때문에 엑손 스플라이스 인핸서(ESE), 엑손 스플라이스 침묵자(ESS), 인트론 스플라이스 인핸서(ISE) 또는 인트론 스플라이스 침묵자(ISS)로 지칭된다(본원에 참고로 도입되는 문헌(Black, D. L., Annu Rev Biochem 72 (2003) 291-336)).

이종 폴리펩티드를 발현하는 형질감염 세포를 선별하기 위해 다양한 방법, 예컨대, 분광학적 방법, 예를 들어, 형광, ELISA 및 이의 변법, 생물학적 활성 분석법, 이러한 활성과 무관한 분석법, 예컨대, 이종 폴리펩티드를 인식하여 이 폴리펩티드에 결합하는 항체를 사용하는 웨스턴 블롯팅, SDS 폴리아크릴아미드 겔 전기영동 또는 방사성면역분석법을 이용할 수 있으나 이들로 한정되지 않는다. 원형질막-결합 이종 폴리펩티드는 그의 C-말단을 제외하고 가용성 이종 폴리펩티드와 동일한 아미노산 서열 및 이차 구조를 가지기 때문에, 상기 원형질막-결합 이종 폴리펩티드는 예를 들어, 가용성 변이체와 동일한 항체를 사용하여 확인할 수 있다.

폴리펩티드의 원형질막-결합 변이체는 이것을 발현하는 세포에 단단히 연결된다. 따라서, 원형질막-결합 변이체는 이종 폴리펩티드 또는 단백질, 예를 들어, 면역글로불린의 발현을 위한 핵산으로 성공적으로 형질감염된 세포를 단리하기 위한 마커로서 사용될 수 있다. 한 실시양태에서, 폴리펩티드는 면역글로불린이다. 한 실시양태에서, 면역글로불린은 IgG, IgE 및 IgA로 이루어진 군으로부터 선택된다.

이종 폴리펩티드의 원형질막-결합 변이체에 대한 이종 폴리펩티드의 가용성 변이체의 분자 비는 50:50 초과 내지 100:0 미만, 바람직하게는 75:25 초과 내지 100:0 미만이다. 예를 들어, 진핵세포가 면역글로불린을 코딩하는 본 발명에 따른 핵산으로 형질감염된 경우, 성공적으로 형질감염된 세포는 원형질막-결합 면역글로불린의 등장에 의해 선별될 수 있다.

본 발명에 따른 핵산은 이종 폴리펩티드에 대한 코딩 영역, 택일적으로 스플라이싱될 수 있는 핵산 및 경막 도메인에 대한 코딩 영역 또는 이의 단편 또는 GPI-고착자에 대한 신호 펩티드에 대한 코딩 영역을 5'에서 3' 방향으로 포함하는 핵산이다. 보다 상세하게는, 본 발명은

a) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산,

b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, 및

을 포함하는 핵산을 포함한다.

다른 실시양태에서, i) 택일적으로 스플라이싱되는 인트론의 5' 스플라이스 부위는 이종 폴리펩티드를 코딩하는 핵산의 정상적인 정지-코돈의 5'에 위치하고, ii) 제2 핵산은 택일적으로 스플라이싱될 수 있는 핵산이며, iii) 5' 스플라이스 부위는 종종 사용될 뿐 기본적으로 사용되지 않고 택일적으로 프로세싱된 이종 폴리펩티드, 즉 원형질막-결합 폴리펩티드에 대한 정상적으로 프로세싱된 이종 폴리펩티드, 즉 가용성 폴리펩티드의 분자 비가 50:50 초과 내지 100:0 미만이 되게 한다. 한 실시양태에서, 제1 핵산과 제2 핵산은 작동가능하게 연결된다. 즉, 제2 핵산의 번역 정지 코돈이 폴리펩티드 또는 이의 단편을 코딩하는 제1 핵산의 리딩 프레임에 인 프레임으로 위치되어 있다.

택일적 스플라이싱에 의해 제거될 수 있는 핵산은 폴리펩티의 적어도 단편을 코딩하는 핵산 다음에 위치하고 경막 도메인의 적어도 단편을 코딩하거나 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산 앞에 위치한다. 한 실시양태에서, 이종 폴리펩티드는 원하는 N-말단 폴리펩티드 및 면역글로불린 중쇄 C_H3 또는 C_H4 도메인 또는 이의 변이체의 적어도 C-말단 단편을 포함하는 융합 폴리펩티드이다. 한 실시양태에서, 핵산은 제1 핵산과 제2 핵산 및/또는 제2 핵산과 제3 핵산 사이에 제4 핵산을 포함한다. 즉, 제4 핵산은 예를 들어, 제2 핵산 다음 (즉, 3' 스플라이스 수용 부위 다음) 제3 핵산의 5' 말단 앞에 위치한다.

이종 폴리펩티드를 코딩하는 핵산과 경막 도메인을 코딩하거나 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산 사이에 위치한 택일적으로 스플라이싱될 수 있는 핵산을 사용하여, 이종 폴리펩티드의 2개 변이체, 즉 경막 도메인 또는 GPI-고착자를 갖지 않은 이종 폴리펩티드 및 경막 도메인 또는 GPI-고착자를 갖는 이종 폴리펩티드를 발현시킬 수 있다. 이종 폴리펩티드는 예를 들어, 호르몬; 사이토카인; 성장 인자; 수용체 리간드, 작용제 또는 길항제; 세포독성제; 항바이러스제; 조영제; 효소 억제제; 효소 활성화제 또는 효소 활성 조절제, 예컨대, 알로스테릭 물질; 면역글로불린; 및 이들의 융합체 및 단편으로부터 선택되나, 이들로 한정되지 않는다. 한 실시양태에서, 폴리펩티드는 면역글로불린, 면역글로불린 중쇄 폴리펩티드 또는 면역글로불린 융합체이다.

본 발명은 택일적으로 스플라이싱될 수 있는 핵산이 포함되어 있는 한 임의의 폴리펩티드, 임의의 경막 도메인 및 GPI-고착자에 대한 임의의 신호 펩티드를 사용하여 실시할 수 있다. 보다 상세하게는, 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산 단편이 적절하게 선택되어야 한다. 선행 폴리펩티드 및 후속 경막 도메인 또는 GPI-고착자가 자유롭게 선택될 수 있다.

본 발명은 a) 제1 다중 클로닝 부위, b) 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 스플라이싱될 수 있는 핵산으로서, 이때 i) 상기 스플라이싱될 수 있는 핵산이 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 상기 스플라이싱될 수 있는 핵산이 전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않는, 핵산, c) 제2 다중 클로닝 부위를 포함하는 핵산을 추가로 포함한다.

본 발명은 예를 들어, C3b/C4b 수용체(보체 수용체 타입 1)(Hourcade, D., et al, J. Exp. Med. 168 (1988) 1255-1270), 인간, 닭 및 래트 EGFR(Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., and Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L., et al., Mol. Cell Biol. 10 (1990) 2973-2982), 면역글로불린(Ig) α, ε, γ 및 μ 중쇄(Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, and Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, B.J., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, MX., Gene Exp. 2 (1992) 319-327), 인간 PLA₂ 수용체(Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), 닭 Cek5(Connor, RJ., and Pasquale, E.B., Oncogene 11 (1995) 2429-2438), 및 인간 FGFR(Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634)을 코딩하는 핵산들로 이루어진 군으로부터 유래된 제2 핵산, 즉 택일적으로 스플라이싱될 수 있는 핵산(그러나, 이들로 한정되지 않음)을 사용하여 실시할 수 있다.

한 실시양태에서, 제2 핵산은 C_H3/C_H4 도메인을 코딩하는 엑손과 경막 도메인의 적어도 단편을 코딩하는 엑손 사이에 위치한 면역글로불린의 인트론이다. 한 실시양태에서, 제2 핵산은 인간(hu) 면역글로불린(Ig) α(알파) 중쇄, hu Ig δ(델타) 중쇄, hu Ig ε(엡실론) 중쇄, hu Ig γ1, γ2, γ3 및 γ4(감마) 중쇄, hu Ig μ(뮤) 중쇄, 뮤린 Ig 중쇄 타입 α(알파), 뮤린 Ig 중쇄 타입 δ(델타), 뮤린 Ig 중쇄 타입 ε(엡실론), 뮤린 Ig 중쇄 타입 γ1, 뮤린 Ig 중쇄 타입 γ2A, 뮤린 Ig 중쇄 타입 γ2B, 뮤린 Ig 중쇄 타입 γ3 및 뮤린 Ig 중쇄 타입 μ(뮤)를 코딩하는 핵산으로 이루어진 군으로부터 유래된다.

한 실시양태에서, 제2 핵산은 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 γ3 중쇄, 인간 면역글로불린 γ4 중쇄, 인간 면역글로불린 ε 중쇄(1) 및 인간 면역글로불린 ε 중쇄(2)를 코딩하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제2 핵산은 인간 면역글로불린 δ 중쇄, 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 μ 중쇄, 뮤린 중쇄 타입 α, 뮤린 중쇄 타입 γ1, 뮤린 중쇄 타입 γ2B, 뮤린 중쇄 타입 γ3 및 뮤린 중쇄 타입 μ를 코딩하는 핵산들로 이루어진 군으로부터 유도되거나 선택된다.

본 발명은 예를 들어, 경막 도메인의 적어도 단편을 코딩하는 핵산의 경우 C3b/C4b 수용체(보체 수용체 타입 1)(Hourcade, D., et al., J. Exp. Med. 168 (1988) 1255-1270), 인간, 닭 및 래트 EGFR(Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., and Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L., et al., Mol. Cell Biol. 10 (1990) 2973-2982), Ig α, ε, γ 및 μ 중쇄(Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, and Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, BJ., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, M.L., Gene Exp. 2 (1992) 319-327), 인간 PLA₂ 수용체(Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), 닭 Cek5(Connor, RJ., and Pasquale, E.B., Oncogene 11 (1995) 2429-2438), 및 인간 FGFR(Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634)을 코딩하는 핵산들로 이루어진 군으로부터 선택된 제3 핵산(그러나, 이들로 한정되지 않음)을 사용하여 실시할 수 있다. 한 실시양태에서, 제3 핵산은 인간(hu) 면역글로불린(Ig) α 중쇄, hu Ig δ 중쇄, hu Ig ε 중쇄, hu Ig γ1, γ2, γ3 및 γ4 중쇄, hu Ig μ 중쇄, 뮤린 Ig 중쇄 타입 α, 뮤린 Ig 중쇄 타입 δ, 뮤린 Ig 중쇄 타입 ε, 뮤린 Ig 중쇄 타입 γ1, 뮤린 Ig 중쇄 타입 γ2A, 뮤린 Ig 중쇄 타입 γ2B, 뮤린 Ig 중쇄 타입 γ3 및 뮤린 Ig 중쇄 타입 μ를 코딩하는 핵산으로 이루어진 군으로부터 유래된다. 한 실시양태에서, 제3 핵산은 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 γ3 중쇄, 인간 면역글로불린 γ4 중쇄, 인간 면역글로불린 ε 중쇄(1) 및 인간 면역글로불린 ε 중쇄(2)를 코딩하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제3 핵산은 인간 면역글로불린 δ 중쇄, 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 μ 중쇄, 뮤린 중쇄 타입 α, 뮤린 중쇄 타입 γ1, 뮤린 중쇄 타입 γ2B, 뮤린 중쇄 타입 γ3 및 뮤린 중쇄 타입 μ를 코딩하는 핵산들로 이루어진 군으로부터 선택된다.

경막 도메인의 적어도 단편을 코딩하는 핵산으로 이루어진 군 이외에, 제3 핵산은 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군으로부터 선택될 수 있다. GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군은 인간 알칼리성 디에스터레이즈, 아세틸콜린 에스터레이즈, 알칼리성 포스파테이즈(장, 간 및 태반), CAMPATH-1 항원, 암배아 항원, CD55, CD59, CD90, 콘택틴-1, E48 항원, 폴레이트 수용체 A 및 B, GPI-고착 단백질 p137, 림프구 기능-관련 항원-3, mDIA 상호작용 단백질, 5'-뉴클레오티데이즈, 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 GPI-고착자; 뮤린, LY-6C 항원, LY-6 항원, 5'-뉴클레오티데이즈, OX45 항원, 줄기세포 항원-2, 혈관 세포 부착 분자-1, Qa 림프구 항원 2(Qa2)로부터 유래된 GPI-고착자; 토끼 트레할레이즈로부터 유래된 GPI-고착자; 래트 브레비칸 단백질, CD90, 글리피칸 단백질, 헤파린 설페이트 프로테오글리칸, MRC OX-45 항원, 5'-뉴클레오데이즈, 췌장 분비 과립 막 주 당단백질, T-세포 표면 단백질 RT6.2로부터 유래된 GPI-고착자; 효모 DNA 복구 단백질 PHR1, 당인지질-고착 표면 단백질 1로부터 유래된 GPI-고착자; 돼지 아밀로이드 전구체 단백질, 디펩티데이즈로부터 유래된 GPI-고착자; 트립파노소마 브루세이 다양성 변이체 표면 단백질, 폴리시클릭 산성 반복 단백질로부터 유래된 GPI-고착자; 트립파노소마 콘골렌즈(congolense) 변이체 표면 단백질 YNat 1.1로부터 유래된 GPI-고착자; 닭 멜라노트랜스페린, 신경 세포 부착 분자로부터 유래된 GPI-고착자; 토페도 마모라타(Torpedo marmorata) 아세틸콜린 에스터레이즈로부터 유래된 GPI-고착자; 햄스터 프리온 단백질로부터 유래된 GPI-고착자; 소 5'-뉴클레오티데이즈로부터 유래된 GPI-고착자; 점균류 막 단백질 Gp64, 전구-포자 특이적 항원으로부터 유래된 GPI-고착자; 및 스퀴드(squid) Sgp1, Sgp2로부터 유래된 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군으로부터 선택될 수 있다.

본 발명에 따른 제2 핵산의 핵산 서열들의 예가 하기 표 1에 기재되어 있다. 표 2에서, 본 발명에 따른 제3 핵산의 핵산 서열 및 본 발명에 따른 제3 핵산 서열에 상응하는 아미노산 서열의 예가 하기 표 2에 기재되어 있다. 임의적 핵산인 제4 핵산의 핵산 서열 및 본 발명에 따른 상기 임의적 핵산인 제4 핵산에 상응하는 아미노산 서열의 예가 하기 표 3에 기재되어 있다.

하기 표 1에는 5' 스플라이스 공여 부위, 제2 (택일적으로 스플라이싱될 수 있는) 핵산 및 3' 스플라이스 수용 부위가 기재되어 있다. 제2 핵산의 서열이 일반으로 1 kb를 초과하기 때문에 표 1에 기재된 서열은 단축되고 전장 제2 핵산의 전체 크기를 표시하는 숫자에 의해 분리된 제2 핵산의 처음 약 100개 뉴클레오티드 및 마지막 100개 뉴클레오티드를 보여준다. 제2 핵산의 전장 서열은 서열목록의 주어진 서열번호에 포함되어 있다. 정지 코돈은 밑줄로 표시되어 있다.

스플라이스 공여 부위는 스플라이스 공여 부위의 선행 컨센서스 서열, 및 수직선에 의해 분리된 제2 핵산의 처음 6개 뉴클레오티드를 포함하는 형태로 주어진다(예를 들어, 문헌(Zhang, M.Q., Human Mol. Gen. 7 (1998) 919-932) 참조). 마찬가지로, 스플라이스 수용체 부위는 수직선에 의해 분리되어 있는 제2 핵산 및 후속 스플라이스 수용 부위 컨센서스 서열의 마지막 6개 뉴클레오티드를 기재함에 의해 주어진다. 수직선 바로 다음에 위치한 뉴클레오티드(5' 스플라이스 공여 부위) 및 수직선 바로 앞에 위치한 뉴클레오티드(3' 스플라이스 수용 부위)는 제2 (스플라이싱될 수 있는) 핵산의 첫번째 뉴클레오티드 및 마지막 뉴클레오티드이다. 제2 핵산 내의 정지 코돈은 표 1에서 밑줄로 표시되어 있다.

제2 핵산은 이종 폴리펩티드를 코딩하는 핵산, 즉 제1 핵산 또는 임의적 핵산 서열인 작은 (9 내지 21개 염기) 개재 핵산 서열에 직접 연결될 수 있다. 한 실시양태에서, 임의적 핵산인 개재 (제5) 핵산은 제2 핵산이 수득되는 게놈 내의 제2 핵산 앞에 위치한 핵산으로부터 유래된다.

표 2에서, 경막 도메인의 단편을 코딩하는 제3 핵산 서열 및 GPI-고착자에 대한 신호 펩티드의 아미노산 서열의 예가 기재되어 있다. 이 서열은 단독으로 또는 임의적 서열인 개재 서열, 즉 제4 핵산과 함께 3' 스플라이스 수용 부위 다음에 위치할 수 있다. 표 3에서, 제4 핵산 서열 및 이 제4 핵산 서열에 상응하는 아미노산 서열의 예가 표 3에 기재되어 있다.

한 실시양태에서, 본 발명에 따른 핵산은 제2 핵산과 제3 핵산 사이에 제4 핵산을 포함한다. 한 실시양태에서, 본 발명에 따른 핵산은 제1 핵산과 제2 핵산 사이에 제5 핵산을 포함한다. 본 발명의 한 실시양태는 제3 핵산이 i) 동일한 또는 ii) 상이한 유전자 또는 유기체로부터 제2 핵산으로서 수득되고, 즉 상기 제3 핵산이 게놈 내에서 상기 제2 핵산과 함께 존재할 필요가 없다는 것이다.

서열은 공개적으로 입수가능한 게놈 또는 데이타베이스(예를 들어, 인간 게놈 프로젝트, http://www.gdb.org/; mouse genome database, http://www.informatics.jax.org/; SwissProt (http://www.expasy.org/sprot/)로부터 유래된다. 정보를 이용할 수 없는 경우, 서열은 소프트웨어 ALOM(예컨대, 문헌(Klein, P., et al., Biochim. Biophys. Acta 787 (1984) 221-226) 참조)에 의해 예측되거나 완성된다. 전장 막 도메인의 경우, 괄호안의 서열은 주어진 스위스프로트(SwissProt) 소프트웨어 이외에 ALOM에 의해 예측된다.

한 실시양태에서, 제2 핵산은 서열번호 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172 및 173을 포함하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 본 발명에 따른 핵산 중 제2 핵산은 서열번호 001 내지 009의 핵산 서열들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제2 핵산은 서열번호 002, 003, 156, 157, 170 및 171을 포함하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 010 내지 018의 핵산 서열들 및 서열번호 019 내지 069의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 010, 011, 012, 013, 014, 015, 016, 017, 018, 160, 161, 163, 164, 165, 166, 167, 168, 174, 175 및 176의 핵산 서열들 및 서열번호 019 내지 069 및 162의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 011, 012, 165, 166 및 175의 핵산 서열들 및 서열번호 019 내지 036의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 또 다른 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 011, 012, 165, 166 및 175의 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제4 핵산은 서열번호 070 내지 078의 핵산 서열들 및 서열번호 079 내지 129의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산을 포함한다.

한 실시양태에서, 면역글로불린 중쇄 및 경막 도메인의 폴리펩티드는 면역글로불린 중쇄의 폴리펩티드이다. 면역글로불린을 발현시키고자 하는 경우, 본 발명의 핵산은 면역글로불린 경쇄를 코딩하는 핵산과 함께 진핵 숙주세포 내로 도입된다. 이 핵산은 동일한 핵산 또는 상이한 핵산 상에 위치할 수 있다.

본 발명은 본 발명의 벡터를 포함하는 진핵세포뿐만 아니라 본 발명의 핵산을 포함하는 벡터를 포함한다.

본 발명에 따른 핵산에 의해 코딩된 이종 폴리펩티드의 가용성 변이체는 본 발명의 핵산으로 진핵세포를 형질감염시키고, 상기 핵산에 의해 코딩된 폴리펩티드의 발현에 적합한 조건 하에 상기 세포를 배양하고, 세포의 세포질 또는 세포 배양물로부터 폴리펩티드를 회수함으로써 제조할 수 있다.

본 발명에 따른 진핵세포를 발생시키고자 하는 경우, 키트가 제공된다. 상기 키트는 2개 이상의 다중 클로닝 부위, 및 5' 스플라이스 공여 부위로 시작되며 3' 스플라이스 수용 부위로 종결되는 스플라이싱될 수 있는 핵산을 함유하는 벡터를 포함하는데, 이때 i) 상기 핵산은 번역 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 상기 핵산은 전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않는다.

한 실시양태에서, 본 발명의 진핵세포는 포유동물 세포이다. 한 실시양태에서, 포유동물 세포는 CHO 세포, NS0 세포, Sp2/0 세포, COS 세포, K652 세포, BHK 세포 및 HEK 세포를 포함하는 군으로부터 선택된 세포이다.

하기 실시예, 서열목록 및 도면은 본 발명의 이해를 돕기 위해 제공된 것이고, 본 발명의 진정한 범위는 첨부된 청구범위에 기재되어 있다. 본 발명의 사상을 벗어나지 않으면서 기재된 절차에 변형을 가할 수 있다.

표 설명

표 1: 제2 핵산의 예

표 2: 제3 핵산 및 제3 핵산에 상응하는 아미노산의 예

표 3: 제4 핵산 및 제4 핵산에 상응하는 아미노산의 예

표 4: sIgG/mIgG 발현 벡터 "pmIgG-A"의 제작에 있어서 클로닝 및 돌연변이유발용 올리고뉴클레오티드 프라이머

표 5: 대수기 동안 여러 시점에서 계산된 4개의 상이한 SPR에 기초한, 모든 선택된 클론에 대해 측정된 평균 SPR

표 6: 단일 세포를 96웰 플레이트 내에 배분한 지 3주 후 상이한 IgG 농도 수준에 대한 클론의 분포, 및 ELISA에 의한 515개의 mIgG-분류 클론 및 550개의 대조군 클론의 세포 배양물 상청액의 분석

표 7: 제2 선별에서 상이한 IgG 농도 수준에 대한 클론의 분포.

표 8: CASY^? TT 세포 계수기(Scharfe Systems)로 측정한 모든 클론의 0, 1, 2, 3, 4 및 7일 진탕기 배양물의 세포수

표 9: ELISA에 의한 10일 진탕기 배양물의 생산성 측정

서열 설명

서열번호 001: 인간 면역글로불린 δ 중쇄로부터 유래된 제2 핵산

서열번호 002: 인간 면역글로불린 γ1 중쇄로부터 유래된 제2 핵산

서열번호 003: 인간 면역글로불린 γ2 중쇄로부터 유래된 제2 핵산

서열번호 004: 인간 면역글로불린 μ 중쇄로부터 유래된 제2 핵산

서열번호 005: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제2 핵산

서열번호 006: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제2 핵산

서열번호 007: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제2 핵산

서열번호 008: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제2 핵산

서열번호 009: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제2 핵산

서열번호 010: 인간 면역글로불린 δ 중쇄로부터 유래된 제3 핵산

서열번호 011: 인간 면역글로불린 γ1 중쇄로부터 유래된 제3 핵산

서열번호 012: 인간 면역글로불린 γ2 중쇄로부터 유래된 제3 핵산

서열번호 013: 인간 면역글로불린 μ2 중쇄로부터 유래된 제3 핵산

서열번호 014: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제3 핵산

서열번호 015: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제3 핵산

서열번호 016: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제3 핵산

서열번호 017: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제3 핵산

서열번호 018: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제3 핵산

서열번호 019: 인간 AChE로부터 유래된 제3 핵산

서열번호 020: 인간 장 알칼리성 포스파테이즈로부터 유래된 제3 핵산

서열번호 021: 인간 간 알칼리성 포스파테이즈로부터 유래된 제3 핵산

서열번호 022: 인간 태반 알칼리성 포스파테이즈로부터 유래된 제3 핵산

서열번호 023: 인간 CAMPATH-1 항원으로부터 유래된 제3 핵산

서열번호 024: 인간 암배아 항원으로부터 유래된 제3 핵산

서열번호 025: 인간 CD55로부터 유래된 제3 핵산

서열번호 026: 인간 CD59로부터 유래된 제3 핵산

서열번호 027: 인간 CD90으로부터 유래된 제3 핵산

서열번호 028: 인간 콘택틴-1로부터 유래된 제3 핵산

서열번호 029: 인간 E48 항원으로부터 유래된 제3 핵산

서열번호 030: 인간 폴레이트 수용체 A로부터 유래된 제3 핵산

서열번호 031: 인간 폴레이트 수용체 B로부터 유래된 제3 핵산

서열번호 032: 인간 GPI-고착 단백질 p137로부터 유래된 제3 핵산

서열번호 033: 인간 림프구 기능-관련 항원-3으로부터 유래된 제3 핵산

서열번호 034: 인간 mDIA 상호작용 단백질로부터 유래된 제3 핵산

서열번호 035: 인간 5'-뉴클레오티데이즈로부터 유래된 제3 핵산

서열번호 036: 인간 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 제3 핵산

서열번호 037: 뮤린 세포 표면 단백질 LY-6C 항원으로부터 유래된 제3 핵산

서열번호 038: Ly-6 항원 ThB로부터 유래된 제3 핵산

서열번호 039: 뮤린 5'-뉴클레오티데이즈로부터 유래된 제3 핵산

서열번호 040: 뮤린 OX45 항원으로부터 유래된 제3 핵산

서열번호 041: 뮤린 줄기 세포 항원 2로부터 유래된 제3 핵산

서열번호 042: 뮤린 혈관 세포 부착 분자 1로부터 유래된 제3 핵산

서열번호 043: 래트 브레비칸으로부터 유래된 제3 핵산

서열번호 044: 래트 CD90 항원으로부터 유래된 제3 핵산

서열번호 045: 래트 글리피칸으로부터 유래된 제3 핵산

서열번호 046: 래트 MRC OX45 항원으로부터 유래된 제3 핵산

서열번호 047: 래트 5'-뉴클레오티데이즈로부터 유래된 제3 핵산

서열번호 048: 래트 췌장 분비 과립 막 주 당단백질 GP2로부터 유래된 제3 핵산

서열번호 049: 래트 T-세포 표면 단백질 RT6.2로부터 유래된 제3 핵산

서열번호 050: 효모 DNA 복구 단백질 PHR1로부터 유래된 제3 핵산

서열번호 051: 효모 당인지질-고착 표면 단백질-1로부터 유래된 제3 핵산

서열번호 052: 돼지 아밀로이드 전구 단백질로부터 유래된 제3 핵산

서열번호 053: 돼지 디펩티데이즈로부터 유래된 제3 핵산

서열번호 054: 트립파노소마 브루세이 변이체 표면 단백질 IL Tat 1.1로부터 유래된 제3 핵산

서열번호 055: 트립파노소마 브루세이 변이체 표면 단백질 MIT 117a로부터 유래된 제3 핵산

서열번호 056: 트립파노소마 브루세이 변이체 표면 단백질 MIT 118a로부터 유래된 제3 핵산

서열번호 057: 트립파노소마 브루세이 변이체 표면 단백질 MIT 221로부터 유래된 제3 핵산

서열번호 058: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.1000 BC로부터 유래된 제3 핵산

서열번호 059: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.5b로부터 유래된 제3 핵산

서열번호 060: 트립파노소마 브루세이 프로사이클릭 산성 반복 단백질로부터 유래된 제3 핵산

서열번호 061: 트립파노소마 브루세이 변이체 표면 단백질 TxTat 1로부터 유래된 제3 핵산

서열번호 062: 트립파노소마 콘골렌즈 변이체 표면 단백질 YNat 1.1로부터 유래된 제3 핵산

서열번호 063: 닭 멜라노트랜스페린으로부터 유래된 제3 핵산

서열번호 064: 닭 신경 세포 부착 분자로부터 유래된 제3 핵산

서열번호 065: 토페도 마모라타 AChE로부터 유래된 제3 핵산

서열번호 066: 햄스터 프리온 단백질로부터 유래된 제3 핵산

서열번호 067: 소 5'-뉴클레오티데이즈로부터 유래된 제3 핵산

서열번호 068: 점균류 막 단백질 Gp64로부터 유래된 제3 핵산

서열번호 069: 점균류 전구-포자 특이적 항원으로부터 유래된 제3 핵산

서열번호 070: 인간 면역글로불린 δ 중쇄로부터 유래된 제4 핵산

서열번호 071: 인간 면역글로불린 γ1 중쇄로부터 유래된 제4 핵산

서열번호 072: 인간 면역글로불린 γ2 중쇄로부터 유래된 제4 핵산

서열번호 073: 인간 면역글로불린 μ 중쇄로부터 유래된 제4 핵산

서열번호 074: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제4 핵산

서열번호 075: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제4 핵산

서열번호 076: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제4 핵산

서열번호 077: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제4 핵산

서열번호 078: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제4 핵산

서열번호 079: 인간 AChE로부터 유래된 제4 핵산

서열번호 080: 인간 장 알칼리성 포스파테이즈로부터 유래된 제4 핵산

서열번호 081: 인간 간 알칼리성 포스파테이즈로부터 유래된 제4 핵산

서열번호 082: 인간 태반 알칼리성 포스파테이즈로부터 유래된 제4 핵산

서열번호 083: 인간 CAMPATH-1 항원으로부터 유래된 제4 핵산

서열번호 084: 인간 암배아 항원으로부터 유래된 제4 핵산

서열번호 085: 인간 CD55로부터 유래된 제4 핵산

서열번호 086: 인간 CD59로부터 유래된 제4 핵산

서열번호 087: 인간 CD90으로부터 유래된 제4 핵산

서열번호 088: 인간 콘택틴-1로부터 유래된 제4 핵산

서열번호 089: 인간 E48 항원으로부터 유래된 제4 핵산

서열번호 090: 인간 폴레이트 수용체 A로부터 유래된 제4 핵산

서열번호 091: 인간 폴레이트 수용체 B로부터 유래된 제4 핵산

서열번호 092: 인간 GPI-고착 단백질 p137로부터 유래된 제4 핵산

서열번호 093: 인간 림프구 기능-관련 항원-3으로부터 유래된 제4 핵산

서열번호 094: 인간 mDIA 상호작용 단백질로부터 유래된 제4 핵산

서열번호 095: 인간 5'-뉴클레오티데이즈로부터 유래된 제4 핵산

서열번호 096: 인간 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 제4 핵산

서열번호 097: 뮤린 세포 표면 단백질 LY-6C 항원으로부터 유래된 제4 핵산

서열번호 098: Ly-6 항원 ThB로부터 유래된 제4 핵산

서열번호 099: 뮤린 5'-뉴클레오티데이즈로부터 유래된 제4 핵산

서열번호 100: 뮤린 OX45 항원으로부터 유래된 제4 핵산

서열번호 101: 뮤린 줄기 세포 항원 2로부터 유래된 제4 핵산

서열번호 102: 뮤린 혈관 세포 부착 분자 1로부터 유래된 제4 핵산

서열번호 103: 래트 브레비칸으로부터 유래된 제4 핵산

서열번호 104: 래트 CD90 항원으로부터 유래된 제4 핵산

서열번호 105: 래트 글리피칸으로부터 유래된 제4 핵산

서열번호 106: 래트 MRC OX45 항원으로부터 유래된 제4 핵산

서열번호 107: 래트 5'-뉴클레오티데이즈로부터 유래된 제4 핵산

서열번호 108: 래트 췌장 분비 과립 막 주 당단백질 GP2로부터 유래된 제4 핵산

서열번호 109: 래트 T-세포 표면 단백질 RT6.2로부터 유래된 제4 핵산

서열번호 110: 효모 DNA 복구 단백질 PHR1로부터 유래된 제4 핵산

서열번호 111: 효모 당인지질-고착 표면 단백질-1로부터 유래된 제4 핵산

서열번호 112: 돼지 아밀로이드 전구 단백질로부터 유래된 제4 핵산

서열번호 113: 돼지 디펩티데이즈로부터 유래된 제4 핵산

서열번호 114: 트립파노소마 브루세이 변이체 표면 단백질 IL Tat 1.1로부터 유래된 제4 핵산

서열번호 115: 트립파노소마 브루세이 변이체 표면 단백질 MIT 117a로부터 유래된 제4 핵산

서열번호 116: 트립파노소마 브루세이 변이체 표면 단백질 MIT 118a로부터 유래된 제4 핵산

서열번호 117: 트립파노소마 브루세이 변이체 표면 단백질 MIT 221로부터 유래된 제4 핵산

서열번호 118: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.1000 BC로부터 유래된 제4 핵산

서열번호 119: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.5b로부터 유래된 제4 핵산

서열번호 120: 트립파노소마 브루세이 프로사이클릭 산성 반복 단백질로부터 유래된 제4 핵산

서열번호 121: 트립파노소마 브루세이 변이체 표면 단백질 TxTat 1로부터 유래된 제4 핵산

서열번호 122: 트립파노소마 콘골렌즈 변이체 표면 단백질 YNat 1.1로부터 유래된 제4 핵산

서열번호 123: 닭 멜라노트랜스페린으로부터 유래된 제4 핵산

서열번호 124: 닭 신경 세포 부착 분자로부터 유래된 제4 핵산

서열번호 125: 토페도 마모라타 AChE로부터 유래된 제4 핵산

서열번호 126: 햄스터 프리온 단백질로부터 유래된 제4 핵산

서열번호 127: 소 5'-뉴클레오티데이즈로부터 유래된 제4 핵산

서열번호 128: 점균류 막 단백질 Gp64로부터 유래된 제4 핵산

서열번호 129: 점균류 전구-포자 특이적 항원으로부터 유래된 제4 핵산

서열번호 130: 모든 개재 인트론과 함께 C_H1 내지 C_H3까지의 엑손 및 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHG1) 유전자

서열번호 131: 플라스미드 pIgG-A에 의해 코딩된 γ 쇄 불변 영역의 아미노산 서열

서열번호 132: 올리고뉴클레오티드 프라이머 TM-fw1

서열번호 133: 올리고뉴클레오티드 프라이머 TM-rv1

서열번호 134: 올리고뉴클레오티드 프라이머 M1-rv

서열번호 135: 올리고뉴클레오티드 프라이머 M2-fw

서열번호 136: 올리고뉴클레오티드 프라이머 TM-fw2

서열번호 137: 올리고뉴클레오티드 프라이머 TM-rv2

서열번호 138: 올리고뉴클레오티드 프라이머 mutSphI-1

서열번호 139: 올리고뉴클레오티드 프라이머 mutSphI-2

서열번호 140: 모든 개재 인트론과 함께 C_H1 내지 M2까지의 엑손, 인트론 6 내의 IgG1의 분비 형태에 대한 폴리아데닐화 신호, 및 IgG1의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHG1) 유전자

서열번호 141: 플라스미드 pmIgG-A에 의해 코딩된 짧은 (sIgG) 이소폼의 아미노산 서열

서열번호 142: 플라스미드 pmIgG-A에 의해 코딩된 γ-쇄 불변 영역의 긴 (mIgG) 이소폼의 아미노산 서열

서열번호 143:모든 개재 인트론과 함께 C_H1 내지 C_H3의 엑손, 및 면역글로불린의 분비 형태에 대한 폴링아데닐화 부위를 포함하는 인트론 6의 인접 5' 부분을 포함하는 인간 IGHG1 유전자

서열번호 144: 플라스미드 pmIgGΔ-A에 의해 코딩된 γ-쇄 불변 영역의 짧은 (sIgG) 이소폼의 아미노산 서열

서열번호 145: 플라스미드 pmIgGΔ-A에 의해 코딩된 γ-쇄 불변 영역의 긴 (sIgG) 이소폼의 아미노산 서열

서열번호 146: pmIgGΔ-B로부터 제거된 코딩되는 서열

서열번호 147: 플라스미드 pIgG-GPI-B의 발생을 위해 삽입된 코딩되는 서열(인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드의 아미노산 서열(NCBI 검색번호: M 13077; 뉴클레오티드: 1542부터 1643까지))

서열번호 148: 발현 플라스미드 pIgG-GPI-B의 C_H1부터 3' UTR까지 이르는 γ 쇄 발현 카세트 불변 영역의 DNA 서열

서열번호 149: 플라스미드 pIgG-GPI-B에 의해 코딩된 γ 쇄 불변 영역의 sIgG 이소폼의 아미노산 서열

서열번호 150: 플라스미드 pIgG-GPI-B에 의해 코딩된 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드를 포함하는 γ 쇄 불변 영역의 긴 이소폼의 아미노산 서열

서열번호 151: 인간 섬유모세포 성장인자 수용체 1로부터 유래된 제2 핵산

서열번호 152: 뮤린 상피 성장인자 수용체로부터 유래된 제2 핵산

서열번호 153: 인간 보체 수용체 1(C3b/C4b)로부터 유래된 제2 핵산

서열번호 154: 뮤린 인터류킨 4 수용체로부터 유래된 제2 핵산

서열번호 155: 인간 면역글로불린 α 중쇄로부터 유래된 제2 핵산

서열번호 156: 인간 면역글로불린 ε 중쇄(1)로부터 유래된 제2 핵산

서열번호 157: 인간 면역글로불린 γ3 중쇄로부터 유래된 제2 핵산

서열번호 158: 뮤린 Ig 중쇄 타입 ε으로부터 유래된 제2 핵산

서열번호 159: 뮤린 Ig 중쇄 타입 γ2A로부터 유래된 제2 핵산

서열번호 160: 인간 섬유모세포 성장인자 수용체 1로부터 유래된 제3 핵산

서열번호 161: 뮤린 상피 성장인자 수용체로부터 유래된 제3 핵산

서열번호 162: 인간 보체 수용체 1(C3b/C4b)로부터 유래된 제3 핵산

서열번호 163: 뮤린 인터류킨 4 수용체로부터 유래된 제3 핵산

서열번호 164: 인간 면역글로불린 α 중쇄로부터 유래된 제3 핵산

서열번호 165: 인간 면역글로불린 ε 중쇄로부터 유래된 제3 핵산

서열번호 166: 인간 면역글로불린 γ3 중쇄로부터 유래된 제3 핵산

서열번호 167: 뮤린 Ig 중쇄 타입 ε으로부터 유래된 제3 핵산

서열번호 168: 뮤린 Ig 중쇄 타입 γ2A로부터 유래된 제3 핵산

서열번호 169: 인간 인터류킨 4 수용체로부터 유래된 제2 핵산

서열번호 170: 인간 면역글로불린 ε 중쇄(2)로부터 유래된 제2 핵산

서열번호 171: 인간 면역글로불린 γ4 중쇄로부터 유래된 제2 핵산

서열번호 172: 뮤린 면역글로불린 δ 중쇄로부터 유래된 제2 핵산

서열번호 173: 인간 면역글로불린 ε 중쇄(2)로부터 유래된 제2 핵산

서열번호 174: 인간 인터류킨 4 수용체로부터 유래된 제3 핵산

서열번호 175: 인간 면역글로불린 γ4 중쇄로부터 유래된 제3 핵산

서열번호 176: 뮤린 Ig 중쇄 타입 δ로부터 유래된 제3 핵산

실시예 1

게놈 단편의 클로닝 및 진핵 sIgG/mIgG 발현 벡터의 구축

a) sIgG 발현 벡터 "pIgG-A"의 구축

단백질 "A"에 대한 특이성을 가진 면역글로불린을 발현시키기 위해 벡터 "pIgG-A"를 구축하였다. 상기 벡터는 상기 면역글로불린의 분비 sIgG 형태를 코딩하고 하기 요소들을 포함한다(도 1C 참조):

1. - 인간 사이토메갈로바이러스(hCMV)로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열(Kozak, M., Nucleic Acids Res. 15 (1987) 8125-48)을 포함하는 합성 5' UTR,

- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA, 및

- 모든 개재 인트론과 함께 C_H1부터 C_H3까지의 엑손, 및 IgG1의 분비 형태의 중쇄에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHGl) 유전자와 연결된 마우스 Ig μ 인핸서(J_H3-J_H4 스위치 영역)를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2

로 이루어진, 인간 γ1 중쇄에 대한 전사 단위체.

중쇄 불변 영역의 뉴클레오티드 서열은 서열번호 130에 기재되어 있다. 플라스미드 pIgG-A에 의해 코딩된 γ-쇄 불변 영역의 아미노산 서열은 서열번호 131에 기재되어 있다.

2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열을 포함하는 합성 5' UTR,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,

- 인간 면역글로불린 κ 불변(IGKC) 유전자에 연결된 마우스 인트론 2 Ig κ 인핸서, 및

- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR

으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.

3. 포유동물 세포에 대한 선별 마커로서 네오마이신 포스포트랜스퍼레이즈 전사 단위체.

4. 대장균에서 플라스미드 복제를 위한 벡터 pUC18로부터의 복제 기점.

5. 대장균에서 앰피실린 내성을 부여하는 베타-락타메이즈 유전자.

b) sIgG/mIgG 발현 벡터 "pmIgG-A"의 구축

엑손 C_H3의 인트론 다운스트림의 주요 부분(인트론 6), 엑손 M1, 엑손 M1의 인트론-다운스트림(인트론 7), 엑손 M2, 및 γ1 쇄의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 IGHGl 좌위의 5.2 kb 게놈 단편을, 익스팬드 롱 템플레이트 PCR 시스템(Expand Long Template PCR System; 독일 소재의 Roche Diagnostics GmbH) 및 하기 표 4에 기재된 올리고뉴클레오티드 프라이머를 사용한 PCR로 인간 게놈 DNA(독일 만하임 소재의 Roche Diagnostics GmbH)로부터 증폭하였다.

증폭된 단편은 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87203513 내지 87208691에 상응한다. 서브클로닝된 PCR 생성물의 시퀀싱은 상응하는 염색체 14번 서열과 비교할 때 98% 동일성을 보였고, 모든 차이는 인트론 또는 3' UTR에서 발견되었다. 엑손 M2 정지 코돈으로부터 219 bp 다운스트림에 위치한 SphI 제한 부위를, 표 2에 기재된 올리고뉴클레오티드 프라이머를 사용한 PCR-기초 부위 지정 돌연변이유발로 파괴하였다. 그 다음, SphI 제한 부위를 통해 면역글로불린 γ1 쇄 발현 벡터 pIgG-A 내로 클로닝하여 단편을 인트론 6의 5' 플랭킹 부분과 연결함으로써, 게놈 수준으로 구성된 완전한 γ1 쇄 전사 단위체를 생성하였다. 서브클로닝함으로써 단백질 "A"에 대한 특이성을 가진 항체의 분비 형태(sIgG) 및 막 결합 형태(mIgG)를 코딩하는 진핵 발현 벡터 "pmIgG-A"를 구축하였다. 플라스미드는 하기 요소들을 포함한다(도 1A 참조):

1. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열을 포함하는 합성 5' UTR,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA, 및

- 모든 개재 인트론과 함께 C_H1부터 M2까지의 엑손, 및 인트론 6 내의 IgG1의 분비 형태에 대한 폴리아데닐화 신호 및 IgG1의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 IGHGl 유전자에 연결된, J_H3-J_H4 스위치 영역(Banerji, J., et al., Cell 33 (1983) 729-740; Gillies, S.D., et al., Cell, 33 (1983) 717-728)으로부터 마우스 Ig μ 인핸서를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2

로 이루어진, 인간 γ1 중쇄에 대한 전술한 전사 단위체.

중쇄 불변 영역의 게놈 구성은 도 2A에 나타나 있고, 뉴클레오티드 서열은 서열번호 140에 기재되어 있다. 플라스미드 pmIgG-A에 의해 코딩된 γ-쇄 불변 영역의 짧은 (sIgG) 이소폼 또는 긴 (mIgG) 이소폼의 아미노산 서열은 서열번호 141 또는 142에 기재되어 있다.

2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열을 포함하는 합성 5' UTR,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,

- 인간 면역글로불린 κ 불변(IGKC) 유전자와 연결된 마우스 인트론 2 Ig κ 인핸서(Emorine, L., et al., Nature 304 (1983) 447-449; Picard, D., and Schaffner, W., Nature (1984) 307, 80-82), 및

- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR

으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.

3. 포유동물 세포에 대한 선별 마커로서의 네오마이신 포스포트랜스퍼레이즈 전사 단위체.

4. 대장균에서의 플라스미드 복제를 위한 벡터 pUC18로부터의 복제 기점.

5. 대장균에서 앰피실린 내성을 부여하는 β-락타메이즈 유전자.

c) sIgG/mIgG 발현 벡터 "pmIgGΔ-A" 및 "pmIgGΔ-B"의 구축

실시예 1b)에 기재된 것과 유사한 방식으로, 엑손 C_H3의 인트론 다운스트림의 주요 부분(인트론 6) 및 엑손 M1을 포함하는 인간 면역글로불린 중쇄 γ3(IGHG3) 좌위의 1.1 kb 게놈 단편을 PCR로 증폭하였다(올리고뉴클레오티드에 대해서는 표 2 참조). 단편은 98%의 서열 동일성으로 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87235195 내지 87236300에 상응한다. 엑손 M1 내의 하나의 뉴클레오티드 교환만이 침묵 돌연변이라는 점을 제외하고 모든 차이는 인트론에서 발견되므로, 코딩된 아미노산 서열은 변경되지 않는다. 유사하게, 엑손 2, 및 γ4 쇄의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ4(IGHG4) 좌위의 1.6 kb 단편을 PCR로 증폭하였다(올리고뉴클레오티드에 대해서는 표 2 참조). 단편은 98%의 서열 동일성으로 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87087786 내지 87089377에 상응하고, 모든 차이는 3' UTR에서 발견된다. 엑손 M2로부터 212 bp 다운스트림에 위치한 SphI 부위를 PCR-기초 부위 지정 돌연변이유발로 파괴하였다. 두 단편을 PCR(올리고뉴클레오티드에 대해서는 표 2 참조)로 M1과 M2 사이에 연결한 후, 인트론 6 내 SphI 부위를 통해 γ1 쇄 발현 벡터 내로 클로닝함으로써, M1과 M2 사이의 인트론(인트론 7)을 갖지 않은 게놈 구성을 가진 하이브리드 γ1 - γ3 - γ4 쇄 발현 카세트를 생성하였다. 서브클로닝함으로써, 단백질 "A"에 대한 특이성을 가진 항체의 분비 sIgG 및 막 결합 mIgG 형태를 코딩하는 진핵 발현 벡터 "pmIgGΔ-A"를 구축하였다. 플라스미드는 하기 요소들을 포함한다(도 1B도 참조):

1. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열을 포함하는 합성 5' UTR,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA,

- 모든 개재 인트론과 함께 C_H1부터 C_H3까지의 엑손, 및 IgG1의 분비 형태의 중쇄에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHGl) 유전자와 연결된 마우스 Ig μ 인핸서(J_H3-J_H4 스위치 영역)를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2,

- 인간 IGHG3 유전자로부터의 인트론 6 및 엑손 M1의 3' 부분, 및

- 엑손 M2, 및 인간 IGHG4 유전자로부터의 면역글로불린의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 3' UTR

으로 이루어진, 하이브리드 γ1 - γ3 - γ4 중쇄에 대한 전술한 전사 단위체.

중쇄 불변 영역의 게놈 구성은 도 2B에 나타나 있고, 뉴클레오티드 서열은 서열번호 143에 기재되어 있다. 플라스미드 pmIgGΔ-A에 의해 코딩된 γ 쇄 불변 영역의 짧은 (sIgG) 이소폼 또는 긴 (mIgG) 이소폼의 아미노산 서열은 서열번호 144 또는 145에 기재되어 있다.

2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,

- 코작 컨센서스 서열을 포함하는 합성 5' UTR,

- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,

- 인간 면역글로불린 κ 불변(IGKC) 유전자와 연결된 마우스 인트론 2 Ig κ 인핸서, 및

- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR

으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.

γ 및 κ 쇄의 가변 영역을 코딩하는 cDNA 서열을 교환함으로써 sIgG/mIgG 발현 벡터 "pmIgGΔ-B"를 구축하였다. 상기 벡터는 pmIgGΔ-A에 대해 기재된 것과 동일한 구성을 갖지만 단백질 "B"에 대한 특이성을 가진 면역글로불린을 코딩한다.

실시예 2

Sp2/0-Agl4 세포의 형질감염 및 분석

a) Sp2/0-Agl4 세포의 배양 및 전기영동

Sp2/0-Agl4 하이브리도마 세포(ATCC 수탁번호 CRL-1581, Shulman, M., et al., Nature 276 (1978) 269-270)를 37℃, 5% CO₂ 및 95% 습도의 조건 하에 10% 한외-저(ultra-low) IgG 태아 소 혈청(FCS)(미국 소재의 Invitrogen Corp.) 및 2 mM 글루타민(미국 소재의 Invitrogen Corp.)로 보충된 RPMI 배지(미국 소재의 Invitrogen Corp.) 중에서 배양하였다. 형질감염 후, 4℃에서 137 mM NaCl, 5 mM KCl, 0.7 mM Na₂HPO₄ 및 6 mM 글루코스를 함유하는 pH 7.0의 20 mM HEPES-완충제(N-(2-하이드록시에틸)-피페라진-N'-2-에탄설폰산) 중에서 10⁶개 세포 당 10 ㎍의 플라스미드 DNA로 세포를 전기천공하였다. 전기천공은 220V 및 960 μF에서 진펄서(Genepulser) 전기천공 장치(미국 소재의 Bio-Rad Laboratories Inc.)를 이용하여 수행하였다. 형질감염 후, 세포를 웰 당 100 ㎕ 배지 중 5000 세포의 밀도로 96웰 플레이트에 분배하였다. 형질감염 세포의 선별을 위해, 500 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)을 전기천공 후 1일째 날에 배지에 첨가하였다. 배지를 2 내지 3일마다 바꾸어 선별 압력을 유지하였다. 형질감염시킨 지 약 2주 후, 형질감염종 클론을 96웰 플레이트로부터 단리하여 적절한 배양 용기 내에서 더 증식시켰다. 저장을 위해, 클론의 약 10⁶개 세포를 저 IgG FCS(미국 소재의 Invitrogen Corp.) 중의 10% 디메틸설폭사이드(독일 소재의 Sigma-Aldrich Co.) 중에서 동결시키고 액체 질소 중에 저장하였다.

플라스미드 pmIgG-A, pmIgGΔ-A 및 pIgG-A로 각각 10⁶개 세포를 형질감염시켜 각각 15, 19 및 12개의 독립 클론을 형성하였다. 추가 분석을 위해 각 형질감염으로부터 6개의 클론을 무작위로 선별하였다.

b) 유세포분류에 의한 IgG 정량 및 분석

실시예 2a)의 각 클론의 10⁵개 세포를 6웰 플레이트에서 G418(전술한 바와 같음)을 함유하는 2 ㎖ 배지 중에 접종하고 48시간 동안 배양하였다. 그 다음, 상청액을 모아 분비된 IgG의 양을 제조자의 프로토콜에 따라 "인간 Fc 검출 키트"(CIS biointernational)를 사용한 균질 시간-해상 형광(HTRF) 면역분석으로 정량하였다. 유세포분류로 원형질막-결합 항체를 분석하기 위해, 각 클론의 10⁵개 세포를 4℃에서 PBS(인산염 완충 식염수)로 2회 세척한 후, 50 ㎕ FITC-접합 F(ab')₂ 단편 마우스 항-인간 IgG(독일 소재의 Dianova) 중에 재현탁시키고, 1% BSA(독일 소재의 Roche Diagnostics GmbH)를 함유하는 PBS 중에 1:50으로 희석하고, 4℃의 암실에서 1시간 동안 항온처리하였다. PBS로 2회 세척한 후, 세포를 PBS 중에 재현탁시키고 BD FACSCalibur 유세포분류기(미국 소재의 BD Biosciences)로 분석하였다. 세포 표면에 결합된 IgG의 양의 척도로서 평균 형광 강도를 각 클론에 대해 측정하였다.

도 3에서, 유세포분류에서의 평균 형광 강도는 각 클론에 대해 세포 배양물 상청액 중의 IgG 농도와 함께 표시된다. pmIgG-A 또는 pmIgGΔ-A(즉, sIgG 및 mIgG 형태 둘다에 대한 플라스미드)로 형질감염된 클론의 경우 분비된 IgG의 증가된 양이 상승된 세포 표면 신호와 일치함이 관찰되었다. 이러한 상관관계는 pIgG-A(즉, 항체의 분비 형태인 sIgG만을 코딩하는 플라스미드)로 형질감염된 클론의 경우에는 관찰되지 않았다.

실시예 3

유세포분류에 의한 안정하게 형질감염 세포의 분류

IgG를 안정하게 발현하는 클론을 생성하기 위해, 3xlO⁶개 Sp2/0-Agl4 세포를 전술한 바와 같은 전기천공으로 플라스미드 pmIgGΔ-B로 형질감염시켰다. 형질감염시킨 지 1일 후, 세포를 500 ㎍/㎖의 G418 선별 배지로 옮기고 약 2주 동안 풀(pool)로서 배양하였다. 선별 후, 형질감염 세포의 표면에 결합된 IgG를 표지하고 가장 강한 신호를 가진 세포를 유세포분류로 분류하였다. 이로써, 상기 풀로부터의 4x10⁶개 세포를 4℃에서 배지로 2회 세척한 후, 배지 중에 1:50으로 희석된 플루오레세인(FITC)-접합 F(ab')₂ 단편 마우스 항-인간 IgG(독일 소재의 Dianova)와 함께 얼음 위에서 20분 동안 항온처리하였다. 배지를 사용한 2 단계 세척 후, 세포를 배지 중에 재현탁시키고 BD FACS밴티지 유세포분류기(미국 소재의 BD Biosciences)로 옮겼다. 게이트는 동일한 집단의 형광 강도의 상위 5 내지 6%를 갖는 세포를 포괄하도록 설정하였고, 이 게이트로 분류된 세포를 모았다. 모은 세포를 선별 배지 중에서 수일 동안 배양함으로써 증폭하였다. 이 세포를 이용하여 제2 및 연속적으로 제3 분류 주기를 전술한 바와 같이 수행하였다. 분류된 세포를 풀로서 회수하는 대신에, 제4 및 최종 분류 단계를 96웰 플레이트 내로의 단일 세포 배분에 이용하였다. 이 배분은 141개의 독립 클론을 생성하였고, 이 클론들 중 21개의 클론이 실시예 2b)에 기재된 HTRF 면역분석에 의한 IgG 발현 분석을 위해 선택되었다. 이 클론들 중에서 가장 높은 분비 속도 및 그에 따라 가장 강한 세포 표면 신호를 보이는 2개의 클론, 즉 5B11 및 9B3을 이들의 생산성에 대한 추가 평가를 위해 스피너 배양기 중에서의 혈청 부재 생장에 적응시켰다.

실시예 4

클론의 비생산성의 측정

클론 5B11 및 9B3의 비생산성을 측정하기 위해, 상기 클론들을 100 ㎖ 스피너 플라스크(미국 소재의 Belco) 내에서 1x 콜레스테롤/지질 농축물(미국 소재의 Invitrogen Corp.), 4 mM 글루타민(미국 소재의 Invitrogen Corp.) 및 250 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)로 보충된 ProCHO 6k 배지(미국 소재의 Cambrex Corp.) 중에서 소정의 조건 하에 배양하였다. 세포가 정지 성장기에 도달할 때까지 37℃, 5% CO₂ 및 95% 습도에서 세포를 생장시켰다. 대수 성장기 동안 여러 시점에서 모든 클론의 세포수를 CASY 세포 계수기(독일 소재의 Scharfe Systems)를 사용하여 측정하고 상청액 중의 IgG 농도를 단백질 A 친화 크로마토그래피(하기 참조)로 측정하였다. 기준물로서 클론 J5-H3을 배양하고 동등한 조건 하에 분석하였다. 이 클론도 Sp2/0-Agl4 세포의 형질감염으로부터 유래되었고 클론 5B11 및 9B3과 동일한 항체, 즉 알베이트(albeit) 분비 형태만을 안정하게 발현한다. 클론 J5-H3은 여러 제한 희석 및 서브클로닝 단계에 의해 보편적으로 발생되었고 산업적 제조 과정을 위한 생산성 요건을 만족시키도록 1000개 초과의 클론 중에서 선별된다.

세포 배양물 상청액 중의 IgG 농도는 Akta™ 익스플로러 크로마토그래피 장치(스웨던 소재의 GE Healthcare(이전 명칭: Amersham Biosciences))를 사용한 분석 친화 크로마토그래피로 측정하였다. 소정의 부피의 세포 배양물 상청액을 단백질 세파로스 컬럼에 가하여 IgG와 친화 매트릭스의 결합을 촉진하였다. 상기 컬럼을 pH 5.0의 100 mM 시트르산으로 세척한 후, 결합된 항체를 pH 3.0의 100 mM 시트르산으로 용출하였다. 용출은 280 nm에서 용출물의 UV 흡광도를 연속적으로 기록함으로써 모니터링하였다. 샘플 항체 농도는 소정의 항체 농도를 함유하는 표준 샘플로 시스템을 보정한 후 통합된 UV 흡광도로부터 계산하였다.

모든 클론에 대해 비생성속도(SPR)를 세포수 및 세포 배양물 상청액 중의 IgG 농도로부터 하기 방정식으로 계산하였다:

상기 식에서,

는 시간 간격의 초기와 말기 사이에 상청액 중의 IgG 농도의 차이를 [pg/㎖]로 표시한 것이고,

는 시간 간격의 초기와 말기의 세포수의 산술 평균을 [세포/㎖]로 표시한 것이고,

는 시간 간격의 길이를 [일]로 표시한 것이다.

평균 SPR은 대수 성장기 동안 여러 시점에서 계산한 4개의 상이한 SPR을 기초로 하여 모든 클론에 대해 산정되었다(도 5 및 하기 표 5).

막 결합 mIgG에 의해 분류된 두 클론, 즉 5B11 및 9B3은 산업적 규모로 클론을 제조하기에 적합한 범위에 속하는 15 내지 20 g·세포^-1·d^-1의 평균 SPR을 나타내었다. 이 클론들의 SPR은 동일한 세포주에서 번거로운 전통적인 기법에 의해 수득된, 동일한 항체를 발현하는 클론(클론 J5-H3)을 사용하여 달성할 수 있는 SPR에 필적할만 하였다.

실시예 5

면역형광 현미경에 의한 sIgG 및 mIgG의 검출

세포내 및 세포 표면 결합 항체를 면역형광 현미경으로 검출하였다. 세포내 염색을 위해, 폴리-L-라이신-코팅 현미경 슬라이드에 부착된 세포를 PBS 중의 2%(v/v) 포름알데히드로 고정하고, PBS 중의 0.2%(v/v) 트립톤 X-100으로 10분 동안 투과성 세포로 만들고 PBS로 2회 세척하였다. 비특이적 결합 부위를 PBS 중의 3%(v/v) BSA(소 혈청 알부민)로 30분 동안 블로킹하였다. 세포를 세척 완충제(WB: PBS 중의 0.2%(w/v) BSA, 0.1%(v/v) Tween 20)로 2회 세척한 후, WB 중에 1:50으로 희석된 R-파이코에리쓰린-접합 F(ab')₂ 단편 염소 항-인간 IgG(독일 Dianova 소재)와 함께 1시간 동안 항온처리하였다. WB로 4회 세척하고 이중 탈이온화된 H₂O로 2회 세척한 후, 세포를 커버슬립 하에 올려놓고 4℃의 암실에서 현미경 분석 시까지 저장하였다. 세포 표면 결합 항체를 염색하기 위해, 10⁵개 세포를 냉각된 PBS 중의 1%(w/v) BSA로 세척한 후, 비특이적 결합 부위를 얼음 상에서 PBS 중의 1% BSA로 30분 동안 블록킹하였다. IgG 표지를 위해, 세포를 PBS 중의 1%(w/v) BSA 중에 1:50으로 희석된 R-파이코에리쓰린-접합 F(ab')₂ 단편 염소 항-인간 IgG(독일 Dianova 소재)와 함께 얼음 상에서 1시간 동안 항온처리하였다. 냉각된 PBS로 3회 세척한 후, 세포를 폴리-L-라이신-코팅 현미경 슬라이드에 부착시키고 실온에서 PBS 중의 2%(v/v) 포름알데히드로 10분 동안 고정시켰다. PBS로 2회 세척한 후, 세포를 커버슬립 하에 올려놓고 4℃의 암실에서 현미경 분석 시까지 저장하였다. 세포내 및 표면 표지 세포를 Plan-APOCHROMAT 4Ox/1.0 대물렌즈(독일 소재의 Carl Zeiss)를 사용한 액시오포트 형광 현미경 상에서 분석하였다.

클론 5B11에서, 항체는 세포 표면 상에서 주로 mIgG 형태로 검출될 수 있었고(도 6, 사진 1), 발현/분비 경로 및 세포내에서 sIgG 형태 및 mIgG 형태 둘다로 검출될 수 있었다(사진 4). 반대로, 클론 J5-H3에서 세포내 항체만이 검출될 수 있었는데(도 6, 사진 2 및 5), 이는 이 클론이 mIgG를 발현하지 않았기 때문이다. 두 방법을 이용한 염색 모두 비형질감염 세포주 Sp2/0-Agl4에서 관찰되지 않았는데(도 6, 사진 3 및 6), 이는 이 세포가 IgG를 전혀 발현하지 않았기 때문이다.

실시예 6

노던 블롯팅에 의한 γ-쇄 mRNA 이소폼의 검출

일차 전사체의 택일적 스플라이싱/폴리아데닐화에 의해 나타나는 2개의 중쇄 이소폼 사이의 비를 측정하기 위해, 안정하게 형질감염된 클론의 RNA를 노던 블롯으로 분석하였다. 따라서, 총 RNA는 RNeasy 기법(독일 소재의 Qiagen)을 이용하여 세포로부터 단리하였다. 그 다음, 각각의 경우, 변성 아가로스 겔 전기영동으로 10 ㎍의 총 RNA를 분획하고 노던맥스 시스템(미국 소재의 Ambion Inc.)을 사용하여 나일론 막으로 옮겼다. 블롯 막의 혼성화를 위해, 2개의 상이한 DNA 프로브를 DECA프라임(DECAprime) II 키트(미국 소재의 Ambion Inc.)를 사용한 무작위 프라이밍 방법으로 [α-³²P]로 표지하였다. 도 7B에 나타낸 바와 같이, 프로브 "A"는 엑손 C_H1과 C_H3 사이에서 중쇄 mRNA에 상보적이므로 상기 두 이소폼 모두에 혼성화한다. 대조적으로, 프로브 "B"는 긴 mIgG 중쇄 mRNA의 3' UTR에만 결합한다. 막의 혼성화 및 엄격한 세척 후, 블롯을 오토래디오그래피로 분석하였다.

도 7A는 클론 5B11, 클론 J5-H3 및 세포주 Sp2/O-Agl4로부터의 총 RNA와 노던 블롯의 오토래디오그래피를 나타낸다. 프로브 "A"를 사용한 혼성화는 상기 항체 둘다를 발현하는 클론에서 sIgG의 중쇄를 코딩하는 짧은 mRNA 이소폼의 예측된 크기에 상응하는 1.8 kb 신호를 주로 보여주었다(레인 1 및 2). 도시된 긴 노출에서, 2 kb와 4 kb 사이의 일부 약한 신호도 검출되었다. 클론 5B11에서만 보여지는 3.3 kb 밴드(레인 1)는 mIgG의 중쇄를 코딩하는 긴 mRNA 이소폼을 나타내는데, 이는 블롯이 프로브 "B"(레인 4)와 혼성화할 때 동일한 이동 패턴을 가진 밴드가 단일 신호로서 검출되기 때문이다. 레인 1에서 1.8 kb 밴드와 3.3 kb 밴드의 상대적인 신호 강도의 비교는 항체 중쇄 형질전환유전자의 일차 전사체가 주로 작은 mRNA 이소폼으로 프로세싱되어 항체의 분비된 sIgG 형태를 발생시킴을 암시한다. 단지 소량(5% 미만)이 긴 mRNA 이소폼으로 완전히 스플라이싱되어 원형질막-결합 mIgG를 생성한다.

실시예 7

알칼리성 카보네이트 추출법 및 면역블롯팅에 의한 IgG 중쇄 이소폼의 정제 및 검출

mIgG 중쇄를 검출하기 위해, 퓨지키(Fujiki)(Fujiki, Y., et al., J. Cell Biol. 93 (1982) 97-102)에 의해 개발된 알칼리성 카보네이트 추출법을 이용하여 막 단백질을 안정하게 형질감염 세포로부터 추출하였다. 각각의 경우, 10⁷개 세포를 PBS로 2회 세척한 후, 얼음 상의 0.1M NaCl로 1회 세척하였다. pH 11.5의 냉각된 1 ㎖ 0.1 M Na₂CO₃ 중에 재현탁시킨 후, 세포를 초음파처리로 20초 동안 파괴하고, 30분 동안 얼음 상에서 항온처리한 다음, 4℃에서 200,000 x g로 60분 동안 원심분리하였다. 이 단계를 이용하여, 내재 막 단백질을 여전히 함유하는 세포막을 가용성 내용물로부터 분리하였다. 상청액을 모으고, 이 상청액에 최종 농도가 1%(w/v)가 되도록 트리톤 X-100을 첨가하고 최종 농도가 60 mM이 되도록 N-옥틸-베타-D-글루코피라노사이드를 첨가하고 최종 농도가 50 mM이 되도록 pH 7.4의 TRIS-HCl을 첨가하고 최종 농도가 300 mM이 되도록 NaCl을 첨가하였다("SN 분획"). 따라서, 막 펠릿을 1.1 ㎖의 0.1 M Na₂CO₃(pH 11.5), 1%(w/v) 트리톤 X-100, 60 mM N-옥틸-베타-D-글루코피라노사이드, 50 mM TRIS-HCl(pH 7.4) 및 300 mM NaCl 중에서 해상하였다. 이 단계 후 불용성 성분들을 15,00O x g에서 10분 동안 원심분리하여 제거하고, 상청액을 "막 분획"으로서 모았다. 단백질 A 침강 분석을 수행하여 막 또는 SN 분획으로부터 항체 이소폼을 정제하였다. 따라서, 각 분획을 4℃에서 30 ㎕ 층 부피 단백질 A 세파로스(스웨던 소재의 GE Healthcare)와 함께 60분 동안 항온처리한 후, 0.02%(v/v) Igepal CA360을 함유하는 PBS로 4회 세척하였다. 단백질 A 매트릭스에 결합된 단백질을 70℃에서 환원 단백질 겔 샘플 완충제로 용출하고 SDS 폴리아크릴아미드 겔 전기영동(NuPAGE?-system, 미국 소재의 Invitrogen Corp.)으로 분리하였다. 분리 후, 단백질을 반건조 면역블롯팅법에 따라 PVDF(폴리비닐리덴플루오라이드) 막으로 옮겼다(Ausubel, F.A., et al. (eds.) Current Protocols in Molecular Biology, Vol. 2, John Wiley and Sons, Inc., New York (1995)). 막에 고정된 IgG 중쇄를 호스라디쉬 퍼록시데이즈(덴마크 소재의 DakoCytomation, DAKO A/S)에 커플링된 다중클론 토끼 항-인간 IgG 항체로 표지하고 LUMI-영상화기 F1(독일 소재의 Roche Diagnostics GmbH) 상의 화학발광 반응(LUMI-라이트 플러스 웨스턴 블롯팅 키트(LUMI-Light PLUS Western Blotting Kit)(독일 소재의 Roche Diagnostics GmbH)으로 검출하였다.

sIgG의 중쇄에 따른 강한 신호는 항체를 발현하는 두 클론(클론 5B11 및 J5-H3, 도 8의 레인 1, 2, 4 및 5 참조)의 막 및 SN 분획에서 검출할 수 있었다. 클론 5B11의 경우, sIgG 중쇄 위에서 이동하는 추가 단백질도 검출되었다(도 8, 레인 1). 이 밴드는 내재 막 단백질이 풍부한 이 클론의 막 분획에서 주로 발견된다. 상기 밴드는 sIgG 중쇄보다 8 kDa 더 많은 이론상 분자량을 가진 보다 큰 mIgG 중쇄 이소폼을 나타낸다. 일관적으로, 클론 J5-H3에는 상응하는 신호가 없는데(도 8의 레인 2), 이는 이 클론이 항체의 분비 형태만을 발현하기 때문이다.

실시예 8

CHO-K1 세포의 배양 및 형질감염

현탁 배양물 중에서의 혈청 부재 생장에 미리 적응된 CHO-K1 세포(ATCC 수탁번호 CCL-61; Puck, T.T., et al., J. Exp. Med. 108 (1958), 945-956)를, 37℃, 5% CO₂ 및 95% 습도 하에 현탁 플라스크 내에서 8 mM L-알라닐-L-글루타민(미국 소재의 Invitrogen Corp.) 및 1x HT 보충제(미국 소재의 Invitrogen Corp.)로 보충된 ProCHO4-CDM 배지(미국 소재의 Cambrex Corp.) 중에서 배양하였다. 3일 또는 4일마다 세포를 새로운 배지 내로 2x1O⁵ 세포/㎖의 농도로 분할하였다. 형질감염 동안, 세포를 실온에서 총 부피 200 ㎕ PBS 중의 7.5x10⁶개 세포 당 20 ㎍의 플라스미드 DNA로 전기천공하였다. 전기천공은 15 ms 동안 단회 160 V 펄스를 사용하는 사각형 파동 프로토콜을 이용하여 2 mm 갭 큐빗 내의 진 펄서 XCell 전기천공 장치(미국 소재의 Bio-Rad Laboratories)로 수행하였다. IgG를 안정하게 발현하는 클론을 발생시키기 위해, 6x10⁷개 세포를 전술한 바와 같이 플라스미드 pmIgGΔ-B로 전기천공하였다. 그 후, 안정하게 형질감염된 세포의 선별을 위해 형질감염시킨 지 1일 후 배양물에 첨가된 700 ㎍/㎖ G418과 함께 세포를 상기 특정된 배지 중의 풀로서 약 2주 동안 배양하였다.

실시예 9

유세포분류에 의한 안정하게 형질감염된 CHO-K1 세포의 분류

선별 후, 형질감염 세포의 표면에 결합된 IgG를 표지하고, 가장 강한 신호를 가진 세포를 유세포분류기로 분류하였다. 따라서, 풀로부터의 4x10⁷개 세포를 먼저 40 μM 나일론 메쉬에 통과시켜 큰 세포 응집물을 제거한 후, 37℃에서 아큐맥스(Accumax)(PAA)와 함께 15분 동안 항온처리하여 남은 보다 작은 응집물을 분리하였다. 세포를 얼음 상에서 배지 중의 1%(w/v) BSA와 함께 20분 동안 항온처리한 후, 암실 내의 얼음 상에서 1%(w/v) BSA를 함유하는 총 부피 8 ㎖ 배지 중의 10 ng/㎖ 단백질 A 알렉사 플루오르(Alexa Fluor) 488(미국 소재의 Molecular Probes Inc., Invitrogen Corp.)로 30분 동안 염색하였다. 배지 중의 1%(w/v) BSA를 사용한 2회 세척 단계 후, 세포를 배지 중에 재현탁시키고 BD FACS아드리아(FACSAria) 세포 분류기(미국 소재의 BD Bioscience)로 옮겼다. 살아있는 단일 세포의 집단을 전방향-산란기/측면-산란기(FSC/SSC) 도트 플롯으로 게이팅하였다. 게이팅된 생존 세포의 형광 강도의 상위 5%를 가진 세포를 포괄하는 하위집단을 한정하고 이 집단으로부터 약 45,000개 세포를 모았다(mIgG-분류 세포 풀). 대조군으로서 약 40,000개 세포를 이들의 형광도와 관계없이 FSC/SSC-게이팅된 생존 세포 집단으로부터 무작위로 모았다(대조군 세포 풀). 모은 세포 풀을 선별 배지(실시예 8 참조) 중에서 2주 동안 배양함으로써 증폭시켰다. 그 다음, 제2 분류 사이클을 수행하였다. mIgG-분류 세포 풀로부터의 세포를 전술한 바와 같이 세포 표면 IgG에 대해 염색하였다. BD FACS아드리아 세포 분류기(미국 소재의 BD Biosciences)를 이용하여 형광 강도의 상위 4%를 가진 세포를 생존 단일 세포의 집단으로부터 분류하였다(FSC/SSC 도트 플롯에 의해 게이팅됨). 분류된 세포를 96웰 플레이트 내로 단일 세포로서 모았다. 대조군 세포 풀로부터 단일 세포를 FSC/SSC-게이팅된 비염색 생존 세포 집단으로부터 무작위로 모았다. 단일 세포 클론을 선별 배지(실시예 8 참조) 중에서 2주 동안 배양함으로써 증폭시켰다.

실시예 10

ELISA에 의한 IgG 농도의 측정

세포 배양물 상청액 중의 면역글로불린 농도는 포획 시약으로서 바이오티닐화 항-인간 IgG F(ab')₂ 단편을 사용하고 검출 시약으로서 퍼록시데이즈-접합 항-인간 IgG F(ab')₂ 항체 단편을 사용하는 샌드위치 ELISA로 측정하였다. 스트렙타비딘 코팅 96웰 플레이트(Pierce Reacti-Bind™ 스트렙타비딘 코팅 폴리스티렌 스트립 플레이트, 코드 번호 15121)를 진탕 하에 실온에서 1시간 동안 항온처리함으로써 희석 완충제(희석 완충제: 0.5 중량/부피(w/v)%의 소 혈청 알부민을 함유하는 PBS 완충제) 중의 포획 항체로서의 0.5 ㎍/㎖ 바이오티닐화 염소 다중클론 항-인간 IgG F(ab')₂ 항체 단편으로 코팅하였다. 그 후, 플레이트를 0.3 ㎖ 초과의 세척 완충제(세척 완충제: 1%(w/v) 트윈 20을 함유하는 PBS)로 3회 세척하였다. 세포 배양물 상청액(샘플)을 함유하는 IgG를 희석 완충제 중에 0.5 내지 20 ng/㎖의 농도로 연속(2배) 희석하고, 웰에 첨가하고, 실온에서 진탕 하에 1시간 동안 항온처리하였다. 희석 완충제 중의 정제된 표준 항체(0.5 내지 20 ng/㎖)를 IgG 단백질 표준 곡선의 작도를 위해 사용하였다. 플레이트를 0.3 ㎖/웰 세척 완충제로 3회 세척한 후, 항-인간 Fcγ에 결합된 결합체를 염소 다중클론 항-인간 F(ab')₂-특이적 IgG(F(ab')₂<h-Fcγ>POD; 독일 소재의 Dianova, 코드 번호 109-036-098)의 퍼록시다제-접합 F(ab')₂ 단편으로 검출하였다. 플레이트를 0.3 ㎖/웰 세척 완충제로 3회 세척한 후, 플레이트를 ABTS(2,2'-아지노-비스(3-에틸벤즈티아졸린-6-설폰산) 퍼록시데이즈 기질 용액(독일 소재의 Roche Diagnostics GmbH, 코드 번호 1684302)으로 현상하였다. 10 내지 30분 후, 테칸 스펙트라플루오르플러스(Tecan Spectrafluorplus) 플레이트 판독기(독일 소재의 Tecan Deutschland GmbH) 상에서 흡광도를 405 nm 및 490 nm에서 블랭크 시약에 대해 측정하였다. 배경 보정을 위해, 490 nm에서의 흡광도를 하기 식에 따라 405 nm에서의 흡광도로부터 차감하였다:

샘플의 IgG 함량은 표준 곡선으로부터 산출하였다.

실시예 11

mIgG 발현 CHO 클론의 검색 및 선별

단일 세포를 96웰 플레이트 내로 배분한 지 3주 후, 515개의 mIgG-분류 클론 및 550개의 대조군 클론의 세포 배양물 상청액을 ELISA로 분석하였다(실시예 10 참조). 하기 표 6은 상이한 IgG 농도 수준에 대한 클론의 분포를 보여준다.

대조 방법에서 모든 클론의 90%가 1 ㎍/㎖ 이하의 IgG 농도를 보임이 관찰되었다. 대조적으로, 어떤 mIgG-분류 클론도 이 군에 속하지 않았다. 게다가, 이 방법에서 22 ㎍/㎖를 초과하는 IgG 농도는 6개의 클론에 의해 달성된 반면, 대조 방법에서 측정된 가장 높은 IgG-농도는 12.3 ㎍/㎖이었다. 그 후, 10 ㎍/㎖를 초과하는 모든 mIgG-분류 클론 및 3 ㎍/㎖를 초과하는 모든 대조군 클론을 제2 검색을 위해 24웰 플레이트로 옮겼다. 클론은 선별 배지(실시예 8 참조) 중에서 20일 동안 배양함으로써 증폭시킨 후, 세포 배양물 상청액 중의 IgG 농도를 ELISA로 측정하였다. 하기 표 7은 상이한 IgG 농도 수준에 대한 클론의 분포를 보여준다.

대조군 클론은 6.1 ㎍/㎖의 평균 IgG 농도와 함께 16.8 ㎍/㎖ 이하의 발현 수준을 보였다. 대조적으로, mIgG-분류 클론의 평균 발현 수준은 31.4 ㎍/㎖이었고, 이 군에 속하는 한 클론의 최대 관측 IgG 농도는 58.9 ㎍/㎖이었다. 그 다음, 45 ㎍/㎖를 초과하는 발현 수준을 보이는 6개의 mIgG-분류 클론 및 10 ㎍/㎖를 초과하는 발현 수준을 보이는 2개의 대조군 클론을 추가 평가를 위해 125 ㎖의 진탕기 플라스크로 옮겼다.

실시예 12

선별된 CHO 클론의 생산성 평가

진탕에 적응시키기 위해, 실시예 11의 선별된 클론을 125 ㎖의 진탕기 플라스크로 옮기고 표준 조건(실시예 8 참조) 하에 150 rpm의 회전 진탕기 상의 25 ㎖ 선별 배지(실시예 8 참조) 중에서 1주 동안 배양하였다. 그 후, 각 클론에 대해 1x10⁶개 세포/㎖를 8 mM L-알라닐-L-글루타민(미국 소재의 Invitrogen Corp.), 1x HT 보충제(미국 소재의 Invitrogen Corp.) 및 400 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)로 보충된 25 ㎖ ProCHO5-CDM 배지(미국 소재의 Cambrex Corp.)에 접종하고 전술한 바와 같이 125 ㎖ 진탕기 플라스크 중에서 배양하였다. 0, 1, 2, 3, 4 및 7일째 날, 모든 클론의 세포수를 CASY^? TT 세포 계수기(독일 소재의 Scharfe Systems)로 측정한 결과, 모든 시험된 클론의 생장이 유사하였음을 알 수 있었다(하기 표 8 참조).

10일째 날, 세포 배양물 상청액을 모아 IgG 농도를 ELISA로 측정하였다(하기 표 9 참조).

6개의 mIgG-분류 클론들 중 3개 클론(즉, 클론 1A1, 1B6 및 1D6)이 2개의 대조군 클론과 유사한 범위 내의 발현 수준을 보임이 관찰되었다. 나머지 3개 mIgG-분류 클론(즉, 클론 1C5, 1D1 및 2D6)은 대조군 클론에서 관찰된 것보다 3.3배 이상 더 많은 현저히 증가된 IgG 발현을 보였다.

실시예 13

선별된 CHO 클론의 노던 블롯 분석

진탕기 플라스크 내에서의 생장에 적응된(실시예 12 참조) 6개의 mIgG-분류 클론 및 2개의 대조군 클론을 노던 블롯으로 분석하여 일차 전사체의 택일적 스플라이싱에 의해 나타나는 2개의 중쇄 이소폼 사이의 비를 측정하였다. 비교를 위해, 클론 "27"을 동시에 분석하였다. 이 클론은 동일한 항체의 분비 형태만에 대한 게놈 수준으로 구성된 발현 벡터로 CHO-K1 세포를 안정하게 형질감염시켜 수득하였다. 노던 블롯은 실시예 6에 상세히 기재된 바와 같이 수행하였고 도 9에 나타내었다.

실시예 14

sIgG/IgG-GPI 발현 벡터 "pIgG-GPI-B"의 구축

면역글로불린의 원형질막 고착을 위해, 엑손 M1의 3' 부분에 의해 코딩된 천연 경막 도메인 및 엑손 M2에 의해 코딩된 세포내 영역을 GPI 고착을 매개하는 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드로 치환시켰다. 이로써, 하기 53개 아미노산(즉, LWTTITIFITLFLLSVCYSATVTFFKVKWIFSSVYDLKQTIVPDYRNMIRQGA(서열번호 146))을 코딩하는 플라스미드 pmIgGΔ-B(실시예 Ic 참조)의 DNA 서열은 인간 태반 알칼리성 포스파테이즈(NCBI 검색번호: M 13077; 뉴클레오티드: 1542 내지 1643)의 카복시-말단 신호 펩티드의 하기 아미노산 서열(즉, AGTTDAAHPGRSWPALLPLLAGTLLLLETATAP(서열번호 147))을 코딩하는 DNA 서열에 의해 치환되었다.

발현 플라스미드 pIgG-GPI-B의 C_H1부터 3' UTR까지 걸쳐 있는 γ 쇄 발현 카세트 불변 영역의 핵산 서열은 서열번호 148에 기재되어 있다.

플라스미드 pIgG-GPI-B에 의해 코딩된 γ 쇄 불변 영역의 sIgG 이소폼의 상응하는 아미노산 서열은 서열번호 149에 기재되어 있다.

플라스미드 pIgG-GPI-B에 의해 코딩된 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드를 포함하는 γ 쇄 불변 영역의 긴 이소폼의 상응하는 아미노산 서열은 서열번호 150에 기재되어 있다.

이 플라스미드는 중쇄 전구-mRNA의 택일적 스플라이싱에 의해 항체의 분비 형태(sIgG) 및 GPI-고착 형태가 발현될 수 있게 한다(도 10 참조).

SEQUENCE LISTING <110> F. Hoffmann-La Roche AG <120> POLYPEPTIDE PRODUCING CELLS <130> 23748 WO <150> EP 06010146.6 <151> 2006-05-17 <160> 176 <170> PatentIn version 3.2 <210> 1 <211> 2767 <212> DNA <213> Homo sapiens <400> 1 gtgagtcacc cccaggccca gggttgggac ggggactctg aggggggcca taaggagctg 60 gaatccatac taggcagggg tgggcactgg gcaggggcgg ggctaggctg tcctgggcac 120 acaggcccct tctcggtgtc cggcaggagc acagacttcc cagtactcct gggccatgga 180 tgtcccagcg tccatccttg ctgtccacac cacgtgctgg cccaggctgg ctggcacagt 240 gtaagaggtg gatacaaccc ctcgccgtgc cctgaggagt ggcggtttcc tcccaagaca 300 ttccccacgg ctgggtgctg ggcacaggcc ttccctggtg tgaccgtgaa tgtggtcacc 360 ctgaacagct gccctctctg gggacatctg actgtccaag accacagtca gcacctctgg 420 gagccagagg ggtctccaga gacccccaga tgtcaggctt gggctcagtg cccagcgaaa 480 ggtcagcccc acacatgccc ataatgggcg cccacccaga gtgacagccc ccagcctcct 540 gccaggccca cccttttccg cccccttgag gcatggcaca cagaccagtg cgcccactgc 600 ccgagcatgg ccccagtggg atgtggtggc cacgaggggc tgtacacaca gcaggaggct 660 gtccgccctg ctcagggcct gctgcctatg ccccagctgt ccaaccaagg gaggcatgga 720 agggcccctg gtgtaagctg gagccaggca cccaggcccc cggccaccct gcagagccaa 780 ggaaaggaag acacccaagt caacaagggg cagggctgag ggctgtccca ggctcttttg 840 gcccgagggg ctgccagcag ccctgacccg gcatgggcct tccccaaaag cgaccctgtg 900 aggtggcctc acagagaacc ccctctgagg acagtgtctg accctgcctg cctcacacag 960 atgggcccca cagcagtggg caacctgggg ggcagcagcc caacctgacc ctgcagggac 1020 tgccccctgc agcagcagct gcttctcagt cccccaacct ccctgtcccc gccagagggt 1080 cttccccgaa gctgcagccc caacccatgg ctgcccacct ggaaccggga ctccctgtcc 1140 actgccccct ccccttcggg gccccatctg tgctggggcc caggttcggc ctacagattc 1200 ccatcattgc catggcctcc tgaccttgcc tatccacccc caaccaccgg ctccatgctg 1260 accctccccc aggctcccac gcccagctgg ccggccatcc ccaggcacag acagtctggg 1320 atctcacagg ttagcctgga ccatccacct ggccagacct gggagaggct ggaagctgcc 1380 ctgccaccat gctccagggc cccaggttgc agtactatgg ggtgagggtg tgtgtgcaca 1440 cctgtgtgta cctaggatat ccgagtgtac ccttgtgccc ccaagcacaa gtctccctcc 1500 caggcagtga ggcccagatg gtgcagtggt tagagctgag gcttatccca cagagaaccc 1560 tggcgccttg gtcaaggaag cccctatgcc tttcttgcct cgatttcccc tcttgtctgc 1620 tgagccagca ggggccacgt cctgggctgc tgtgaggagg aagcaagttg gtgctaggag 1680 gggctcctgt gtgtgcatgg gcgggagggg tgcaggtatc tgagcacccc ggtctccact 1740 tgagagagca gggcaggagc tccctgaccc acccagacta cacacgctgt gtccacgtgt 1800 ctcccattat ctgtggcaga ggatccggct tctttctcaa tttccagttc ttcacaaagc 1860 aatgcctttg taaaatgcaa taagaaatac tagaaaaatg atatgaacag aaagacacgc 1920 cgattttttg ttattagatg taacagacca tggccccatg aaatgatccc ggaccagatc 1980 cgtccacacc cgccactcag cagctctggc cgagctcaca gtacaaccac aataaactct 2040 tgttgaatga actctaggaa gtctgtgacg tggctggttc ttgtcaatgc ttcctgcctg 2100 cccacaggct cttcctcgtg gatggggctg tgcttgccac ggaagcgcgt ttttcccggc 2160 ctaggcttgc cttgggcccc actgccgtct ccagctggag atgaccttct atacacacat 2220 ttgctcatga cagacccttg cttagccccc ttccatggct ccctcctgct gctgggataa 2280 aatcaccttg cctggatatc ccctcctggg cccctttcca ccctccttag tcagcacccc 2340 cagttcaggg cacctgcttt ccccgctgcg gagaagccac tctctccttg ctgcccggct 2400 gtgtcttgcc ttccacacct tgtcacagtg gccacttcct aaggaaggcc tccctgtgtg 2460 caggtgtgca gaagtgcccc agcctcccgt cacctttgtc acgggagccc aatccatgag 2520 agtctatggt tctgtctgtc tgccccactc agggcagcga caagtccagg cggggaggac 2580 acagtaggca gagatttgtc gaggggacat atgagcaaga gggtgaggct gggagctccc 2640 tggagataac cacgcctcct gggaagactc gccgtcattt cagctccacg ctgtgcgggg 2700 gtgggtggag gggtagcctg gccctcatga ccagggagct tctcactcag cccctgttcc 2760 tccccag 2767 <210> 2 <211> 1287 <212> DNA <213> Homo sapiens <400> 2 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga 60 tgcttggcac gtaccccgtg tacatacttc ccaggcaccc agcatggaaa taaagcaccc 120 agcgcttccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180 gaggcctgag tggcatgagg gaggcagagt gggtcccact gtccccacac tggcccaggc 240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacgag 360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420 ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840 tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg 900 cccctgcagc cgccacacac acacagggga tcacacacca cgtcacgtcc ctggccctgg 960 cccacttccc agtgccgccc ttccctgcag ctggggtcac atgaggtgtg ggcttcacca 1020 tcctcctgcc ctctgggcct cagggaggga cacgggagac ggggagcggg tcctgctgag 1080 ggccaggtcg ctatctaggg ccgggtgtct ggctgagccc cggggccaaa gctggtgccc 1140 agggcgggca gctgtgggga gctgacctca ggacattgtt ggcccatccc ggccgggccc 1200 tacatcctgg gtcctgccac agagggaatc acccccagag gcccaagccc agggggacac 1260 agcactgacc acccccttcc tgtccag 1287 <210> 3 <211> 1301 <212> DNA <213> Homo sapiens <400> 3 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga 60 tgcttggcac gtaccccgtc tacatacttc ccgggcaccc agcatggaaa taaagcaccc 120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccgtgggtca ggccgagtct 180 gaggcctgag tggcatgagg gaggcagagc gggttccact gtccccacac tggcccaggc 240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg 360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420 tcctgtgagc gccctgtcct ccgacctcca tgcccactcg ggggcatgcc tagtccatgt 480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggctgccct 540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600 tgtggaggga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660 ccgcgctgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780 acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840 tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg 900 cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc 960 gtccctggca ctggcccact tcccaatgcc gcccttccct gcagctgagg tcacatgagg 1020 tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacagg agatggggag 1080 cgggtcctgc tgagggccag gtcgctatct agggctgggt gtctggctga gtcccggggc 1140 caaagctggt gcccagggca ggcagctgtg gggagctgac ctcaggacac tgttggccca 1200 tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga 1260 gcccagcagg acacagtatt gaccacccac ttcctgtcca g 1301 <210> 4 <211> 1914 <212> DNA <213> Homo sapiens <400> 4 gtaaacccac cctgtacaac gtgtccctgg tcatgtccga cacagctggc acctgctact 60 gaccctgctg gcctgcccac aggctcgggg cggctggccg ctctgtgtgt gcatgcaaac 120 taaccgtgtc aacggggtga gatgttgcat cttataaaat tagaaataaa aagatccatt 180 caaaagatac tggtcctgag tgcacgatgc tctggcctac tggggtggcg gctgtgctgc 240 acccaccctg cgcctcccct gcagaacacc ttcctccaca gcccccaccc ctgcctcacc 300 cacctgcgtg cctcagtggc ttctagaaac ccctgaattc cctgcagctg ctcacagcag 360 gctgacctca gacttgccat tcctcctact gcttccagaa agaaagctga aagcaaggcc 420 acacgtatac aggcagcaca caggcatgtg tggatacaca tggacagaca cggacacaca 480 caaacacatg gacacacaga gacgtgctaa cccatgggca cacacataca cagacatgga 540 cccacacaca aacatatgtg gacacacatg tacaaacatg cacaggcaca caaagagaac 600 actgactaca ggcacacaca cacacgggca cactacccac aggcacacaa cagatggaca 660 cgcgtacaca gacatgcaca cacccacagg cacaacacgt gcgcatgccg gccggccccc 720 gcccacattc tcccagggcc ctgccggata ctctgtccct gcagcagttt gctccctgcg 780 ctgtgctggc cccggggctt tgggcccagg ctctgcttgt ccttctgtct ctgcttggag 840 gtgctgccat ggcacccagc ttgggctctg cctggggagc ggaggcccca gggatagcat 900 gtgacccctg ctgaggccag gctcctgatg aaggcagcag atagccccca cacccaccgg 960 tgagcagaac cagagcctgt gccatgtgct gagagcaggc agtgactaag catatgggcc 1020 cagagggcag agtggctgcc ctgggcagct gctcctctta gcaggaggcc tcaggagatg 1080 agctagagca agtctgcccc tgcaaatacc acctgctccc caacccacag cagggagcag 1140 gcgaggtcag acagcagcag cccgggaagg accgagcccc agcagggaag gcagggcccg 1200 agtgaggtct ccacacccaa cgcacagtgc tgtctctaac tggggccacc tccgagtccc 1260 cgccacactc ttggcccttt ggagtcctgg gctccaggtg tctcccaagg gcccatctgt 1320 gcaggggatg caaccccccg aatgtcctca tcccactgtg gagctcaggt ctctgtctgc 1380 tccctgggtc ctggcagggt aggacaagtc cgccaggatg tccccatgca gactctgctc 1440 caagagggag ctggagagtc agggccttgg tgagggagtc aggatcgggt tccccccagc 1500 tcagtcctcc cacctgccag cccccacagc acagggcagg gccacacccc ctgcttcccc 1560 ctccaggaga gtcaggacat gctggccgct gctccgctgg ggccccgccc tccagccccc 1620 accttggtct gtgtgctgca tcccccacgc tctctctgcc accccaggac tctgaggaaa 1680 agacctcaga gtcccagccc tgcccagcct cggcctgtgc ccccgctgca tcaggctttc 1740 aggggcccag cccatgccct gggcagtgcc cgagcccccc tgcacttgct ctccccaccc 1800 ctgggtgcag cacagcctag gggccaaggg tgggcctaga ggatgggccc cgggggggct 1860 ttgctgggtg ccaccccagc ctgaccctat tcccccgtgc tgtgtctcct gcag 1914 <210> 5 <211> 2432 <212> DNA <213> Mus musculus <400> 5 gtaaacccac caatgtcagc gtgtctgtga tcatgtcaga gggagatggc atctgctact 60 gagccaccct gcctgtccct actcctgaaa taaactctgt gctcatccaa agtatccctg 120 cacttccatc cagtgcctgt ccatcatcct tagggtctac agaacacagg gaggggtcag 180 ggcccaggga gggagaaaca ccaccaccta agcttgtaag gcctcggaga ctttgaagac 240 ccttcatgcc tagagtatat gtgtatgcat gtctatgtat tggtgagtgc ttatggatgg 300 gtccatgtgc cttcatgtgt gtacctgtgt gcagcaagag aggagtgagt ttgtgtgcac 360 ctatggttta taggtatgta tatgggtata agtacatatg tggacacact atatctatgt 420 ccctgtgagc aagtgtgtgc ctgtgcatac ctatgagcat gcatatatct atgtgtgttc 480 atgttggtgg aaacatgaga gtgtgtgcac ctgccctgtg aatgtgcaat gagtgaatgg 540 gaagtaagaa taaactgggg atgaaatcca aggcgagcag actcagccaa gaaggcaaag 600 ctcatgggag agtccccagg gcagtgggtt gctgcacaag tactctgagt ggtgggtggt 660 gtggctgttt attagaccgc agcttctaac ccaaacaaga cagggataga tggagcaaaa 720 gggtagcacc atcaaggctg gtgccgtgtg ggggtcacaa tagagatgat ggtatgagaa 780 tgaagggatg aacacagggg cactgggaag aagatgccac gcaccctcag taggccatcc 840 ctgaatggaa acatgcattc agggtgacca ctgactcatg agaaagacat atagcatggc 900 acagacaacc ctcagcagca ccctgctctt cacacatgca catgggcata caccctgttc 960 tgcatacatg cacatgggca tacatgcaca gacactcaca tttgcacact cacacagacc 1020 tgaaccctgg aggaagatga agttcacagc ccacacccag cttctggaaa gcaaggggag 1080 tcccctccaa gcccccggga gaatttccag gcccgacact gacaactaca cacaatggac 1140 aagggcatag gcccctccag gtgccccctt tctaacctaa gtctcccttc ccatcctgag 1200 cccaagtatc acaaaccaga agcaggataa gaggcaaatc tgggaagaag caggagcagg 1260 ccatggagac cactcccaca caggcctcgg cctcctccat gggcacccct agaacacaaa 1320 gttctacaac caggtatact tggagcccag gtgtccacaa gagggcagtg ggggccctgc 1380 tcctgtctca caggccttca gaacttcggg gggggggggg aggagttgct ggtttctagc 1440 aacttccctc tgctctcaga gcaagagtgg agtaaaggcc catgcatgcc ctggatactc 1500 tccagcttga aagtccagtt ccctgagaat agcaagagca acagaccagc ttgggaaacc 1560 tgactcagaa aagtaccata gccacccatg gaatccaagg cctggcccat gacagagaat 1620 cctagtaagg aggagtcaat aggtgaaaga ctgaatcccc acagggagag ggggcagaga 1680 agctggagaa tcacgatagt cgggaaagat gatgagtgag cggctggagg gtaatggatg 1740 gctggctaca aggatgaacg atggggatga tggatggatt gatggatggc tgcagtgaca 1800 gaaatacgag tggttgacta tcagtacaca tttcctactg ccacttaaaa tgaaactctg 1860 tgcgcagaga acctgaggac agcagggttg gctctactgg gggtctttac tgttgcttaa 1920 cccccagtca cagctcttaa gaatgcaaca gagtcctctg accacatgtc caggccttgg 1980 tagtctaact ttggcccaga aatcacattg gcctgtatct gtttgaaggt gtctgatctt 2040 acacaaccct agtacccaag ccaagattag cctaagaact ggggtttagg gaggtattgc 2100 taaatatcta gaaaggactg agacctaagg agccttgggt tcaaactctt ctcagagttt 2160 gacagaaaca actctcttac catgacaggt ctctaattaa ggtttcccta agagagagag 2220 atgggtcttg gggccatctc aagaactgct gggattccag tcccttacct gggaccctgc 2280 ctcctcatta tccctgaaca agtcccttcc cgggaataag ggacccctac caccactgtc 2340 cccaaagccc aaggaggcat agaagcagaa accttaagtc tgagccccca tccccatggg 2400 tttggatcta gaaggtcatc tatgtcttac ag 2432 <210> 6 <211> 1411 <212> DNA <213> Mus musculus <400> 6 gtaaatgatc ccagtgtcct tggagccctc tggtcctaca ggactctgac acctacctcc 60 acccctccct gtgtaaataa agcacccagc actgccttgg gaccctgcaa taatgtcctg 120 gtgatttctg agatgtagag tctagctagg tcatggaatg aggggtctcc atggtttgag 180 gcctgagttg tgactaagga aaaacccata ggcctacact gccacaccca gcacttttga 240 atttgcctga catgaaaaga atttacctct ccctggaaag tggagcctta tccctaggca 300 gttcccttac cagaccttcc tctagcttgc actttgttct gggcacagaa tgtgtctaac 360 cccccaaagc aaggaagaca caacctctac ctccctcact ctgtccttac cccttttcct 420 ggctaagcat ctcactgagt gcgctgaata gatgcatgtg gccacagtct tgcagacaga 480 cccttgccat ctctccactc agctttccag aggctaagtc tagcccgtat ggtgataatg 540 cagggagctc tatgctatct cagtgctatc agactcccaa gtggaggatg aacatggacc 600 cattaaaacc aacctgcgca gcaacaccct gccaataagg cccgtatgtg aaaatgtgca 660 cacatctaca catgcacagg cacacacaca cacacatgca tgggcacaca cacatacaga 720 gagagagaat cacagaaact cccatgagca tcctatacag tactcaaaga taaaaaggta 780 ccaggtctac ccacatgatc atcctcggca tttacaagtg ggccaactga tacagataaa 840 acttttctat gccaaggacg ccaacatata cacaagtccg ctcatgacaa atctgtccct 900 gaacctcaga ctggcgcccg tgactcatac agtggacact cctccaaagc tgtatagctt 960 cctttacttc cctgtgtgta ctttctctga agtacactca tcacacagaa gaggccctgt 1020 gattactctg gccctctgtt cttggtcatc agagaataga cagaagatca ggcaaactac 1080 acagacactt cccacaatca tcacaggccc tgactctgct ctccagtctc aaaactgaag 1140 gctggagcac acagaataag ctcctgcaca ggccaggcca gtatcgggtc cagtgtgtct 1200 gactgagccc agggacaaaa tggcagcact ttggggaact gaggtttctg gtccaagaag 1260 gagagatgga ggcccaggga gggtctgctg acccagccca gcccagccca gctgcagctt 1320 tctcctgggc ctccatacag cctcctgcca cacagggaat ggccctagcc ccaccttatt 1380 gggacaaaca ctgaccgccc tctctgtcca g 1411 <210> 7 <211> 1357 <212> DNA <213> Mus musculus <400> 7 gtaaatgagc tcagcaccca caaagctctc aggtcctaag agacactggc acccatatcc 60 atgcatccct tgtataaata aagcatccag caaagcctgg taccatgtaa aactgtcctg 120 gttctttcca aggtatagag catagctcac gggctgatag gtctggccag ggttggagga 180 cagccttgtc tataggaaga gaatgaggtt tctgcactgc atgactcaga ggtcatgagt 240 cattctgcct tggactgttg gggcttggct ttaggcagtg ccttttcctt gccttcccat 300 gaaccagcag ctgccagaca tagagataat cctaggaagc ctcaaatgga taagcacaca 360 aacccacctc ccttaggctg ttcctgtccc cctgccccat ttctctactt aggggttttt 420 ctgagtctat tgtggagtga cacatggcca ggggcattcc atagaccttt gtcatctata 480 ctctcaactc aggcagcttt tcacagacga ggtctgcaca cccatacaaa tggctcactc 540 ctgcctgtgc cacctggggc tgaggcacat ggctcttgat gccccaaggg agggactatt 600 agatagccac actcatgcta aatcctgacc ctgctgaaca ccatccagtc catatagcac 660 atgtatcctc atgctcgtga gcacaaaacg catttaacac actgggacaa ctcctctgtg 720 cccagcacag cacctacatc cagcaatgta tcaccataca cacggccaaa aattcaatgc 780 ccacgtttct gccatcacaa tcagacacac ctttcctctt ctgaggacac tccattctcc 840 gctcaaaaca agacctctga agccagattc atctctggta cctcggggtc atgcttcaac 900 cccacatgaa taattcaaac catagccata atggtctgaa tcacttcaca ctgggatgtt 960 cccaagttca ggcaagaaaa gccacaggct ctgctgatga ctgaagaata gcaaagggtc 1020 agtccagctg tatagccact gttgacctgg gtcacaggcc ctgctgaccc tccaccttct 1080 cctgtactga aggaatgaaa gatgagacaa gcatagaggg cacttgaata atccaggtca 1140 ctctgaggtc catccaaggc attattggac tcaggtggag gaagctgaga ctgatgtccc 1200 agagggaaag gaaggaaagc aggccccggg gagggtctgc tgtcccagtc aggctggaga 1260 tctctcctct gacttcatgc agacatgtct gcctcacagg gaatctctcc cagcatcaac 1320 catgttggga caaacactga ctgtcctctc tgttcag 1357 <210> 8 <211> 1472 <212> DNA <213> Mus musculus <400> 8 gtaaatgaga acagcaccta gccattcctc gggtcttaca agacactgat accagcccta 60 accggtgaac cctataaata aagcacccag agatgggacc ttgtgagatt atcttggttc 120 tttacatggc acatagttca tgatacacct cagccacagg ctgtggggtc tggccagggt 180 tcaaggtgta agttaacatc caagaaagaa caaggtctta tactgccaga cccagggcat 240 gcaagtggac ctgcccttgc cagagatcat ccctctctgc atagcaagtt tgacccaagg 300 ggccctcttc atactcttcc ccacaaccag caactgttct gtgatgagtc tggagataga 360 aatatcgccc tagaaaatat ccaaagaaag gaacacagaa agtgtatccc acctcaacac 420 gaaccccacc ttcatttgtc tgtccttccc tctaccgtga ctcccctacc ttgacctagg 480 aggtctctgt atgtattaca tagacaggca ggaagactca tacatgaagc ccgttcatct 540 ccaccacacc cctagcgata gggataggga tgagtactcc taagagacta cctcccatat 600 gacattcact cacacctaag ttccaagaca ctgagagact tatgacccta gctgccccca 660 aggaagtaac taatcaaata cctacataga tgctgagacc agaactatta gaaccagcct 720 gctaagcatc actcaaccca catggtacct ccaagcctac atacatccac tgatacctca 780 cctaggcagc atgaatagca accaaaccca tcttagtgtc gggatatccc tagacactac 840 ctaaatgtac acatttggac cagtgaagat gaaatagctc tcatgggtac ctaactgttt 900 tcccctaaca cacacaagta ccttcagacc cattctgtcc ctctatgcct aagcccctat 960 tttcatccct tacagttaac actctcccat agctgtataa cctgactcac ttcccaatgt 1020 ggaccttcta ggaagcccag gtatcatcaa acgcaggccc tactctcact ctgtccctct 1080 gtactcagtc accagggaac aagcagtagg tcaggcaagc tgcagagcta ttacctacag 1140 ggcttccaag ccttgaatca gccaagccag ccccagtact gagggatagg gtagacaaaa 1200 agggttcctg catagcccag gccagcatca ggtccagtgt atctggctct acccagggac 1260 aaaacggcag cacattgggg agctgaggtt tctggttcac agagaacata aaggagagat 1320 ggccccaggg agggtcagat ggccccaggg agggtctgct gacccagtca ggctgcagct 1380 ttctcctggg cctccatgca gcctcctgcc acacagggaa tggccctagc tctaccttgt 1440 tgggacaaac actgactttc ctctctgttc ag 1472 <210> 9 <211> 1860 <212> DNA <213> Mus musculus <400> 9 gtaaacccac actgtacaat gtctccctga tcatgtctga cacaggcggc acctgctatt 60 gaccatgcta gcgctcaacc aggcaggccc tgggtgtcca gttgctctgt gtatgcaaac 120 taaccatgtc agagtgagat gttgcatttt ataaaaatta gaaataaaaa aaatccattc 180 aaacgtcact ggttttgatt atacaatgct catgcctgct gagacagttg tgttttgctt 240 gctctgcaca caccctgcat acttgcctcc accctggccc ttcctctacc ttgccagttt 300 cctccttgtg tgtgaactca gtcaggctta caacagacag agtatgaaca tgcgattcct 360 ccagctactt ctagatatat ggctgaaagc ttgcctaacc tggtgcaggc agcattcagg 420 cacatatata gacacacatg catttataca tagatatata ggtacacatg tgtagacaca 480 tacatgaatg tgtattcatg gacacacaga caaaggtaca catatataca catgagttca 540 tgcgcacaca catgcatgga cacttacaaa cgccttcaga gacaaatagg catagacaca 600 caaccactca cagaaacaga taccaatatg catggtcctg tgtacacaga aacagactat 660 aggcaaatat acacaaataa actatataga tacaaagata tgcatataca cacatgtaca 720 gaaacatctt cacatgtgta cactaacatg tgaacaggta tagcacacag atacacctgg 780 actctgacca gggctgtaat ctccaaggct cacggctcag agagcctaca ctaggctggg 840 tcactgatac tcctcaggag cccactctat gattgggaga gataacccca ggtacaaagt 900 atgcctatct gtctcaacac catggggcag aagatactcc actaaccacc catgacagaa 960 agttagcctt ggctgtgtct ccattaatag aacacctcag aagaccaatg tgaaattgcc 1020 taacccactc acacccaccc tgatctccag ttcaaaatgc agaaaacata atgcagttgt 1080 ccaaaagatg ccccaaccac acacacacac acacacacac acacacacac acacacacac 1140 acacacacac acacacacca tcaaggagcc tctgtaagga gtcaccaccc aataacactg 1200 cctctttggg ctcatatcct ggacattctt catattcata tccatttggg gcctaggctt 1260 tagatatccc caagggctca tctttacagg gatcagagat cccaataaat gccctggtcc 1320 cacagcctcc ctcaggtatc tgtctgttta tctcttggta ccaagaccca acattgctgg 1380 caggggtagg acaagcaacg cacgggaact ctgatcaaag aaagtcatga gatgcctgag 1440 tccttcagga agtaaggagg gacaacctct ggtatccctg ttcttattgc taaagcccaa 1500 gagacaggga gacctgctct aaattctcag tctaaacagc accgatggca ccacctgctc 1560 agggaaagtc cagagcacac caatatcatt ttgccacagt tcctgagtct gcctttaccc 1620 aggtccatac attgcatctg tcttgcttgc tctgctgccc cagggctcct ggaacaaagg 1680 ctccaaatta gtgtgtccta cagcttggcc tgttctgtgc ctccgtctag cttgagctat 1740 taggggacca gtcaatactc gctaagattc tccagaacca tcagggcacc ccaaccctta 1800 tgcaaatgct cagtcacccc aagacttggc ttgaccctcc ctctctgtgt cccttcatag 1860 <210> 10 <211> 87 <212> DNA <213> Homo sapiens <400> 10 agcctgtgga ccaccctgtc cacgtttgtg gccctcttca tcctcaccct cctctacagc 60 ggcattgtca ctttcatcaa ggtgaag 87 <210> 11 <211> 78 <212> DNA <213> Homo sapiens <400> 11 gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60 gccaccgtca ccttcttc 78 <210> 12 <211> 78 <212> DNA <213> Homo sapiens <400> 12 gggctgtgga ccaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60 gccaccatca ccttcttc 78 <210> 13 <211> 81 <212> DNA <213> Homo sapiens <400> 13 aacctgtggg ccaccgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagt 60 accaccgtca ccttgttcaa g 81 <210> 14 <211> 63 <212> DNA <213> Mus musculus <400> 14 actgtgacct tcctcaccct cttcctactg agcttgttct acagcacagc actcactgtt 60 aca 63 <210> 15 <211> 84 <212> DNA <213> Mus musculus <400> 15 gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagtgt gtgctacagc 60 gctgctgtca cactcttcaa ggta 84 <210> 16 <211> 78 <212> DNA <213> Mus musculus <400> 16 gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60 gcctctgtca cactcttc 78 <210> 17 <211> 78 <212> DNA <213> Mus musculus <400> 17 gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60 gcctctgtca ccctcttc 78 <210> 18 <211> 84 <212> DNA <213> Mus musculus <400> 18 aacctgtgga ccactgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagc 60 accaccgtca ccctgttcaa ggtg 84 <210> 19 <211> 30 <212> PRT <213> Homo sapiens <400> 19 Gly Glu Ala Ala Arg Arg Pro Gly Leu Pro Leu Pro Leu Leu Leu Leu 1 5 10 15 His Gln Leu Leu Leu Leu Phe Leu Ser His Leu Arg Arg Leu 20 25 30 <210> 20 <211> 26 <212> PRT <213> Homo sapiens <400> 20 Asp Ala Ala His Pro Val Ala Ala Ser Leu Pro Leu Leu Ala Gly Thr 1 5 10 15 Leu Leu Leu Leu Gly Ala Ser Ala Ala Pro 20 25 <210> 21 <211> 24 <212> PRT <213> Homo sapiens <400> 21 Ser Ser Ala Gly Ser Leu Ala Ala Gly Pro Leu Leu Val Ala Leu Ala 1 5 10 15 Leu Tyr Pro Leu Ser Val Leu Phe 20 <210> 22 <211> 30 <212> PRT <213> Homo sapiens <400> 22 Asp Ala Ala His Pro Gly Arg Ser Val Val Pro Ala Leu Leu Pro Leu 1 5 10 15 Leu Ala Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro 20 25 30 <210> 23 <211> 26 <212> PRT <213> Homo sapiens <400> 23 Ser Ala Ser Ser Asn Ile Ser Gly Gly Ile Phe Leu Phe Phe Val Ala 1 5 10 15 Asn Ala Ile Ile His Leu Phe Cys Phe Ser 20 25 <210> 24 <211> 27 <212> PRT <213> Homo sapiens <400> 24 Ala Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr Val Gly Ile 1 5 10 15 Met Ile Gly Val Leu Val Gly Val Ala Leu Ile 20 25 <210> 25 <211> 29 <212> PRT <213> Homo sapiens <400> 25 Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr 1 5 10 15 Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr 20 25 <210> 26 <211> 27 <212> PRT <213> Homo sapiens <400> 26 Asn Gly Gly Thr Ser Leu Ser Glu Lys Thr Val Leu Leu Leu Val Thr 1 5 10 15 Pro Phe Leu Ala Ala Ala Trp Ser Leu His Pro 20 25 <210> 27 <211> 32 <212> PRT <213> Homo sapiens <400> 27 Cys Glu Gly Ile Ser Leu Leu Ala Gln Asn Thr Ser Trp Leu Leu Leu 1 5 10 15 Leu Leu Leu Ser Leu Ser Leu Leu Gln Ala Thr Asp Phe Met Ser Leu 20 25 30 <210> 28 <211> 22 <212> PRT <213> Homo sapiens <400> 28 Ser Gly Ala Pro Thr Leu Ser Pro Ser Leu Leu Gly Leu Leu Leu Pro 1 5 10 15 Ala Phe Gly Ile Leu Val 20 <210> 29 <211> 39 <212> PRT <213> Homo sapiens <400> 29 Asp Leu Cys Asn Glu Lys Leu His Asn Ala Ala Pro Thr Arg Thr Ala 1 5 10 15 Leu Ala His Ser Ala Leu Ser Leu Gly Leu Ala Leu Ser Leu Leu Ala 20 25 30 Val Ile Leu Ala Pro Ser Leu 35 <210> 30 <211> 24 <212> PRT <213> Homo sapiens <400> 30 Ser Gly Ala Gly Pro Trp Ala Ala Trp Pro Phe Leu Leu Ser Leu Ala 1 5 10 15 Leu Met Leu Leu Trp Leu Leu Ser 20 <210> 31 <211> 26 <212> PRT <213> Homo sapiens <400> 31 Asn Ala Gly Glu Met Leu His Gly Thr Gly Gly Leu Leu Leu Ser Leu 1 5 10 15 Ala Leu Met Leu Gln Leu Trp Leu Leu Gly 20 25 <210> 32 <211> 49 <212> PRT <213> Homo sapiens <400> 32 Ala Arg Gly Leu Met Asn Gly Tyr Arg Gly Pro Ala Met Asp Ser Glu 1 5 10 15 Glu Asp Met Met Val Thr Ala Leu His Ser Leu Thr Leu Gln Thr Val 20 25 30 Val Ile His Ser Leu Ser Ser Val Leu Pro Gly Ile Thr Leu Ala Ile 35 40 45 Asn <210> 33 <211> 30 <212> PRT <213> Homo sapiens <400> 33 Ser Ser Gly His Ser Arg His Arg Tyr Ala Leu Ile Pro Ile Pro Leu 1 5 10 15 Ala Val Ile Thr Thr Cys Ile Val Leu Tyr Met Asn Val Leu 20 25 30 <210> 34 <211> 27 <212> PRT <213> Homo sapiens <400> 34 Ser Gly Ala Ser Ser Leu His Arg His Phe Gly Leu Leu Leu Ala Ser 1 5 10 15 Leu Ala Pro Leu Val Leu Cys Leu Ser Leu Leu 20 25 <210> 35 <211> 26 <212> PRT <213> Homo sapiens <400> 35 Ser Thr Gly Ser His Cys His Gly Ser Phe Ser Leu Ile Phe Leu Ser 1 5 10 15 Leu Trp Ala Val Ile Phe Val Leu Tyr Gln 20 25 <210> 36 <211> 31 <212> PRT <213> Homo sapiens <400> 36 Gly Ala Ala Pro Gln Pro Gly Pro Ala His Leu Ser Leu Thr Ile Thr 1 5 10 15 Leu Leu Met Thr Ala Arg Leu Trp Gly Gly Thr Leu Leu Trp Thr 20 25 30 <210> 37 <211> 30 <212> PRT <213> Mus musculus <400> 37 Asn Ala Ala Val Pro Thr Gly Ala Ser Thr Trp Thr Met Ala Gly Val 1 5 10 15 Leu Leu Phe Ser Leu Ser Ser Val Ile Leu Gln Thr Leu Leu 20 25 30 <210> 38 <211> 35 <212> PRT <213> Mus musculus <400> 38 Asn Glu Arg Leu Val Ser Ala Ala Pro Gly His Ala Leu Leu Ser Ser 1 5 10 15 Val Thr Leu Gly Leu Ala Thr Ser Leu Ser Leu Leu Thr Val Met Ala 20 25 30 Leu Cys Leu 35 <210> 39 <211> 26 <212> PRT <213> Mus musculus <400> 39 Ser Ala Ala Ser His Tyr Gln Gly Ser Phe Pro Leu Val Ile Leu Ser 1 5 10 15 Leu Ser Ala Val Ile Phe Val Leu Tyr Gln 20 25 <210> 40 <211> 24 <212> PRT <213> Mus musculus <400> 40 Ser Ser Gly Val Cys Trp Thr Ala Thr Trp Leu Val Val Thr Thr Leu 1 5 10 15 Ile Ile His Arg Ile Leu Leu Thr 20 <210> 41 <211> 32 <212> PRT <213> Mus musculus <400> 41 Asn Phe Ser Ala Ala Gly Leu Gly Leu Arg Ala Ser Ile Pro Leu Leu 1 5 10 15 Gly Leu Gly Leu Leu Leu Ser Leu Leu Ala Leu Leu Gln Leu Ser Pro 20 25 30 <210> 42 <211> 16 <212> PRT <213> Mus musculus <400> 42 Ala Lys Ser Phe Tyr Phe Ile Cys Tyr Leu Cys Leu Tyr Leu Ala Leu 1 5 10 15 <210> 43 <211> 22 <212> PRT <213> Rattus norvegicus <400> 43 Gly Asn Ser Ala Glu Gly Ser Met Pro Ala Phe Leu Leu Phe Leu Leu 1 5 10 15 Leu Gln Leu Trp Asp Thr 20 <210> 44 <211> 32 <212> PRT <213> Rattus norvegicus <400> 44 Cys Gly Gly Ile Ser Leu Leu Val Gln Asn Thr Ser Trp Leu Leu Leu 1 5 10 15 Leu Leu Leu Ser Leu Ser Phe Leu Gln Ala Thr Asp Phe Ile Ser Leu 20 25 30 <210> 45 <211> 29 <212> PRT <213> Rattus norvegicus <400> 45 Ser Ala Ala Thr Arg Pro Glu Pro His Tyr Phe Phe Leu Leu Phe Leu 1 5 10 15 Phe Thr Leu Val Leu Ala Ala Ala Arg Pro Arg Trp Arg 20 25 <210> 46 <211> 24 <212> PRT <213> Rattus norvegicus <400> 46 Ser Ser Gly Val His Trp Ile Ala Ala Trp Leu Val Val Thr Leu Ser 1 5 10 15 Ile Ile Pro Ser Ile Leu Leu Ala 20 <210> 47 <211> 26 <212> PRT <213> Rattus norvegicus <400> 47 Ser Ala Ala Ser His Tyr Gln Gly Ser Phe Pro Leu Ile Ile Leu Ser 1 5 10 15 Phe Trp Ala Val Ile Leu Val Leu Tyr Gln 20 25 <210> 48 <211> 22 <212> PRT <213> Rattus norvegicus <400> 48 Arg Asn Thr Gly Phe Leu Leu Ala Trp Pro Thr Phe Phe Leu Pro Val 1 5 10 15 Phe Leu Ala Trp Leu Phe 20 <210> 49 <211> 30 <212> PRT <213> Rattus norvegicus <400> 49 Ser Ser Ala Gly Ala Arg Glu Ser Cys Val Ser Leu Phe Leu Val Val 1 5 10 15 Leu Pro Ser Leu Leu Val Gln Leu Leu Cys Leu Ala Glu Pro 20 25 30 <210> 50 <211> 33 <212> PRT <213> Candida albicans <400> 50 Ser Ser Gly Val Lys Ala Thr Gln Gln Met Ser Met Val Lys Leu Val 1 5 10 15 Ser Ile Ile Thr Ile Val Thr Ala Phe Val Gly Gly Met Ser Val Val 20 25 30 Phe <210> 51 <211> 32 <212> PRT <213> Yeast sp. <400> 51 Asn Ala Ala Thr Asn Val Lys Ala Asn Leu Ala Gln Val Val Phe Thr 1 5 10 15 Ser Ile Ile Ser Leu Ser Ile Ala Ala Gly Val Gly Phe Ala Leu Val 20 25 30 <210> 52 <211> 25 <212> PRT <213> porcine <400> 52 Ala Arg Ala Ala Pro Thr Thr Ser Leu Gly Ser Leu Met Thr Val Ser 1 5 10 15 Ala Leu Ala Ile Leu Gly Trp Ser Val 20 25 <210> 53 <211> 26 <212> PRT <213> porcine <400> 53 Ser Ala Ala Pro Ser Leu His Leu Pro Pro Gly Ser Leu Leu Ala Ser 1 5 10 15 Leu Val Pro Leu Leu Leu Leu Ser Leu Pro 20 25 <210> 54 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 54 Ser Asn Ser Phe Val Ile His Lys Ala Pro Leu Phe Leu Ala Phe Leu 1 5 10 15 Leu Phe <210> 55 <211> 24 <212> PRT <213> Trypanosoma brucei <400> 55 Asp Ser Ser Ile Leu Val Thr Lys Lys Phe Ala Leu Thr Val Val Ser 1 5 10 15 Ala Ala Phe Val Ala Leu Leu Phe 20 <210> 56 <211> 24 <212> PRT <213> Trypanosoma brucei <400> 56 Asn Gly Ser Phe Leu Thr Ser Lys Gln Phe Ala Phe Ser Val Val Ser 1 5 10 15 Ala Ala Phe Val Ala Leu Leu Phe 20 <210> 57 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 57 Ser Asn Ser Phe Val Ile Ser Lys Thr Pro Leu Trp Leu Ala Val Leu 1 5 10 15 Leu Phe <210> 58 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 58 Asp Gly Ser Phe Leu Val Asn Lys Lys Phe Ala Leu Met Val Tyr Asp 1 5 10 15 Phe Val Ser Leu Leu Ala Phe 20 <210> 59 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 59 Asn Gly Ser Phe Leu Thr Ser Lys Gln Phe Ala Leu Met Val Ser Ala 1 5 10 15 Ala Phe Val Thr Leu Leu Phe 20 <210> 60 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 60 Gly Ala Ala Thr Leu Lys Ser Val Ala Leu Pro Phe Ala Ile Ala Ala 1 5 10 15 Ala Ala Leu Val Ala Ala Phe 20 <210> 61 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 61 Ser Asn Ser Phe Val Ile Asn Lys Ala Pro Leu Leu Leu Gly Phe Leu 1 5 10 15 Leu Phe <210> 62 <211> 20 <212> PRT <213> Trypanosoma congolense <400> 62 Ser Gly Ser Ser His Gly Thr Lys Ala Ile Arg Ser Ile Leu His Val 1 5 10 15 Ala Leu Leu Met 20 <210> 63 <211> 28 <212> PRT <213> Gallus sp. <400> 63 Ala Gly Asn Lys Leu Ile Gln Gln His Leu Leu Val Ile Thr Phe Val 1 5 10 15 Pro Phe Ile Ile Leu Gly Gln Leu Gln Gly Leu Gly 20 25 <210> 64 <211> 26 <212> PRT <213> Gallus sp. <400> 64 Ala Thr Leu Gly Ser Pro Ser Thr Ser Ser Ser Phe Val Ser Leu Leu 1 5 10 15 Leu Ser Ala Val Thr Leu Leu Leu Leu Cys 20 25 <210> 65 <211> 25 <212> PRT <213> Torpedo marmorata <400> 65 Ser Ser Ser Gly Thr Ser Ser Ser Lys Gly Ile Ile Phe Tyr Val Leu 1 5 10 15 Phe Ser Ile Leu Tyr Leu Ile Phe Tyr 20 25 <210> 66 <211> 24 <212> PRT <213> Hamster sp. <400> 66 Ser Ser Ala Val Leu Phe Ser Ser Pro Pro Val Ile Leu Leu Ile Ser 1 5 10 15 Phe Leu Ile Phe Leu Met Val Gly 20 <210> 67 <211> 26 <212> PRT <213> Bos taurus <400> 67 Ser Ala Gly Ser His Cys Cys Gly Ser Phe Ser Leu Ile Phe Leu Ser 1 5 10 15 Val Leu Ala Val Ile Ile Ile Leu Tyr Gln 20 25 <210> 68 <211> 23 <212> PRT <213> slime mold <400> 68 Ser Ser Ala Thr Thr Ile Ala Phe Asn Ala Phe Val Val Phe Ala Ile 1 5 10 15 Val Leu Ser Val Leu Leu Phe 20 <210> 69 <211> 22 <212> PRT <213> slime mold <400> 69 Gly Ser Ala Ser Thr Val Val Ala Ser Leu Ser Leu Ile Ile Phe Ser 1 5 10 15 Met Ile Leu Ser Leu Cys 20 <210> 70 <211> 25 <212> DNA <213> Homo sapiens <400> 70 acctggccat gacccccctg atccc 25 <210> 71 <211> 29 <212> DNA <213> Homo sapiens <400> 71 agctgcaact ggaggagagc tgtgcggag 29 <210> 72 <211> 33 <212> DNA <213> Homo sapiens <400> 72 agctgcaact ggaggagagc tgtgcggagg cgc 33 <210> 73 <211> 25 <212> DNA <213> Homo sapiens <400> 73 agggggaggt gagcgccgac gagga 25 <210> 74 <211> 31 <212> DNA <213> Mus musculus <400> 74 aacgtcaaga gccactttcc tatgtgctac t 31 <210> 75 <211> 48 <212> DNA <213> Mus musculus <400> 75 ggctgcaact ggacgagacc tgtgctgagg cccaggacgg ggagctgg 48 <210> 76 <211> 27 <212> DNA <213> Mus musculus <400> 76 ggctagacct ggatgatatc tgtgctg 27 <210> 77 <211> 23 <212> DNA <213> Mus musculus <400> 77 agctggaact gaatgagacc tgt 23 <210> 78 <211> 33 <212> DNA <213> Mus musculus <400> 78 agggggaggt gaatgctgag gaggaaggct ttg 33 <210> 79 <211> 4 <212> PRT <213> Homo sapiens <400> 79 Gly Phe Thr His 1 <210> 80 <211> 4 <212> PRT <213> Homo sapiens <400> 80 Ala Cys Thr Thr 1 <210> 81 <211> 4 <212> PRT <213> Homo sapiens <400> 81 Cys Ala Pro Ala 1 <210> 82 <211> 4 <212> PRT <213> Homo sapiens <400> 82 Ala Gly Thr Thr 1 <210> 83 <211> 4 <212> PRT <213> Homo sapiens <400> 83 Thr Ser Ser Pro 1 <210> 84 <211> 4 <212> PRT <213> Homo sapiens <400> 84 Ile Thr Val Ser 1 <210> 85 <211> 4 <212> PRT <213> Homo sapiens <400> 85 Ser Gly Thr Thr 1 <210> 86 <211> 4 <212> PRT <213> Homo sapiens <400> 86 Glu Gln Leu Glu 1 <210> 87 <211> 4 <212> PRT <213> Homo sapiens <400> 87 Lys Leu Val Lys 1 <210> 88 <211> 4 <212> PRT <213> Homo sapiens <400> 88 Gln Val Lys Ile 1 <210> 89 <211> 4 <212> PRT <213> Homo sapiens <400> 89 Cys Cys Gln Glu 1 <210> 90 <211> 4 <212> PRT <213> Homo sapiens <400> 90 Ala Ala Ala Met 1 <210> 91 <211> 4 <212> PRT <213> Homo sapiens <400> 91 Ala Met His Val 1 <210> 92 <211> 4 <212> PRT <213> Homo sapiens <400> 92 Gly Ser Arg Gly 1 <210> 93 <211> 4 <212> PRT <213> Homo sapiens <400> 93 Thr Cys Ile Pro 1 <210> 94 <211> 4 <212> PRT <213> Homo sapiens <400> 94 Tyr Gly Tyr Ser 1 <210> 95 <211> 4 <212> PRT <213> Homo sapiens <400> 95 Arg Ile Lys Phe 1 <210> 96 <211> 4 <212> PRT <213> Homo sapiens <400> 96 Gln Tyr Arg Ser 1 <210> 97 <211> 4 <212> PRT <213> Mus musculus <400> 97 Glu Asp Leu Cys 1 <210> 98 <211> 4 <212> PRT <213> Mus musculus <400> 98 Thr Asp Leu Cys 1 <210> 99 <211> 4 <212> PRT <213> Mus musculus <400> 99 Arg Ile Lys Phe 1 <210> 100 <211> 4 <212> PRT <213> Mus musculus <400> 100 Asp Leu Ala Arg 1 <210> 101 <211> 4 <212> PRT <213> Mus musculus <400> 101 Ser Ser Phe Cys 1 <210> 102 <211> 4 <212> PRT <213> Mus musculus <400> 102 His Leu Met Phe 1 <210> 103 <211> 4 <212> PRT <213> Rattus norvegicus <400> 103 Ala Pro Ser Ser 1 <210> 104 <211> 4 <212> PRT <213> Rattus norvegicus <400> 104 Lys Leu Val Lys 1 <210> 105 <211> 4 <212> PRT <213> Rattus norvegicus <400> 105 Gly Gln Lys Thr 1 <210> 106 <211> 4 <212> PRT <213> Rattus norvegicus <400> 106 Thr Leu Ala Arg 1 <210> 107 <211> 4 <212> PRT <213> Rattus norvegicus <400> 107 Arg Ile Lys Phe 1 <210> 108 <211> 4 <212> PRT <213> Rattus norvegicus <400> 108 Asn Gly Thr Pro 1 <210> 109 <211> 4 <212> PRT <213> Rattus norvegicus <400> 109 Asn Cys Leu Tyr 1 <210> 110 <211> 4 <212> PRT <213> Candida albicans <400> 110 Gly Ser Ser Ser 1 <210> 111 <211> 4 <212> PRT <213> Yeast sp. <400> 111 Ser Ser Lys Lys 1 <210> 112 <211> 4 <212> PRT <213> porcine <400> 112 Glu Pro Leu Ser 1 <210> 113 <211> 4 <212> PRT <213> porcine <400> 113 Asn Tyr Gly Tyr 1 <210> 114 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 114 Asn Thr Thr Gly 1 <210> 115 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 115 Asn Ala Cys Lys 1 <210> 116 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 116 Glu Lys Cys Arg 1 <210> 117 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 117 Thr Thr Gly Ser 1 <210> 118 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 118 Glu Lys Cys Cys 1 <210> 119 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 119 Glu Asp Cys Arg 1 <210> 120 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 120 Glu Pro Glu Pro 1 <210> 121 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 121 Asn Thr Thr Ala 1 <210> 122 <211> 4 <212> PRT <213> Trypanosoma congolense <400> 122 Ser His Leu Pro 1 <210> 123 <211> 4 <212> PRT <213> Gallus sp. <400> 123 Gln Cys Ser Gly 1 <210> 124 <211> 4 <212> PRT <213> Gallus sp. <400> 124 Thr Val Ile Pro 1 <210> 125 <211> 4 <212> PRT <213> Torpedo marmorata <400> 125 Asp Gly Glu Leu 1 <210> 126 <211> 4 <212> PRT <213> Hamster sp. <400> 126 Asp Gly Arg Arg 1 <210> 127 <211> 4 <212> PRT <213> Bos taurus <400> 127 Arg Ile Gln Phe 1 <210> 128 <211> 4 <212> PRT <213> slime mold <400> 128 Asn Asn Val Cys 1 <210> 129 <211> 4 <212> PRT <213> slime mold <400> 129 Ser Thr Thr Thr 1 <210> 130 <211> 2074 <212> DNA <213> Homo sapiens <400> 130 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560 cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620 ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680 cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740 tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800 ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860 ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920 gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980 agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040 gcccactcgg gggcatgcga cagattgagg atcc 2074 <210> 131 <211> 330 <212> PRT <213> Artificial <220> <223> Amino acid sequence of the gamma-chain constant region encoded by plasmid pIgG-A <400> 131 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 132 <211> 40 <212> DNA <213> Artificial <220> <223> TM-fw1 <400> 132 ggccgagtct gaggcctgag tggcatgagg gaggcagagt 40 <210> 133 <211> 48 <212> DNA <213> Artificial <220> <223> TM-rv1 <400> 133 aactggatcc atgtagaaaa gaggagaagc cccgggggtc catgtagt 48 <210> 134 <211> 47 <212> DNA <213> Artificial <220> <223> M1-rv <400> 134 gatccacttc accttgaaga aggtgacggt ggcactgtag cacacgc 47 <210> 135 <211> 49 <212> DNA <213> Artificial <220> <223> M2-fw <400> 135 caccttcttc aaggtgaagt ggatcttctc ctcggtggtg gacctgaag 49 <210> 136 <211> 33 <212> DNA <213> Artificial <220> <223> TM-fw2 <400> 136 ctccagcagc agctgccctg ggctgggcca cga 33 <210> 137 <211> 50 <212> DNA <213> Artificial <220> <223> TM-rv2 <400> 137 cagggatccc ccgaggtgca gctggaccag cctcctcctg accgtgtttt 50 <210> 138 <211> 68 <212> DNA <213> Artificial <220> <223> mutSphI-1 <400> 138 ctaccccaga cctccgctgc ttggtgcctg cagggcactg ggggccaggt gtcccctcag 60 caggacgt 68 <210> 139 <211> 62 <212> DNA <213> Artificial <220> <223> mutSphI-2 <400> 139 cctgctgagg ggacacctgg cccccagtgc cctgcaggca ccaagcagcg gaggtctggg 60 gt 62 <210> 140 <211> 6949 <212> DNA <213> Homo sapiens <400> 140 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560 cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620 ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680 cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740 tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800 ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860 ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920 gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980 agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040 gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100 cccccacggc actaacccct ggcagccctg cccagcctcg cacccgcatg gggacacaac 2160 cgactccggg gacatgcact ctcgggccct gtggagggac tggtgcagat gcccacacac 2220 acactcagcc cagacccgtt caacaaaccc cgcactgagg ttggccggcc acacggccac 2280 cacacacaca cgtgcacgcc tcacacacgg agcctcaccc gggcgaaccg cacagcaccc 2340 agaccagagc aaggtcctcg cacacgtgaa cactcctcgg acacaggccc ccacgagccc 2400 cacgcggcac ctcaaggccc acgagccgct cggcagcttc tccacatgct gacctgctca 2460 gacaaaccca gccctcctct cacaaggtgc ccctgcagcc gccacacaca cacaggcccc 2520 cacacgcagg ggaacacacg ccacgtcgcg tccctggcac tggcccactt cccaatacag 2580 cccttccctg cagctggggt cacatgaggt gtgggcttca ccatcctcct gccctctggg 2640 cctcagggag ggacacggga gacggggagc gggtcctgct gagggccagg tcgctatcta 2700 gggccgggtg tctggctgag tcccggggcc aaagctggtg cccagggcgg gcagctgtgg 2760 ggagctgacc tcaggacatt gttggcccat cccggccggg ccctacatcc tgggccccgc 2820 cacagaggga atcaccccca gaggcccaag cccaggggga cacagcactg accaccccct 2880 tcctgtccag agctgcaact ggaggagagc tgtgcggagg cgcaggacgg ggagctggac 2940 gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 3000 gccaccgtca ccttcttcaa ggtcggccgc acgttgtccc cagctgtcct tgacattgtc 3060 ccccatgctg tcacaaactg tctctgacac tgtcccacag gctgtcccca cctgtccctg 3120 acgctgtccc ccatgctctc acaaactgtc cctgacattg tccccaatgc tgcccccacc 3180 tgtccaacag tgtcccccag gctctcccca catgtccccg acactgtccc ccatgctgtc 3240 cccatctgtc cccaacactg tcccccaccc tgtccccctt tgtccccaac actgtccccc 3300 acagtttcca cctgtccctg acactgtccc ccatgctttc cccacctgtc cctgacacca 3360 tcccccactc tgtcccctat agttcctggc cctgtccccc acgctgtccc ctacagtacc 3420 tggcactgtc ccccatgctg tcccctcctg tatgaaaccc tgtcccacat gctgtcccca 3480 cctgtccgtg acaatatccc ccacactgtc cccacctgtc cccgacactc tcctccacgt 3540 tgttcttacc taaacccgac actttcctcc atgctgtccc cacccatctc cgacactgta 3600 ccccacgttg tccccacctg tcctcaacac tgtcccccat gctgtcccca cctgtcccca 3660 acactctcct ccatgctgtc cccacctgtc cctgatattg tcccccatgc agtctccacc 3720 tgtccccaat gctgtccccc aggctgtacc taccagtaca acactgtccc ccatgctgtc 3780 cccacctgtc cctgacactg tcccccacgc tgtcccctcc tgtccccgac actgtccccc 3840 acactgtccc cacctgtccc caacactatc ctccatgctg tcccctcctg tccccacctg 3900 tcccctacac tgtcccccat gctgtcccca ccagtcccca aaactttcct ccacactgtc 3960 cccacctgtc cccaacactg tcccccacgc tatcccccct gtccccgaca atgtccccac 4020 tgtttcctcc tgttccctcc tatccctgac actgtccgcc atgctgtccc cacctgtccc 4080 tgacactgtc tcccactctg tcccctataa tccctgacac tgtcccccac gccgtcccct 4140 cccgtatgca ccactgtccc ccaagctgtc cccacctgtc ctcaacacag tcccccatgc 4200 tgtccccacc tgtccccaac actctcctcc atgtccccac ctgtccctga tattgtcccc 4260 catgcagtcc ccacctgtcc ccgatgctgt cccccgggct gtacctacca gtccaacact 4320 gtcccccaca ctctccccac ctgtccctga tactgtcccc catgctgtcc ccacctgtcc 4380 cggacactgt tctccacgat ctcccctcct gtccctgaca ctgtccccca cactgtcccc 4440 acctgtcccc aacactatcc tccatcctgt cccaacctgt ctcctacact gtcccccatg 4500 ctgtccccac cagtccccaa cactgtcctc catgctgtcc cccatgtccc caacactgtc 4560 ccccatgcta cctcccctgc ccctgacaat gtccccactg tttcctgtcc cctcctatcc 4620 ctgacactgt cccccatgct gtccccacct gtcccccaca tggtctccac cggtccctga 4680 cactgtctcc cactctgtcc cctataatcc ctgacactgt cccccacacc gtcccctcct 4740 gtatgcacca cggtccccca tgctgtcccc acctgtccct gatgctgtcc tccacacagt 4800 ccccacctct ccctgacact gtccccatct ctccccaaca ctctcctcca tgctgtcctc 4860 aactgtcccc aacactcttc cacactctgt ctccacctgt ccctgacact gtcccccaca 4920 ctgtcctcac ctgtgtctga cactgtcccc cacgctgtcc ccacctgtcc ctgacgctgt 4980 cttctgtgct gtccacatgc tgttggtgcc ctggctctgc tctctatcac caagcctcag 5040 agcaggcagt ggtgaggcca tggcacctgg gtggcatgag gggccggatg ggcctcaggg 5100 gcagggctgt ggcctgcgtg gactgacagg tgggtgggcc ttgggggcag agaggtggcc 5160 tcagtgccct gaggggtggg tggggctcgg gggcagggct gtggcctcgc tcacccctgt 5220 gctgtgcctt gcctacaggt gaagtggatc ttctcctcgg tggtggacct gaagcagacc 5280 atcatccccg actacaggaa catgatcgga cagggggcct agggccaccc tctgcggggt 5340 gtccagggcc gcccagaccc cacacaccag ccatgggcca tgctcagcca ccacccaggc 5400 cacacctgcc cccgacctca ccgccctcaa ccccatggct ctctggcctc gcagttgccc 5460 tctgaccctg acacacctga cacgcccccc ttccagaccc tgtgcatagc aggtctaccc 5520 cagacctccg ctgcttggtg cctgcagggc actgggggcc aggtgtcccc tcagcaggac 5580 gtccttgccc tccggaccac aaggtgctca cacaaaagga ggcagtgacc ggtatcccag 5640 gcccccaccc aggcaggagc tggccctgga gccaaccccg tccacgccag cctcctgaac 5700 acaggcgtgg tttccagatg gtgagtggga gcatcagccg ccaaggtagg gaagccacag 5760 caccatcagg ccctgttggg gaggcttccg agagctgcga aggctcactc agacggcctt 5820 cctcccagcc cgcagccagc cagcctccat tccgggcact cccgtgaact cctgacatga 5880 ggaatgacgt tgttctgatt tcaagcaaag aacgctgctc tctggctcct gggaacagtc 5940 tcggtgccag caccacccct tggctgcctg cccacactgc tggattctcg ggtggaactc 6000 gacccgcagg gacagccagc cccagagtcc gcactgggga gagaaggggc caggcccagg 6060 acactgccac ctcccaccca ctccagtcca ccgagatcac tcggagaaga gtctgggcca 6120 tgtggccgct gcaggagccc cacagtgcaa gggtgaggat agcccaagga agggctgggc 6180 atctgcccag acaggcctcc cacagaaggc tggtgaccag gtcccaggcg ggcaagactc 6240 agccttggtg gggcctgagg acagaggagg cccaggagca tcggggagag aggtggaggg 6300 acaccgggag agccaggggc gtggacacag ccagaactca tcacagaggc tggcgtccag 6360 tcccgggtca tgtgcagcag gaacaagcag ccactctggg ggcaccaggt ggagaggcaa 6420 gacgacaaag agggtgcccg tgttcttgcg aaagcggggc tgctggccac gagtgctgga 6480 cagaggcccc cacgctctgc tgcccccatc acgccgttcc gtgactgtca cgcagaatct 6540 gcagacagga agggagactc gagcgggagt gcggccagag cctgcctcgg ccgtcaggga 6600 ggactcccgg gctcactcga aggaggtgcc accatttcag ctttggtagc ttttcttctt 6660 cttttaaatt ttctaaagct cattaattgt ctttgatgtt tcttttgtga tgacaataaa 6720 atatcctttt taagtcttgt acttcgtgat gggagccgcc ttcctgtgtc cacgcgcctc 6780 ctgcccccgg tgggaagcac ggtcaggagg aggctggtcc agctgcacct cgggggctcc 6840 ctgcactcgc cccccgcctc ctgcagccac acgcattgcc cgagcgaccc tccctggccc 6900 ctgtcactac atggaccccc ggggcttctc ctcttttcta catggatcc 6949 <210> 141 <211> 330 <212> PRT <213> Homo sapiens <400> 141 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 142 <211> 399 <212> PRT <213> Homo sapiens <400> 142 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys 325 330 335 Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr 340 345 350 Ile Phe Ile Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val 355 360 365 Thr Phe Phe Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys 370 375 380 Gln Thr Ile Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 385 390 395 <210> 143 <211> 4608 <212> DNA <213> Homo sapiens <400> 143 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560 cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620 ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680 cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740 tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800 ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860 ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920 gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980 agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040 gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100 cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160 cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220 cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280 ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340 cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400 ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460 agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520 ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580 gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640 gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700 agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760 gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820 ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880 ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940 cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgctaagcg tgtgctacag 3000 tgccaccgtc accttcttca aggtgaagtg gatcttctcc tcggtggtgg acctgaagca 3060 gaccatcgtc cccgactaca ggaacatgat aaggcagggg gcctagggcc accctctgcg 3120 gggtgtccag ggccgcccag accccacaca cgagccgtgg gccatgctca gccaccaccc 3180 aggccacacc tgccccctga cctcaccgcc ctcaacccca tggctctctg gcttcgcagt 3240 cgccctctga gccctgaaac gccccccttc cagaccctgt gcatagcagg tctaccccag 3300 acctccgctg cttggtgcca gggcactggg ggccaggtgt cccctcagca ggacgtccct 3360 gccctctgga ccaccaggtg ctcacacaaa aggaggtaac cggcatccca ggcccccact 3420 caggcaggac ctcgccctgg agccaacccc gtccacgcca gcctcctgaa cacaggcatg 3480 gtttccagat ggtgagtggg agcatcagtc gccaaggtag ggaagccaca gcaccatcag 3540 gccctgttgg ggaggcttcc gagagctgcg aaggctcact cagacggcct tcctcccagc 3600 ccgcagccag ccagcctcca ttccgggcac tcccgtgaac tcctgacatg aggaatgagg 3660 ttgttctgat ttcaagcaaa gaacgctgct ctctggctcc tgagaacagt ctcggtgcca 3720 gcaccacccc ttggctgcct gcccacactg ctggattctc gggtggaact cgacccgcag 3780 ggacagccag ccccagagtc cgcactgggg agagaagggg ccaggcccag gacactgcca 3840 cctcccaccc actccagtcc accgagatca ctcagagaag agcctgggcc atgtggccgc 3900 tgcaggagcc ccacagtgca agggtgagga tagcccaagg aagggctggg catctgccca 3960 gacaggcctc ccacagaagg ctggtgacca ggtcccaggc gggcaagact cagccttggt 4020 ggggcctgag gacagaggag gcccaggagc atcggggaga gaggtggagg gacaccggga 4080 gagccaggag cgtggacaca gccagaactc accacagagg ctggcgtcca gtcccgggtc 4140 acgtgcagca ggaacaagca gccactctgg gggcaccagg tggagaggca agacgacaaa 4200 gagggtgccc gtgttcttgc gaaagcgggg ctgctggcca cgagtgctgg acagaggccc 4260 ccacgctctg ctgcccccat cacgccgttc cgtgactgtc acgcagaatc cacagacagg 4320 aagggaggct cgagcgggac tgcggccagc gcctgcctcg gccgtcaggg aggactcctg 4380 ggctcactcg aaggaggtgt caccatttca gctttggctt ttcttcttct tttaaatttt 4440 ctaaagctca ttaattgtct ttgatgtttc ttttttgatg acaataaaat atccttttta 4500 agtcttgtac ttcgtgatgg gagccacctt cctgtgtcca cgcgcctcct gcccccggtg 4560 gaaaacacgg tcaggaggag gctggtccag ctgcacctcg ggggatcc 4608 <210> 144 <211> 330 <212> PRT <213> Artificial <220> <223> Amino acid sequence of the short (sIgG) isoform of the gamma-chain constant region encoded by plasmid pmIgGdelta-A <400> 144 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 145 <211> 399 <212> PRT <213> Artificial <220> <223> Amino acid sequence of the long (mIgG) isoform of the gamma-chain constant region encoded by plasmid pmIgGdelta-A <400> 145 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys 325 330 335 Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr 340 345 350 Ile Phe Ile Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val 355 360 365 Thr Phe Phe Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys 370 375 380 Gln Thr Ile Val Pro Asp Tyr Arg Asn Met Ile Arg Gln Gly Ala 385 390 395 <210> 146 <211> 53 <212> PRT <213> Homo sapiens <400> 146 Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe Leu Leu Ser Val 1 5 10 15 Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val Lys Trp Ile Phe Ser 20 25 30 Ser Val Val Asp Leu Lys Gln Thr Ile Val Pro Asp Tyr Arg Asn Met 35 40 45 Ile Arg Gln Gly Ala 50 <210> 147 <211> 34 <212> PRT <213> Homo sapiens <400> 147 Ala Gly Thr Thr Asp Ala Ala His Pro Gly Arg Ser Val Val Pro Ala 1 5 10 15 Leu Leu Pro Leu Leu Ala Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr 20 25 30 Ala Pro <210> 148 <211> 4551 <212> DNA <213> Artificial <220> <223> DNA sequence of the gamma-chain expression cassette constant region, from CH1 to 3'UTR of expression plasmid pIgG-GPI-B <400> 148 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560 cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620 ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680 cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740 tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800 ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860 ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920 gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980 agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040 gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100 cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160 cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220 cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280 ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340 cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400 ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460 agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520 ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580 gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640 gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700 agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760 gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820 ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880 ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940 cggggccggc accaccgacg ccgcgcaccc ggggcggtcc gtggtccccg cgttgcttcc 3000 tctgctggcc gggaccctgc tgctgctgga gacggccact gctccctagg gccaccctct 3060 gcggggtgtc cagggccgcc cagaccccac acacgagccg tgggccatgc tcagccacca 3120 cccaggccac acctgccccc tgacctcacc gccctcaacc ccatggctct ctggcttcgc 3180 agtcgccctc tgagccctga aacgcccccc ttccagaccc tgtgcatagc aggtctaccc 3240 cagacctccg ctgcttggtg ccagggcact gggggccagg tgtcccctca gcaggacgtc 3300 cctgccctct ggaccaccag gtgctcacac aaaaggaggt aaccggcatc ccaggccccc 3360 actcaggcag gacctcgccc tggagccaac cccgtccacg ccagcctcct gaacacaggc 3420 atggtttcca gatggtgagt gggagcatca gtcgccaagg tagggaagcc acagcaccat 3480 caggccctgt tggggaggct tccgagagct gcgaaggctc actcagacgg ccttcctccc 3540 agcccgcagc cagccagcct ccattccggg cactcccgtg aactcctgac atgaggaatg 3600 aggttgttct gatttcaagc aaagaacgct gctctctggc tcctgagaac agtctcggtg 3660 ccagcaccac cccttggctg cctgcccaca ctgctggatt ctcgggtgga actcgacccg 3720 cagggacagc cagccccaga gtccgcactg gggagagaag gggccaggcc caggacactg 3780 ccacctccca cccactccag tccaccgaga tcactcagag aagagcctgg gccatgtggc 3840 cgctgcagga gccccacagt gcaagggtga ggatagccca aggaagggct gggcatctgc 3900 ccagacaggc ctcccacaga aggctggtga ccaggtccca ggcgggcaag actcagcctt 3960 ggtggggcct gaggacagag gaggcccagg agcatcgggg agagaggtgg agggacaccg 4020 ggagagccag gagcgtggac acagccagaa ctcaccacag aggctggcgt ccagtcccgg 4080 gtcacgtgca gcaggaacaa gcagccactc tgggggcacc aggtggagag gcaagacgac 4140 aaagagggtg cccgtgttct tgcgaaagcg gggctgctgg ccacgagtgc tggacagagg 4200 cccccacgct ctgctgcccc catcacgccg ttccgtgact gtcacgcaga atccacagac 4260 aggaagggag gctcgagcgg gactgcggcc agcgcctgcc tcggccgtca gggaggactc 4320 ctgggctcac tcgaaggagg tgtcaccatt tcagctttgg cttttcttct tcttttaaat 4380 tttctaaagc tcattaattg tctttgatgt ttcttttttg atgacaataa aatatccttt 4440 ttaagtcttg tacttcgtga tgggagccac cttcctgtgt ccacgcgcct cctgcccccg 4500 gtggaaaaca cggtcaggag gaggctggtc cagctgcacc tcgggggatc c 4551 <210> 149 <211> 330 <212> PRT <213> Artificial <220> <223> amino acid sequence of the sIgG isoform of the gamma-chain constant region encoded by plasmid pIgG-GPI-B <400> 149 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Pro 100 105 110 Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys 115 120 125 Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val 130 135 140 Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp 145 150 155 160 Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr 165 170 175 Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp 180 185 190 Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu 195 200 205 Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Ala Cys Pro Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <210> 150 <211> 380 <212> PRT <213> Artificial <220> <223> amino acid sequence of the long isoform of the gamma-chain constant region including the carboxy-terminal signal peptide of the human placental alkaline phosphatase encoded by plasmid pIgG-GPI-B <400> 150 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys 325 330 335 Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Ala Gly Thr Thr Asp Ala 340 345 350 Ala His Pro Gly Arg Ser Val Val Pro Ala Leu Leu Pro Leu Leu Ala 355 360 365 Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro 370 375 380 <210> 151 <211> 2061 <212> DNA <213> Homo sapiens <400> 151 gtacacactg taacttctcc tctcgatgtc ctgccctcgc cacgggcacg gggggagcat 60 gcatttccag gcttggggag acacagaggc aggagagctg gaagaatggg ctcctgcctg 120 cctggtgcca catcctgccc cagctttgag ggctgaatcc tctcagctca gagaagagct 180 tccctagttt tgcaggcgca cggaggcctc ccacccgtac acctgcctct gctctccccc 240 tggccattgc aatgcatgcc cgggatctgg gtttaccctg cagcccgact cctccagggc 300 aggctccttc cgtccttggg tccagcagcc tcccccctcc gctgggtact gagcatctga 360 aaagtctcag atagggccct acacctcttc tcccttctca agtgctcagc ccaggggtgg 420 ggcttgctgc ttgcaaagag cagcccaccc tcctgtactg ccatcctatt gcctttgaag 480 aaggaggtca gcctggacag gtgaactgag ttgccttcag aaaggcctgt ctcaggcagc 540 cgcagcaggc ttcacgatgt ccatgtatcc tgtttgcctg ctgccgtctc tcctctccca 600 agaggggagg tctgcgtgtt gagccaggga ggaaggagcc tgcagcctgc tcagggtggt 660 ggctggtgac tgcggggcca gggcttgctg ctgtctctcg gaatgtcctg catgtgggtc 720 tggctgttcc tgctggcact gccctcttct ctctcccctc ctttcccact ctgccctgct 780 tgcccgtcag ggtctccgga tgcccctgct ggaggcagag aagcgttctg tttttatcat 840 cgtccctgtc ttggtcctgt ccgtgctccc catgtgctcc caatcagttg tcttcgttcc 900 tcaacatcag ggaaagaaaa aacagcaaca cttctccctg tcatcagctc tgctgtctcc 960 ttgtcaggcc ttgggacgtt ctctgggctc agtctagggt cgtgcctcat gcctcatgcc 1020 tctctgggaa ggttcccagg ggcgccgcct ccatggttgg ctggtgggtt ttaaagggga 1080 aggttgggag gaggcctgtg gaaggaggag ggccgtccac acccgtgggg caaagcgtgt 1140 tccatgaaac cagtgctgtg cgtgctggga tgaaagcctc ccagcctctc gtgctgaagg 1200 gaaaggtgga ccgaactggc ttagctgctg tggcaatggg gtggggggtg agtcctaatc 1260 agaaggtggg agaagagaat aacaaaatgg aactccgccc cctgccgcca catttcctta 1320 agttttagga gttggggcct atgagtagaa tttgaaagaa ctaccaaaaa agcttatttt 1380 tggaaattaa gtcagctttg cctgtggttt ggctaggaat aaatatttac ctgtgtgccc 1440 ctacagagat gacacagacc caaagtggga cattgagcaa ggcacaggct ggttcccctc 1500 ctgtcctctg tcctcattct gtgagtgcca ccatcaccag gtactgtggc ctgcagaaat 1560 aaacgaggca ccaaccctgc cctcagggac cccgtgtctt cttagggaca gaggactcag 1620 aaacatctgt gtccccgcat gttaagtgca tgcacacagt gctgaggctt tgcagagaag 1680 ggccatggct ccctgaggag accaagaaag gcacatagaa gtgacttctc agctggccct 1740 tgcaggatcc ctgggtgcct gtacctctcc agtccagctg agcaaggagg ctcaggaatt 1800 aatgaagatg gggcttgtgt agcacgatgg ttctaggcca tcccttttcc atggctcaag 1860 tccattgaag gcagcctcca aaatcagggg gttgcctgat cctcctagtg ccacaatccc 1920 agtcctagct agaacttgcc atggttcttc tccctaaaag ttcccagggg acaggagaca 1980 ggtgttgctt ttctaatgga gcgggacctc gcatggacgg ggccctccaa gcctgctaac 2040 accctgttcg cactgactca g 2061 <210> 152 <211> 2726 <212> DNA <213> Mus musculus <400> 152 tacgttcaat ggcagtggat cttaaagacc ttttggatct aagaccagaa gccatctctg 60 actcccctct caccttccag tttcttccaa atcctctggg ccagccagag gtctcagatt 120 ctgccctctt gccctgtgcc caccttgttg accactggac agcatatgtg atggctactg 180 ctagtgccag cttcacaaga ggttaacact acggactagc cattcttcct atgtatctgt 240 ttctgcaaat acagccgctt tacttaagtc tcagcacttc ttagtctcct cttttcctct 300 cagtagccca aggggtcatg tcacaaacat ggtgtgaagg gctactttgt caaatgaaaa 360 ggtctatctt ggggggcatt tttttctttt ctttttttct tgaaacacat tgcccagcaa 420 agccaataaa tttctctcat cattttgttt ctgataaatt cttactattg attgaaatgc 480 ttccctgagg aacattaaat tatgtatgaa tttccattca aagtcatcat gcagcagtgg 540 tatcaagcag gcagcatcta gtgcagaact gagattgtct acagaatgcc tgcttgatgc 600 tcagccttat atcccagtta cggacatgtc tacaaatagc ccttctctta ccatctctcc 660 cttaacttca tgatgtggta gctgattcct tctgccatca actgaaatgg caaaataaag 720 gaaagcctga atcctgtctc ccctcttagt ttccaaggac acttgcccag aaaaatgcgc 780 cccccccccc ccgtatcccc aggcagcatc caggactttc ttaaatggtt ctctgtacaa 840 tcccaccttt aaaacagtca gtgaccattc tttgtaatca ttactttatt aatggttttc 900 ttttctaaac cacctgcctt tgctgttgta gcttctcaat acatgctctg agacaaatca 960 ttccttatat attccaatat tgctgaaaac tcattaattt ttactaatag ggggttgttt 1020 tctaaagctc aggaaatgac ttgtactccc taagtaggaa atgttgcaaa ccaccatttc 1080 atgatgtaca gttgattcaa ttaagtcagg tctgtgagga ctttggttcc ttatctatat 1140 gtaaataatg ctgataccaa atctttgcta ttcattaaca tgtaatcttg caaataataa 1200 taaatttaac agaaactcaa attgaggtag attcttaagg ataatagctt tcagcctagc 1260 cataaaagaa atgaaaaaat agtctttaaa gatcccaaat tcagaattag taatattaat 1320 tcagatagtc cttcgtaaga ttgaaaaaca tgacttctga tttctcatct ttccaaagtt 1380 agacttgacc ttggtgagat ggcaaagtta aaaaattcct ggggtttaag gatatattgg 1440 ggcaacagtc acagcaacgg tgatgctttt tatatctaaa tcctgtcagg ttttgtttcc 1500 actgagctca ttcattcacc tagggatctc attaaaagta ggggaccggg ctggtgagat 1560 ggctcagcag gtaagagcac ccgactgctc ttccgaaggg cctgagttca aatcccagaa 1620 accacatggt ggctcacaac catccgtaac aagatctgac tccctcttct ggtgtgtctg 1680 aagacagcta cagtgtactt acatataata aataaataaa tcttaaaaaa aaaaaaaaag 1740 taggggaccc tatcagaggt ctcaatgtgc ctggaaggtc tcccaacatg gctgtgggaa 1800 aatgcctgac aatttttttt caattgcatg tgtgttctcc gagaaaggat aagatgcaag 1860 tttatataag aagcaggatt tacttatact aaaatgcctt acacgtaagg ttcaggtagc 1920 atcgtggcag agagggtaga aagactgtaa gagccagagg accaggatgt ccgctcttag 1980 tgtcttctat atatgaaaga aagctgtacc cgtgaattct caaacagttg tctacatatc 2040 acctgcacaa tggccgttct ggaaatctaa aaaaaacaaa aaacaaacaa acaaataaat 2100 aaataaataa atatcaaaaa atcaaaaacc acccctagat gaaaagctac aagtaattaa 2160 aagctgctaa aagggggaga atcaattttc tccagagaca agtccctgat aggtcatcca 2220 atttcgggtg atcagcccta agcacataca catataagca atactaaacg gacacagctg 2280 gtctatatac ttacaacttg gggcttgaag gaagttggtg gggaaggggg gagagtagta 2340 atgatgtatg taaatacagt actcatgtac gaaactcccc aaaaataaag aattcttaaa 2400 attattaaaa actggtattc ttgtcttgga ctattttctg aattttatat taatattttc 2460 atcatcaaaa gactataaaa tgattataat aatgagagaa gttcagatga aacatcaact 2520 gtcttaaatg tagaaaagga aactgacttc aggcagagaa gctaaaaatg ttggcaacct 2580 tgccttggga cttagccacc agtcatttcc tctatataag tcacccatat cccaatttct 2640 gagataattt taaatgttat cactgtgtca aaggtgcagg acatgtatgg aatgcccata 2700 ttaccttctc ttgtctctca ttccag 2726 <210> 153 <211> 5686 <212> DNA <213> Homo sapiens <400> 153 gggtgagttg gcagcaacat ctcttggttt aagagttcca gcacagcgat agtactttct 60 agccacatct cagcaaggaa actaggctat tgccacctgc tcttaagagg cttgaacaca 120 ggtgttaact cctgattgaa atgaacaaag ataggagaag attaggggga aaatctgtat 180 ccttgctgga aaccagggca gtgcacatat aaagagtatg ctgttcactg gatgggaagg 240 aaaaaaactt agaagtgtag tagtcaaagc acacaaacaa ccctaaccca gagtagacat 300 tgctggaaga aagggaagac catgtagcag ctgtgtgaga gaatgaatct taatgataac 360 agcatgatcc cttgctaggg ctgccatcaa aaagtacagg ccttcctcgt tttattgtac 420 ttcgcagatg ttatgctttt tacaaattga acgcttgtgg gaacgctgtg taagcatgtt 480 cgtcggcatc atttatccaa cagcgtgtgt tgacttcgtg tctctgtgta gcattttgat 540 tattctcaca gtatcccaga tgttttcatt attatcatgt ctgtgatagt gatctgtcat 600 cagtgatctt tgatgttact attgtcattg tttggggtcc ctacgaactg cacccatata 660 agacagaaaa cttaatcaat aaatgtgcgt gctttgactg ctccatggac tagacattcc 720 ccttctgtct ccctctcttc aggactccct aatccctgag acacaataat actaaaatga 780 ctccaattaa taaccctaca atagccttta agtgttgaca tgaagggaag agtcatgcat 840 ctcttacttt aaatcaaaag ctagagatga ttaagcttac tgaggaagat acgttgaaaa 900 ccaagatagg ccaaaagcca ttcctcatgt gccaaacagc tagaaagttg taaaggcaaa 960 gtaaaaatac ttgaaggaaa tttaaaatgc tcttccagtg aacacatgta tgataagaag 1020 gtaaaacagc cttattgctg atatggaaga agttttagtg gtctagacat aagatcaaac 1080 tagaaacatt tcctgaagcc aaagcgtaat cctgagcaag gccgtaactc tcttcaattc 1140 tgtgaaggct gacagaagct ggaagctagc agaatttggt tcctgaggtt taaggaaaga 1200 agccctctcc ataacataaa ggtccaaggt gaagcagcca gtgctcatat agaagttgca 1260 gcaagttatc tagaaaatct agctaagatc actgacgaag gtgttacact aaataacaga 1320 ttttccatgt agacaaaaca gccatctatt ggactttcat agctagagag gagaagccaa 1380 tacctgggtt caaagcttca aagaacaggc tgacttttta ggagctaatg ccgctggtga 1440 ctttgagttg aagccaatgt tcaccgacca ttctaaaaat cctagggccc ttaagcatta 1500 agttaaatat accttgcctg tgtctataaa tggaagaaca aagcctgatg acagaggtat 1560 gtttgcggca tagtttactg aatattttaa gcccactgtt gagatctagt gctcagaaaa 1620 acagattcct ttcaaaatat tactgctcat tgacattgca cctaagcagc caagagctct 1680 aatggagaag gacatggaga tgaatggagt tttcctgcct gctaacaaca gcagccattc 1740 tgcagcccat ggctgaagga gtaattttga ctttcaagtt tcactattta agaaatacat 1800 tttgtaaggt gagtccccac agacagtaat tcctctgatg gatctgaaca aaataagttg 1860 aaaactgctg gaaagaattc atcattctac ataccattaa gaacattcgt gattcatggg 1920 aagagcttaa aatatcaaca ttaataggag tttggtagaa gttaattcca accctcatgg 1980 ctgactttga gaggttcaag acttcagcgg aggaaataac tgaagatgtg gtgaaaatcg 2040 caagagaact acaattagaa gtggagcctg aagacgtgac tgaattgcga caaattcatg 2100 atcaaacttg aacagatgag gagttgcttc tcatgaatca gcagagaaag tggttttttt 2160 gaggtggagt gtcttcctgg tgatgatgac atgagcattg tgaaaatgac cacaaaggat 2220 acagaatatt acaaaaactt aggtgataaa gcagcagcag tatcgggagg attaactcca 2280 attttgaaag cagttcagag ggtaaaatgt tatcaaacag cattgcatgc tagaaaaatc 2340 ttttgtgaaa ggaagagtcc atcaatacag caattttatt gctgtctcag cttaagaaat 2400 tgccacagcc accccagcct tcagcaacca ccaccctgat cagtcagcag ccatcaacct 2460 tgaggcaaga ccctccacca acaaaaagat tacaaattat tgaaggtcag ataatcttta 2520 gtattttctt atcaataaac ctttttttaa agtatgactt tgtttagaca taatgctatt 2580 tcacacttaa tagactaccg tatagtataa acacaacttt tagactcact gagaaatcaa 2640 aaaattcatc tgactcattt gttgtgatat gtgttttatt gtggtggtct ggaactgaac 2700 ctgcaatata tttgaggaat gtctgtaaca cgaagtgggc ggcttaatac aacagaagtt 2760 tttggagttc cattctagag actggaaatc caaaatcaag gttttgggag ggccacgctc 2820 cctctgaatc ctgtagggaa ggatccttca ttgcatcttc cagcttctgg agccacaggc 2880 cttccttggc atgtggcagc agaactccaa tttctgtctc tgtcctcata tggccatctt 2940 ccctctgggt ctgtgtcctc atatgctgtt ctctctgtgc atgtctgttt ccaaagtttt 3000 cccttttaat aaggacacca gtcacactgg attagggcct accttcatga cctcacctta 3060 acttgattgc gtctgcaaag atcgtatttc caaataaggt cacatccaca gggactggag 3120 gttaagactt cagcatactc aggggagaca caattcaacc tataacagag cccctttgaa 3180 aatgtcaggc atcaggtgct cacagcacac ggtccagctg ttggtgctca cccttgctca 3240 gcacacggtg gaggctctgc ctcaatctca ttcttcatgg gaacagctaa gccaggtagc 3300 gaatacgagt tacgtttgtg tcaccacagc agacactgaa aggaagtttg tggtgtccag 3360 cacatttgcc agcataggcc tcacagacca caacacctag aatctgacaa aaattagaat 3420 aaatccgatg tctccttttc tctctttttt taagcatttt taaatacaat tggtaaattt 3480 cctgactgta ccctactcat cttgcattgc tgaataagtg aggaacctct ctatggcatg 3540 aagcagaaaa ccattgagct tatgagaaga aacaggaaat acatgtaaaa gagaccagtc 3600 tgaaaaatca ggagaaattt tacaaaagag atttactgcc aagaaaccag ggaaactttc 3660 agaacactct ccttttcata tttgtaacaa gattcaattg tacaaatact tctgtgaaac 3720 tagccatgaa gtgtgtacat gaatgaatat atgtattcag tgtgtttata tatttcattt 3780 catacatgtg atctatatca tatatatata tatatatata tatatatatc acaatgaata 3840 ttgcagaaaa ttaaagcaaa gagtaagaag agttaaccaa atgttccctg aatgcagtgg 3900 gaaaagatga aaaggagaag acaggcaagc acagtggctc acacatgtaa tcccaacata 3960 ttgagaggcc ggggcaagag gatcacttga gcccaggagc tcaagaccag cctggacaac 4020 atggcaaaaa cccatctcta caaaaaagta taaaaattag ctgggcatgg cagcatgtga 4080 ctgtagtcac agctaggcag gagaatgaag tgggaggatc acctgagccc aggaggctga 4140 ggcttcagtg agccttgatg gcaaccctgc actccagcct ggatgacaga atgagaccct 4200 gtctcaaaaa aggaaaaaga gaagacatat gtaacacagt gtcaggattc aaaatacatg 4260 tagcaaaaat tccagaaggg taagcaaata agcccatacc tagccatcac tagggaaact 4320 tctgtgtttc agggatagag aaaaaaactc tgattccaga aataaaatgt gaaaatataa 4380 tacccgcaaa agaaataaat ttattgacac cacattgatt ctatattgta taagatatat 4440 tgtataacac taaattgtag aagatagcac ttctcttgag ccaagctaat atgcacacct 4500 agaggctcca ggtacacatt aaaggataag caaagacaca aaaattgtac catttaagta 4560 tgtttcccag gcaattcata agcaaatttt taaaaaggag aatgatgaat tccaaaggaa 4620 atctcaatga gataggatgt aggtaaaaag aaaaaacaac aataaaaaaa acatacacac 4680 aaaatcttgg caatgtaata ataatttatt aataatctct ctaaactcat agaatatatc 4740 aataaaacta gaaaatgtga gacagcaaga aaagataggc tagacttaca ttacagaaaa 4800 gatgagtaga ctgactatat agagtttgac tctaaaattg agaaaagagg tttaaatatg 4860 tgtcacgtgt atatgtataa tatacatgca cacatataaa atgaaattcc tcactggaaa 4920 aaatattaag tttaatttcc aaattattag aatgactaaa acagttgaat ctatctgttc 4980 catatagtaa ttgaggggga aggaaaagga atagcaagga atccattttt ctcttccacc 5040 agaaataagc tccctcatgt ttgggtcagg tcactttatt cattgctttc tccacatcct 5100 catcattagg catcatgaaa tcaatgaaaa ggcagtgaaa gaatgatgat gaaagctaat 5160 caaatgtatc atttacctca atacgtttgg tttaatcttc ttgttgaaag acaaattctc 5220 ctagacagga tcaaaagcaa catatcttgt atttataaaa aacatgtctc aagtaaaatg 5280 acatagtatt atacacacac acacacatac acacacacac acacattaag ggaaaatgca 5340 gacaaaaaat ggcagaaata atatttagag aaagatagaa tttaagaaaa aaaattgtca 5400 aacaggtctg caaaataatt gttttatttt ggtgccagtt acagtccgca atgaagcgaa 5460 gatattaaga agcaaagtgg gccaggagaa attagagcag aaatatctct ttcaatagtg 5520 agagaatagg aaaaagaagt agaaaagctg ggaacaatag gtaaagttta ggctaggcct 5580 tagacttctc ctgcattgta atccctctgg tttgccacat atgcatgctg tcaggaagtt 5640 gatgaggtat gtacagcaca atttattttc cattttttgc ctttag 5686 <210> 154 <211> 1260 <212> DNA <213> Mus musculus <400> 154 gtgagtatca gggtcgtagg ctgtgaggat ctctacagcc gtgtatattc tctgttcaga 60 aattccctct ggctgaccgt ggcgttttcc gttctaggat gcctctaact atacatccct 120 gtggctgtgg tgtggtgatc cgagggctgc actaacacac agatttctgt ggttgtcact 180 gttcagggcc acagaatgac tgagtcttct ttctatacag tatgcagtag ctggatagtc 240 aggactgggg aaggttgtgt gaggttgact cggtggtacc gctgaggagg aaaagggctt 300 gtccagagca ggcgtgatgt acagcgcaca ttgttttttt cagcaagtaa tgaaaatctg 360 tgactgagtg accttggggg ctgcggtggt gaggagagct cacgggaatc ctggagcagt 420 gtagctggcg tgtcaaaagc agaaacgcag gagatgggtc agtgcgccga ggcccggagt 480 ttaaatcccc agagcccacg taaaagcctt gcgcagtagc acgcatgcgt aatcctgatg 540 gagcaattag gagaagccgg tggccggcta gcctgtgcag actgtgaaaa cagagcatct 600 gaagctgtgt gaaaggctag ctcgcctgtg ctcctcagat cctgacatac gccatctcga 660 gcaaaagatt aacaatcgat taaaacccac acatgaaaac aaagaaacca gttagctcca 720 gataaaagca aatgccagga aggaaaggag gcagagggca ggggtggagg agcaggtggg 780 agaggatgac gtcagagaaa tctcagtggc cgtgaacaag gaagatattc cagggcttgt 840 tctgaatgtg tgatctttta aaccatgtgg ccctcttagc ctgtgagaaa agtccatttc 900 tagccctgct gaacagagaa gcccagggga gcaaccaact ggccttcggt cactcagcaa 960 ggacctagta gaggctggct ttgaacttga gccctccagg gcacttgacc tctgagcttt 1020 gggaaaacaa gcgaggcagc ttcacgctgt tgtgatctgg acttggatca gggccagtga 1080 ggacagggac agggatgggt gtgataagga cttggtgtgt aagagggaga gttggggaga 1140 caggtgggag ggctatctgt agccaggtaa ccaagggtcc caggggaacc cccagtgtgg 1200 acgcggactg cacatgacac agggcggcct ccccattcat gactgttttt ctccttgcag 1260 <210> 155 <211> 2627 <212> DNA <213> Homo sapiens <400> 155 gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc acctgctact 60 gagccgcccg cctgtcccca cccctgaata aactccatgc tcccccaagc agccccacgc 120 ttccatccgg cgcctgtctg tccatcctca gggtctcagc acttgggaaa gggccagggc 180 atggacaggg aagaataccc cctgccctca gcctcggggg gcccctggca cccccctgag 240 cctttccacc ctggtgtgag tgtgagttgt gagtgtgaga gtgtgtggtg caggaggcct 300 cgctggtgtg agatcttagg tctgccaagg caggcacagc ccaggatggg ttctgagaga 360 tgcacatgcc ccggacagtt ctgagtgagc agtggcatgg ccgtttgtcc ctgagagagc 420 cgcctctggc tgtagctggg agggaatagg gagggtaaaa ggagcaggct agccaagaaa 480 ggcgcaggta gtggcaggag cggcgaggga gtgaggggct ggactccagg gccccactgg 540 gaggacaagc tccaggaggg ccccaccacc ctagtgggtg ggcctcagga cgtcccactg 600 acgcatgcag gaaggggcac ctccccttaa ccacactgct ctgtacgggg cacgtgggca 660 caggtgcaca ctcacactca catatacgcc tgagccctgc aggagcggaa cgttcacagc 720 ccagacccag ttccagaaaa gccaggggag tcccctccca agcccccaag ctcagcctgc 780 tcccctaggc ccctctggct tccctgtgtt tccactgtgc acagatcagg caccaactcc 840 acagacccct cccaggcagc ccctgctccc tgcctggcca agtctcccat cccttcctaa 900 gcccaactag gacccaaagc atagacaggg aggggccacg tggggtggca tcagaagcag 960 gccagtgaga cagggcctgc ccagggccct ctgcatgcct ctggcttctg cctggggctc 1020 ccaggagtgt aagaacagtc ccacaaccac tgtggggaca cctggcaccc agactcccac 1080 aagggggcag tggggcccct gctcgtgcct tagacatctt ccgggcctcc ccagggcccc 1140 ccgccttctg gctgcctccc tctgctctca gggccaaggt gaggtggagg ccactgtcac 1200 ccctgagggt ccagtcacca gagggtaatt gagagcaaca ggtcactcgg ggaagccctg 1260 ccacagagaa gccctccagc ccatgggacc caggacctgg cccaggggag gggcttttaa 1320 agagaggggg aaagagggag aatcaacaga tgaggggctg aaccagcaga cagagatcag 1380 gcagacacat gggtagatcc taggacatat aatgaatgga tgggtggatg gaggattggt 1440 agacggagga tggatgggtg ggtaaatggc tggatggagg atggacagat ggatatatga 1500 tggatggatg aaggacgggt ggatggagga tggatgagtg gatgaatgaa ggatggaaga 1560 tggatggatg gatgggtgga tggactgatg gatgatggat ggatggatgg atggatgatg 1620 gatggatggg taggcggatg gaggatggaa gggtggatgg aggatggaag atagatggag 1680 gggtgaatgg aggatgggtg gactgacgga ggattgagga tactggggtg ggtgggtggg 1740 tagatctatg gaggataggt gtatggaaga taattggatg gagaattgct ttatgaatgg 1800 atgaatgaag agatggaaaa tagctttata gatggatggg tgaatggatg gatggataga 1860 tggaagaagg atgaatggat ggaaaatagc tttatagata tatgggtgga tatttaagtg 1920 atagccttac attaatagat gaatggagga tgaatggttg ggtgagtggg taggagtgtt 1980 actgatggag gggtggatat acggataata gctttataga tggatggatg gatagatgga 2040 tggaaggata gaaagacagg tgaatgactg gatgtatcag catatgacaa gcaggtacag 2100 ctgtacatgg gaggtctatg ccctgagacc ctgaggaaaa tgaggatgcc cgtgctggtg 2160 gccctcacct ggccctcgct tgtaacccct cagccacatt ccctgggaag gcaacagagg 2220 cctctggtct tgcccattca acctttggca cactgagtgt cagacccagg tctctgtctt 2280 ggacccagat ctccttgagg gtgggtgtgt ctggtcctct ctggccccgg gacccagtca 2340 ctgaatacgt ggctgggact gagacggggt ggggtgggag gggcgggagg gtacctcggg 2400 ctcaagcttc ccttggagaa gcagatggtg tccactttct gccctgccaa gtctctccct 2460 gaagtgccct aagaatgtca aagacagaag gtcccagccc ctcacctggg actctgcctc 2520 ctcatcctcc ctgggggagt ctcaggcctt agatggggac ccagacccca ctgtccccag 2580 accccaagga agcatagccg ctgttcacac gagtctgggc ctggcag 2627 <210> 156 <211> 1937 <212> DNA <213> Homo sapiens <400> 156 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga 60 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac 120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg 180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg 240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc 300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct 360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca 420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg 480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc 540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc 600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc 660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc 720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc 780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt 840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact 900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg 960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc 1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag 1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca 1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg 1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat 1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc 1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag 1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct 1500 cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg 1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc 1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg 1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt 1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc 1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920 tgggtgccca ccctcag 1937 <210> 157 <211> 1301 <212> DNA <213> Homo sapiens <400> 157 gtaaatgagt gcgacggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga 60 tgcttggcac gtaccccgtg tacatacttc ccgggcaccc agcatggaaa taaagcaccc 120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180 gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc 240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg 360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420 tcctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840 tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg 900 cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc 960 gtccctggca ctggcccact tcccaataca gcccttccct gcagctgggg tcacatgagg 1020 tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacggg agacggggag 1080 tgggtcctgc tgagggccag gtcgctatct agggccgggt gtgtggctga gtcccggggc 1140 caaagctggt gcccagggcg ggcagctgtg gggagctgac ctcaggacac tgttggccca 1200 tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga 1260 gcccagcagg acacagcact gaccaccctc ttcctgtcca g 1301 <210> 158 <211> 1553 <212> DNA <213> Mus musculus <400> 158 gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga 60 cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga 120 ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct 180 gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat 240 gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt 300 cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt 360 ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg 420 atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa 480 catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa 540 ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact 600 cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt 660 tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca 720 cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc 780 aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca 840 cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg 900 ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga 960 ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac 1020 cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080 ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg 1140 agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag 1200 agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct 1260 ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 1320 gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag 1380 accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca 1440 acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg 1500 gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cag 1553 <210> 159 <211> 1354 <212> DNA <213> Mus musculus <400> 159 gtaaatgagc tcagcacaca caatgctcct gggtcctaat ggacactggc acccatatcc 60 atgcatccct tgtataaata aagcacccag caaagcctgg gaccatgtaa aactgtcctg 120 gttctttcca aggtatagag catagctcac gggctgatag ttctagccag ggttggagga 180 cagccttgtc tttaggtttc tgcactgcag gactcagagc tcatgagtca tcttggcctg 240 aagagtggaa cttagcttta ggcagtatct ttcctttact tcccacaaac cagcagctgc 300 cagacataga gataatccta ggaagcctca aatggagaag cacacaaacc cacctccctc 360 aggctgttcc tctccccagg ccccacttct ttacctaagg gtttctctga gtctattgta 420 gaggcacaca tggccaggga tattccggag acccttagca tccatacact caactcaggc 480 agcttttcac aggtgaggtc tgcacatcca tacagacggc tcactcctgc ctgtgccacg 540 tggggctgag gcacatggct cttgctgccc caagggaggg actattagat agccacagtc 600 atgctgaatc ctgacccatt caaattagcc tgctgaacac catccagtcc atatagcaca 660 tgtatccaca tgcacgtgtg cacacacaca tttaacacac tgggacaact cctctgtgcc 720 ctgcacagca cctacatcca gcaatgtatc accatacaca cggccaaaaa ttcaatgccc 780 acgtttctgc catcacaaac agacacacct ttcctctctg tggccactgc attatatgct 840 caacacaaga cctctgaagc cagatccatc tctggtacct cagggtcatg cttcaacccc 900 acatgaatta tgcaaaccat agccataatg gtctgaatca cttcacattg gaatggtccc 960 aagatcaggc aagaaaagcc acaggctctg ttgatgactg aaggacagca aagggtcagt 1020 ccagctgtat aaccactgtt gacctgggtc acagaccctg ctgaccctcc atattctctt 1080 gtactgaatg aatgaaaaat gagacaagca tagagggccc ttgcacaatc taggtcagta 1140 tgaggtctac ccgaggcatc attggagtca gctggaggaa gctgagactg atgtcccaga 1200 gggaaaggaa aagaaagaag gctccaggaa gggtctgctg taccagtcag gctggagctc 1260 tctcctctac ttcatgcaaa catgtctgca tcacagggaa tctctcccag caccaaccat 1320 gttgggacaa acactgactg tcctctctgt tcag 1354 <210> 160 <211> 81 <212> DNA <213> Homo sapiens <400> 160 tcgcccctgt acctggagat catcatctat tgcacagggg ccttcctcat ctcctgcatg 60 gtggggtcgg tcatcgtcta c 81 <210> 161 <211> 90 <212> DNA <213> Mus musculus <400> 161 aagataccat ctattgccac tgggattgtg ggtggcctcc tcttcatagt ggtggtggcc 60 cttgggattg gcctattcat gcgaagacgt 90 <210> 162 <211> 29 <212> PRT <213> Homo sapiens <400> 162 Thr His Asp Ala Leu Ile Val Gly Thr Leu Ser Gly Thr Ile Phe Phe 1 5 10 15 Ile Leu Leu Ile Ile Phe Leu Ser Trp Ile Ile Leu Lys 20 25 <210> 163 <211> 81 <212> DNA <213> Mus musculus <400> 163 cgccttccac tgggggtcac catctcctgc ctctgcatcc cgttgttttg cctgttctgt 60 tacttcagca ttaccaagat t 81 <210> 164 <211> 63 <212> DNA <213> Homo sapiens <400> 164 accatcacct tcctcaccct cttcctgctg agcctgttct atagcacagc actgaccgtg 60 acc 63 <210> 165 <211> 87 <212> DNA <213> Homo sapiens <400> 165 tggacgtgga ccggcctctg catcttcgcc gcactcttcc tgctcagcgt gagctacagc 60 gccgccatca cgctcctcat ggtgcag 87 <210> 166 <211> 78 <212> DNA <213> Homo sapiens <400> 166 gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60 gccaccgtca ccttcttc 78 <210> 167 <211> 78 <212> DNA <213> Mus musculus <400> 167 gagctgtgga ccagtatttg tgtcttcatc accctgttcc tgctcagtgt gagctatggg 60 gccactgtca ccgtcctc 78 <210> 168 <211> 78 <212> DNA <213> Mus musculus <400> 168 gggctctgga caaccatcac catcttcatc agcctcttcc tgctcagcgt gtgttacagc 60 gcctctgtca cactcttc 78 <210> 169 <211> 3111 <212> DNA <213> Homo sapiens <400> 169 gtgagtatca agaggcctaa gcaatggtaa tctccactct ccattcttcc cctgtggcca 60 gacacttccc ctggctgagt ctctgggctt ttatatcata ggatgcctct aatggcaatc 120 ctgccattag atacacctgc cgtggtgtat ctgccaggta ggcaggctag gctgcagtaa 180 caaacaagcc cacaatttcc atggcttaac actatgggaa tatatttctt gctcacgtaa 240 caagctaacg tgaatgttgc tggtttgtag gtggtttccc tccctgtaga aatctgggga 300 gtgaggttct ttccatcttg tggtgccgtc attctccagg acaaagattc ttacctactt 360 ttgtgtcctg gtttcctttg gcagcctggt gaagcctatg gacctcattt cagaatattt 420 ttaaatacat aaaatcccag cctgggcaat atagtgaaac ccccatctgt acaaaaatta 480 gccaggcatg gtggcatgca cctgtagtcc caggtactgg gaaggctgag gtgggaggat 540 cacttgagcc caggagtttg aggctgcagt gagccgtgat cgtaccactt tactcccacc 600 tgggtgacag agcaagagcc catctctaaa aataaataaa tacaatgaaa taaaataaaa 660 taaatagaac tacagaggaa actaattgta ttgaaatgca gttataaaac atttaaacac 720 atttttaatc tagagatata tgtgcttctt tattaagatc tataaataat aagttctagg 780 ggtagctcgc ataaatactg taatttcaaa gtagataagc ataaataata ctttatgata 840 ctgaaattgt gatgtgatat gagaatagct gtgagttttg ttttgctggg gacaggatca 900 gtgatgctgt cattactggg gtctcttccc tccattcttt ttttaaaatt gtattttatt 960 ttatttttaa aattttaaaa taaatagaga cagggtatca ctatgttgcc caggctgctt 1020 ttgacctcct gggctccagt gatcttccca tcttggcttc ccaaagtgct gggattacaa 1080 gtgggagcca gtgttcctgg ccccttcctc cattcttaat ggaaggagat gctaggtgtg 1140 agaggttagg gaaagtaaag atgtaatttc tttcccatcc aagttctcag acccctgaat 1200 tctacctgca gccatgttgg tccatcaacc ccaagtgaag aatccctgct ctagggcccc 1260 accattgtct gtatccagcc agcagaagag gcgtgattat ggagatcaca tctgcttctt 1320 gaaagcagac agcccggaag tgggccgcat cacttcctct caaattctat tggtgaaaat 1380 ggtcacatga ctacacatag ccacaaagga ggctgggaac tttctcactt ggaacctaca 1440 tcccagaaac aactcttttc agtgaggtat cccacaggtc tttcgcagta gaaatattga 1500 ttatctcaca taaaatgaag tcttacaaat ggacctactg ggttttgtac agcagccaag 1560 tgatatctct tcccttctgc tgtcttccct tctgccatcc ttcacatggt ggcattgtat 1620 ccttagactt gccacccatg ccctcaggtt ggccgttgca cactgtctta cataaagcag 1680 gaaggaaagg aaaggctgct acgagagagt gtaccttgtg catctctttt ttaatcagga 1740 agcaaacatc tttctagaag cttccctagc aaaattcccc ttacatctca ttggccaaga 1800 ctgttacatg ttacatggtt actgttatta cttgctcatt gcaaggaaga ctgggaactc 1860 aaatgcctgg aaaaaggaac aggataatcg tgattggctc aagccttagg gtgggcatgg 1920 ctccctgaca agggagagag gaaaaagctg ttgagtgaag aagactgctt cagtttcccc 1980 atctgtataa tgggaggagt aagggctgtc gtaaaaactc aatgaaagaa gattcttcaa 2040 cgtggtaggt gcagtggcag ctggcagtac cctgaccctg ccaccgcaca gccctctcag 2100 cattgctcat cctgcactgt ggatatcagt tgagccacgt gtctcctgcc ctgggctgtg 2160 agctccatag gcagggtctc catggctgta tctccagaac ccagcacaga accaggtgct 2220 tgggaaagtt ttgaattgat tctcatctgc cattggcatg gggaagggaa ctagcttgta 2280 tgaaacagat aacaatgtat gggaccctca ttcattattt cagcaaatat ttgctgagtt 2340 cctcctacat ggctagccct gtgctagaca ctggggaatc ggcgatgaac aaagcagata 2400 gaaatcccca ctcttgtgga gctgacattc tggagggaga gacaaaaagc aaacatataa 2460 agaaagaaag aaatcacatg gatctggatg acagtgagtg ctgggaagaa aataaaagca 2520 gaggaagggg atggagcgat gggcaggggg caacggtagg gagggtgtcg gggaaaactt 2580 tttggagaat gtgacgatga aagtgaacaa ggagaagtca accgtgttga gatgatggca 2640 gctaatgatg tggacaggcc actctgttct gagtgcatta tctattgatt catcatgtca 2700 tcctcgcaac agccctgcac gatcaattct gtcattaacc ccatagtaca gatgaggatg 2760 cggaggcaca gagaagataa gggacttgtc ctgtgtcaca cagcaaggag ccatccggct 2820 cctaagttgg tgcatttgac ttctgtgctt ccggaaagaa agagcagcaa gtttaagatc 2880 tggaggtggc actgagcttt ggaggagcag ggggcaatga ggtggccggt gtgacgagga 2940 ctcaatgtgc aagagggaga gtggtgggga gatgaggtgg aggggtggtc ggcggtcaga 3000 tcgtggaggg tctcggacga gggtcctgac cctgggtctc cagtcctggg aagtggagcc 3060 caggctgtac catggctgac ctcagctcat ggcttcccct cccacttcca g 3111 <210> 170 <211> 2093 <212> DNA <213> Homo sapiens <400> 170 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga 60 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac 120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg 180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg 240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc 300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct 360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca 420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg 480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc 540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc 600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc 660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc 720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc 780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt 840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact 900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg 960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc 1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag 1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca 1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg 1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat 1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc 1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag 1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct 1500 cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg 1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc 1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg 1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt 1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc 1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920 tgggtgccca ccctcagggc tggctggcgg ctccgcgcag tcccagaggg ccccggatag 1980 ggtgctctgc cactccggac agcagcaggg actgccgaga gcagcaggag gctctgtccc 2040 ccacccccgc tgccactgtg gagccgggag ggctgactgg ccaggtcccc cag 2093 <210> 171 <211> 1285 <212> DNA <213> Homo sapiens <400> 171 gtaaatgagt gccagggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga 60 tgcttggcac gtaccccgtg tacatacttc ccgggcgccc agcatggaaa taaagcaccc 120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180 gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc 240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300 tgggggattt gccagcgtgg ccctccctcc agcagcacct gccctgggct gggccacgag 360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420 ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540 gcccagcctc gaacccacat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600 tgtggaggga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780 acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840 tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg 900 cccctgcagc cgccacacac acaggggaac acacgccacg tcgcgtccct ggcactggcc 960 cacgtcccaa tacagccctt ccctgcagct ggggtcacat gaggggtggg tttcaccatc 1020 ctcctgccct ctggggctca gggagggaca cgggagacgg ggagtgggtc ctgctgaggg 1080 ccaggtcgct atctagggcc gggtgtctgg ctgagcccca gggccaaagc tggtgcccag 1140 ggtggacagc ttccgggagc tgacctcagg acattgttgg cccatcccgg ccgggcccta 1200 catcctgggc cccgccacag agggaatcac ccccagaggc ccaagcccag ggggacacag 1260 cactgaccac ccccttcctg tccag 1285 <210> 172 <211> 6350 <212> DNA <213> Mus musculus <400> 172 gtaagtcaca actgggtaag agtgtcaagc aaggacagca cttggtacct atgatagaca 60 aatactcctg tttgggaaga ggaggtctgc attgtctaga taagaggaac actgtgctta 120 tctgtttcag tttaaaagac agaactacat aacacttcac cctttctaca acacttagat 180 ttttcagccc tctcctctat ggtgtttcct gaaccctgaa gaaagtgata tagatgttta 240 tttattttct agggccactg ttccaaagaa acaatcacgt attattagca gcttgaccag 300 gtgtgaattt cccccagtat ccacttctgc tccctgtggg atgaagtccc tccataagta 360 aagttgaagg ctgtgggcat aaatgcaaat gcctgtaatc caattttaca agtccatgac 420 atacatttaa caaacaatag cagttacttc tctactggag cctatgaact ccccagctat 480 aggtttttcc cttctgcaga gcagagctta aatccaatag ggaagaagtt ggttgtaccc 540 ataactgcca taccactatt acaccaataa gcacatctta catagcaaga caattagtgt 600 agcactcaaa gtccatgttc aagagagaat gttggcaaca gcctatataa catctcccag 660 cacagaaaag aaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag 720 gaaaggaaag gaaaggaaag gaaaggaaag gaaagaaaag aaaagaaaag aaaagaaaag 780 aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaagg 840 aaaagaaagg aaaagaaagg aagacagcca gaaggcagct tccacttcag tcctagccca 900 tgttttctat gtcttacagc caaggttagt gaagtctcta gcagtaggaa tttatcatct 960 acttctggca tgcaagtaaa atcaatggtg ataacttttg tggtttgtgg ctccttggga 1020 gcctccctga acaataattt atgcagaggt agcccagctt tgccactggg gcttccatta 1080 aacaaacttt ggattgaggg agtgtctttt tctacctgca cacagtgatt cctatgtttt 1140 aactcttaat gagtcactgt tgtttgttgt tgttgttatt gttgttgtta ttgttgttgt 1200 tgttgttgtt tctatcaacc cagacactat agggctataa ggcaggtgga agcatcactg 1260 gctccagctg ttctcagtca tgctcttcct atcaatgttt gtgtaatgac tgcccctttt 1320 actgtcggtt ttctatgggt gcctatggat aacgctgggt tgggcgaaac ccttgatggc 1380 agcttttccc actgcttgct tatccatgta ggtgagagca cattcactct cacttgagag 1440 gcttaggcct ttatgaagtc tgcctgacat atgggatagg taggcttata tgcttaccca 1500 tcatgcaccc atgtgctggt accataagca agatcagacc tcacctgttc atgtagcatg 1560 cagaggatca gaatatttca caagaatgcc agaagctctc attactctct ggccttctct 1620 taaagatcac atcctctaac aaagcttacc aaagccacta acatctgagt tagtcctact 1680 caggtacaca tttcttaatg ctccagcaaa agcatctcta cccacttcat tgggcactaa 1740 acaccacttc tcacatgttt agagtttttt gttaagactt taaattatct ttcagtcatg 1800 tctgatgttc atgggcacct cagccagtaa taactgagtg tttctggtgt gtgcaggttt 1860 ttgtctgttt tgtgttgttt atatgccagg aaaaagctgt ttagtacaga tctaattggc 1920 attccccttc cttcatggtg tggatatttc ttttgagtta aaacatcccc tcttgtggca 1980 gggggagggc tagaggtcaa tggaatgatt tcccgagttt ccttggataa atgaaacctt 2040 tgtctcaggg aaggaagaat ggttctactt ctgtttctcc acttcatgat gctgactcta 2100 gcctcttcca tgccccgtgt ctccaggcta tgaaggaatc cagcatgctt ttctctcttc 2160 cttccttatc ttcttcatgg gttccaagtg ggttcctgtg gtttccacag gaaaggcttt 2220 ttagcacaaa tctgatctgt actgtctttc ctttatcccc tgccagctct gagacagaaa 2280 gccagcatct ctatcagaat ctctcttttg ccttcagaat cagagaccac tgtgaaaggc 2340 agcatccgtg catctttttt tccattgtac tccttcatta cgtgagcaag atttttctaa 2400 gcagatagct tagccttcat cgcacatctt agcacacact gcaaatgtca cacagacagc 2460 ttgctatgcc atcccatgta tactattttc aaggattgca ataccttctc tgatctgaaa 2520 tccattcaag taaaacaaca tgttgcaggt ccaattcaag aggcatgcca cctcatacca 2580 tataaaagaa gatggtcagc aaaaattcct gctctctcag acaactcaga cttgggagca 2640 gaaattccta tcacctctag cagggagtaa acaactacta ctacagctgg aagcatacta 2700 tctcctacca taaaagatgc tagcttctct gacaccttag acctgaggca aggaatcctc 2760 tgcctcattt ctttcgtctg ctggaaagcc tacaggacta agggctgctg taagcttgac 2820 acaagcttga ggttgaaagg tgtcagacag gcttcacctg aggggcccta tatatgagtg 2880 tagtgaggat ggaacaggct acgtggggca tcctccggca tcttgtcctc agagtggcct 2940 tcagagccca ggctcaagtc agccatactt ccccacttag actctggaaa tgccacagta 3000 tgtccacaac ctccacaccc agctacacaa aattgagaga gggacctagt gggactgcag 3060 caatcacatg aggccatacc tggaccagcc aagctgccag tataacagtc gtggctctga 3120 gattttgaaa gcttggtctg ttgtctatgc ctcgggatct ttgggatgcc ttaggatcca 3180 tcgagaaagt tctagagatc atgcctgttt ctggctgcac tgtactgact gagaacaggg 3240 gctacagcac cactgtttct catggcctac ttcctgccag gtggtgcctc attagtactg 3300 aaaggagcct gacctacact tgccccaaat tggccttttc ttttcccctg tggcattggt 3360 tcctcaaagg acactaaggt tttctcttac ttgactccct caggatctct ctacagattt 3420 tcacaggtca ctcctcagag ctagagtcat accagcatga ctatcctctg cccacattca 3480 cacagcatgc ttaggaagtc tgggcatgct ctgtagtcat cttcattagg ttgttcccac 3540 ctgcctctct atctgcccct gccccacttc cccttgttct gcctgttggt ctctccctac 3600 tctgtgcttc acatgtcttg aggtagatac atctgcctga gtcccacata acacttcttc 3660 atcacaccaa cccctgagaa caataatgtt cttagttctg tcgactagca cctcctgact 3720 tgtctctatg atgccattct tcccctccta cccatccatc accctgttgc caaggcactc 3780 tctgagacat cttgtttcta catagataca gaagaacatt tgattaggca tgtaggccat 3840 ggtgaaagaa aaacaccaag taaactttta acatcacaat tttatttaaa actactagag 3900 aggactcagc aatgctcaaa gagactaaat tcccaggtga aaggagatgg gatgttgtat 3960 tctaggcaca gacagacaga gcagtgggac atatgtaatc accaagaaat cagccaaatt 4020 tttaataaac accttagctg ccgagaggga tgagaacaca gaagaatccc aaattctgag 4080 ccaatcacca ctcacttaac ctcccaccca ggacactgct aagcaagaaa caccttcgag 4140 cacagtgtgg gcagaatatc catcttgtac cagctccaag gcctgctgaa tataagggtt 4200 atcccaaagc acctagagcc agaagtcaac tatgataccc cagctccagc acagctcagt 4260 tcccagttcc aaaaaacagg tcttccatgc ctggtggata agatgatatg cacttgtatc 4320 tcacccccag actctacaat ccatgtatat acaatgccta gcatgcaatc agtaattaca 4380 agatacaaat gattgataac caagacagag acagtacatg ggattagacc tgaggtacgg 4440 gaaaggttgg gaaagcattc atagtgtccc ttgctacaag aagtcccaga gctttgcagg 4500 gtgtgagcag attctaacct cccccattgg caagtcttct caaagctgct tctgctacta 4560 gagaaccctc tttcccagcc acctgccact atttatcact tatctgagtt ttccccatga 4620 ttctaggatg ctaccacctc ctgcctgagt cagacggtcc ttccaggaga cctgatggtc 4680 ctgcccttgc ctgagacctt tctaggctga atggtcatca tgtccactgt ctggttagct 4740 tggttgcctc tgtgttaagt tgcttcatac tacatgtagc aaggaaagtt acctttccac 4800 ttctcaggac actgtaaaga agcacttctg taaattatag tgagaaacga tcaataataa 4860 atgaaatgaa caaacataaa cctctcttat ctctatggga cctgccctaa ggcctcttgt 4920 ggatgcctga aaccttgagt gttcttaagc catgtgtcac ttcagtcatt aacctgtggc 4980 tgaggtggat cctgactgac aaacagacag gcatgtagac agcttgaagc ctggacaaag 5040 agaaggttga cgttccaggc aaagcaagag cctatcacat tgttccaaag tgtgtgattt 5100 agaatcagaa gatttcttgt ttaaaatata ctcaaaaagt tataaaatat cagccaggac 5160 tagtcataaa gcttaaatct gagagagaga gagagagaga gagagagaga gagaggtgtt 5220 catgtatata catatgtgtg tgtgtgtata tatatgtatg tatatgtatg tatatgtgta 5280 tattggtgtt tgggtgtcag attccctgga attaaagtta taaacagtta tgagctgcaa 5340 agtaggcttt ccaatgtctt gttctccaac cataggtaat tgaaactgga aactacaggt 5400 aaaggaggct gccaagtgtt tcttattatg ctaagattca gtgttctaca atattcacat 5460 gatttcactt tgatatggtg aaatgccttt aggccaacgc atccacagac ttcacagtga 5520 ccccagctga gcttacatat aatgtcaaac agcacttgtt gaatagatac ccaggcagcc 5580 ctgtgaccca tggtgttttc cttaattctt cccatctgcc ttggactttc acaccttgag 5640 ttgagatgtg ctttctgtag aaatgtattt ccctaggtct gtacatcagc caccaccctt 5700 tctgatcttg gaccatactt cagtctccag ctgggatatt catatgcatg cttagatatg 5760 gcataaccat cgttaacgtc ttctgttacc tttaggatta agttaccgta gctaggatgc 5820 tttccaatct ctccctccat ttgcaaaggc tcagggttcc ttctgactct ggagtagtac 5880 tctttcccaa tgagtgcacc atgaccacta ttcttcctta gaatgttact cccctttctc 5940 tgcctttttc atggcacatc tttctgagaa aacctacctg gtctagctgc tctttctggg 6000 tcttcttaag tagtaaccta actcctgcac catccgtgtg gcagtgacat agatccacat 6060 caggtttgga ttcagatatt ccaatcccat gcagaccaat ctatgtgtga gattccagga 6120 tccagcaggc tggggcatgg gttgaggggt aggattcttt ggggcaaagt ggttagtagg 6180 cacttgggac tggaagtgat aagtattagc gggaggaggg catatgatca aaacattgct 6240 gctggatgtg aaagctgtac cttcaggttc agtgttcagg agaccaggtt aataagaaat 6300 gatctttctg tagggtggag accttctcat gagcactagt tcttccctag 6350 <210> 173 <211> 1739 <212> DNA <213> Mus musculus <400> 173 gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga 60 cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga 120 ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct 180 gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat 240 gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt 300 cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt 360 ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg 420 atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa 480 catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa 540 ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact 600 cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt 660 tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca 720 cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc 780 aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca 840 cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg 900 ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga 960 ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac 1020 cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080 ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg 1140 agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag 1200 agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct 1260 ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 1320 gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag 1380 accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca 1440 acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg 1500 gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cagtcagtgg 1560 ggaaaggaca tctgcctcta gggctgaaca gagactggag cagtctcaga gcaggtggga 1620 tggggacctc tgccactcta gcttcatcag aactgcatga gacaagtatg gggtctaccc 1680 cctccccact gtcacctgga gtctggggaa gctaactggc tggtcccacc ccatcccag 1739 <210> 174 <211> 93 <212> DNA <213> Homo sapiens <400> 174 ttcgagcagc acctcctgct gggcgtcagc gtttcctgca ttgtcatcct ggccgtctgc 60 ctgttgtgct atgtcagcat caccaagatt aag 93 <210> 175 <211> 78 <212> DNA <213> Homo sapiens <400> 175 gggctgtgga cgaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60 gccaccgtca ccttcttc 78 <210> 176 <211> 84 <212> DNA <213> Mus musculus <400> 176 ggcctgtggc ccacaatgtg caccttcgtg gccctcttcc tgctcacact gctctacagt 60 ggcttcgtca ccttcatcaa ggta 84

Claims

a) 인 프레임 번역 정지 코돈(in frame translational stop codon) 없이 이종 폴리펩티드를 코딩하는 제1 핵산,

b) 5' 스플라이스 공여 부위(5' splice donor site)로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위(3' splice acceptor site)로 종결되는 제2 핵산,

c) M1-M2-엑손-융합체에 의해 코딩되는 면역글로불린 경막 도메인인 경막 스트레치(transmembrane stretch)를 코딩하는 제3 핵산

을 5'에서 3' 방향으로 포함하는 핵산.
제1항에 있어서,

제1 핵산이 이종 폴리펩티드 및 마커를 코딩함을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

제1 핵산이 3' 말단에서 인 프레임 번역 정지 코돈을 갖지 않음을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

제1 핵산에 의해 코딩되는 폴리펩티드가 면역글로불린 중쇄, 면역글로불린 경쇄, 및 이들의 융합체를 포함하는 군으로부터 선택됨을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

제2 핵산이 1개의 5' 스플라이스 공여 부위 및 1개의 3' 스플라이스 수용 부위만을 포함함을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

제2 핵산이 천연 발생 면역글로불린 중쇄 인트론이고, 서열번호 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172 및 173을 포함하는 핵산들로 이루어진 군으로부터 선택됨을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

제1 핵산이 게놈 수준으로 구성된 면역글로불린 중쇄 유전자의 모든 엑손 및 모두는 아니지만 1개의 인트론을 포함하는 면역글로불린 중쇄를 코딩함을 특징으로 하는 핵산.
제1항 또는 제2항에 있어서,

폴리펩티드가 면역글로불린, 면역글로불린 중쇄 폴리펩티드 또는 면역글로불린 융합체임을 특징으로 하는 핵산.
제1항에 따른 핵산을 포함하는 진핵세포.
제9항에 있어서,

진핵세포가 CHO 세포, NS0 세포, Sp2/0 세포, COS 세포, K562 세포, BHK 세포 및 HEK 세포로 이루어진 군으로부터 선택됨을 특징으로 하는 진핵세포.
삭제
a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산,

ii) 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및

iii) M1-M2-엑손-융합체에 의해 코딩되는 면역글로불린 경막 도메인인 경막 스트레치를 코딩하는 제3 핵산

을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;

b) 상기 형질감염된 세포에 도입된 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드로 번역하는 것이 가능하도록 형질감염 세포를 배양하는 단계로서, 이때 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱(alternative splicing)에 의해 가용성 이종 폴리펩티드 및 원형질막-결합 이종 폴리펩티드를 생성하는, 단계; 및

c) 원형질막-결합 이종 폴리펩티드를 가진 세포를 이종 폴리펩티드를 발현하는 세포로서 선별하는 단계

를 포함하는, 이종 폴리펩티드를 발현하는 진핵세포의 선별 방법.
제12항에 있어서,

이종 폴리펩티드가 호르몬, 사이토카인, 인터류킨, 면역글로불린, 항융합원성(antifusogenic) 펩티드, 성장 인자, 수용체 리간드, 세포독성제, 항바이러스제, 조영제, 효소 억제제, 효소 활성 조절제, 및 이들의 융합체를 포함하는 폴리펩티드로 이루어진 군으로부터 선택됨을 특징으로 하는 방법.
제12항 또는 제13항에 있어서,

i) 제1 핵산이 면역글로불린 중쇄 C_H3 또는 C_H4 도메인을 코딩하고,

ii) 제2 핵산이 면역글로불린 중쇄 C_H3 또는 C_H4 도메인 엑손의 5' 스플라이스 공여 부위로 시작되고 후속 면역글로불린 중쇄 경막 도메인 엑손 M1의 3' 스플라이스 수용 부위로 종결됨

을 특징으로 하는 방법.
제12항 또는 제13항에 있어서,

제2 핵산이 C3b/C4b 수용체; 인간, 닭 및 래트 EGFR; FGFR; 인간 및 마우스 면역글로불린 α, ε, γ 및 μ 중쇄; 인간 PLA₂ 수용체; 닭 Cek5; 및 마우스 백혈병 억제 인자 수용체 α-쇄를 포함하는 군으로부터 선택된 폴리펩티드 또는 단백질을 코딩하는 핵산으로부터 수득됨을 특징으로 하는 방법.
제12항 또는 제13항에 있어서,

생성된 전구-mRNA의 1개 인트론만이 택일적으로 스플라이싱될 수 있음을 특징으로 하는 방법.
제12항 또는 제13항에 있어서,

세포의 선별이 유세포분류, ELISA, 면역침전, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리법 및 면역학적 결합으로 이루어진 군으로부터 선택된 방법에 의해 수행됨을 특징으로 하는 방법.
제12항 또는 제13항에 있어서,

원형질막-결합 폴리펩티드에 대한 가용성 폴리펩티드의 분자 비가 50:50 초과 내지 100:0 미만임을 특징으로 하는 방법.
a) 진핵세포를 제공하는 단계;

b) 제1항에 따른 핵산으로 상기 진핵세포를 형질감염시키는 단계;

c) 상기 핵산의 발현이 가능하도록 형질감염 세포를 배양하는 단계; 및

d) 배양 배지 또는 세포의 세포질로부터 폴리펩티드 또는 단백질을 회수하는 단계

를 포함하는, 제1항에 따른 핵산에 의해 코딩된 이종 폴리펩티드 또는 단백질의 제조 방법.
삭제