KR20050037574A

KR20050037574A - 위암 관련 유전자 훼밀리

Info

Publication number: KR20050037574A
Application number: KR1020057002453A
Authority: KR
Inventors: 고상석; 큉 류; 정현호; 웬 젱; 이복만; 송시영
Original assignee: 주식회사 엘지생명과학
Priority date: 2002-08-14
Filing date: 2003-08-14
Publication date: 2005-04-22
Also published as: US20060121471A1; EP1546171A4; WO2004016636A1; JP2006508644A; CN1681835A; AU2003251202A1; EP1546171A1

Abstract

본 발명은 개괄적으로 위암에서의 유전자 발현 변화에 관한 것이다. 본 발명은 구체적으로 정상 위 조직과 비교하여 위암 조직에서 차등 발현되는 mRNA 종에 상응하는 인간 유전자 훼밀리에 관한 것이다.

Description

위암 관련 유전자 훼밀리{Gene families associated with stomach cancer}

본 발명은 개괄적으로 정상 위 조직과 비교하여 위암 환자로부터의 위 조직에서의 유전자 발현의 변화에 관한 것이다. 본 발명은 구체적으로 정상 조직과 비교하여 진행성 위암 및 다른 악성 신생물에서 차등 발현되는 인간 유전자 훼밀리에 관한 것이다.

위암

미국에서는, 매년 약 24,000명의 새로운 위암 환자가 진단되고 있다. 지난 60년간 위암 발생률은 상당히 감소해왔지만, 위암은 여전히 밝혀지지 않은 인자들에 의해 유발되는 심각한 질환이다. 비슷한 상황 하에서, 어떤 사람들은 위암을 발병하고 다른 사람들은 그렇지 않다.

위암은 보통 55세를 넘는 사람에서 발생하며 여자 보다 남자에서 2배많다. 이러한 유형의 암은 미국에서는 많지 않지만 사람들이 건조, 피클링, 훈제, 또는 염 처리에 의해 보존된 음식을 많이 먹는 일본, 한국, 라틴 아메리카, 동유럽 일부에서 더 많다. 반대로, 신선한 과일과 채소 섭취는 이 질환으로부터 보호할 수 있다.

위암은 위의 어느 부분에서도 발병할 수 있고 위 전체와/나 다른 기관으로 확산될 수 있다. 또한 위암은 위벽을 따라 성장할 수 있고 식도나 소장으로 확산될 수 있다. 암이 위벽을 통해 자라는 경우, 이웃한 림프절, 간, 췌장과 결장으로 확산될 수 있다. 위암은 더 멀리, 난소, 폐 및 멀리 떨어진 림프절까지도 확산될 수 있다. 위암이 신체의 또 다른 부분으로 전이되는 경우, 이 종양 세포들은 원래 종양에 있는 것들과 동일한 유형의 것이다. 환언하면, 간에 전이된 세포들은 여전히 위암 세포들이다. 난소로 확산되어 하나 이상의 난소 종양을 일으키는 종양 세포는 크루켄베르크(Krukenberg) 종양으로 알려져 있으며 난소 세포가 아닌 형질변환된 위 세포로 구성되어 있다.

위암의 징후는 정해져 있지 않기 때문에, 초기에 발견하는 것이 어렵다. 징후는 소화불량, 속쓰림, 복부통증, 구역 및 구토, 설사 또는 변비, 식욕부진, 허약 피로, 대변에 섞인 피나 피를 토하는 환자에 의해 탐지되는 출혈을 포함한다. 진단은 보통 환자가 액체 바륨 추적물질을 섭취한 후 행해지는 상부 위장관과 식도의 x-레이에 의해 수행된다. 위 내시경을 이용한 위와 식도 내시경도 수행할 수 있다. 비정상적 조직이 발견되면, 위 내시경을 통해 생검을 실시할 수 있다. 생검 표본에 암 세포가 나타나면, 주위 림프절을 생검하고 간과 췌장과 같은 주위 기관을 CT 촬영을 통해 검사하여 질환의 정도나 단계를 결정한다. 위암의 치료방법은 다른 유형의 암에 사용되는 것-가능하게는 이웃한 림프절의 제거와 함께, 발병 기관의 제거(일부 또는 전체 위절제), 화학요법, 방사선요법 및 면역요법(암 세포를 공격하는 면역계 성분을 자극)-과 유사하다(http://cancernet.nci.nih.gov/cancertypes.html). 초기 위암은 거의 징후가 없으므로, 진단은 보통 치료가 덜 효과적인 질병이 진행된 단계 후에야 이루어진다.

위암에서의 분자적 변화

위암의 발병 및 진행과 관련된 위 세포에서의 분자적 변화에 대해서는 거의 알려져 있지 않다. 따라서, 위암의 발병과 진행과 관련된 새로운 분자적 마커의 동정이 필요할 뿐 아니라 유전자 발현 수준에서의 변화를 조사할 필요가 있어왔다. 더욱이, 중재(intervention)가 위암 진행을 중지하거나 지연시키는데 성공적일 것으로 기대된다면, 이 질환의 초기 징후를 정확하게 진단하는 수단을 확립할 필요가 있다. 위암의 초기 징후를 정확하게 진단하는 한 가지 방법은 질병 진행과 독특하게 관련된 마커를 밝히는 것이다(Kim 등 (2001), Oncogene 20: 4568-4575 참조). 마찬가지로, 위암 진행을 방지하거나 중단시키는 치료법의 개발은 위에서 암으로의 형질전환과 성장을 담당하는 유전자의 확인에 의존한다.

도 1 도 1은 유전자 LBFL301의 스플라이스 변이체인 서열번호 1(클론 AD12) 및 서열번호 3(클론 CH4)의 서열 차이를 보여주는 다이어그램이다.

도 2 도 2는 LBFL301, 변이체 AD12의 오픈 리딩 프레임에 의해 코딩되는 단백질(서열번호 2)의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 3 도 3은 LBFL301, 변이체 CH4 의 오픈 리딩 프레임에 의해 코딩되는 단백질(서열번호 4)의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 4 도 4는 LBFL304의 최장 오픈 리딩 프레임에 의해 코딩되는 단백질(서열번호 6)의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 5 도 5 는 LBFL305의 오픈 리딩 프레임에 의해 코딩되는 단백질(서열번호 14)의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 6 도 6은 3개의 LBFL306 클론의 상대적 배열 위치를 보여주는 것이다.

도 7 도 7은 클론번호 LBFL306-EF3의 오픈 리딩 프레임에 의해 코딩되는 단백질(서열번호 18)의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 8 도 8은 클론번호 LBFL306-GC7(서열번호 20)의 오픈 리딩 프레임에 의해 코딩되는 단백질의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

도 9 도 9는 클론번호 LBFL306-GE2(서열번호 22)의 오픈 리딩 프레임에 의해 코딩되는 단백질의 소수성 플랏이다. Kyte-Doolittle 및 Goldman 등의 방법에 따라 분석을 수행하였다.

발명을 수행하기 위한 최량의 형태

Ⅰ. 개괄적 기재

본 발명은 정상 인간 조직과 비교하여 인간 위암 조직 및 다른 악성 신생물에서 차등적으로 발현되는 새로운 유전자 훼밀리의 동정에 부분적으로 기초한다. 이들 유전자 훼밀리는 서열번호 1, 3, 5, 7, 9, 11, 13, 17, 19 및 21의 인간 cDNA를 포함한다.

본 발명의 유전자 및 단백질은 샘플에서 위암을 검출하거나 위암의 진행을 모니터하는 진단제나 마커로 사용될 수 있다. 이들은 또한 유전자 발현 또는 활성을 조절하는 약제의 표적으로 사용될 수도 있다. 예를 들어, 위암의 과증식 과정을 포함하여, 종양 성장과 관련된 생물학적 과정을 조절하는 약제를 동정할 수 있다.

Ⅱ. 구체적 태양

A. 위암과 관련된 단백질

본 발명은 분리된 단백질, 단백질의 대립형질 변이체, 및 단백질의 보존적 아미노산 치환체를 제공한다. 여기에 사용된, "단백질" 또는 "폴리펩티드"는 부분적으로 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18에 나타낸 인간 아미노산 서열을 갖는 단백질을 가리킨다. 이 용어는 또한 상기 구체적으로 언급한 것과 약간 상이한 아미노산 서열을 갖는 자연적으로 발생하는 대립형질 변이체 및 단백질을 가리킨다. 대립형질 변이체는 상기 언급한 것과 약간 다른 아미노산 서열을 가질지라도 여전히 동일하거나 유사한 이들 단백질과 연관된 생물학적 기능을 가질 것이다.

여기에 사용된, 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 인간 아미노산 서열과 관련된 단백질 훼밀리는 인간뿐만 아니라 유기체로부터 분리된 단백질을 포함한다. 이들 단백질과 관련된 단백질 훼밀리의 다른 구성원을 동정하고 분리하는데 사용되는 방법은 하기하는 바와 같다.

본 발명의 단백질은 바람직하게는 분리된 형태이다. 여기에 사용된, 단백질은 물리적, 기계적 또는 화학적 방법을 사용하여 보통 단백질과 연관된 세포 성분들로부터 단백질을 제거할 때 분리된다고 말한다. 당업자는 분리된 단백질을 얻기 위한 표준적인 정제방법을 쉽게 사용할 수 있다.

본 발명의 단백질은 추가로 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 스플라이스 변이체 및 삽입, 결실 또는 보존적 아미노산 치환 변이 체를 포함한다. 여기에 사용된, 보존적 변이체는 단백질의 생물학적 기능에 부정적인 영향을 미치지 않는 아미노산 서열 상의 변화를 가리킨다. 치환, 삽입 또는 결실은 변화된 서열이 단백질과 관련된 생물학적 기능을 방지하거나 파괴할 때 단백질에 부정적인 영향을 미친다고 한다. 예를 들어, 어떤 경우에는 단백질의 전체 전하, 구조 또는 소수성/친수성 성질을 생물학적 활성에 부정적인 영향을 미치지 않으면서 변화시킬 수 있다. 따라서, 아미노산 서열을 예를 들어 단백질의 생물학적 활성에 부정적인 영향을 미치지 않으면서, 폴리펩티드를 더 소수성 또는 친수성이 되도록 변화시킬 수 있다.

통상적으로, LBFL301에 의해 코딩된 단백질 훼밀리의 대립형질 변이체, 보존적 치환 변이체, 및 구성원은 서열번호 2 또는 4의 서열과 적어도 약 50%, 60%, 70% 또는 75%의 아미노산 서열 상동성, 보다 바람직하게는 적어도 약 80-90%, 보다 더 바람직하게는 적어도 약 92-95%, 가장 바람직하게는 적어도 약 95-98%의 서열 상동성을 갖는 아미노산 서열을 가질 것이다. LBFL304에 의해 코딩되는 단백질 훼밀리의 대립형질 변이체, 보존적 치환 변이체, 및 구성원은 서열번호 6, 8, 10 또는 12의 서열과 적어도 약 50%, 60%, 70% 또는 75%의 아미노산 서열 상동성, 보다 바람직하게는 적어도 약 80% 이상, 보다 더 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 99 또는 99.5%의 서열 상동성을 갖는 아미노산 서열을 가질 것이다. LBFL305 또는 LBFL306에 의해 코딩되는 단백질 훼밀리의 대립형질 변이체, 보존적 치환 변이체, 및 구성원은 서열번호 14 또는 18의 서열과 적어도 약 50%, 60%, 70% 또는 75% 이상의 아미노산 서열 상동성, 보다 바람직하게는 적어도 약 80-90%, 보다 더 바람직하게는 적어도 약 92-94%, 가장 바람직하게는 적어도 약 95%, 98% 또는 99% 이상의 서열 상동성을 갖는 아미노산 서열을 가질 것이다. 여기에서 이러한 서열에 관한 상동성은 서열들을 배열하고 필요 시 공간을 도입하여 최대 퍼센트 상동성을 얻도록 한 후, 보존적 치환은 서열 상동성의 일부로 간주하지 않으면서 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18과 동일한 후보 서열 상의 아미노산 잔기의 퍼센트로서 정의된다(관련 지수에 대해서는 B란을 참조하라). 융합 단백질, 또는 펩티드 서열로의 N-말단, C-말단 또는 내부 연장, 결실 또는 삽입은 상동성에 영향을 미치지 않는 것으로 해석되어야 한다.

따라서, 본 발명의 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 아미노산 서열을 갖는 분자; 이들 단백질의 적어도 약 3, 4, 5, 6, 10, 15, 20, 25, 30, 35개 이상의 아미노산 잔기의 연속적인 서열을 갖는 그의 단편; 하나 이상의 아미노산 잔기가 상기 코딩 서열 내나 그의 N- 또는 C- 말단으로 삽입된 아미노산 서열 변이체; 및 적어도 하나의 잔기에 의해 치환된 상기 서열의 아미노산 서열 변이체, 또는 상기한 바와 같은 그의 단편을 포함한다. 이러한 단편은 또한 펩티드 또는 폴리펩티드라 하며, 분명한 친수성 부위뿐만 아니라 항원성 부위, 공지의 단백질 영역에 상응하는 아미노산 서열 부위로 확인된 단백질의 기능적 부위를 함유할 수 있다. 이들 부위는 모두 MacVector(Oxford Molecular)와 같은 보편적으로 이용가능한 단백질 서열 분석 소프트웨어를 사용하여 용이하게 확인할 수 있다.

예상되는 변이체는 추가로 예를 들어 상동적 재조합, 부위-특이적 또는 PCR 돌연변이에 의한 예정된 돌연변이를 포함하는 것들, 토끼, 마우스, 랫트, 돼지, 소, 양, 말 및 비인간 영장류를 포함하지만 이들로 제한되지는 않는 다른 동물 종의 상응하는 단백질, 및 단백질 훼밀리의 대립형질 또는 기타 자연적으로 발생하는 변이체(예를 들어, 모두 여기에 참조로서 인용되는 GenBank 등록번호 XM_128002, XM_129365, NM_021420, NM_133971(DNA 서열) 및 NP_598732(단백질 서열)에 상응하는 마우스 단백질에 대해 유사성을 나타내는 마우스 동족체)를 포함한다. 부가적인 변이체는 단백질이 치환, 화학적, 효소적, 또는 기타 적절한 수단에 의해 자연적으로 발생하는 아미노산 이외의 부위(예를 들어 효소나 방사성동위원소와 같은 검출가능한 부위)로 공유적으로 변형된 유도체를 포함한다.

본 발명은 추가로 본 발명의 단백질 또는 폴리펩티드 및 희석제를 포함하는 조성물을 제공한다. 적당한 희석제는 수성 또는 비수성 용매 또는 이들의 배합물일 수 있고, 단백질 또는 폴리펩티드의 안정성, 용해도, 활성, 및/또는 저장성에 기여하는 부가적인 성분들, 예를 들어 수용성 염 또는 글리세롤을 포함할 수 있다.

하기하는 바와 같이, 단백질 훼밀리의 구성원은 (1) 단백질의 수준이나 적어도 하나의 활성을 조절하는 약제를 동정하고, (2) 단백질의 결합 상대를 동정하고, (3) 폴리클로날 또는 모노클로날 항체를 유발하기 위한 항원으로, (4) 치료 약제 또는 표적으로, (5) 위암 및 다른 과증식성 질환의 진단제나 마커로 사용될 수 있다.

B. 핵산 분자

본 발명은 추가로 바람직하게는 분리된 형태, 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18을 갖는 단백질 및 여기에 기재된 관련된 단백질을 코딩하는 핵산 분자를 제공한다. 여기에 사용된, "핵산"은 상기 정의된 바와 같은 단백질이나 펩티드를 코딩하거나; 그러한 펩티드를 코딩하는 핵산에 상보적이거나; 적절히 엄격한 조건 하에서 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 핵산과 혼성화하고 안정하게 결합되어 있거나; 서열번호 2 또는 4의 펩티드 서열과 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 서열번호 2 또는 4의 펩티드 서열과 적어도 약 80-90%, 보다 바람직하게는 적어도 약 92-95%, 가장 바람직하게는 적어도 약 95-98%를 공유하는 폴리펩티드를 코딩하거나; 서열번호 1 또는 3의 오픈 리딩 프레임에 걸쳐 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80-90%, 보다 바람직하게는 적어도 약 92-95%, 보다 더 바람직하게는 적어도 약 95-98%의 뉴클레오티드 서열 상동성을 나타내거나; 서열번호 6, 8, 10 또는 12의 펩티드 서열과 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80%, 보다 바람직하게는 적어도 약 85%, 가장 바람직하게는 적어도 약 90%, 95%, 98%, 99%, 99.5%의 상동성을 공유하는 폴리펩티드를 코딩하거나; 서열번호 5, 7, 9 또는 11의 오픈 리딩 프레임에 걸쳐 적어도 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80%, 보다 바람직하게는 적어도 약 85%, 보다 더 바람직하게는 적어도 약 90%, 95%, 98%, 99%, 99.5% 이상의 뉴클레오티드 서열 상동성을 나타내거나; 서열번호 14 또는 18의 펩티드 서열과 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80-90%, 보다 바람직하게는 적어도 약 92-94%, 가장 바람직하게는 적어도 약 95%, 98%, 99% 이상의 상동성을 공유하는 폴리펩티드를 코딩하거나; 서열번호 13 또는 17의 오픈 리딩 프레임에 걸쳐 적어도 약 50%, 60%, 70% 또는 75%, 바람직하게는 적어도 약 80-90%, 보다 바람직하게는 적어도 약 92-94%, 보다 더 바람직하게는 적어도 약 95%, 98%, 99% 이상의 뉴클레오티드 서열 상동성을 나타내는 RNA나 DNA로 정의된다.

본 발명은 추가로 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 상보물에 특이적으로 혼성화하는 분리된 핵산 분자, 특히 오픈 리딩 프레임에 걸쳐 특이적으로 혼성화하는 분자를 포함한다. 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 상보물에 특이적으로 혼성화하는 그러한 분자는 전형적으로 엄격한 혼성화 조건 하에서 혼성화한다.

게놈 DNA, cDNA, mRNA 및 안티센스 분자, 및 자연적인 소스로부터 유래되거나 합성되든지 간에, 대체 백본에 기초하거나 대체 염기를 포함하는 핵산이 구체적으로 고안된다. 그러나, 본 발명에 따른 단백질을 코딩하는 핵산과 적절하게 엄격한 조건 하에서 혼성화하거나 상보적인 것을 포함하는 그러한 혼성화 또는 상보적 핵산은 추가로 어떠한 선행기술 핵산에 비해서도 신규하고 비자명한 것으로 정의된다.

뉴클레오티드 또는 아미노산 서열 수준에서의 상동성은 서열 유사성 서치를 위해 만들어진 프로그램 blastp, blastn, blastx, tblastn 및 tblastx에 의해 사용되는 알고리즘을 사용하는 BLAST(Basic Local Alignment Search Tool) 분석(Altschul 등, (1997) Nucleic Acids Res 25:3389-3402, 및 Karlin 등, (1990) Proc Natl Acad Sci USA 87:2264-2268, 모두 참조로서 전체 인용됨)에 의해 결정된다. BLAST 프로그램에 의해 사용되는 접근법은 먼저 문제 서열과 데이터베이스 서열 간에, 공간이 있거나 없이, 유사한 단편을 고려한 후, 확인된 모든 매치의 통계학적 유의성을 평가하고, 마지막으로 미리 선정된 유의성 경계를 만족시키는 매치들만을 요약하는 것이다. 서열 데이터베이스의 유사성 서치에 있어서의 기본적인 이슈를 논의하기 위해서는, 참조로서 완전히 인용하는 Altschul 등, (1994) Nature Genetics 6: 119-129를 참고하라. 히스토그램, 기재, 배열, 예측(즉, 데이터베이스에 대한 매치를 보고하기 위한 통계학적 유의성 경계), 컷오프, 매트릭스 및 필터(낮은 복잡도)를 위한 서치 파라미터가 기본 셋팅이다. blastp, blastx, tblastn 및 tblastx에 의해 사용되는 기본 채점 매트릭스는 길이가 85개 뉴클레오티드 또는 아미노산을 넘는 문제 서열을 위해 권장되는 BLOSUM62 매트릭스이다(Henikoff 등, (1992) Proc Natl Acad Sci USA 89:10915-10919, 전체 참조로서 인용됨).

Blastn를 위해, 채점 매트릭스는 M(즉, 매치되는 잔기 쌍에 대한 보상 점수) 대 N (즉, 미스매치되는 잔기에 대한 벌점)의 비율에 의해 설정되며, M 및 N의 기본 값은 각각 5 및 -4이다. 4개의 blastn 지수가 아래와 같이 조정되었다: Q=10(공간을 만든 벌점); R=10(공간을 연장시킨 벌점); wink=1(문제를 따라 매 wink 번째 위치에서 단어 히트를 만듦); 및 gapw=16(공간이 있는 배열을 만드는 윈도우 폭을 설정함). 동등한 Blastp 지수 셋팅은 Q=9; R=2; wink=1; 및 gapw=32였다. GCG 팩키지 버전 10.0에서 이용할 수 있는 서열 간 Bestfit 비교는 DNA 파라미터 GAP=50(공간을 만드는 벌점) 및 LEN=3(공간을 연장시키는 벌점)을 사용하고 단백질 비교에서 동등한 셋팅은 GAP=8 및 LEN=2이다.

"엄격한 조건"은 (1) 세척을 위해 낮은 이온강도와 높은 온도, 예를 들어 50 ℃에서 0.015 M NaCl/0.0015 M 시트르산나트륨/0.1% SDS를 사용하거나, (2) 혼성화 중 포름아미드와 같은 변성화제, 예를 들어 42 ℃에서 0.1% 소혈청알부민을 갖는 50%(vol/vol) 포름아미드/0.1% 피콜/0.1% 폴리비닐피롤리돈/750 mM NaCl을 갖는 pH 6.5의 50 mM 인산나트륨 완충액, 75 mM 시트르산나트륨을 사용하는 것이다. 또 다른 예는 42 ℃에서 50% 포름아미드, 5×SSC(0.75 M NaCl, 0.075 M 시트르산나트륨), 50 mM 인산나트륨(pH 6.8), 0.1% 피로인산나트륨, 5×덴하르츠 용액, 초음파 처리된 연어 정자 DNA(50 ㎍/㎖), 0.1% SDS, 및 10% 황산덱스트란으로 혼성화하고, 42 ℃, 0.2×SSC 및 0.1% SDS로 세척하는 것이다. 당업자는 깨끗하고 검출 가능한 혼성화 신호를 얻기 위하여 엄격도 조건을 적절하게 결정하고 변화시킬 수 있다. 바람직한 분자는 상기 조건 하에서 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 상보물과 혼성화하고, 기능적 또는 전장 단백질을 코딩하는 것들이다. 보다 더 바람직한 혼성화 분자는 상기 조건 하에서 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 오픈 리딩 프레임의 상보 쇄와 혼성화하는 것들이다.

여기에 사용된, 핵산 분자는 핵산 분자가 다른 폴리펩티드를 코딩하는 오염 핵산 분자로부터 실질적으로 분리되었을 때 "분리되었다"라고 한다.

본 발명은 추가로 개시된 핵산 분자의 단편을 제공한다. 여기에 사용된, 핵산 분자의 단편은 코딩 또는 비코딩 서열의 작은 부분을 가리킨다. 단편의 크기는 의도하는 용도에 의해 결정될 것이다. 예를 들어, 단편을 단백질의 활성 부분을 코딩하기 위하여 선택한다면, 그 단편은 단백질의 기능적 부위(들)를 코딩하는데 충분한 만큼 클 필요가 있다. 예를 들어, 예상되는 항원성 부위에 상응하는 펩티드를 코딩하는 단편을 제조할 수 있다. 단편을 핵산 프로브 또는 PCR 프로브로 사용하고자 한다면, 그 단편 길이는 프로빙/프라이밍 중 상대적으로 적은 위양성을 얻도록 선택될 것이다(H란에서의 논의를 참조하라).

중합효소 연쇄반응(PCR)을 위한 프로브나 특이적 프라이머로, 또는 본 발명의 단백질을 코딩하는 유전자 서열을 합성하는데 사용되는 본 발명의 핵산 분자의 단편(즉, 합성 올리고뉴클레오티드)은 화학적 기술, 예를 들어 Matteucci 등((1981) J Am Chem Soc 103:3185-3191)의 포스포르아미다이트 방법에 의해서나 자동화된 합성 방법을 이용하여 쉽게 제조할 수 있다. 또한, 더 큰 DNA 단편은 유전자의 다양한 모듈 단편을 결정한 후, 올리고뉴클레오티드를 결찰하여 완전한 변형된 유전자를 만드는 올리고뉴클레오티드 그룹의 합성과 같은, 잘 알려진 방법에 의해 쉽게 제조할 수 있다.

본 발명의 핵산 분자는 추가로 진단 및 프로브 목적을 위해 검출 가능한 표지를 함유하도록 변형될 수 있다. 다양한 표지가 당업계에 알려져 있으며 여기에 기재된 코딩 분자와 함께 쉽게 사용될 수 있다. 적당한 표지는 바이오틴, 방사성표지 또는 형광표지된 뉴클레오티드 등을 포함하지만, 이들로 제한되는 것은 아니다. 당업자는 본 발명의 핵산 분자의 표지된 변이체를 얻기 위하여 어떠한 표지도 쉽게 사용할 수 있다.

C. 기타 관련된 핵산 분자의 분리

상기한 바와 같이, 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17을 갖는 핵산 분자의 동정 및 특성규명으로 당업자는 여기에 기재된 서열뿐만 아니라 그 단백질 훼밀리의 다른 구성원을 코딩하는 핵산 분자를 분리할 수 있다. 추가로, 현재 개시된 핵산 분자로 당업자는 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18을 갖는 단백질뿐만 아니라 그 단백질 훼밀리의 다른 구성원을 코딩하는 핵산 분자를 분리할 수 있다.

예를 들어, 당업자는 쉽게 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 아미노산 서열을 이용하여 적절한 세포로부터 제조된 발현 라이브러리를 스크리닝하기 위한 항체 프로브를 제조할 수 있다. 전형적으로는, 정제된 단백질(하기하는 바와 같은)로 면역화된 토끼와 같은 포유동물로부터의 폴리클로날 항혈청 또는 모노클로날 항체를 사용하여 포유동물 cDNA 또는 람다 gtll 라이브러리와 같은 게놈 발현 라이브러리를 프로빙하여, 단백질 훼밀리의 다른 구성원에 대한 적절한 코딩 서열을 얻을 수 있다. 클로닝된 cDNA 서열은 융합단백질로서 발현되거나, 그 자체의 조절 서열을 이용하여 직접 발현되거나, 효소 발현을 위해 사용되는 특정 숙주에게 적합한 조절 서열을 이용한 제작물에 의해 발현될 수 있다.

다르게는, 여기에 기재된 코딩 서열의 일부를 합성하고 어느 포유류 유기체로부터의 단백질 훼밀리의 구성원을 코딩하는 DNA를 검색하기 위한 프로브로 사용할 수 있다. 약 18-20 뉴클레오티드를 함유하는(6-7개의 아미노산을 코딩하는) 올리고머를 제조하여 게놈 DNA나 cDNA 라이브러리를 스크리닝하여 과도한 수준의 위양성을 제거하기 위한 엄격한 조건 또는 충분한 엄격도의 조건 하에서 혼성화를 얻을 수 있다.

부가적으로, 올리고뉴클레오티드 프라이머 쌍을 코딩 핵산 분자를 선별적으로 클로닝하기 위한 중합효소 연쇄반응(PCR)에서 사용하기 위하여 제조할 수 있다. 그러한 PCR 프라이머를 사용하기 위한 PCR 변성/어닐링/연장 사이클은 당업계에 잘 알려져 있으며 다른 코딩 핵산 분자를 분리하는데 사용하기 위해 쉽게 적합화시킬 수 있다.

단백질 훼밀리의 다른 구성원을 코딩하는 핵산 분자는 또한 PSI-BLAST(Altschul 등, (1997) Nucleic Acids Res 25:3389-3402); PHI-BLAST(Zhang 등, (1998) Nucleic Acids Res 26:3986-3990), 3D-PSSM(Kelly 등, (2000) J Mol Biol 299(2):499-520); 및 기타 컴퓨터 분석방법(Shi 등, (1999) Biochem Biophys Res Commun 262(1):132-138 및 Matsunami 등, (2000) Nature 404(6778):601-604)을 포함하지만, 이들로 제한되지 않는 어떠한 이용 가능한 컴퓨터 방법을 이용해서도 존재하는 게놈 또는 다른 서열 정보에서 확인될 수 있다.

D. 핵산 분자를 함유하는 rDNA 분자

본 발명을 추가로 코딩 서열을 함유하는 재조합 DNA 분자(rDNAs)를 제공한다. 여기에 사용된, rDNA 분자는 인 사이츄에서 분자적으로 조작된 DNA 분자이다. rDNA 분자를 생성하는 방법은 당업계에 잘 알려져 있다. 예를 들어, Sambrook 등, Molecular Cloning - A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001을 참조하라. 바람직한 rDNA 분자에서, 코딩 DNA 서열은 발현 조절 서열 및/또는 벡터 서열에 작동 가능하게 연결된다.

당업계에 잘 알려진 바와 같이, 본 발명의 서열을 코딩하는 단백질 훼밀리 중 하나에 작동 가능하게 연결되는 벡터 및/또는 발현 조절 서열의 선택은 원하는 기능적 성질, 예를 들어, 단백질 발현 및 형질전환되는 숙주세포에 직접적으로 의존한다. 본 발명에 의해 고안된 벡터는 적어도 복제 또는 숙주 염색체로의 삽입, 바람직하게는 rDNA 분자에 포함된 구조 유전자의 발현도 유도할 수 있다.

작동 가능하게 연결된 단백질 코딩 서열의 발현을 조절하는데 사용되는 발현 조절 요소가 당업계에 알려져 있으며, 유도성 프로모터, 구성적 프로모터, 분비 신호, 및 기타 조절 요소를 포함하지만, 이들로 제한되지는 않는다. 바람직하게는, 유도성 프로모터는 숙주 세포 배지 중의 영양소에 반응하는 것과 같이, 쉽게 조절된다.

일례에서, 코딩 핵산 분자를 함유하는 벡터는 원핵생물 레플리콘(replicon), 즉 그로 형질전환된 세균 숙주세포와 같은 원핵 숙주세포의 염색체 외에 존재하는 재조합 DNA 분자의 자가 복제 및 유지를 유도하는 능력을 갖는 DNA 서열을 포함한다. 그러한 레플리콘은 당업계에 잘 알려져 있다. 또한, 원핵생물 레플리콘을 포함하는 벡터는 또한 발현이 약물 내성과 같은 검출 가능한 마커를 부여하는 유전자를 포함할 수도 있다. 전형적인 세균 약물 내성은 앰피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린에 대한 내성을 부여하는 것들이다.

원핵생물 레플리콘을 포함하는 벡터는 추가로 E. coli와 같은 세균 숙주 세포에서 코딩 유전자 서열의 발현(전사 및 해독)을 유도할 수 있는 원핵생물 또는 박테리오파지 프로모터를 포함할 수 있다. 프로모터는 RNA 중합효소의 결합과 전사가 일어나도록 해주는 DNA 서열에 의해 형성된 발현 조절 요소이다. 세균 숙주와 양립 가능한 프로모터 서열은 전형적으로 본 발명의 DNA 단편을 삽입하기 위한 편리한 제한 위치를 함유하는 플라스미드 벡터에서 제공된다. 그러한 벡터 플라스미드의 전형적인 예는 BioRad Laboratories(Richmond, CA)로부터 입수 가능한 pUC8, pUC9, pBR322 및 pBR329, 및 Pharmacia(Piscataway, NJ)로부터 입수 가능한 pPL 및 pKK223이다.

진핵세포, 바람직하게는 위 세포와 같은 척추동물 세포와 양립 가능한 발현 벡터가 또한 코딩 서열을 함유하는 rDNA 분자를 형성하는데 사용될 수 있다. 바이러스 벡터를 포함한 진핵세포 발현 벡터가 당업계에 잘 알려져 있으며, 몇몇 상업적 입수처로부터 이용 가능하다. 전형적으로는, 원하는 DNA 단편을 삽입하기 위한 편리한 제한 위치를 함유하는 그러한 벡터가 제공된다. 그러한 벡터의 전형적인 예는 pSVL 및 pKSV-10(Pharmacia), pBPV-1/pML2d(International Biotechnologies, Inc.), pTDT1(ATCC, #31255), 여기에 기재된 벡터 pCDM8, 기타 진핵생물 발현 벡터이다. 벡터는 필요한 경우 위 세포 특이적 프로모터를 포함하도록 변형될 수 있다.

본 발명의 rDNA 분자를 제작하는데 사용되는 진핵세포 발현 벡터는 추가로 진핵세포에서 효과적인 선별 가능한 마커, 바람직하게는 약물 내성 선별 마커를 포함할 수 있다. 바람직한 약물 내성 마커는 발현이 네오마이신 내성을 일으키는 유전자, 즉, 네오마이신 포스포트랜스퍼라제(neo) 유전자이다(Southern 등, (1982) J Mol Anal Genet 1:327-341). 다르게는, 선별 가능한 마커는 별도의 플라스미드 상에 존재할 수 있으며, 두 벡터는 숙주세포의 공동-형질감염에 의해 도입되고, 선별 마커에 적당한 약물 중에서 배양함으로써 선별된다.

E. 외생적으로 공급된 코딩 핵산 분자를 함유하는 숙주세포

본 발명은 추가로 본 발명의 단백질을 코딩하는 핵산 분자로 형질전환된 숙주세포를 제공한다. 숙주세포는 원핵 또는 진핵세포일 수 있다. 본 발명의 단백질 발현을 위해 유용한 진핵세포는, 세포주가 세포 배양방법과 양립 가능하고 발현 벡터의 증식과 유전자 산물의 발현과 양립 가능한 이상, 제한되지 않는다. 바람직한 진핵 숙주세포는 효모, 곤충 및 포유류 세포, 바람직하게는 마우스, 랫트, 원숭이 또는 인간 세포주와 같은 척추동물 세포를 포함하지만, 이들로 제한되는 것은 아니다. 바람직한 진핵 숙주세포는 ATCC로부터 CCL61로서 입수 가능한 중국 햄스터 난소(CHO) 세포, ATCC로부터 CRL 1658로서 입수 가능한 NIH 스위스 마우스 배아 세포(NIH/3T3), 새끼 햄스터 신장 세포(BHK), 및 기타 진핵 조직 배양 세포주를 포함한다.

어떠한 원핵 숙주도 본 발명의 단백질을 코딩하는 rDNA 분자를 발현하는데 사용할 수 있다. 바람직한 원핵 숙주는 E. coli이다.

본 발명의 rDNA 분자로의 적절한 숙주세포의 형질전환은 사용하는 벡터의 유형과 사용하는 숙주 시스템에 전형적으로 의존하는 잘 알려진 방법에 의해 달성된다. 원핵 숙주세포의 형질전환에 관하여, 전기천공과 염 처리 방법이 전형적으로 사용된다(예를 들어, Cohen 등, (1972) Proc Natl Acad Sci USA 69:2110; 및 상기 Sambrook 등을 참조하라). rDNA를 함유하는 벡터로의 척추동물 세포의 형질전환에 관하여, 전기천공, 양이온성 지질 또는 염 처리 방법이 전형적으로 사용된다. 예를 들어, Graham 등, (1973) Virol 52:456; Wigler 등, (1979) Proc Natl Acad Sci USA 76;1373-1376을 참조하라.

성공적으로 형질전환된 세포, 즉 본 발명의 rDNA를 함유하는 세포는 선별 마커의 선별을 비롯한 잘 알려진 기술에 의해 확인될 수 있다. 예를 들어, 본 발명의 rDNA의 도입으로부터 생성된 세포는 단일 콜로니를 형성하도록 클로닝될 수 있다. 이들 콜로니로부터 세포를 수획, 용균하고 그 DNA 함량을 Southern, (1975) J Mol Biol 98:503 또는 Berent 등, (1985) Biotech 3:208에 기재된 것과 같은 방법을 이용하여 rDNA의 존재에 대해 조사하거나, 면역학적 방법을 통해 세포로부터 생산된 단백질을 어세이한다.

F. rDNA 분자를 이용한 재조합 단백질의 생산

본 발명은 추가로 여기에 기재된 핵산 분자를 사용하여 본 발명의 단백질을 제조하는 방법을 제공한다. 일반적인 용어로, 재조합 형태의 단백질의 생산은 전형적으로 하기 단계를 포함한다:

첫째, 본 발명의 단백질을 코딩하는 핵산, 예를 들어 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 17, 서열번호 1의 뉴클레오티드 131-862 또는 131-859, 서열번호 3의 뉴클레오티드 174-587 또는 174-584, 서열번호 5의 뉴클레오티드 38-892 또는 38-895, 서열번호 7의 뉴클레오티드 53-892 또는 53-895, 서열번호 9의 뉴클레오티드 65-892 또는 65-895, 서열번호 11의 뉴클레오티드 92-892 또는 92-895, 서열번호 13의 뉴클레오티드 49-1437 또는 49-1434, 또는 서열번호 17의 뉴클레오티드 75-575 또는 75-572을 포함하거나, 필수성분으로 하여 구성되거나, 구성되는 핵산 분자를 얻는다. 코딩 서열이 이들 오픈 리딩 프레임과 같이 인트론에 의해 방해되지 않는다면, 이것은 어느 숙주에서의 발현에도 직접적으로 적합하다.

그 후 바람직하게 핵산 분자는 상기한 바와 같은 적당한 조절 서열과 작동 가능하게 연결되어, 단백질 오픈 리딩 프레임을 함유하는 발현 단위를 형성한다. 발현 단위는 적당한 숙주를 형질전환하는데 사용되며 형질전환된 숙주는 재조합 단백질의 생산을 가능하게 하는 조건 하에서 배양된다. 임의로 재조합 단백질은 배지 또는 세포로부터 분리되고; 단백질의 회수 및 정제는 약간의 불순물을 견딜 수 있는 일부 경우 필요치 않을 수 있다.

상기 각각의 단계는 다양한 방법으로 수행될 수 있다. 예를 들어, 원하는 코딩 서열을 게놈 단편으로부터 얻고 적절한 숙주에서 직접 사용할 수 있다. 다양한 숙주에서 작동 가능한 발현 벡터의 제작은 상기한 바와 같은 적당한 레플리콘과 조절 서열을 이용하여 달성된다. 조절 서열, 발현 벡터, 및 형질전환 방법은 유전자를 발현하는데 사용되는 숙주세포의 유형에 의존하며 이미 상세히 논의한 바 있다. 적당한 제한 위치는 정상적으로 이용 가능하지 않은 경우, 이들 벡터로 삽입하기 위한 절단 가능한 유전자를 제공하기 위하여 코딩 서열의 끝에 첨가된다. 당업자는 재조합 단백질을 생산하기 위한 본 발명의 핵산 분자의 사용을 위하여 당업계에 알려진 어떠한 숙주/발현 시스템도 용이하게 적합화할 수 있다.

G. 결합 상대 동정방법

본 발명의 또 다른 태양은 본 발명의 단백질의 결합 상대를 분리하고 동정하는 방법을 제공한다. 일반적으로, 가능한 결합 상대와 본 발명의 단백질의 결합을 가능하게 하는 조건 하에서 본 발명의 단백질을 가능한 결합 상대 또는 세포 추출물 또는 분획과 혼합한다. 혼합 후, 펩티드, 폴리펩티드, 단백질 또는 본 발명의 단백질과 결합된 다른 분자를 혼합물로부터 분리한다. 그 후 본 발명의 단백질과 결합된 결합 상대를 제거하여 추가로 분석한다. 결합 상대를 확인하고 분리하기 위하여, 전체 단백질, 예를 들어 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 전체 아미노산 서열을 포함하는 단백질을 사용한다. 다르게는, 그 단백질의 단편을 사용할 수 있다.

여기에 사용된, 세포 추출물은 용균 또는 파쇄된 세포로부터 제조된 조제물 또는 분획을 가리킨다. 세포 추출물의 바람직한 출처는 인간 위암으로부터 유래된 세포 또는 형질전환된 위 세포, 예를 들어 위암으로부터의 생검 조직 또는 조직 배양 세포이다. 다르게는, 세포 추출물을 정상 조직 또는 이용가능한 세포주, 특히 위-유래된 세포주로부터 제조될 수 있다.

다양한 방법을 세포 추출물을 얻는데 사용할 수 있다. 세포를 물리적 또는 화학적 파쇄방법을 이용하여 파쇄할 수 있다. 물리적 파쇄방법의 예는 초음파 및 기계적 전단(shearing)을 포함하지만, 이들로 제한되는 것은 아니다. 화학적 용균방법의 예는 계면활성제 용균 및 효소 용균을 포함하지만, 이들로 제한되는 것은 아니다. 당업자는 본 방법에 사용하기 위한 추출물을 얻기 위하여 세포 추출물을 제조하는 방법을 쉽게 적합화할 수 있다.

일단 세포 추출물을 제조하면, 단백질과 결합 상대의 결합이 일어날 수 있는 조건 하에서 추출물을 본 발명의 단백질과 혼합한다. 다양한 조건을 사용할 수 있으며, 인간 세포의 세포질에서 발견되는 조건을 근접하게 닮은 조건이 가장 바람직하다. 삼투압, pH, 온도, 사용된 세포 추출물의 농도와 같은 특징을 단백질과 결합 상대의 결합을 최적화하기 위하여 변화시킬 수 있다.

적절한 조건 하에서 혼합한 후, 결합된 복합체를 혼합물로부터 분리한다. 다양한 기술을 혼합물을 분리하는데 사용할 수 있다. 예를 들어, 본 발명의 단백질에 특이적인 항체를 사용하여 결합 상대 복합체를 면역침전시킬 수 있다. 다르게는, 크로마토그래피 및 밀도/침강 원심분리와 같은 표준 화학적 분리기술을 사용할 수 있다.

추출물 중에서 발견되는 비결합된 세포성분을 제거한 후, 결합 상대를 복합체로부터 통상적인 방법을 이용하여 해리시킬 수 있다. 예를 들어, 해리는 혼합물의 염 농도나 pH를 변화시킴으로써 달성할 수 있다.

혼합 추출물로부터 결합된 결합 상대를 분리하는 것을 돕기 위하여, 본 발명의 단백질을 고상 지지체 상에 고정시킬 수 있다. 예를 들어, 단백질을 니트로셀룰로스 매트릭스나 아크릴 비드에 부착시킬 수 있다. 단백질의 고상 지지체로의 부착은 추출물 중에 발견되는 다른 성분으로부터 펩티드/결합 상대 쌍을 분리하는 것을 도와준다. 확인된 결합 상대는 단일 단백질이거나 2 이상의 단백질의 복합체일 수 있다. 다르게는, 결합 상대는 Takayama 등, (1997) Methods Mol Biol 69:171-184 또는 Sauder 등, (1996) J Gen Virol 77:991-996의 방법에 따라 파-웨스턴(Far-Western) 어세이를 이용하여 확인하거나, 에피토프 태그된 단백질 또는 GST 융합 단백질을 통해 확인할 수 있다.

다르게는, 본 발명의 핵산 분자를 효모 2-하이브리드 시스템 또는 다른 인 비보 단백질-단백질 검출 시스템에서 사용할 수 있다. 효모 2-하이브리드 시스템은 다른 단백질 상대 쌍을 확인하는데 사용되어 왔으며 여기에 기재된 핵산 분자를 사용하기 위하여 쉽게 적합화될 수 있다.

H. 위암 관련 유전자를 코딩하는 핵산 발현을 조절하는 약제의 동정방법

본 발명의 다른 태양은 서열번호 2, 4, 6, 8, 10, 12 또는 18의 아미노산 서열을 갖는 단백질, Mst1 단백질 또는 서열번호 14의 아미노산 서열을 갖는 단백질과 같은 본 발명의 스플라이스 변이체와 같은 본 발명의 단백질을 코딩하는 핵산의 발현을 조절하는 약제를 동정하는 방법을 제공한다. Mst1 단백질 또는 스플라이스 변이체를 코딩하는 핵산 발현을 조절하는 약제는 위암 치료에 특별한 용도를 가질 것이다. 그러한 어세이는 본 발명의 핵산의 발현 수준 변화를 모니터링하는데 이용할 수 있는 어떠한 수단도 이용할 수 있다. 여기에 사용된, 약제는 세포에서 핵산의 발현을 상향- 또는 하향-조절할 수 있으면 본 발명의 핵산의 발현을 조절한다고 말한다.

한 어세이 형태에서, 서열번호 1의 뉴클레오티드 131-862, 또는 서열번호 3의 뉴클레오티드 174-587, 서열번호 5의 뉴클레오티드 38-895, 서열번호 7의 뉴클레오티드 53-895, 서열번호 9의 뉴클레오티드 65-895, 서열번호 11의 뉴클레오티드 92-895, 서열번호 13의 뉴클레오티드 49-1437 또는 49-1434, 서열번호 17의 뉴클레오티드 75-575 및/또는 5' 및/또는 3' 조절 요소와 어떠한 어세이 가능한 융합 상대 간의 리포터 유전자 융합을 함유하는 세포주를 제조할 수 있다. 반딧불이 루시페라제 유전자 및 클로람페니콜 아세틸트랜스퍼라제를 코딩하는 유전자를 비롯한 수많은 어세이 가능한 융합 상대가 알려져 있고 용이하게 이용 가능하다(Alam 등, (1990) Anal Biochem 188:245-254). 그 후 리포터 유전자 융합을 함유하는 세포주를 적절한 조건 및 시간 하에 시험하고자 하는 약제에 노출시킨다. 약제에 노출된 샘플과 대조 샘플 간에 리포터 유전자의 차등 발현으로 본 발명의 핵산의 발현을 조절하는 약제를 동정한다.

부가적인 어세이 형태를 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18을 갖는 단백질과 같은 본 발명의 단백질을 코딩하는 핵산의 발현을 조절하는 약제의 능력을 모니터링하기 위하여 사용할 수 있다. 예를 들면, mRNA 발현을 본 발명의 핵산과의 혼성화에 의해 직접 모니터링할 수 있다. 세포주를 적절한 조건 및 시간 하에 시험하고자 하는 약제에 노출시키고, 총 RNA 또는 mRNA를 Sambrook 등, Molecular Cloning - A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001에 기재된 것과 같은 표준 방법에 의해 분리한다.

바람직한 세포는 인간 위 조직, 예를 들어 위암 환자로부터의 위 생검 조직 또는 배양세포로부터 유래된 것이다. ATCC 위암 세포주 카탈로그 번호 NCI-SNU-16, CRL-1863, HTB-103, CRL-1739 및 CRL-1864와 같은 세포주를 사용할 수 있다. 다르게는, 다른 이용 가능한 세포 또는 세포주를 사용할 수 있다.

약제에 노출된 세포와 대조 세포 간의 RNA 발현수준의 차이를 검출하기 위한 프로브를 본 발명의 핵산으로부터 제조할 수 있다. 고 엄격도의 조건 하에서 표적 핵산하고만 혼성화하는 프로브를 설계하는 것이 필수적이지는 않지만 바람직하다. 고도로 상보적인 핵산 하이브리드만이 높은 엄격도의 조건 하에서 형성된다. 따라서, 어세이 조건의 엄격도는 하이브리드를 형성하기 위하여 두 핵산 쇄 간에 존재해야만 하는 상보성의 양을 결정한다. 엄격도는 프로브:표적 하이브리드와 프로브:비표적 하이브리드 간의 안정성 차이를 최대화하도록 선택되어야 한다.

본 발명의 핵산으로부터 당업계에 알려진 방법을 통해 프로브를 설계할 수 있다. 예를 들어, 프로브의 G+C 함량과 프로브 길이가 프로브의 표적 서열에의 결합에 영향을 미칠 수 있다. 프로브 특이성을 최적화하는 방법은 상기 Sambrook 등 또는 Ausubel 등, Short Protocols in Molecular Biology, Fourth Ed., John Wiley & Sons, Inc., New York, 1999에서 보편적으로 이용 가능하다.

혼성화 조건은 각각의 프로브를 위해 요구되는 바대로 Sambrook 등 및 Ausubel 등의 방법과 같은 공지의 방법을 이용하여 변형할 수 있다. 총 세포성 RNA 또는 폴리A RNA가 농후화된 RNA의 혼성화를 어떠한 이용가능한 형태에서도 수행할 수 있다. 예를 들어, 총 세포성 RNA 또는 폴리A RNA가 농후화된 RNA를 고상 지지체에 고정하고 고상 지지체를 본 발명의 서열의 적어도 하나, 또는 하나의 일부를 포함하는 적어도 하나의 프로브에 프로브가 특이적으로 혼성화하는 조건 하에서 노출시킨다. 다르게는, 본 발명의 서열의 적어도 하나 또는 하나의 일부를 포함하는 핵산 단편을 실리콘 칩, 다공성 유리 웨이퍼 또는 막과 같은 고상 지지체에 고정할 수 있다. 그 후 고상 지지체를 고정된 서열이 특이적으로 혼성화하는 조건 하에서 샘플로부터의 총 세포성 RNA 또는 폴리A RNA에 노출시킬 수 있다. 그러한 고상 지지체 및 혼성화 방법은 예를 들어 Beattie, (1995) WO 95/11755에 개시된 것과 같이 널리 이용 가능하다. 무처리된 세포 집단 및 약제에 노출된 세포 집단의 RNA 샘플에 특이적으로 혼성화하는 특정 프로브의 능력을 조사함으로써, 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 서열을 갖는 단백질을 코딩하는 핵산의 발현을 상향- 또는 하향-조절하는 약제를 동정한다.

또한 mRNA의 정량 및 정성 분석을 위한 혼성화를 RNase 보호 어세이(즉, RPA, Ma 등, (1996) Methods 10:273-238 참조)를 이용하여 수행할 수 있다. 간략하게는, 유전자 산물을 코딩하는 cDNA 및 파지 특이적 DNA 의존적 RNA 중합효소 프로모터(예를 들어, T7, T3 또는 SP6 RNA 중합효소)를 포함하는 발현 비히클을 파지 프로모터 하류, cDNA 분자의 3' 말단에서 선형화하고, 그러한 선형화된 분자를 추후 인 비트로 전사에 의한 cDNA의 표지된 안티센스 전사물의 합성을 위한 주형으로 사용한다. 그 후 표지된 전사물을 80% 포름아미드, 40 mM Pipes, pH 6.4, 0.4 M NaCl 및 1 mM EDTA를 포함하는 완충액 중에서 밤새 45 ℃에서 인큐베이션하여 분리된 RNA의 혼합물(즉, 총 또는 분획화된 mRNA)에 혼성화시킨다. 그 후 생성된 하이브리드를 40 ㎍/㎖ 리보뉴클레아제 A 및 2 ㎍/㎖ 리보뉴클레아제를 포함하는 완충액에서 분해시킨다. 외래 단백질의 불활성화 및 추출 후, 샘플을 분석용 우레아/폴리아크릴아미드 겔 상에 로딩한다.

다른 어세이에서, 본 유전자 산물의 발현에 영향을 미치는 약제를 동정하기 위하여, 본 발명의 유전자 산물을 생리적으로 발현하는 세포 또는 세포주를 먼저 확인한다. 그렇게 동정된 세포 및/또는 세포주는 적절한 표면 전달 기작 및/또는 세포질 캐스케이드와 약제의 외생적 접촉에 관하여 전사 장치의 조절의 정교성이 유지되도록 필요한 세포 기구를 포함하는 것으로 예상된다. 더욱이, 그러한 세포 또는 세포주는 본 유전자 산물에 독특한 하나 이상의 항원성 단편에 융합된 본 유전자 산물을 코딩하는 구조 유전자의 작동 가능한 비-해독 5' 프로모터-함유 말단을 포함하는 발현 비히클(예를 들어, 플라스미드 또는 바이러스 벡터)로 형질도입 또는 형질감염되어, 상기 단편은 상기 프로모터의 전사 조절 하에 있고 분자량이 자연 발생 폴리펩티드와 구별되거나 추가로 면역학적으로 구별되는 태그 또는 다른 검출 가능한 마커를 포함하는 폴리펩티드로서 발현된다. 그러한 방법은 당업계에 잘 알려져 있다(상기 Sambrook 등을 참조).

그 후 상기 개괄한 바와 같은 형질도입 또는 형질감염된 세포 또는 세포주를 적절한 조건 하에서 약제와 접촉시킨다. 예를 들어, 약제학적으로 허용 가능한 부형제 중의 약제를 생리학적 pH의 인산 완충 식염수(PBS), 생리학적 pH의 이글스 평형 염 용액(BSS), PBS 또는 BSS 포함 혈청 또는 PBS 또는 BSS 포함 조절 배지와 같은 수용성 생리학적 완충액 및/또는 37 ℃에서 인큐베이션된 혈청 중의 세포와 접촉시킨다. 상기 조건은 당업자에 의해 필요한 바대로 조절될 수 있다. 세포를 약제와 접촉시킨 후, 세포를 파쇄하고 용균물의 폴리펩티드를 분획하여 폴리펩티드 분획을 풀링하고 면역학적 어세이(예를 들어, ELISA, 면역침전 또는 웨스턴 블랏)에 의해 추가로 가공되는 항체와 접촉시킨다. "약제-접촉된" 샘플로부터 분리된 단백질 풀을 부형제만을 세포와 접촉시킨 대조 샘플과 비교하여 "약제-접촉된" 샘플로부터 면역학적으로 생성된 신호의 증가 또는 감소를 약제의 유효성을 식별하는데 사용한다.

I. 위암 관련 단백질의 수준 또는 적어도 하나의 활성을 조절하는 약제를 동정하는 방법

본 발명의 다른 태양은 서열번호 2, 4, 6, 8, 10, 12 또는 18의 아미노산 서열을 갖는 단백질, Mst1 단백질 또는 서열번호 14의 아미노산 서열을 갖는 단백질과 같은 본 발명의 스플라이스 변이체와 같은 본 발명의 단백질의 수준이나 적어도 하나의 활성을 조절하는 약제를 동정하는 방법을 제공한다. 그러한 방법이나 어세이는 원하는 활성을 모니터링하거나 검출하는 어떠한 수단도 이용할 수 있다.

하나의 형태에서, 비노출된 대조세포 집단과 비교하여 시험하고자 하는 약제에 노출된 세포 집단 간의 본 발명의 단백질의 상대적 양을 어세이할 수 있다. 이 형태에서, 특이적 항체와 같은 프로브를 상이한 세포 집단에서 단백질의 차등 발현을 모니터링하는데 사용한다. 적절한 조건 및 시간 하에서 세포주 또는 집단을 시험하고자 하는 약제에 노출시킨다. 세포 용균물을 노출된 세포주 또는 집단 및 대조, 비노출된 세포주 또는 집단으로부터 제조할 수 있다. 그 후 세포성 용균물을 프로브로 분석한다.

충분한 길이인 경우, 또는 원하거나 면역원성을 증가시키기 위하여 필요한 경우, 적절한 담체에 포접된 본 발명의 펩티드, 폴리펩티드 또는 단백질을 이용하여 적절한 면역화 프로토콜에서 적절한 포유류 숙주를 면역화함으로써 항체 프로브를 제조한다. BSA, KLH 또는 다른 담체 단백질과 같은 담체와의 면역원성 포접체를 제조하는 방법은 당업계에 잘 알려져 있다. 어떤 상황에서는, 예를 들어 카보디이미드 시약을 이용하는 직접적 포접이 효과적이고; 다른 상황에서는, Pierce Chemical Co.(Rockford, IL)에 의해 공급되는 것과 같은 결합 시약이 합텐(hapten)에 대한 접근가능성을 제공하는데 바람직할 수 있다. 합텐 펩티드는 예를 들어 담체에 대한 결합을 용이하게 하기 위하여 시스테인 잔기로 아미노 또는 카복시 말단에서 신장되거나 시스테인 잔기가 중간중간에 존재할 수 있다. 일반적으로 면역원의 투여는 당업계에 일반적으로 이해되고 있는 바와 같이 적당한 애쥬번트를 사용하여 적당한 시간에 걸친 주사에 의해 수행된다. 면역화 일정 동안, 항체 역가를 구해 항체 형성의 적절성을 결정한다.

이러한 방법으로 생산된 폴리클로날 항혈청이 일부 용도에는 만족스러운 한편, 약제학적 조성물로서는, 모노클로날 조제물을 사용하는 것이 바람직하다. 원하는 모노클로날 항체를 분비하는 불멸화된 세포주를 일반적으로 알려진 바와 같이, Kohler와 Milstein의 표준 방법((1975) Nature 256:495497) 또는 림프구 또는 지라 세포의 불멸화를 수행하는 변형 방법을 이용하여 제조할 수 있다. 원하는 항체를 분비하는 불멸화된 세포주를 항원이 펩티드 합텐, 폴리펩티드 또는 단백질인 면역어세이에 의해 스크리닝한다. 원하는 항체를 분비하는 적절한 불멸화 세포 배양물을 동정하면, 세포를 인 비트로 또는 복수액에서의 생산에 의해 배양할 수 있다.

그 후 원하는 모노클로날 항체를 배양 상등액 또는 복수 상등액으로부터 회수한다. 완전한 항체뿐만 아니라 면역학적으로 유의한(항원-결합) 부분을 함유하는 모노클로날 항체의 단편이나 폴리클로날 항혈청을 길항제로서 사용할 수 있다. Fab, Fab', 또는 F(ab')₂ 단편과 같은, 면역학적으로 반응성인(항원-결합) 항체 단편의 사용이 이들 단편이 전체 면역글로불린 보다 덜 면역원적이므로 특히 치료적 차원에서 자주 바람직하다.

또한 항체 또는 항원-결합 단편을 재조합 수단에 의해 현재의 기술을 이용하여 제조할 수 있다. 또한 원하는 부위의 단백질에 특이적으로 결합하는 항체 부위를 인간화 항체와 같은, 다중 종 기원을 갖는 키메라 컨텍스트에서 제조할 수 있다.

상기 방법에서 어세이되는 약제는 무작위로 선별되거나 합리적으로 선별 또는 설계된다. 여기에서는, 본 발명의 단백질 단독 또는 그의 결합된 기질, 결합 상대 등과의 결합에 관여하는 특이적인 서열을 고려하지 않고 무작위로 약제를 선별하였을 때 약제를 무작위적으로 선별하였다고 말한다. 무작위적으로 선별된 약제의 예는 화학적 라이브러리 또는 펩티드 복합 라이브러리, 또는 유기체의 증식 브로쓰를 사용하는 것이다.

여기에서, 표적 부위의 서열 및/또는 약제의 작용과 관련한 그의 형태를 고려하여 비-무작위적 근거로 약제를 선택할 때 약제를 합리적으로 선별 또는 설계하였다고 말한다. 이들 부위를 구성하는 펩티드 서열을 사용하여 약제를 합리적으로 선별하거나 합리적으로 설계할 수 있다. 예를 들어, 합리적으로 선별된 펩티드 약제는 아미노산 서열이 어떠한 기능적 컨센서스 부위와 동일하거나 그의 유도체인 펩티드일 수 있다.

본 발명의 약제는 예를 들어 탄수화물뿐 아니라 펩티드, 소분자, 비타민 유도체일 수 있다. 우성 음성 단백질, 이들 단백질을 코딩하는 DNA, 이들 단백질에 대한 항체, 이들 단백질의 펩티드 단편 또는 이들 단백질의 모방체(mimic)를 세포에 도입하여 기능에 영향을 미칠 수 있다. 본 명세서에서 "모방체"는 모 펩티드와 화학적으로 상이하나 모 펩티드와 형태적 기능적으로 유사한 구조를 제공하기 위하여 펩티드 분자의 하나 또는 몇몇 부위를 변형시킨 것을 가리킨다(참조 Grant, Molecular Biology and Biotechnology, Meyers , ed., pp. 659-664, VCH Publishers, Inc., New York, 1995). 당업자는 본 발명의 약제의 구조적 성질에 관하여 제한이 없음을 쉽게 인식할 수 있을 것이다.

본 발명의 펩티드 약제는 당업계에 알려진 바와 같이, 표준 고상(또는 용액상) 펩티드 합성 방법을 이용하여 제조될 수 있다. 또한, 이들 펩티드를 코딩하는 DNA는 상업적으로 이용가능한 올리고뉴클레오티드 합성 장치를 이용하여 합성되거나 표준 재조합 생산 시스템을 이용하여 재조합적으로 생산될 수 있다. 비-유전자-코딩된 아미노산을 포함하고자 하는 경우 고상 펩티드 합성을 이용한 생산이 필요하다.

또 다른 부류의 본 발명의 약제는 본 발명의 단백질의 결정적인 위치와 면역반응하는 항체이다. 항체 약제는 적당한 포유류 대상을 항원성 부위로서 항체에 의해 표적화하고자 하는 단백질의 부위를 함유하는 펩티드로 면역화시킴으로써 얻어진다.

J. 위암 관련 단백질의 발현 또는 적어도 하나의 활성을 조절하는 약제의 사용

실시예에서 제공되는 바와 같이, 본 발명의 서열번호 2, 4, 6, 8, 10, 12 또는 18의 아미노산 서열을 갖는 단백질, 및 Mst1 또는 서열번호 14의 아미노산 서열을 갖는 단백질과 같은 Mst1 스플라이스 변이체 단백질 및 핵산과 같은, 본 발명의 단백질 및 핵산은 위암 조직에서 차등적으로 발현된다. 작용제 또는 길항제와 같은, 단백질의 발현 또는 단백질의 적어도 하나의 활성을 상향- 또는 하향-조절하거나 변화시키는 약제가 단백질의 기능과 활성 관련된 생물학적 및 병리학적 과정을 조절하는데 사용될 수 있다.

예를 들어, 두 가지 유형의 약물이 Mst1, 서열번호 13 및 14에 관련된 유전자를 통해 작용하는 것으로 나타나 있다(예를 들어, GenBank 등록번호 NM_006282, 핵산 및 단백질 서열이 각각 서열번호 15 및 16으로 주어져 있음). 첫번째로, 골다공증 및 다른 골질환을 치료하는데 사용되는 약물인 비스포스포네이트가 파골세포 상에 직접 작용하여 아폽토시스(apoptosis) 중 Mst1의 캐스파제 절단을 유도하는 것으로 밝혀져 있다. 두번째로, 사이토트리에닌(cytotrienin) A가 백혈병, 유방암 및 폐암을 치료하는데 사용되는 항암 약물이다(미국특허 제6,251,885호). 사이토트리에닌 A는 사이토트리에닌 A-유도된 아폽토시스 중 Mst1을 활성화하는 것으로 밝혀져 있다(Watabe 등, (2000) J Biol Chem 275:8766-8771).

본 명세서에서, 대상은 본 발명의 단백질에 의해 매개된 병리학적 또는 생물학적 과정의 조절이 필요한 한 어떠한 포유동물일 수도 있다. 용어 "포유동물"은 포유류 강에 속하는 개체로 정의된다. 본 발명은 특히 인간 대상을 치료하는데 유용하다.

병리학적 과정은 해로운 영향을 미치는 생물학적 과정의 카테고리를 가리킨다. 예를 들어, 본 발명의 단백질의 발현은 위 세포의 증식이나 과형성과 연관될 수 있다. 본 명세서에서, 약제가 상기 과정의 정도나 중증도를 감소시킬 때 약제는 병리학적 과정을 조절한다고 말한다. 예를 들어, 본 발명의 단백질의 발현이나 적어도 하나의 활성을 상향- 또는 하향- 조절하거나 변화시키는 약제의 투여에 의해 위암을 방지하거나 질병 진행을 조절할 수 있다.

본 발명의 약제는 단독, 또는 특정 병리학적 과정을 조절하는 다른 약제와의 배합물로서 제공될 수 있다. 예를 들어, 본 발명의 약제는 다른 공지된 약물과 병용 투여할 수 있다. 본 명세서에서, 두 약제를 동시에 투여하거나 약제가 동시에 작용하게 하는 방식으로 독립적으로 투여하는 경우 두 약제를 병용 투여한다고 말한다.

본 발명의 약제는 비경구, 피하, 정맥 내, 근육 내, 복강 내, 경피 또는 박칼 경로를 통해 투여될 수 있다. 다르게 또는 동시에, 투여는 경구 투여를 통할 수도 있다. 투여 용량은 수혜자의 연령, 건강, 체중, 병용 치료의 종류, 존재하는 경우, 치료의 빈도, 및 원하는 효과의 성질에 의해 좌우될 것이다.

본 발명은 추가로 본 발명의 단백질 발현 또는 적어도 하나의 활성을 조절하는 하나 이상의 약제를 함유하는 조성물을 제공한다. 개개의 요구는 변화하며, 각 성분의 유효량의 최적 범위의 결정은 당업계의 기술 범위 내에 있다. 전형적인 용량은 0.1 내지 100 ㎍/㎏ 체중을 포함한다. 바람직한 용량은 0.1 내지 10 ㎍/㎏ 체중을 포함한다. 가장 바람직한 용량은 0.1 내지 1 ㎍/㎏ 체중을 포함한다.

약리학적으로 활성인 약제와 함께, 본 발명의 조성물은 활성 화합물의 작용 부위로의 전달을 위해 약제학적으로 사용될 수 있고 활성 화합물의 제제로의 가공을 용이하게 하는 부형제 및 보조제를 포함하는 적당한 약제학적으로 허용되는 담체를 포함할 수 있다. 비경구 투여를 위한 적당한 제제는 수용성 형태, 예를 들어 수용성 염 형태의 활성 화합물의 수용액을 포함한다. 또한, 적절한 오일상 주사 현탁액으로서의 활성 화합물의 현탁액을 투여할 수 있다. 적당한 친유성 용매 또는 비히클은 지방 오일, 예를 들어 참깨유, 합성 지방산 에스테르, 예를 들어 에틸 올레이트 또는 트리글리세라이드를 포함한다. 수성 주사 현탁액은 예를 들어 나트륨 카복시메틸셀룰로스, 솔비톨, 및/또는 덱스트란을 포함하는 현탁액의 점도를 증가시키는 물질을 함유할 수 있다. 임의로, 현탁액은 또한 안정화제를 함유할 수 있다. 리포좀을 또한 약제를 세포로 전달하기 위하여 캡슐화하는데 이용할 수 있다.

본 발명에 따른 전신 투여용 약제학적 제제는 장내, 비경구 또는 국소 투여를 위해 제제화될 수 있다. 실제로, 세 가지 유형의 제제 모두를 동시에 사용하여 활성성분의 전신 투여를 달성할 수 있다.

경구 투여를 위해 적당한 제제는 경질 또는 연질 젤라틴 캡슐, 환제, 코팅정을 비롯한 정제, 엘릭시르, 현탁제, 시럽 또는 흡입제 및 그들의 방출 제어 형태를 포함한다.

본 발명의 방법을 수행하는데 있어서, 본 발명의 화합물은 단독으로 또는 병용하여, 또는 다른 치료 또는 진단제와 병용하여 사용될 수 있다. 특정의 바람직한 태양에서, 본 발명의 화합물은 일반적으로 허용되는 의료 관행에 따라 이들 상태를 위해 전형적으로 처방되는 다른 화합물들과 함께 공동투여될 수 있다. 본 발명의 화합물은 인 비보에서, 보통 인간, 양, 말, 소, 돼지, 개, 고양이, 랫트와 마우스에서, 또는 인 비트로에서 사용될 수 있다.

K. 형질전환 동물

서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 cDNA 서열, 서열번호 2, 4, 6, 8, 10, 12, 14 또는 18의 폴리펩티드 서열을 코딩하는 오픈 리딩 프레임 또는 적어도 약 3, 4, 5, 6, 10, 15, 20, 25, 30, 35개 이상의 아미노산 잔기의 연속된 서열을 갖는 그의 단편에 상응하는 돌연변이, 녹-아웃 또는 변형된 유전자를 함유하는 형질전환 동물 또한 본 발명에 포함된다. 형질전환 동물은 재조합, 외생적 또는 클로닝된 유전물질이 실험적으로 도입된 유전적으로 변형된 동물이다. 이러한 유전물질은 자주 "트랜스진"이라 언급된다. 트랜스진의 핵산 서열, 이 경우 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17 형태는 특정 핵산 서열이 정상적으로는 발견되지 않는 게놈 위치 또는 트랜스진의 정상 위치에 도입될 수 있다. 트랜스진은 표적 동물의 종과 동일하거나 다른 종의 게놈으로부터 유래된 핵산 서열로 구성될 수 있다.

일부 태양에서, 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17을 포함하는 유전자의 전부 또는 일부가 결실된 형질전환 동물이 제작될 수 있다. 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17에 상응하는 유전자가 하나 이상의 인트론을 함유하는 경우, 전체 유전자-모든 엑손, 인트론 및 조절 서열-이 결실될 수 있다. 다르게는, 전체 유전자 보다 작게 결실될 수 있다. 예를 들어, 하나의 엑손 및/또는 인트론을 결실하여, 변형된 형태의 본 발명의 단백질을 발현하는 동물을 창제할 수 있다.

용어 "생식 세포주 형질전환 동물"은 유전자 변형 또는 유전적 정보가 생식 세포주로 도입되어, 형질전환 동물이 유전 정보를 자손에게 전달하는 능력을 갖는 형질전환 동물을 가리킨다. 그러한 자손이 사실 상 그러한 변형 또는 유전 정보의 일부 또는 전부를 갖는다면, 그들 역시 형질전환 동물이다.

변형 또는 유전 정보는 수혜자가 속하는 동물 종에 대해 외래이거나, 특정 수혜자 개체에게만 외래이거나, 수혜자가 이미 소유하고 있는 유전 정보일 수 있다. 마지막의 경우, 변형되거나 도입된 유전자는 원래 유전자와 다르게 발현될 수 있다.

형질전환 동물은 형질감염, 전기천공, 미세주사, 배아 줄기세포에서의 유전자 표적화 및 재조합 바이러스 및 레트로바이러스 감염을 포함한 다양한 상이한 방법에 의해 생산될 수 있다(예를 들어 미국특허 제4,736,866호; 미국특허 제5,602,307호; Mullins 등, (1993) Hypertension 22:630-633; Brenin 등, (1997) Surg Oncol 6:99-110; Recombinant Gene Expression Protocols (Methods in Molecular Biology, Vol. 62), Tuan, ed., Humana Press, Totowa, NJ, 1997).

활성화된 발암유전자 서열을 발현하는 것(미국특허 제4,736,866호); 원숭이 SV40 T-항원을 발현하는 것(미국특허 제5,728,915호); 인터페론 조절인자 1(IRF-1)의 발현이 결여된 것(미국특허 제5,731,490호); 도파민 기능부전을 나타내는 것(미국특허 제5,723,719호); 혈압 조절에 관여하는 적어도 하나의 인간 유전자를 발현하는 것(미국특허 제5,731,489호); 자연적으로 발생하는 알츠하이머 병을 나타내는 상태와 더 큰 유사성을 나타내는 것(미국특허 제5,720,936호); 세포 부착을 매개하는 능력이 감소된 것(미국특허 제5,602,307호); 소 성장호르몬 유전자를 갖는 것(Clutter 등, (1996) Genetics 143:1753-1760); 또는 완전한 인간 항체 반응을 나타낼 수 있는 것(McCarthy (1997) Lancet 349:405)을 포함한 수많은 재조합 또는 형질전환 마우스가 생산되어 왔다.

마우스와 랫트가 대부분의 형질전환 실험에서 선택되는 동물로 남아있는 반면, 일부 경우 다른 동물 종을 사용하는 것이 바람직하거나 필요하기조차 하다. 형질전환 과정이 양, 염소, 돼지, 개, 고양이, 원숭이, 침팬지, 햄스터, 토끼, 소 및 기니아 피그를 비롯한 다양한 비-쥐류 동물에서 성공적으로 사용되어 왔다(예를 들어 Kim 등, (1997) Mol Reprod Dev 46:515-526; Houdebine, (1995) Reprod Nutr Dev 35:609-617; Petters (1994) Reprod Fertil Dev 6:643-645; Schnieke 등, (1997) Science 278:2130-2133; 및 Amoah, (1997) J Animal Science 75:578-585를 참조하라).

핵산 단편을 재조합 가능한 포유류 세포로 도입하는 방법은 다중 핵산 분자의 동시-형질전환을 선호하는 어떠한 방법도 될 수 있다. 형질전환 동물을 생산하는 상세한 과정은 미국특허 제5,489,743호 및 미국특허 제5,602,307호의 개시내용을 비롯하여, 당업자에게 용이하게 이용 가능하다.

L. 진단방법

본 발명의 유전자 및 단백질은 동일한 유형의 비-암성 조직과 비교하여 위암 조직과 다른 악성 신생물에서 차등적으로 발현되므로, 본 발명의 유전자와 단백질을 사용하여 그러한 암을 진단하거나 모니터링하거나 질병 진행을 추적하는데 사용될 수 있다. 본 발명의 핵산 분자 또는 단백질을 이용하여, 위암을 포함한, 암을 진단하는 하나의 수단은 생검 표본과 같은 살아있는 대상으로부터 조직을 얻는 것을 포함한다.

분자생물학적 도구의 사용은 법정 기술에서 보편적인 것이 되었다. 예를 들어, 서열번호 1, 3, 5, 7, 9, 11, 13 또는 17의 서열의 전부 또는 적어도 일부를 포함하는 핵산 프로브를 법정/병리학적 표본에서 핵산 분자의 발현을 결정하는데 사용할 수 있다. 추가로, 전사 프로파일 분석을 수행하는 어떠한 수단에 의해서도 핵산 어세이를 수행할 수 있다. 핵산 분석에 더하여, 본 발명의 법정의학적 방법은 본 발명의 단백질, 특히 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20을 포함하는 단백질을 표적화하여, 유전자의 상향- 또는 하향-조절을 결정할 수 있다(Shiverick 등, (1975) Biochim Biophys Acta 393:124-133).

본 발명의 방법은 조직을 콜라게나제 또는 다른 프로테아제로 처리하여 조직을 세포 용균이 잘 일어나게 하는 것을 포함할 수 있다(Semenov 등, (1987) Biull Eksp Biol Med 104:113-116). 더욱이, 분석을 위하여 위의 상이한 부분으로부터 생검 샘플을 얻는 것이 가능하다.

본 발명의 핵산 또는 단백질 분자를 검출하는 어세이는 어떠한 이용 가능한 형태일 수도 있다. 핵산 분자의 전형적인 어세이는 혼성화 또는 PCR 기초 형태를 포함한다. 본 발명의 단백질, 폴리펩티드 또는 펩티드의 전형적인 어세이는 인 사이츄 결합 어세이 등과 같은 모든 이용 가능한 형태의 항체 프로브의 사용을 포함한다(Harlow & Lane, Antibodies - A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1988 참조). 바람직한 태양에서, 어세이를 적절한 조절 하에 수행한다.

상기 방법은 또한 다른 조직 또는 기관, 예를 들어 본 발명의 핵산 분자의 발현이 검출되는 조직에서 질병 상태를 탐지하는 프로토콜 및 방법을 포함한 다른 진단 프로토콜에 사용될 수 있다.

추가의 기재 없이, 상기 기재 및 하기 예시적 실시예를 이용하여, 당업계에서 통상적 기술을 가진 자는 본 발명의 화합물을 제조하고 이용하고, 청구된 방법을 수행할 수 있을 것으로 믿는다. 따라서 하기 실시예는 본 발명의 바람직한 태양을 구체적으로 나타내지만, 나머지 개시내용을 어떤 식으로든지 제한하는 것으로 해석되어서는 안 된다.

본 발명은 정상 조직과 비교하여 진행성 위암(AGC) 및 다른 악성 신생물에서 차등적으로 발현되는 새로운 유전자 훼밀리의 발견에 기초한 것이다. 본 발명은 서열번호 3, 5, 7, 9, 11, 13, 17 또는 19를 포함하는 분리된 핵산 분자; 서열번호 4, 14 또는 18의 아미노산 서열을 코딩하는 분리된 핵산 분자; 서열번호 3 또는 17의 전체 길이에 걸쳐 적어도 약 92%의 핵산 서열 상동성을 나타내고 위암에서 발현되는 단백질을 코딩하는 분리된 핵산 분자, 서열번호 13의 전체 길이에 걸쳐 적어도 약 95%의 뉴클레오티드 서열 상동성을 나타내고 위암에서 발현되는 단백질을 코딩하는 분리된 핵산 분자, 및 상기 핵산 분자 중 어느 것의 상보물을 포함하는 분리된 핵산 분자를 포함한다.

본 발명은 추가로 분리된 핵산 분자를 포함하는 벡터를 포함하는, 하나 이상의 발현 조절 요소에 작동 가능하도록 연결된 핵산 분자를 포함한다. 본 발명은 추가로 본 발명의 핵산 분자를 함유하도록 형질전환된 숙주 세포 및 본 발명의 핵산 분자로 형질전환된 숙주 세포를 단백질이 발현되는 조건 하에서 배양하는 단계를 포함하는 단백질 제조방법을 포함한다.

본 발명은 추가로 서열번호 4, 6, 8, 10, 12, 14 또는 18의 아미노산 서열을 포함하는 분리된 폴리펩티드, 서열번호 6, 8, 10 또는 12의 적어도 10개의 아미노산을 포함하는 분리된 폴리펩티드, 서열번호 6, 8, 10 또는 12의 보존적 아미노산 치환을 포함하는 분리된 폴리펩티드, 및 서열번호 6, 8, 10 또는 12의 자연 발생 아미노산 서열 변이체를 포함하는 분리된 폴리펩티드로 구성된 그룹으로부터 선택되는 분리된 폴리펩티드를 제공한다. 본 발명의 폴리펩티드는 또한 서열번호 4의 서열과 적어도 약 90%의 아미노산 서열 상동성, 바람직하게는 서열번호 4의 서열과 적어도 약 92-95%, 보다 바람직하게는 적어도 약 95-98%의 서열 상동성을 갖는 아미노산 서열을 갖는 폴리펩티드를 포함하다. 본 발명의 폴리펩티드는 또한 서열번호 6, 8, 10 또는 12의 서열과 적어도 약 50%, 60%, 70% 또는 75%의 아미노산 서열 상동성, 바람직하게는 서열번호 6, 8, 10 또는 12의 서열과 적어도 약 80%, 보다 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98%의 서열 상동성을 갖는 폴리펩티드를 포함한다. 본 발명의 폴리펩티드는 또한 서열번호 14 및 서열번호 18에 나타낸 서열과 각각 적어도 약 95% 및 약 92%의 아미노산 서열 상동성을 갖는 아미노산 서열을 갖는 폴리펩티드를 포함한다.

본 발명은 추가로 모노클로날 및 폴리클로날 항체를 포함하여, 본 발명의 폴리펩티드와 특이적으로 결합하는 분리된 항체 또는 항원-결합 항체 단편을 제공한다.

본 발명은 추가로 핵산 분자를 발현하는 세포를 약제에 노출시키고; 약제가 상기 핵산 분자의 발현을 조절하는지 여부를 결정하여 단백질을 코딩하는 핵산 분자의 발현을 조절하는 약제를 동정하는 것을 포함하는 본 발명의 단백질을 코딩하는 핵산 분자의 발현을 조절하는 약제를 동정하는 방법을 제공한다.

본 발명은 추가로 단백질을 발현하는 세포를 약제에 노출시키고; 약제가 상기 단백질의 수준이나 적어도 하나의 활성을 조절하는지 여부를 결정하여, 단백질의 수준이나 적어도 하나의 활성을 조절하는 약제를 동정하는 것을 포함하는, 본 발명의 단백질의 수준이나 하나 이상의 활성을 조절하는 약제를 동정하는 방법을 제공한다.

본 발명은 추가로 단백질을 가능한 결합 상대에 노출시키고; 가능한 결합 상대가 상기 단백질과 결합하는지 여부를 결정하여, 단백질의 결합 상대를 동정하는 단계를 포함하는, 본 발명의 단백질의 결합 상대를 동정하는 방법을 제공한다.

본 발명은 추가로 단백질을 코딩하는 핵산 분자의 발현을 조절하는 유효량의 약제를 투여하는 단계를 포함하는, 본 발명의 단백질을 코딩하는 핵산 분자의 발현을 조절하는 방법을 제공한다. 본 발명은 또한 본 발명의 단백질의 적어도 하나의 활성을 조절하는 유효량의 약제를 투여하는 단계를 포함하는, 본 발명의 단백질의 적어도 하나의 활성을 조절하는 방법을 제공한다.

본 발명을 추가로 본 발명의 핵산 분자를 함유하도록 변형된 비인간 형질전환 동물, 또는 본 발명의 코딩된 폴리펩티드의 발현이 방지되도록 돌연변이된 핵산 분자를 함유하도록 변형된 비인간 형질전환 동물을 포함한다.

본 발명은 또한 서열번호 3, 5, 7, 9, 11, 13 또는 17의 전부 또는 일부를 포함하는 유전자의 전부 또는 일부가 녹아웃(knocked out)되거나 동물 게놈으로부터 결실된 비인간 형질전환 동물을 포함한다.

본 발명은 추가로 대상으로부터 조직, 혈액, 뇨 또는 기타 샘플을 얻고, 본 발명의 핵산 분자나 본 발명의 폴리펩티드의 발현 수준을 결정하는 단계를 포함하는, 위암 또는 기타 악성 신생물을 진단하는 방법을 제공한다.

본 발명은 추가로 희석제 및 서열번호 4, 6, 8, 10, 12, 14 또는 18의 아미노산 서열을 포함하는 분리된 폴리펩티드, 서열번호 4의 서열과 적어도 약 90%의 아미노산 서열 상동성, 바람직하게는 서열번호 4의 서열과 적어도 약 92-95%, 보다 바람직하게는 적어도 약 95-98%의 서열 상동성을 갖는 아미노산 서열을 갖는 분리된 폴리펩티드, 서열번호 6, 8, 10 또는 12의 적어도 10개의 아미노산 단편을 포함하는 분리된 폴리펩티드, 서열번호 6, 8, 10 또는 12의 자연적으로 발생하는 아미노산 서열 변이체, 서열번호 6, 8, 10 또는 12의 서열과 적어도 약 50%, 60%, 70% 또는 75%의 아미노산 서열 상동성, 바람직하게는 서열번호 6, 8, 10 또는 12의 서열과 적어도 약 80%, 보다 바람직하게는 적어도 약 90-95%, 가장 바람직하게는 적어도 약 95-98% 서열 상동성을 갖는 아미노산 서열을 갖는 분리된 폴리펩티드, 서열번호 14의 서열과 적어도 약 95%의 아미노산 서열 상동성을 갖는 분리된 폴리펩티드, 또는 서열번호 18의 서열과 적어도 약 92%의 아미노산 서열 상동성을 갖는 분리된 폴리펩티드로 구성된 그룹으로부터 선택되는 폴리펩티드 또는 단백질을 포함하는 조성물을 포함한다.

실시예 1a

진행성 위암에서 차등 발현되는 mRNA 의 동정

재료 및 방법

환자 조직 샘플은 진행성 위암으로 진단된 47 내지 68세의, 4명의 남자와 1명의 여자를 포함한, 5명의 한국인 환자로부터 유래되었다. 각각의 환자에 대하여, 조직을 위의 두 부분, 위암 및 암이 없는 부분으로부터 얻어 한 세트의 생검 샘플을 만들었다. 각각의 조직 샘플의 조직학적 분석을 수행하고, 샘플을 비-종양 및 종양 카테고리로 분리하였다.

약간의 변형과 함께, 샘플 제조 프로토콜은 아피메트릭스 유전자칩(Affymetrix GeneChip) 발현 분석 매뉴얼을 따랐다. 먼저 동결 조직을 스펙스 센트리프랩(Spex Certiprep) 6800 프리저 밀(Freezer Mill)을 이용하여 분말로 분쇄하였다. 그 후 총 RNA를 트리졸(Life Technologies)을 사용하여 추출하였다. 각 샘플의 총 RNA 수율(평균 조직 중량 300 ㎎)은 200-500 ㎍이었다. 다음으로, mRNA를 올리고텍스 mRNA 미디 키트(Oligotex mRNA Midi kit)(Qiagen)를 이용하여 분리하였다. mRNA를 최종 부피 400 ㎕로 용출하였으므로, 에탄올 침전 단계가 농도를 1 ㎍/㎕로 하는데 필요하였다. 1-5 ㎍의 mRNA를 이용하여, 이본쇄 cDNA를 슈퍼스크립트 초이스 시스템(SuperScript Choice system)(Gibco-BRL)을 이용하여 만들었다. 제1쇄 cDNA 합성을 T7-(dT₂₄) 올리고뉴클레오티드로 프라이밍하였다. 그 후 cDNA를 페놀-클로로포름 추출하고 최종 농도 1 ㎍/㎕로 에탄올 침전하였다.

2 ㎍/㎕의 cDNA로부터, cRNA를 표준 과정에 따라 합성하였다. cRNA를 바이오틴 표지하기 위하여, 뉴클레오티드 Bio-11-CTP 및 Bio-16-UTP(Enzo Diagnostics)를 반응에 첨가하였다. 37 ℃에서 6 시간 인큐베이션한 후, 표지된 cRNA를 RNeasy 미니 키트 프로토콜(Qiagen)에 따라 세정하였다. 그 후 cRNA를 94 ℃에서 35 분간 단편화하였다(5×단편화 완충액: 200 mM 트리스-아세테이트(pH 8.1), 500 mM KOAc, 150 mM MgOAc).

55 ㎍의 단편화된 cRNA를 45 ℃ 혼성화 오븐에서 60 rpm으로 24 시간 동안 아피메트릭스 인간 게놈 U95 및 U133 세트 어레이 상에서 혼성화하였다. 칩을 세척하고 아피메트릭스 플루이딕스 스테이션즈(Affymetrix fluidics stations)에서 스트렙타비딘 파이코에리트린(SAPE)(Molecular Probes)으로 염색하였다. 염색을 증폭하기 위하여, SAPE 용액을 염색 단계 중간에 항-스트렙타비딘 바이오틴화된 항체(Vector Laboratories)와 함께 첨가하였다. 프로브 어레이에 대한 혼성화를 플루오메트릭 스캐닝(Hewlett Packard Gene Array Scanner)에 의해 검출하였다. 혼성화와 스캐닝에 이어서, 마이크로어레이 영상을 품질 관리를 위해 분석하여, 혼성화 신호에서 주요 칩 결함 또는 이상을 찾았다. 모든 칩이 QC를 통과한 후, 데이터를 U95에 대해 아피메트릭스 마이크로어레이 스위트(v4.0), 및 LIMS(v1.5) 또는 U133에 대해 아피메트릭스 마이크로어레이 스위트(v5.0), 및 LIMS(v3.0)을 사용하여 분석하였다.

종양 및 비종양 위 샘플 간의 유전자의 차등 발현을 하기 통계학적 방법을 사용하여 아피메트릭스 인간 유전자칩 세트, U95 및 U133을 이용하여 결정하였다. (1) 각각의 유전자에 대하여, U95에 대한 아피메트릭스 유전자칩 평균 차이를 각각의 유전자칩 요소에 대해 "부재"(=미검출), "존재"(=검출) 또는 "경계"(=부재인지 존재인지 불명확함) 콜을 만드는 아피메트릭스 마이크로어레이 스위트(v4.0)에 의해 결정하였다. U133에 대한 신호 값을 부재, 존재 또는 경계 콜을 만드는 아피메트릭스 마이크로어레이 스위트(v5.0)에 의해 결정하였다. (2) 종양 및 비종양 위 샘플 모두에서 적어도 10%의 존재 콜 및 종양 또는 비종양 위 샘플 그룹에서 적어도 40%의 존재 콜의 기준을 이용하여, 유전자 세트를 추가 분석을 위해 선별하였다. (3) U95 데이터의 평균 차이 값에 기초하여, 유전자 세트를 고발현 그룹과 저발현 그룹의 두 그룹으로 나누었다. 고발현 그룹은 종양 및 비종양 샘플 모두에서 5 이상의 평균 차이 값을 갖는 유전자를 포함하였다. 나머지 유전자는 저발현 그룹에 포함되었다. 평균 차이 값을 고발현 그룹에 대해서는 로그 스케일로 변환하였지만, 저발현 그룹에 대해서는 변환하지 않았다. U133 데이터에 대해서는, 모든 신호값을 발현 수준을 불문하고 로그 스케일로 변환시켰다. (4) 분산 분석(ANOVA) 방법을 데이터 분석을 위해 사용하였다(Steel 등, Principles and Procedures of Statistics: A Biometrical Approach, Third Ed., McGraw-Hill, 1997). 최종 분석 전에, 리브-원-아웃(leave-one-out) 접근법을 극단치 검출을 위해 사용하였다. 어느 시간에 하나의 샘플을 ANOVA 분석에서 제외하여 분석으로부터 특정 샘플의 제거가 최종 결과에 유의한 영향을 미치는지 여부를 결정하였다. 그렇다면, 그 특정 샘플을 최종 분석으로부터 제외하였다. 극단치 검출 후, 0.05 이하의 p-값으로 차등 발현되는 유전자 리스트를 ANOVA에 의해 작성하였다. 아피메트릭스 유전자칩 U133 칩 세트로부터의 데이터를 유사한 과정으로 분석하였다. (5) 두 개의 부가적인 기준을 U95로부터 만들어진 유전자 리스트에서 유전자 수를 감소시키기 위해 사용하였다. 먼저, 기하평균값을 비종양 대조 그룹 샘플과 종양 질환 그룹 샘플 간에 비교하여 발현 수준에서 적어도 2.0-배 증가 또는 감소를 나타내는 유전자 세트를 얻었다. 두번째, 변화 배수와 p-값의 비율은 400 이상이어야 한다.

결과 및 분석

a) LBFL301 유전자 훼밀리:

칩 데이터의 분석 결과 정상 위 조직으로부터의 샘플과 비교하여 위암 샘플에서 마커 LBFL301의 발현이 유의하게 상향-조절되는 것으로 나타났다(13.75-배; p=0.0172). 이들 결과는 LBFL301의 상향-조절이 위암을 진단할 수 있음을 나타낸다.

LBFL301(서열번호 1 또는 3)의 발현 수준은 각각 아피메트릭스 GeneChips™ U95 및 U133 상의 칩 서열 단편번호 48774_at 및 225681_at에 의해 측정할 수 있다. 정상 대조 조직과 비교한 다양한 악성 신생물에서의 48774_at 및 225681_at의 발현 수준을 변화 배수와 변화의 방향(상향- 또는 하향-조절)도 표시되어 있는 표 1a에 나타내었다. 1.5 초과의 변화 배수가 유의한 것으로 간주되었다.

표 1a

Affy ID	조직	질병	형태	변화배수	방향	T-통계
48774_at	뼈, NOS	뼈 악성신생물, NOS	뼈의 거대세포 암, NOS	5.7	상향	3.5
225681_at	유방, NOS	여성 유방 악성 신생물, NOS	침윤성 관 암	3.4	상향	12.1
225681_at			침윤성 관 및 소엽 암	3.3	상향	3.3
225681_at			침윤성 소엽 암	2.8	상향	5.3
225681_at	자궁경부,NOS	자궁경부 악성 신생물	편평상피세포암, NOS	3.6	상향	3.4
225681_at	결장, NOS	결장 악성 신생물, NOS	점액선암	12.7	상향	2.5
225681_at	결장, NOS	결장 악성 신생물, NOS	선암, NOS	6.9	상향	7.9
225681_at	자궁내막, NOS	자궁내막 악성 신생물	뮐러 혼합 종양	11.0	상향	5.5
225681_at	자궁내막, NOS	자궁내막 악성 신생물	선암, NOS	2.2	상향	3.7
225681_at	식도, NOS	식도 악성 신생물, NOS	선암, NOS	7.2	상향	3.6
225681_at	신장, NOS	신장 악성 신생물, NOS	투명세포 선암, NOS	9.8	상향	5.4
225681_at	신장, NOS	신장 악성 신생물, NOS	윌름 종양	7.2	상향	3.4
225681_at	후두, NOS	후두 악성 신생물, NOS	편평상피세포암, NOS	6.6	상향	4.3
225681_at	간, NOS	간 이차 악성 신생물, NOS	선암, NOS	12.4	상향	3.5
225681_at	폐, NOS	폐 악성 신생물, NOS	편평상피세포암, NOS	5.4	상향	5.4
225681_at	폐, NOS	폐 악성 신생물, NOS	선암, NOS	4.4	상향	5.1
225681_at	림프절, NOS	림프절 이차 악성 신생물, NOS	편평상피세포암, NOS	4.1	상향	2.7
225681_at	림프절, NOS	림프 및 대식세포 조직 악성 신생물, NOS	악성 림프종, NOS	-4.3	하향	-3.2
225681_at	대망, NOS	대망 악성 신생물	유두 장액성 선암	7.2	상향	4.1
225681_at		대망 이차 악성 신생물	유두 장액성 선암	4.8	상향	4.3
225681_at		대망 이차 악성 신생물	뮐러 혼합 종양	4.7	상향	11.0
225681_at	난소, NOS	난소 악성 신생물	선암, NOS	13.8	상향	2.6
225681_at		난소 악성 신생물	장액성 낭선암, NOS	10.7	상향	2.8
225681_at		난소 불특정 반응의 신생물	난소갑상선종, NOS	9.5	상향	6.4
225681_at		난소 악성 신생물	유두 장액성 선암	7.7	상향	3.7
225681_at		난소 이차 악성 신생물	선암, NOS	6.9	상향	3.7
225681_at		난소 불특정 반응의 신생물	점액성 낭종, 경계영역 악성 종양	5.3	상향	7.2
225681_at	췌장, NOS	췌장 악성 신생물, NOS	선암, NOS	7.8	상향	9.3
225681_at	직장, NOS	직장 악성 신생물	선암, NOS	7.7	상향	5.8

표 1a

Affy ID	조직	질병	형태	변화배수	방향	T-통계
225681_at	연질조직, NOS	결합 및 기타 연질조직 불특정 반응의 신생물, NOS	섬유종증, NOS	12.5	상향	7.6
225681_at		결합 및 기타 연질조직의 이차 악성 신생물, NOS	편평상피세포암, NOS	5.3	상향	3.2
225681_at		결합 및 기타 연질조직의 악성 신생물, NOS	섬유종증, 악성	3.7	상향	3.1
225681_at	위, NOS	위 악성 신생물, NOS	선암, NOS	3.6	상향	3.5
225681_at	위, NOS	위 악성 신생물, NOS	반지모양 세포암	3.5	상향	4.5
225681_at	갑상선, NOS	갑상선 악성 신생물	유두암, NOS	4.5	상향	4.1

표 2는 조직 유형에 의한 아피메트릭스 유전자칩을 이용한 실험으로부터 수집된 차등 발현 데이터를 요약한 것이다. 칩을 스캐닝하고 모두 명칭이 "An Automated Computer-based Algorithm for Organizing and Mining Gene Expression Data Derived from Biological Samples with Complex Clinical Attributes"이고 모두 본 명세서에 참조로서 인용되는 관련된 출원 60/331,182, 60/388,745 및 60/390,608에 기재되어 있는 GX 스캔 알고리즘에 의해 데이터를 분석하였다.

표 2- LBFL301(U95: 48774_at, U133: 225681_at): 클론 AD12 & CH4

	U95 데이터로부터의 48774_at	U133 데이터로부터의 225681_at
1. 뼈	상향	-
2. 유방	상향	상향
3. 자궁경부	상향	상향
4. 결장	상향	상향
5. 자궁내막	상향	상향
6. 식도	상향	상향
7. 신장	상향	상향
8. 후두	상향	상향
9. 간	상향	상향
10. 폐	상향	상향
11. 대망	상향	상향
12. 난소	상향	상향
13. 췌장	상향	상향
14. 직장	상향	상향
15. 연질조직	상향	상향
16. 위	상향	상향
17. 갑상선	상향	상향

칩 서열 단편번호 48774_at에 대한 샘플 결합에 의해 결정되는 유전자칩 발현결과를 Taqman™ 어세이(Perkin-Elmer)를 이용하는 정량적 RT-PCR에 의해 검증하였다. 특정 아피메트릭스 단편(48774_at)의 sif 서열로부터 설계된 PCR 프라이머를 어세이에 사용하였다. 각각의 RNA 샘플의 표적 유전자(10 ng의 총 RNA)를 외생적으로 스파이크된 참조 유전자에 상대적으로 어세이하였다. 이 목적을 위하여, 테트라사이클린 내성 유전자를 외생적으로 첨가된 스파이크로 사용하였다. 이 접근법은 일정한 양의 Tet 스파이크 사이클 역치(Ct) 값에 대해 상대적인 표적 mRNA의 Ct 값에 의해 측정되는 상대적 발현을 제공한다. 이 샘플 패널은 U95 유전자칩 상에서의 정상 및 진행성 위암 조직 RNA를 포함하였다. 또한, 유전자칩 상에서 분석되지 않는 몇몇 새로운 샘플을 정량적 RT-PCR에 의한 발현 검증을 위해 사용하였다. Q-RT-PCR 데이터는 진행성 위암에서 관찰된 LBFL301의 상향-조절을 확인시켜준다.

b) LBFL304 유전자 훼밀리:

칩 데이터의 분석 결과 마커 LBFL304의 발현이 정상 위 조직으로부터의 샘플과 비교하여 AGC 샘플에서 유의적으로 상향-조절되는 것으로 나타났다(U95에 대해 3.5-배, p=2.54×10^-3; U133에 대해 6.13-배, p=2.43×10^-4). 이 데이터는 LBFL304의 상향-조절이 위암을 진단할 수 있음을 나타낸다.

LBFL304(서열번호 5, 7, 9 또는 11)의 발현 수준을 아피메트릭스 GeneChips ™ U95 상의 칩 서열 단편번호 35832_at 및 아피메트릭스 GeneChips™ U133 상의 212344_at, 212353_at, 및 212354_at에 의해 측정할 수 있다. 정상 대조 조직과 비교한 다양한 악성 신생물에서의 51263_at, 212344_at, 212353_at, 및 212354_at의 발현 수준을 변화 배수와 변화의 방향(상향- 및 하향-조절) 역시 표시되어 있는 표 1b에 나타내었다. 1.5 초과의 변화 배수가 유의한 것으로 간주되었다.

칩 서열 단편번호 35832_at 에 대한 샘플 결합에 의해 결정되는, GeneChip 발현결과를 Taqman™ 어세이(Perkin-Elmer)를 이용하는 정량적 RT-PCR(Q-RT-PCR)에 의해 검증하였다. 특정 아피메트릭스 단편(35832_at)의 서열 정보 파일로부터 설계된 PCR 프라이머를 어세이에 사용하였다. 각각의 RNA 샘플(10 ng의 총 RNA)의 표적 유전자를 외생적으로 스파이크된 참조 유전자에 대해 상대적으로 어세이하였다. 이 목적을 위하여, 테트라사이클린 내성 유전자를 외생적으로 첨가되는 스파이크로 사용하였다. 이 접근법은 일정량의 Tet 스파이크 사이클 역치(Ct)에 대한 표적 mRNA의 Ct 값에 의해 측정되는 상대적 발현을 제공한다. 샘플 패널은 U95 GeneChips 상에서 분석된 정상 위(정상) 및 진행성 위암(AGC) 조직 RNA를 포함하였다. 또한, GeneChip 상에서 분석되지 않은 몇몇 새로운 샘플을 Q-RT-PCR에 의한 발현 검증을 위해 사용하였다. Q-RT-PCR 데이터는 정상 위 생검 샘플에 비하여 AGC에서 관찰된 LBFL304의 상향-조절을 확인시켜준다.

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212344_at	뼈, NOS	뼈 악성 신생물, NOS	뼈 거대세포암, NOS	6.8	상향	6.9
212353_at		뼈 악성 신생물, NOS	뼈 거대세포암, NOS	5.5	상향	5.7
212354_at		뼈 악성 신생물, NOS	뼈 거대세포암, NOS	5.9	상향	7.1
35832_at		뼈 악성 신생물, NOS	뼈 거대세포암, NOS	10.6	상향	5.7
212344_at	결장, NOS	결장 악성 신생물, NOS	점액성 선암	3.7	상향	2.8
212344_at		결장 악성 신생물, NOS	선암, NOS	2.7	상향	7.9
212353_at		결장 악성 신생물, NOS	점액성 선암	5.7	상향	3.7
212353_at		결장 악성 신생물, NOS	선암, NOS	4.1	상향	9.0
212354_at		결장 악성 신생물, NOS	점액성 선암	4.7	상향	3.5
212354_at		결장 악성 신생물, NOS	선암, NOS	3.0	상향	8.6
35832_at		결장 악성 신생물, NOS	점액성 선암	9.4	상향	3.8
35832_at		결장 악성 신생물, NOS	선암, NOS	6.5	상향	10.2

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212344_at	연질조직, NOS	결합 및 기타 연질조직 악성 신생물, NOS	섬유종증, 악성	2.7	상향	3.2
212353_at		결합 및 기타 연질조직 악성 신생물, NOS	섬유종증, 악성	2.1	상향	2.2
212353_at		결합 및 기타 연질조직 악성 신생물, NOS	점액양 지방육종	-2.7	하향	-2.4
212354_at		결합 및 기타 연질조직 악성 신생물, NOS	섬유종증, 악성	2.2	상향	2.6
35832_at		결합 및 기타 연질조직 악성 신생물, NOS	섬유종증, 악성	3.5	상향	2.6
35832_at		결합 및 기타 연질조직 악성 신생물, NOS	지방육종, NOS	4.8	상향	2.6
212344_at	자궁내막, NOS	자궁내막 악성 신생물	뮐러 혼합 종양	2.4	상향	3.3
212344_at		자궁내막 악성 신생물	선암, NOS	2.2	상향	5.5
212353_at		자궁내막 악성 신생물	뮐러 혼합 종양	1.9	상향	2.9
212353_at		자궁내막 악성 신생물	선암, NOS	2.0	상향	4.2

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212354_at		자궁내막 악성 신생물	뮐러 혼합 종양	2.0	상향	2.7
212354_at		자궁내막 악성 신생물	선암, NOS	1.9	상향	4.7
35832_at		자궁내막 악성 신생물	뮐러 혼합 종양	3.0	상향	3.9
35832_at		자궁내막 악성 신생물	선암, NOS	2.4	상향	4.7
212344_at	식도, NOS	식도 악성 신생물, NOS	선암, NOS	1.7	상향	2.3
212353_at		식도 악성 신생물, NOS	선암, NOS	5.5	상향	3.2
212354_at		식도 악성 신생물, NOS	선암, NOS	2.9	상향	3.1
35832_at		식도 악성 신생물, NOS	선암, NOS	10.7	상향	3.2
212344_at	유방, NOS	여성 유방 악성 신생물, NOS	점액성 선암	3.3	상향	4.8
212344_at		여성 유방 악성 신생물, NOS	침윤성 소엽 암	1.6	상향	2.9
212344_at		여성 유방 악성 신생물, NOS	침윤성 관 암	2.5	상향	8.7
212344_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	2.6	상향	2.8
212353_at		여성 유방 악성 신생물, NOS	침윤성 소엽 암	2.8	상향	4.7

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212353_at		여성 유방 악성 신생물, NOS	침윤성 관 암	3.9	상향	13.0
212353_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	3.4	상향	3.7
212354_at		여성 유방 악성 신생물, NOS	침윤성 소엽 암	1.7	상향	3.1
212354_at		여성 유방 악성 신생물, NOS	침윤성 관 암	2.6	상향	8.5
212354_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	2.7	상향	2.6
35832_at		여성 유방 악성 신생물, NOS	점액성 선암	4.0	상향	5.5
35832_at		여성 유방 악성 신생물, NOS	침윤성 소엽 암	3.2	상향	4.4
35832_at		여성 유방 악성 신생물, NOS	침윤성 관 암	4.5	상향	12.0
35832_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	4.3	상향	4.5
212353_at	신장, NOS	신장 악성 신생물, NOS	투명세포 선암, NOS	2.8	상향	5.5
212354_at		신장 악성 신생물, NOS	투명세포 선암, NOS	2.4	상향	5.3
35832_at		신장 악성 신생물, NOS	투명세포 선암, NOS	6.1	상향	5.6
212344_at	후두, NOS	후두 악성 신생물, NOS	편평상피세포암, NOS	3.0	상향	3.3

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212353_at		후두 악성 신생물, NOS	편평상피세포암, NOS	5.1	상향	3.8
212354_at		후두 악성 신생물, NOS	편평상피세포암, NOS	3.7	상향	3.6
35832_at		후두 악성 신생물, NOS	편평상피세포암, NOS	7.2	상향	3.7
212344_at	폐, NOS	폐 악성 신생물, NOS	선암, NOS	4.1	상향	3.9
212344_at		폐 악성 신생물, NOS	편평상피세포암, NOS	3.1	상향	5.8
212344_at		폐 악성 신생물, NOS	대세포암, NOS	2.7	상향	2.5
212344_at		폐 악성 신생물, NOS	선암, NOS	2.8	상향	6.2
212353_at		폐 악성 신생물, NOS	암종, NOS	4.1	상향	3.2
212353_at		폐 악성 신생물, NOS	편평상피세포암, NOS	3.6	상향	6.5
212353_at		폐 악성 신생물, NOS	대세포암, NOS	3.8	상향	2.7
212353_at		폐 악성 신생물, NOS	선암, NOS	3.6	상향	6.9
212354_at		폐 악성 신생물, NOS	암종, NOS	3.5	상향	2.9
212354_at		폐 악성 신생물, NOS	편평상피세포암, NOS	3.1	상향	5.6

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212354_at		폐 악성 신생물, NOS	대세포암, NOS	2.9	상향	2.6
212354_at		폐 악성 신생물, NOS	선암, NOS	2.9	상향	6.2
35832_at		폐 악성 신생물, NOS	편평상피세포암, NOS	8.8	상향	6.0
35832_at		폐 악성 신생물, NOS	선암, NOS	8.9	상향	7.2
212344_at	난소, NOS	난소 악성 신생물	유두 장액성 선암	3.0	상향	3.9
212353_at		난소 악성 신생물	유두 장액성 선암	3.6	상향	3.9
212354_at		난소 악성 신생물	유두 장액성 선암	2.6	상향	3.4
212344_at	췌장, NOS	췌장 악성 신생물, NOS	선암, NOS	6.9	상향	9.0
212353_at		췌장 악성 신생물, NOS	선암, NOS	7.8	상향	11.2
212354_at		췌장 악성 신생물, NOS	선암, NOS	8.6	상향	11.0
35832_at		췌장 악성 신생물, NOS	선암, NOS	99.8	상향	11.1
212353_at	전립선, NOS	전립선 악성 신생물	악성 의심 이형성	-2.2	하향	-4.7
212353_at	전립선, NOS	전립선 악성 신생물	선암, NOS	-1.5	하향	-2.5

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212354_at		전립선 악성 신생물	악성 의심 이형성	-1.8	하향	-3.8
212354_at		전립선 악성 신생물	선암, NOS	-1.7	하향	-3.8
35832_at		전립선 악성 신생물	악성 의심 이형성	-4.3	하향	-4.4
35832_at		전립선 악성 신생물	선암, NOS	-1.7	하향	-2.6
212344_at	직장, NOS	직장 악성 신생물	선암, NOS	3.0	상향	6.9
212353_at		직장 악성 신생물	선암, NOS	4.1	상향	7.6
212354_at		직장 악성 신생물	선암, NOS	3.0	상향	7.2
35832_at		직장 악성 신생물	선암, NOS	5.4	상향	8.8
212344_at	피부, NOS	피부 악성 신생물, NOS	편평상피세포암, NOS	2.8	상향	2.4
212353_at		피부 악성 신생물, NOS	편평상피세포암, NOS	3.5	상향	2.4
35832_at		피부 악성 신생물, NOS	기저세포암, NOS	3.6	상향	2.5
35832_at		피부 악성 신생물, NOS	편평상피세포암, NOS	5.5	상향	3.0
212344_at	위, NOS	위 악성 신생물, NOS	점액성 선암	7.6	상향	3.1

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212344_at		위 악성 신생물, NOS	반지모양 세포암	3.9	상향	2.4
212344_at		위 악성 신생물, NOS	선암, NOS	2.5	상향	4.9
212353_at		위 악성 신생물, NOS	점액성 선암	11.0	상향	3.7
212353_at		위 악성 신생물, NOS	반지모양 세포암	4.9	상향	2.9
212353_at		위 악성 신생물, NOS	선암, NOS	3.4	상향	5.6
212354_at		위 악성 신생물, NOS	점액성 선암	7.5	상향	3.2
212354_at		위 악성 신생물, NOS	반지모양 세포암	3.7	상향	2.4
212354_at		위 악성 신생물, NOS	선암, NOS	2.7	상향	5.1
35832_at		위 악성 신생물, NOS	반지모양 세포암	8.4	상향	3.4
35832_at		위 악성 신생물, NOS	선암, NOS	8.6	상향	6.7
212344_at	고환, NOS	고환 악성 신생물, NOS	혼합 생식세포암	2.0	상향	2.4
212353_at		고환 악성 신생물, NOS	혼합 생식세포암	4.1	상향	2.8
212354_at		고환 악성 신생물, NOS	혼합 생식세포암	3.4	상향	2.6

표 1b

표 1
Affy ID	조직	질병	형태	변화배수	방향	T-통계
212353_at	대망, NOS	대망 악성 신생물	유두 장액성 선암	1.7	상향	2.6
35832_at	갑상선, NOS	갑상선 악성 신생물	유두암, NOS	2.5	상향	2.5
35832_at	자궁경부, NOS	자궁경부 악성 신생물	편평상피세포암, NOS	3.5	상향	2.3

c) LBFL305 유전자 훼밀리:

칩 데이터의 분석 결과 정상 위 조직으로부터의 샘플과 비교하여 위암 샘플에서 마커 LBFL305의 발현이 유의하게 상향-조절되는 것으로 나타났다(U95 GeneChip을 이용하여 2.2-배; p=0.0051; U133 GeneChip을 이용하여 2.14배, p=0.0109). 이들 결과는 LBFL305의 상향-조절이 위암을 진단할 수 있음을 나타낸다.

LBFL305(서열번호 13)의 발현 수준은 각각 아피메트릭스 GeneChips™ U95 및 U133 상의 칩 서열 단편번호 53858_at 및 225364_at에 의해 측정할 수 있다. 차등 발현 데이터를 조직 유형에 의한 아피메트릭스 유전자칩을 이용한 실험들로부터 수집하고, 모두 명칭이 "An Automated Computer-based Algorithm for Organizing and Mining Gene Expression Data Derived from Biological Samples with Complex Clinical Attributes"이고 모두 본 명세서에 참조로서 인용되는 관련된 출원 60/331,182, 60/388,745 및 60/390,608에 기재되어 있는 GX 스캔 알고리즘에 의해 분석하였다. 정상 대조 조직과 비교한 다양한 악성 신생물에서의 53858_at 및 225364_at의 발현 수준은 변화 배수와 변화의 방향(상향- 또는 하향-조절)도 표시되어 있는 표 1c에 나타나 있다. 1.5 초과의 변화 배수가 유의한 것으로 간주되었다.

표 1c

Affy ID	조직	질병	형태	변화배수	방향	T-통계
53858_at	방광, NOS	방광 악성 신생물, NOS	이행세포암, NOS	1.691	상향	2.377
53858_at	유방, NOS	여성 유방 악성 신생물, NOS	침윤성 관 암	1.538	상향	6.824
53858_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	1.599	상향	2.408
225364_at		여성 유방 악성 신생물, NOS	침윤성 관 및 소엽 암	1.525	상향	3.251
53858_at	자궁경부, NOS	자궁경부 악성 신생물	편평상피세포암, NOS	1.637	상향	4.056
53858_at	자궁내막, NOS	자궁내막 악성 신생물	뮐러 혼합 종양	1.548	상향	2.647
53858_at	식도, NOS	식도 악성 신생물, NOS	선암, NOS	2.079	상향	3.145
225364_at	식도, NOS	식도 악성 신생물, NOS	선암, NOS	1.615	상향	2.915
53858_at	신장, NOS	신장 악성 신생물, NOS	신장세포 암	1.864	상향	6.093
53858_at		신장 악성 신생물, NOS	투명세포 선암, NOS	2.167	상향	6.877
225364_at		신장 악성 신생물, NOS	신장세포 암	1.593	상향	5.045
225364_at		신장 악성 신생물, NOS	투명세포 선암, NOS	1.683	상향	7.924
225364_at	폐, NOS	폐 악성 신생물, NOS	소세포 암, NOS	-1.79	하향	-7.071
53858_at	림프절, NOS	호치킨병, 다중 위치의 림프절 NOS	호치킨병, NOS	1.539	상향	2.519
53858_at	림프절, NOS	림프 및 대식세포 조직의 악성 신생물, NOS	악성 림프종, NOS	1.635	상향	3.243
53858_at	췌장, NOS	랑게르한스섬 악성 신생물	섬세포 암	3.845	상향	7.929
53858_at		췌장 악성 신생물, NOS	선암, NOS	4.171	상향	7.165
225364_at		랑게르한스섬 악성 신생물	섬세포 암	2.343	상향	3.551
225364_at		췌장 악성 신생물, NOS	선암, NOS	2.278	상향	10.793
225364_at	전립선, NOS	전립선 악성 신생물	악성 의심 이형성	-1.641	하향	-4.8
53858_at	직장, NOS	직장 악성 신생물	선암, NOS	1.935	상향	5.416
53858_at	소장, NOS	악성 림프종, 불특정, 림프절외 또는 고형기관 위치의 NOS	악성 림프종, NOS	3.935	상향	3.535
225364_at	소장, NOS	악성 림프종, 불특정, 림프절외 또는 고형기관 위치의 NOS	악성 림프종, NOS	3.024	상향	3.816
53858_at	위, NOS	위 악성 신생물, NOS	반지모양세포 암	1.507	상향	2.46
53858_at		위 악성 신생물, NOS	선암, NOS	2.076	상향	5.928
225364_at		위 악성 신생물, NOS	반지모양세포 암	1.524	상향	3.076
225364_at		위 악성 신생물, NOS	선암, NOS	1.637	상향	6.053

표 1c

Affy ID	조직	질병	형태	변화배수	방향	T-통계
225364_at	갑상선, NOS	악성 림프종, 불특정, 림프절외 또는 고형기관위치의 NOS	악성 림프종, NOS	4.371	상향	9.429
225364_at	갑상선, NOS	갑상선 악성 신생물	유두암, NOS	1.634	상향	3.22
53858_at	외음부, NOS	외음부 악성 신생물, NOS	편평상피세포암, NOS	1.505	상향	2.596

칩 서열 단편번호 53858_at에 대한 샘플 결합에 의해 결정되는, 유전자칩 발현결과를 Taqman™ 어세이(Perkin-Elmer)를 이용하는 정량적 RT-PCR(Q-RT-PCR)에 의해 검증하였다. 특정 아피메트릭스 단편(53858_at)의 서열 정보 파일로부터 설계된 PCR 프라이머를 어세이에 사용하였다. 각각의 RNA 샘플(10 ng의 총 RNA)의 표적 유전자를 외생적으로 스파이크된 참조 유전자에 상대적으로 어세이하였다. 이 목적을 위하여, 테트라사이클린 내성 유전자를 외생적으로 첨가되는 스파이크로 사용하였다. 이 접근법은 일정량의 Tet 스파이크 사이클 역치(Ct)에 대한 표적 mRNA의 Ct 값에 의해 측정되는 상대적 발현을 제공한다. 샘플 패널은 U95 GeneChips 상에서 분석된 정상 위(정상) 및 진행성 위암(AGC) 조직 RNA를 포함하였다. 또한, GeneChip 상에서 분석되지 않은 몇몇 새로운 샘플을 Q-RT-PCR에 의한 발현 검증을 위해 사용하였다. Q-RT-PCR 데이터는 정상 위 생검 샘플에 비하여 AGC에서 관찰된 LBFL305의 상향-조절을 확인시켜준다.

d) LBFL306 유전자 훼밀리

칩 데이터의 분석 결과 정상 위 조직으로부터의 샘플과 비교하여 위암 샘플에서 마커 LBFL306의 발현이 유의하게 상향-조절되는 것으로 나타났다(U133 GeneChip을 이용하여 3.27배, p=0.00217). 이들 결과는 LBFL306의 상향-조절이 위암을 진단할 수 있음을 나타낸다.

LBFL306(서열번호 17, 19 또는 21)의 발현 수준은 각각 아피메트릭스 GeneChips™ U95 및 U133 상의 칩 서열 단편번호 57861_at 및 223251_s_at에 의해 측정할 수 있다. 차등 발현 데이터를 조직 유형에 의한 아피메트릭스 유전자칩을 이용한 실험들로부터 수집하고, 모두 명칭이 "An Automated Computer-based Algorithm for Organizing and Mining Gene Expression Data Derived from Biological Samples with Complex Clinical Attributes"이고 모두 본 명세서에 참조로서 인용되는 관련된 출원 60/331,182, 60/388,745 및 60/390,608에 기재되어 있는 GX 스캔 알고리즘에 의해 분석하였다. 정상 대조 조직과 비교한 다양한 악성 신생물에서의 223251_at의 발현 수준은 변화 배수와 변화의 방향(상향- 또는 하향-조절)도 표시되어 있는 표 1d에 나타나 있다. 1.5 초과의 변화 배수가 유의한 것으로 간주되었다. 그 결과, LBFL306의 발현이 위암뿐만 아니라 방광, 결장, 식도, 신장, 대망, 췌장, 직장 및 연질 조직에서 상향-조절되고, 이 유전자 훼밀리의 발현이 유방, 자궁내막 및 소장 암에서 하향-조절되는 것으로 나타났다.

서열번호 17 또는 19 또는 21을 갖는 전장 cDNA를 GeneTrapper™ cDNA 양성 선별 시스템 키트(Invitrogen)를 이용하여 얻었다. 생성된 cDNA를 2본쇄 플라스미드 DNA로 전환시켜, E. coli 세포(DH10B)를 형질전환하는데 사용하고, 최장 cDNA를 스크리닝하였다. 양성 선별을 유전자-특이적 프라이머를 이용한 PCR에 의해 확인한 후, cDNA 클론을 DNA 서열분석하였다.

노던 블랏 분석을 수행하여 LBFL306에 상응하는 mRNA 전사체의 크기를 결정하였다. 다양한 인간 조직으로부터의 총 RNA를 함유하는 노던 블랏을 사용하고(ClonTech H12), LBFL306-GE2(서열번호 21)를 무작위 프라이머 방법에 의해 방사성 표지하고 블랏을 프로브하는데 사용하였다. 블랏을 65 ℃ 처치 앤 길버트(Church and Gilbert) 완충액에서 혼성화시키고, 실온에서 0.1% SDS를 함유하는 0.1×SSC로 세척하였다. 노던 블랏은 크기가 약 1.5 kb인 이 유전자의 단일 전사체를 나타내었다. 이것은 역시 약 1.5 kb인 전장 클론의 삽입물 크기에 상응하는 것이다.

칩 서열 단편번호 223251_s_at 에 대한 샘플 결합에 의해 결정되는, GeneChip 발현결과를 Taqman™ 어세이(Perkin-Elmer)를 이용하는 정량적 RT-PCR(Q-RT-PCR)에 의해 검증하였다. 특정 아피메트릭스 단편(223251_s_at)의 서열 정보 파일로부터 설계된 PCR 프라이머를 어세이에 사용하였다. 각각의 RNA 샘플(10 ng의 총 RNA)의 표적 유전자를 외생적으로 스파이크된 참조 유전자에 상대적으로 어세이하였다. 이 목적을 위하여, 테트라사이클린 내성 유전자를 외생적으로 첨가되는 스파이크로 사용하였다. 이 접근법은 일정량의 Tet 스파이크 사이클 역치(Ct)에 대한 표적 mRNA의 Ct 값에 의해 측정되는 상대적 발현을 제공한다. 샘플 패널은 U133 GeneChips 상에서 분석된 정상 위 및 진행성 위암 조직 RNA를 포함하였다. 또한, GeneChip 상에서 분석되지 않은 몇몇 새로운 샘플을 Q-RT-PCR에 의한 발현 검증을 위해 사용하였다. Q-RT-PCR 데이터는 정상 위 생검 샘플에 비하여 AGC에서 관찰된 LBFL306의 상향-조절을 확인시켜준다.

표 1d

칩 위치번호	조직	질병	형태	변화배수	방향	T-통계
223251_s_at	방광, NOS	방광 악성 신생물, NOS	이행세포암, NOS	1.649	상향	2.572
223251_s_at	유방, NOS	여성 유방 악성 신생물, NOS	관내 암, NOS	-1.701	하향	-5.202
223251_s_at	결장, NOS	결장 악성 신생물, NOS	선암, NOS	2.651	상향	8.164
223251_s_at	자궁내막, NOS	자궁내막 악성 신생물	뮐러 혼합 종양	-1.806	하향	-2.367
223251_s_at	식도, NOS	식도 악성 신생물, NOS	선암, NOS	5.016	상향	4.269
223251_s_at	신장, NOS	신장 악성 신생물, NOS	이행세포암, NOS	1.755	상향	4.563
223251_s_at		신장 악성 신생물, NOS	투명세포 선암, NOS	1.611	상향	4.054
223251_s_at		신장 악성 신생물, NOS	윌름 종양	4.565	상향	3.891
223251_s_at	대망, NOS	대망 악성 신생물	유두 장액성 선암	1.762	상향	3.398
223251_s_at	췌장, NOS	췌장 악성 신생물, NOS	선암, NOS	2.672	상향	7.13
223251_s_at	직장, NOS	직장 악성 신생물	선암, NOS	2.482	상향	6.042
223251_s_at	소장, NOS	소장 악성 신생물, NOS	육종, NOS	-1.944	하향	-5.716
223251_s_at	연질조직, NOS	결합 및 기타 연질조직 악성 신생물, NOS	점액양 지방육종	1.878	상향	3.894
223251_s_at	위, NOS	위 악성 신생물, NOS	선암, NOS	2.522	상향	5.101

실시예 2

차등 발현된 mRNA 종에 상응하는 전장 인간 cDNA( LBFL301 , LBFL304 , LBFL305 및 LBFL306 )의 클로닝

서열번호 1, 3, 5, 7, 9, 11, 13, 17, 19 또는 21의 전장 cDNA를 올리고-풀링 방법에 의해 얻었다. 간략하게는, 유전자-특이적 올리고를 LBFL301, LBFL304, LBFL305 또는 LBFL306의 서열에 기초하여 설계하였다. 올리고를 바이오틴으로 표지하고 Sambrook 등의 과정에 따라 완전 분화된 위 아데노카시노마 라이브러리(NCI CGAP Gas 4) 또는 Jurkat 세포로부터 제조된 라이브러리로부터 2 ㎍의 단일쇄 플라스미드 DNA(재조합 cDNA)와 혼성화하는데 사용하였다. 혼성화된 cDNA를 스트렙타비딘-포접된 비드에 의해 분리하고 가열하여 용출하였다. 용출된 cDNA를 이본쇄 플라스미드 DNA로 전환하고 E. coli 세포(DH10B)를 형질전환하는데 사용하고 가장 긴 cDNA를 스크리닝하였다. 양성 선별을 유전자-특이적 프라이머를 이용하는 PCR에 의해 확인한 후, cDNA 클론을 DNA 서열분석하였다.

상기 검출된 차등 조절된 mRNA에 상응하는 전장 인간 cDNA의 뉴클레오티드 서열을 서열번호 1, 3, 5, 7, 9, 11, 13, 17, 19 및 21에 나타내었다. 서열번호 1에서, cDNA는 1272개 염기쌍(1255 개 염기쌍 및 폴리A 테일)을 포함한다. 서열번호 3에서, cDNA는 1355개 염기쌍(1334개 염기쌍 및 폴리A 테일)을 포함한다. LBFL304에 대한 몇몇 가능한 개시 코돈이 있고, 이들을 서열번호 5, 7, 9 및 11로 나타내었다. 서열번호 13의 cDNA는 6405개 염기쌍(6369 개 염기쌍 및 폴리A 테일)을 포함한다. 서열번호 17에 상응하는 cDNA는 1299개 염기쌍(1284 개 염기쌍 및 폴리A 테일)을 포함한다. 서열번호 19에 상응하는 cDNA는 2451개 염기쌍(2435 개 염기쌍 및 폴리A 테일)을 포함한다. 서열번호 21에 상응하는 cDNA는 1194개 염기쌍(1178개 염기쌍 및 폴리A 테일)을 포함한다.

서열번호 1, 뉴클레오티드 131-859(정지 코돈을 포함하여 131-862)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 243개 아미노산의 단백질을 코딩한다. 서열번호 1에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 2에 나타내었다.

서열번호 3, 뉴클레오티드 174-584(정지 코돈을 포함하여 174-587)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 137개 아미노산의 단백질을 코딩한다. 서열번호 3에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 4에 나타내었다. 서열번호 4의 단백질 서열은 서열번호 4의 마지막 13개 아미노산은 독특한 반면, 처음 124개 아미노산은 서열번호 2의 것과 동일하다. 도 1에 나타낸 바와 같이, 서열번호 4에 상응하는 단백질 서열의 말단은 오픈 리딩 프레임에서 정지 코돈을 도입하는 45-bp 삽입물에 의해 생성된다.

서열번호 2와 4는 키모트립신 세린 프로테아제 훼밀리 신호(S1) 및 NUDIX 하이드롤라제 훼밀리 신호와 약간 유사하다. 키모트립신 세린 프로테아제 훼밀리 신호(S1)는 세 개의 도메인을 포함하며, 세번째 도메인은 서열번호 4에 없다. 또한, 두 단백질 모두 콜라겐 삼중 나선 반복 영역을 함유한다.

도 2와 3은 서열번호 2와 4의 아미노산 서열의 소수성 분석 결과를 보여준다. 친수성 부위는 상기한 바와 같이, 항원성 펩티드를 제조하는데 사용할 수 있다. 두 서열 모두 길이가 약 30개 아미노산이고, 가장 소수성인 부분이 아미노산 번호 20 주변에서 나타나는 소수성 N-말단을 갖는다. SPScan(GCG Wisconsin Package)에 의한 추가 단백질 서열 분석 결과 아미노산 위치 1-30으로부터의 소수성 부위가 분비 신호 펩티드인 것으로 밝혀졌다.

서열번호 5, 뉴클레오티드 38-892(정지 코돈을 포함한 38-895)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 285개 아미노산의 단백질을 코딩한다. 서열번호 5에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 6에 나타내었다. 서열번호 6은 키모트립신 세린 프로테아제 훼밀리 신호(S1)와 약간 유사하다. 도 4는 서열번호 6의 아미노산 서열의 소수성 분석 결과를 보여준다. 친수성 부위는 상기한 바와 같이, 항원성 펩티드를 제조하는데 사용할 수 있다.

서열번호 7, 뉴클레오티드 53-892(정지 코돈을 포함한 53-895)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 280개 아미노산의 단백질을 코딩한다. 서열번호 7에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 8에 나타내었다. 서열번호 8의 단백질 서열은 서열번호 8이 서열번호 6의 N-말단에서 처음 5개의 아미노산이 결여된 것을 제외하고는, 서열번호 6의 것과 동일하다.

서열번호 9, 뉴클레오티드 65-892(정지 코돈을 포함한 65-895)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 276개 아미노산의 단백질을 코딩한다. 서열번호 9에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 10에 나타내었다. 서열번호 10의 단백질 서열은 서열번호 10이 서열번호 6의 N-말단의 처음 9개 아미노산이 결여된 것을 제외하고는, 서열번호 6의 것과 동일하다.

서열번호 11, 뉴클레오티드 92-892(정지 코돈을 포함한 92-895)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 267개 아미노산의 단백질을 코딩한다. 서열번호 11에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 12에 나타내었다. 서열번호 12의 단백질 서열은 서열번호 12가 서열번호 6의 N-말단의 처음 18개 아미노산이 결여된 것을 제외하고는, 서열번호 6의 것과 동일하다.

서열번호 13, 뉴클레오티드 49-1434(정지 코돈을 포함한 49-1437)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 462개 아미노산의 단백질을 코딩한다. 서열번호 13에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 14에 나타내었다.

BLAST 검색 결과와 두 서열 간의 높은 수준의 상동성은 LBFL305가 Mst1(예를 들어, 서열번호 16)의 스플라이스 변이체임을 암시한다. 배열된 밑줄 친 아미노산 잔기는 서열번호 14와 서열번호 18의 차이점을 나타낸다. Mst1의 공개된 연구에 기초하여, 서열번호 14는 키나제 도메인(아미노산 위치 1-299)(Creasy 등, (1996) J Biol Chem 271:21049-21053), 이어서 키나제 기능을 조절하는 작용을 하는 조절 도메인(아미노산 위치 300-462)(Creasy 등, (1996) J Biol Chem 271:21049-21053)을 포함한다. 또한 아미노산 위치 326-327과 349-350 사이에 두 개의 캐스파제 절단 위치(Graves 등, (2001) J Biol Chem 276:14909-14915)와, 하나의 NES 도메인(아미노산 위치 361-370)(Ura 등, (2002) Proc Natl Acad Sci USA 98: 10148-10153)이 존재한다. 서열번호 16과 비교하여, 서열번호 14는 제2 NES 영역(서열번호 16의 아미노산 위치 441-451)(Ura 등, (2002) Proc Natl Acad Sci USA 98: 10148-10153)이 없다. 또한, 서열번호 14는 자기-결합을 위해 요구되는(Creasy 등, (1996) J Biol Chem 271:21049-21053) 멀티머화 영역(Mst1의 아미노산 위치 431-487)을 포함하지 않는다. 흥미롭게도, NORE, 추정 Ras 작용자 (Khokhlatchev 등, Curr Biol 12:253-265)와의 상호작용을 위해 요구되는 Mst1의 부위(서열번호 16의 아미노산 위치 449-487)는 서열번호 14에는 존재하지 않는다.

도 5는 서열번호 14의 아미노산 서열의 소수성 분석 결과를 나타낸다. 친수성 부위는 상기한 바와 같이 항원성 펩티드를 제조하는데 사용된다.

서열번호 17, 뉴클레오티드 75-572(정지 코돈을 포함하여 75-575)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 166개 아미노산의 단백질을 코딩한다. 서열번호 17에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 18에 나타내었다. 도 7은 서열번호 18의 아미노산 서열의 소수성 분석 결과를 보여준다. 친수성 부위는 상기한 바와 같이 항원성 펩티드를 제조하는데 사용된다.

서열번호 19, 뉴클레오티드 78-1337(정지 코돈을 포함하여 78-1340)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 420개 아미노산의 단백질을 코딩한다. 서열번호 19에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 20에 나타내었다. 도 8은 서열번호 20의 아미노산 서열의 소수성 분석 결과를 보여준다. 친수성 부위는 상기한 바와 같이 항원성 펩티드를 제조하는데 사용된다.

서열번호 19, 뉴클레오티드 78-737(정지 코돈을 포함한 78-740)의 cDNA 뉴클레오티드 서열 내의 오픈 리딩 프레임은 220개 아미노산의 단백질을 코딩한다. 서열번호 21에 의해 코딩되는 예상되는 단백질에 상응하는 아미노산 서열은 서열번호 22에 나타내었다. 도 9는 서열번호 22의 아미노산 서열의 소수성 분석 결과를 보여준다. 친수성 부위는 상기한 바와 같이 항원성 펩티드를 제조하는데 사용된다.

GCG 위스콘신 팩키지 소프트웨어를 이용한 hmmerpfam에 의해 결정된 바에 따르면, 세 LBFL306 클론, EF3(서열번호 17), GC7(서열번호 19) 및 GE2(서열번호 21)는 모두 다중 앤키린(ankyrin) 반복을 포함한다. 앤키린 반복은 EF3, GC7 및 GE2에서 아미노산 잔기 57 내지 89, 91 내지 123 및 124 내지 156이다. 이들 세 앤키린 반복에 더하여, GC7은 잔기 157 내지 190에 부가적인 앤키린 반복을 포함한다.

노던 블랏에 의한 분석을 LBFL301, LBFL304 및 LBFL305에 상응하는 mRNA 전사체의 크기를 결정하기 위하여 수행하였다. 다양한 인간 조직으로부터의 총 RNA를 함유하는 노던 블랏(ClonTech)을 사용하고, 클론 CH4(서열번호 3), 클론 EA10(서열번호 5, 7, 9 또는 11) 및 LBFL305(서열번호 13)를 무작위 프라이머 방법에 의해 방사성 표지하고 블랏을 프로브화하는데 사용하였다. 블랏을 65 ℃에서 처치 앤 길버트 완충액 중에서 혼성화하고, 실온에서 0.1% SDS 함유 0.1×SSC로 세척하였다. 노던 블랏은 각각의 유전자에 대하여 크기가 약 1.57 kb(LBFL301), 2.6 kb(LBFL304) 및 7.95 kb(LBFL305)인 단일 전사체를 나타낸다. 이들은 클론 CH4(1.355 kb), 클론 EA10(서열번호 5, 7, 9 또는 11), 및 LBFL305(6.5 kb)의 삽입물의 크기에 상응한다. 클론 AD12 (서열번호 1)의 서열을 프로브로 사용하는 경우, 클론 AD12 중의 삽입물 크기 1.272 kb에 상응하는 1.44 kb의 전사물이 검출되었다.

다양한 정상 조직에서 LBFL301, LBFL304, LBFL305 또는 LBFL306의 발현을 검출하기 위하여, 전자 노던 블랏(e-노던)을 하기하는 바와 같이 제조하였다. 실시예 1의 칩과 방법을 이용하여, 표 3에 수록된 바와 같이, 정상 조직 패널로부터의 mRNA를 Affymetrix U95 인간 GeneChips과 혼성화하였다. 실험 결과를 표 3에 나타내었다. 각각의 조직 유형에 대하여, 존재 또는 부재로 콜링된 샘플의 수를 샘플 세트 중의 샘플 총수와 함께 나타내었다. 또한, 각 조직 유형에서 중앙값과 25번째 및 75번째 백분위수를 수록하였다. 흥미롭게도, 이 유전자가 위암에서 상향-조절되지만, LBFL301 또는 LBFL304의 발현은 대부분의 정상 위 샘플에서는 검출되지 않았다. 또한, LBFL305와 LBFL306은 대부분의 시험된 정상 위 샘플에서 발현되기는 하지만, 발현 수준이 대부분의 시험된 다른 정상 조직에 비해 낮았다. 이 관찰은 LBFL301, LBFL304, LBFL305 또는 LBFL306이 아래에서 논의하는 바와 같이, 위암을 검출 또는 스크리닝하기 위한 진단제나 마커로 사용될 수 있음을 가리킨다. LBFL301의 발현 수준은 피부조직, 태반, 지방, 동맥, 방광, 뼈, 유방 및 연질 조직 순으로 높은 것으로 나타났다. 이 유전자는 간이나 뇌와 심장의 대부분의 부위에서 검출되지 않지만, 낮은 수준의 발현이 표 3a에 수록된 대부분의 다른 조직에서 검출되었다. LBFL304의 발현 수준은 동맥, 대망, 자궁, 자궁내막, 자궁근층과 전립선에서 가장 높은 것으로 나타났다. LBFL305의 발현 수준은 면역체계의 기관(백혈구 세포, 림프절, 지라 및 갑상선)에 이어서 충수, 동맥, 뼈, 폐에서 가장 높은 것으로 나타났다. 여전히 낮은 수준의 발현이 표 3c에 수록된 대부분의 다른 조직에서 검출되었다. LBFL306의 발현 수준은 면역 체계 기관(예를 들어, 림프절, 지라 및 갑상선) 및 생식체계(예를 들어, 유방, 자궁내막, 전립선 및 자궁)에서 가장 높은 것으로 나타났다.

표 3a - 48774_at에 대한 e-노던 데이터: 정상 조직에서의 LBFL301 유전자 발현

전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
0.5492
	지방	29/33	4/33	130.90	200.78	302.98
	부신	1/12	11/12	-4.10	8.75	22.07
	충수	1/3	2/3	21.54	31.31	71.81
	동맥	3/3	0/3	148.46	203.96	262.32
	방광	6/7	1/7	142.72	195.44	361.02
	뼈	2/4	2/4	75.00	240.38	412.62
	유방	74/82	8/82	104.43	222.98	506.27
	소뇌	0/5	5/5	-7.51	-6.91	0.94
	자궁경부	75/99	24/99	42.04	93.36	144.25
	결장	36/148	112/148	1.75	12.16	29.05
	피질 전두엽	1/7	6/7	5.96	14.07	18.05
	피질 측두엽	0/3	3/3	-0.59	4.13	4.66
	십이지장	9/61	52/61	3.99	11.54	20.62
	자궁내막	16/21	5/21	46.25	85.18	113.55
	식도	14/27	13/27	17.91	42.08	81.58
	난관	21/51	30/51	7.97	20.39	33.96
	담낭	4/8	4/8	16.22	80.97	400.47
	심장	0/3	3/3	-3.80	6.00	11.57
	해마	1/5	4/5	-6.49	-0.18	7.81
	신장	12/87	75/87	-14.80	-4.61	9.24
	후두	4/4	0/4	48.51	119.88	248.62
	좌심방	64/141	77/141	8.19	27.15	61.94
	좌심실	2/15	13/15	-7.49	7.08	13.24
	간	0/33	33/33	-15.13	-8.62	0.03
	폐	43/92	49/92	10.45	30.14	63.21
	림프절	9/12	3/12	43.28	81.96	225.75
	근육	19/38	19/38	23.70	40.22	108.40
	자궁근층	68/106	38/106	19.39	56.42	99.78
	대망	12/16	4/16	76.26	148.41	236.54
	난소	26/75	49/75	4.20	21.96	47.43
	췌장	7/34	27/34	-12.61	0.83	17.69
	태반	5/5	0/5	284.63	361.07	414.51
	전립선	7/32	25/32	0.03	12.08	36.90
	직장	17/44	27/44	3.23	12.57	37.41
	우심방	60/171	111/171	2.99	15.73	53.22
	우심실	43/160	117/160	1.85	16.64	39.58
	피부	56/59	3/59	321.45	906.78	1515.60
	소장	18/68	50/68	0.41	12.19	28.53
	연질조직	5/6	1/6	148.50	202.33	794.03
	지라	5/29	24/29	-3.61	3.04	12.46
	위	15/45	30/45	7.73	18.66	50.97
	고환	3/5	2/5	14.11	27.34	64.24
	흉선	19/71	52/71	4.06	25.61	40.45
	갑상선	7/19	12/19	12.43	32.64	40.31
	자궁	35/56	21/56	32.20	44.73	143.10
	WBC	1/41	40/41	-18.91	-13.33	-6.24

표 3b: 35832_at에 대한 e-노던 데이터: 정상 조직에서의 LBFL304 유전자 발현

단편	전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
35832_at	0.5228
		지방	26/34	8/34	29.09	59.51	89.67
		부신	1/12	11/12	-11.00	-6.08	8.14
		충수	1/3	2/3	43.26	53.50	66.52
		동맥	3/4	1/4	182.70	291.81	428.36
		방광	5/7	2/7	56.36	62.71	64.68
		뼈	3/4	1/4	19.34	77.40	167.06
		유방	65/82	17/82	33.67	63.19	108.61
		소뇌	0/5	5/5	-19.26	-14.78	-13.16
		자궁경부	69/102	33/102	18.76	57.45	94.99
		결장	85/146	61/146	10.73	35.22	87.91
		피질 전두엽	1/7	6/7	-5.03	8.78	14.71
		피질 측두엽	0/3	3/3	-16.73	-16.67	-15.85
		십이지장	19/53	34/53	6.47	20.39	41.95
		자궁내막	15/21	6/21	31.44	93.20	137.68
		식도	15/27	12/27	5.12	27.03	52.89
		난관	19/47	28/47	5.38	22.48	54.99
		담낭	2/7	5/7	8.71	28.94	50.85
		심장	0/3	3/3	-35.98	-28.25	-6.72
		해마	2/5	3/5	-7.43	-3.64	5.68
		신장	28/89	61/89	1.67	20.45	45.18
		후두	4/4	0/4	36.13	54.20	79.75
		좌심방	80/141	61/141	8.32	25.37	52.28
		좌심실	0/15	15/15	-21.85	-17.01	-8.17
		간	2/35	33/35	-10.51	0.02	8.05
		폐	29/93	64/93	2.56	19.47	43.63
		림프절	3/12	9/12	-17.58	-2.85	9.56
		근육	12/42	30/42	-13.74	3.99	23.23
		자궁근층	92/108	16/108	67.57	129.39	203.58
		대망	14/15	1/15	176.65	310.28	368.41
		난소	31/74	43/74	0.66	27.78	54.33
		췌장	4/33	29/33	-9.60	2.09	9.94
		태반	0/5	5/5	-21.32	-3.06	6.08
		전립선	30/32	2/32	82.37	104.56	190.72
		직장	37/44	7/44	51.53	86.73	125.67
		우심방	69/170	101/170	-3.30	8.80	33.56
		우심실	35/160	125/160	-11.65	-0.46	16.02
		피부	28/61	33/61	4.22	25.33	67.56
		소장	36/67	31/67	10.76	33.92	64.75
		연질조직	4/6	2/6	25.95	40.91	58.70
		지라	1/29	28/29	-19.20	-13.77	-6.69
		위	16/47	31/47	-8.30	13.38	47.93
		고환	1/5	4/5	-18.20	5.01	37.66
		흉선	1/73	72/73	-22.55	-12.50	-3.27
		갑상선	14/19	5/19	45.56	98.30	141.24
		자궁	43/58	15/58	37.47	103.26	180.98
		WBC	0/43	43/43	-33.45	-25.32	-20.23

표 3c- 48774_at에 대한 e-노던 데이터: 정상 조직에서의 LBFL305 유전자 발현

전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
0.9444
	지방	31/32	1/32	221.82	286.63	380.88
	부신	12/12	0/12	162.12	214.21	310.82
	충수	3/3	0/3	352.94	506.01	633.71
	동맥	3/3	0/3	343.80	419.88	643.55
	방광	5/5	0/5	221.82	290.82	301.11
	뼈	3/3	0/3	410.63	508.38	662.78
	유방	80/80	0/80	236.84	279.81	338.22
	소뇌	5/5	0/5	182.09	198.28	283.55
	자궁경부	97/101	4/101	179.11	246.50	317.62
	결장	146/151	5/151	247.18	314.49	389.23
	피질 전두엽	7/7	0/7	222.19	230.28	268.13
	피질 측두엽	3/3	0/3	305.66	365.62	377.16
	십이지장	58/61	3/61	206.17	276.14	331.91
	자궁내막	21/21	0/21	158.91	193.40	257.17
	식도	25/27	2/27	182.29	223.24	303.93
	난관	50/51	1/51	168.69	220.72	265.95
	담낭	7/8	1/8	237.67	270.08	312.45
	심장	2/3	1/3	44.79	55.84	56.46
	해마	5/5	0/5	165.94	212.72	328.59
	신장	79/86	7/86	121.83	158.99	209.67
	후두	4/4	0/4	140.76	209.46	302.84
	좌심방	127/141	14/141	58.48	92.78	123.06
	좌심실	9/15	6/15	50.50	74.69	101.06
	간	27/34	7/34	87.73	146.60	197.27
	폐	92/93	1/93	365.58	454.87	550.48
	림프절	11/11	0/11	493.34	943.95	1141.06
	근육	19/39	20/39	41.41	64.44	110.74
	자궁근층	104/106	2/106	188.94	263.73	322.65
	대망	15/15	0/15	198.02	244.56	334.75
	난소	70/74	4/74	133.44	181.39	246.40
	췌장	13/34	21/34	24.30	53.13	84.64
	태반	4/5	1/5	156.58	174.21	182.71
	전립선	32/32	0/32	184.16	234.60	289.05
	직장	42/43	1/43	284.60	365.66	434.01
	우심방	148/169	21/169	54.96	89.92	129.13
	우심실	132/160	28/160	55.58	78.85	114.70

표 3c

전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
	피부	57/59	2/59	250.81	320.57	398.56
	소장	64/68	4/68	196.50	279.29	393.83
	연질조직	6/6	0/6	234.21	307.07	363.66
	지라	31/31	0/31	775.25	879.84	1022.49
	위	41/47	6/47	137.91	217.53	338.54
	고환	5/5	0/5	326.62	358.69	377.26
	흉선	71/71	0/71	691.12	802.96	984.42
	갑상선	18/18	0/18	121.11	162.16	238.53
	자궁	57/58	1/58	157.19	202.53	265.91
	WBC	38/40	2/40	1863.06	2264.27	2743.82

표 3d - 48774_at에 대한 e-노던 데이터: 정상 조직에서의 LBFL306 유전자 발현

전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
0.8143
	지방	31/32	1/32	184.04	242.67	285.20
	부신	6/12	6/12	130.70	157.08	187.26
	충수	3/3	0/3	259.39	301.05	388.31
	동맥	4/4	0/4	168.95	207.06	295.97
	방광	7/8	1/8	196.52	239.43	374.54
	뼈	4/4	0/4	209.35	226.22	292.55
	유방	60/61	1/61	238.09	315.29	421.47
	자궁경부	92/102	10/102	180.90	224.31	342.25
	결장	168/192	24/192	147.41	175.83	215.95
	피질 전두엽	5/5	0/5	133.94	148.22	162.91
	피질 측두엽	3/3	0/3	137.28	147.77	172.44
	십이지장	68/68	0/68	186.24	218.73	336.00
	자궁내막	19/19	0/19	273.57	359.17	436.85

표 3d

전체존재빈도	조직	존재	부재	25% 미만	중앙값	75% 초과
	식도	14/25	11/25	105.83	140.56	195.89
	담낭	7/8	1/8	232.71	293.00	410.47
	심장	1/3	2/3	86.39	100.48	129.68
	해마	9/10	1/10	125.62	140.94	194.06
	신장	53/91	38/91	108.29	147.35	186.69
	후두	3/4	1/4	160.96	190.50	219.55
	좌심방	65/143	78/143	100.94	128.86	157.57
	좌심실	0/13	13/13	82.54	106.63	117.06
	간	15/44	29/44	145.82	204.77	244.58
	폐	104/114	10/114	168.03	203.35	283.11
	림프절	14/14	0/14	207.66	319.53	366.70
	림프구(B+T세포)	24/24	0/24	224.46	292.01	348.07
	근육	31/40	9/40	183.43	240.15	329.99
	자궁근층	122/128	6/128	209.83	244.58	294.20
	대망	13/15	2/15	162.83	236.23	265.24
	난소	80/81	1/81	219.28	259.00	331.64
	췌장	8/40	32/40	97.07	136.80	174.54
	전립선	47/47	0/47	318.31	397.81	525.43
	직장	38/46	8/46	143.79	188.95	232.42
	우심방	87/162	75/162	104.22	132.56	161.54
	피부	38/44	6/44	162.29	198.90	236.86
	소장	72/79	7/79	184.41	230.96	270.34
	연질조직	5/5	0/5	240.30	258.33	499.21
	지라	36/36	0/36	253.03	322.87	390.61
	위	32/54	22/54	139.62	174.76	239.47
	흉선	70/70	0/70	352.12	438.94	511.11
	갑상선	25/25	0/25	177.32	211.27	276.25
	자궁	54/56	2/56	243.74	312.71	387.50
	WBC	21/25	4/25	149.63	176.72	209.49

실시예 3

위암 스크리닝을 위한 LBFL301, LBFL304, LBFL305 또는 LBFL306 mRNA의 검출

서열번호 1, 3, 5, 7, 9, 11, 13, 17, 19 또는 21에 상응하는 mRNA의 발현 수준을 실시예 1에 기재된 바와 같이, 즉 GeneChip 상에서 mRNA 샘플을 스크리닝함으로써, 또는 실시예 2에 기재된 바와 같이, 즉 노던 블랏 상의 mRNA 샘플을 스크리닝함으로써, 위 조직 생검 샘플에서 결정한다. 다르게는, 악성 또는 양성 상태의 비-위 과증식 조직으로부터의 샘플도 분석한다. 위암 환자와 정상인으로부터의 위 조직 샘플을 양성 및 음성 대조로 사용할 수 있다. 유전자 발현을 분석하는 어떠한 수단을 사용해서도, 정상 대조의 것 보다 높은 발현 수준은 위암 또는 위암 발병 가능성의 지표이다.

본 발명을 상기 실시예를 참조로 하여 상세히 기술하였으나, 본 발명의 요지를 벗어나지 않으면서 다양한 변형이 가해질 수 있음을 이해하여야 한다. 따라서, 본 발명은 하기 청구범위에 위해서만 제한된다. 이 출원에 인용된 특허, 특허출원 및 공개문헌들은 모두 그 전체로 참조로서 여기에 인용된다.

<110> LG Life Sciences, Ltd. <120> Gene families associated with stomach cancer <130> PC03015-LG <150> US 60/402,904 <151> 2002-08-14 <150> US 60/404,408 <151> 2002-08-20 <150> US 60/405,304 <151> 2002-08-23 <150> US 60/421,582 <151> 2002-10-28 <160> 22 <170> KopatentIn 1.71 <210> 1 <211> 1272 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (131)..(859) <223> Gene LBFL301, Clone AD12 <400> 1 ggcgcgcggg tgaaaggcgc attgatgcag cctgcggcgg cctcggagcg cggcggagcc 60 agacgctgac cacgttcctc tcctcggtct cctccgcctc cagctccgcg ctgcccggca 120 gccgggagcc atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc 172 Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg 1 5 10 ggc ctc ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc 220 Gly Leu Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala 15 20 25 30 tct gag atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag 268 Ser Glu Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu 35 40 45 gtg gtg gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg 316 Val Val Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val 50 55 60 cct ggt cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct 364 Pro Gly Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro 65 70 75 ggg atc cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg 412 Gly Ile Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu 80 85 90 agg gaa agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca 460 Arg Glu Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser 95 100 105 110 tgg agt tca ttg aat tat ggc ata gat ctt ggg aaa att gcg gag tgt 508 Trp Ser Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys 115 120 125 aca ttt aca aag atg cgt tca aat agt gct cta aga gtt ttg ttc agt 556 Thr Phe Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser 130 135 140 ggc tca ctt cgg cta aaa tgc aga aat gca tgc tgt cag cgt tgg tat 604 Gly Ser Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr 145 150 155 ttc aca ttc aat gga gct gaa tgt tca gga cct ctt ccc att gaa gct 652 Phe Thr Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala 160 165 170 ata att tat ttg gac caa gga agc cct gaa atg aat tca aca att aat 700 Ile Ile Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn 175 180 185 190 att cat cgc act tct tct gtg gaa gga ctt tgt gaa gga att ggt gct 748 Ile His Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala 195 200 205 gga tta gtg gat gtt gct atc tgg gtt ggc act tgt tca gat tac cca 796 Gly Leu Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro 210 215 220 aaa gga gat gct tct act gga tgg aat tca gtt tct cgc atc att att 844 Lys Gly Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile 225 230 235 gaa gaa cta cca aaa t aaatgcttta attttcattt gctacctctt tttttattat 900 Glu Glu Leu Pro Lys 240 gccttggaat ggttcactta aatgacattt taaataagtt tatgtataca tctgaatgaa 960 aagcaaagct aaatatgttt acagaccaaa gtgtgatttc acactgtttt taaatctagc 1020 attattcatt ttgcttcaat caaaagtggt ttcaatattt tttttagttg gttagaatac 1080 tttcttcata gtcacattct ctcaacctat aatttggaat attgttgtgg tcttttgttt 1140 tttctcttag tatagcattt ttaaaaaaat ataaaagcta ccaatctttg tacaatttgt 1200 aaatgttaag aatttttttt atatctgtta aataaaaatt atttccaaca accttaaaaa 1260 aaaaaaaaaa aa 1272 <210> 2 <211> 243 <212> PRT <213> Homo sapiens <400> 2 Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu 1 5 10 15 Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu 20 25 30 Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val 35 40 45 Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly 50 55 60 Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile 65 70 75 80 Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu 85 90 95 Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser 100 105 110 Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys Thr Phe 115 120 125 Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser Gly Ser 130 135 140 Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr Phe Thr 145 150 155 160 Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala Ile Ile 165 170 175 Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn Ile His 180 185 190 Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala Gly Leu 195 200 205 Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro Lys Gly 210 215 220 Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile Glu Glu 225 230 235 240 Leu Pro Lys <210> 3 <211> 1355 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (174)..(584) <223> Gene LBFL301, Clone CH4 <400> 3 ctccgggtgt cgcgggggcg ggaggaatta agggagggag agaggcgcgc gggtgaaagg 60 cgcattgatg cagcctgcgg cggcctcgga gcgcggcgga gccagacgct gaccacgttc 120 ctctcctcgg tctcctccgc ctccagctcc gcgctgcccg gcagccggga gcc 173 atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc ggc ctc 221 Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu 1 5 10 15 ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc tct gag 269 Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu 20 25 30 atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag gtg gtg 317 Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val 35 40 45 gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg cct ggt 365 Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly 50 55 60 cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct ggg atc 413 Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile 65 70 75 80 cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg agg gaa 461 Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu 85 90 95 agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca tgg agt 509 Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser 100 105 110 tca ttg aat tat ggc ata gat ctt ggg aaa att gcg aaa cac gtc aag 557 Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys 115 120 125 agt caa tac gaa tgg aca gaa cta gtc tagaat gagtgtacat ttacaaagat 610 Ser Gln Tyr Glu Trp Thr Glu Leu Val 130 135 gcgttcaaat agtgctctaa gagttttgtt cagtggctca cttcggctaa aatgcagaaa 670 tgcatgctgt cagcgttggt atttcacatt caatggagct gaatgttcag gacctcttcc 730 cattgaagct ataatttatt tggaccaagg aagccctgaa atgaattcaa caattaatat 790 tcatcgcact tcttctgtgg aaggactttg tgaaggaatt ggtgctggat tagtggatgt 850 tgctatctgg gttggcactt gttcagatta cccaaaagga gatgcttcta ctggatggaa 910 ttcagtttct cgcatcatta ttgaagaact accaaaataa atgctttaat tttcatttgc 970 tacctctttt tttattatgc cttggaatgg ttcacttaaa tgacatttta aataagttta 1030 tgtatacatc tgaatgaaaa gcaaagctaa atatgtttac agaccaaagt gtgatttcac 1090 actgttttta aatctagcat tattcatttt gcttcaatca aaagtggttt caatattttt 1150 tttagttggt tagaatactt tcttcatagt cacattctct caacctataa tttggaatat 1210 tgttgtggtc ttttgttttt tctcttagta tagcattttt aaaaaaatat aaaagctacc 1270 aatctttgta caatttgtaa atgttaagaa ttttttttat atctgttaaa taaaaattat 1330 ttccaacaaa aaaaaaaaaa aaaaa 1355 <210> 4 <211> 137 <212> PRT <213> Homo sapiens <400> 4 Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu 1 5 10 15 Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu 20 25 30 Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val 35 40 45 Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly 50 55 60 Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile 65 70 75 80 Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu 85 90 95 Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser 100 105 110 Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys 115 120 125 Ser Gln Tyr Glu Trp Thr Glu Leu Val 130 135 <210> 5 <211> 2500 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (38)..(892) <223> Clone LBFL304, ORF1 <400> 5 ggatataagc agtgcaaccc aagacctaag aatcttg atg ttg gaa ata aag 52 Met Leu Glu Ile Lys 1 5 atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg 100 Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly 10 15 20 aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta 148 Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu 25 30 35 gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac 196 Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn 40 45 50 tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat 244 Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp 55 60 65 aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat 292 Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn 70 75 80 85 aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag 340 Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu 90 95 100 cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca 388 His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro 105 110 115 agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt 436 Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu 120 125 130 caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt 484 Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu 135 140 145 gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac 532 Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His 150 155 160 165 tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg 580 Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu 170 175 180 gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628 Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro 185 190 195 agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag 676 Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln 200 205 210 tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct 724 Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro 215 220 225 gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc 772 Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr 230 235 240 245 gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag 820 Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys 250 255 260 gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc 868 Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser 265 270 275 gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac 920 Ala Ser Ser Ser Leu Ser Ser Asp 280 285 acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980 attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg 1040 tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg 1100 gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac 1160 agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg 1220 ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca 1280 cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc 1340 cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta 1400 gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa 1460 gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct 1520 tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg 1580 catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct 1640 gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata 1700 ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt 1760 tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt 1820 tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac 1880 aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt 1940 ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata 2000 tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag 2060 taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct 2120 tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt 2180 aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct 2240 ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg 2300 tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca 2360 agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata 2420 gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa 2480 actttaaaaa aaaaaaaaaa 2500 <210> 6 <211> 285 <212> PRT <213> Homo sapiens <400> 6 Met Leu Glu Ile Lys Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser 1 5 10 15 Tyr Gly Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile 20 25 30 Asn Trp Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr 35 40 45 Glu Tyr Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr 50 55 60 Leu Lys Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu 65 70 75 80 Gln Asn Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu 85 90 95 Val Val Ser Ala Glu His Ala Val Ser Met Glu Met Ala Ser Ala Asp 100 105 110 Ser Asp Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr 115 120 125 Leu Pro Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser 130 135 140 Pro Glu Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His 145 150 155 160 Leu Asn Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu 165 170 175 Glu Thr Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu 180 185 190 Leu Glu Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro 195 200 205 Lys Glu Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp 210 215 220 Gln Leu Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met 225 230 235 240 Phe Thr Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly 245 250 255 Lys Met Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln 260 265 270 His Leu Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp 275 280 285 <210> 7 <211> 2500 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (53)..(892) <223> Clone LBFL304, ORF2 <400> 7 ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa ag 52 atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg 100 Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly 1 5 10 15 aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta 148 Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu 20 25 30 gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac 196 Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn 35 40 45 tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat 244 Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp 50 55 60 aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat 292 Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn 65 70 75 80 aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag 340 Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu 85 90 95 cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca 388 His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro 100 105 110 agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt 436 Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu 115 120 125 caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt 484 Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu 130 135 140 gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac 532 Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His 145 150 155 160 tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg 580 Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu 165 170 175 gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628 Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro 180 185 190 agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag 676 Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln 195 200 205 tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct 724 Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro 210 215 220 gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc 772 Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr 225 230 235 240 gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag 820 Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys 245 250 255 gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc 868 Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser 260 265 270 gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac 920 Ala Ser Ser Ser Leu Ser Ser Asp 275 280 acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980 attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg 1040 tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg 1100 gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac 1160 agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg 1220 ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca 1280 cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc 1340 cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta 1400 gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa 1460 gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct 1520 tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg 1580 catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct 1640 gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata 1700 ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt 1760 tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt 1820 tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac 1880 aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt 1940 ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata 2000 tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag 2060 taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct 2120 tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt 2180 aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct 2240 ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg 2300 tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca 2360 agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata 2420 gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa 2480 actttaaaaa aaaaaaaaaa 2500 <210> 8 <211> 280 <212> PRT <213> Homo sapiens <400> 8 Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly 1 5 10 15 Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu 20 25 30 Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn 35 40 45 Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp 50 55 60 Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn 65 70 75 80 Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu 85 90 95 His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro 100 105 110 Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu 115 120 125 Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu 130 135 140 Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His 145 150 155 160 Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu 165 170 175 Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro 180 185 190 Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln 195 200 205 Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro 210 215 220 Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr 225 230 235 240 Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys 245 250 255 Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser 260 265 270 Ala Ser Ser Ser Leu Ser Ser Asp 275 280 <210> 9 <211> 2500 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (65)..(892) <223> Clone LBFL304, ORF3 <400> 9 ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga 60 agct atg acc tac aca gag gac agt tat ggg atg gat ggg aag gtt 106 Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val 1 5 10 aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag 154 Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu 15 20 25 30 cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga 202 Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg 35 40 45 ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta 250 Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val 50 55 60 ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act 298 Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr 65 70 75 caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct 346 Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala 80 85 90 gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat 394 Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His 95 100 105 110 aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc 442 Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr 115 120 125 ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg 490 Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp 130 135 140 aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga 538 Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg 145 150 155 aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586 Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr 160 165 170 gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634 Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro 175 180 185 190 agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682 Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly 195 200 205 ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730 Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His 210 215 220 tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778 Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu 225 230 235 cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826 His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu 240 245 250 aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874 Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser 255 260 265 270 tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930 Ser Ser Leu Ser Ser Asp 275 tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990 accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg 1050 gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg 1110 ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct 1170 tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt 1230 gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc 1290 ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc 1350 agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt 1410 tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa 1470 cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa 1530 aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat 1590 aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg 1650 tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta 1710 ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt 1770 ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga 1830 acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt 1890 aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt 1950 ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt 2010 gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta 2070 ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt 2130 agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt 2190 aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga 2250 ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca 2310 gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg 2370 aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct 2430 ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa 2490 aaaaaaaaaa 2500 <210> 10 <211> 276 <212> PRT <213> Homo sapiens <400> 10 Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val Asn Gln 1 5 10 15 Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu Leu His 20 25 30 Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg Leu Ser 35 40 45 Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val Phe Ala 50 55 60 Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr Gln Thr 65 70 75 80 Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala Val Ser 85 90 95 Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His Lys Val 100 105 110 Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr Leu His 115 120 125 Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp Asn Asn 130 135 140 Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg Lys Thr 145 150 155 160 Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr Asp Phe 165 170 175 Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro Arg Leu 180 185 190 Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly Gly Pro 195 200 205 Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His Ser Asp 210 215 220 Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu His Arg 225 230 235 240 Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu Lys Asn 245 250 255 His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser Ser Ser 260 265 270 Leu Ser Ser Asp 275 <210> 11 <211> 2500 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (92)..(892) <223> Clone LBFL304, ORF4 <400> 11 ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga 60 agctatgacc tacacagagg acagttatgg g atg gat ggg aag gtt 106 Met Asp Gly Lys Val 1 5 aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag 154 Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu 10 15 20 cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga 202 Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg 25 30 35 ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta 250 Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val 40 45 50 ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act 298 Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr 55 60 65 caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct 346 Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala 70 75 80 85 gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat 394 Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His 90 95 100 aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc 442 Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr 105 110 115 ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg 490 Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp 120 125 130 aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga 538 Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg 135 140 145 aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586 Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr 150 155 160 165 gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634 Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro 170 175 180 agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682 Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly 185 190 195 ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730 Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His 200 205 210 tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778 Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu 215 220 225 cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826 His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu 230 235 240 245 aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874 Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser 250 255 260 tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930 Ser Ser Leu Ser Ser Asp 265 tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990 accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg 1050 gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg 1110 ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct 1170 tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt 1230 gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc 1290 ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc 1350 agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt 1410 tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa 1470 cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa 1530 aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat 1590 aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg 1650 tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta 1710 ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt 1770 ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga 1830 acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt 1890 aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt 1950 ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt 2010 gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta 2070 ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt 2130 agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt 2190 aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga 2250 ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca 2310 gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg 2370 aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct 2430 ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa 2490 aaaaaaaaaa 2500 <210> 12 <211> 267 <212> PRT <213> Homo sapiens <400> 12 Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp 1 5 10 15 Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr 20 25 30 Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys 35 40 45 Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn 50 55 60 Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val 65 70 75 80 Ser Ala Glu His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp 85 90 95 Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro 100 105 110 Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu 115 120 125 Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn 130 135 140 Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr 145 150 155 160 Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu 165 170 175 Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu 180 185 190 Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu 195 200 205 Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr 210 215 220 Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met 225 230 235 240 Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu 245 250 255 Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp 260 265 <210> 13 <211> 6405 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (49)..(1434) <223> Gene LBFL305 <400> 13 gcgggaggat ggagcagtga gcgggtctgg gcggctgctg gcagcgcc atg gag acg 57 Met Glu Thr 1 gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa 105 Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu 5 10 15 gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa 153 Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys 20 25 30 35 ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag 201 Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu 40 45 50 acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc 249 Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu 55 60 65 cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct 297 Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro 70 75 80 cat gta gtc aaa tat tac ggc agt tat ttt aag aac aca gac tta tgg 345 His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp 85 90 95 atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga 393 Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg 100 105 110 115 tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa 441 Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln 120 125 130 tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac 489 Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His 135 140 145 cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca 537 Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala 150 155 160 aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc 585 Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala 165 170 175 aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg 633 Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val 180 185 190 195 att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga 681 Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly 200 205 210 ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc 729 Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile 215 220 225 cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca 777 His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr 230 235 240 ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa 825 Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys 245 250 255 cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc 873 Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu 260 265 270 275 ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 921 Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg 280 285 290 gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc 969 Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser 295 300 305 cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat 1017 Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp 310 315 320 gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc 1065 Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly 325 330 335 act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att 1113 Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile 340 345 350 355 gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat 1161 Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn 360 365 370 gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc 1209 Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr 375 380 385 atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1257 Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu 390 395 400 aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1305 Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu 405 410 415 aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1353 Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe 420 425 430 435 aaa act agc caa gaa cag cag tct gga aaa gac ata tgt atc caa aat 1401 Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys Ile Gln Asn 440 445 450 tgc cag gga aac ctg ctg tgt aga tac gct ttc tgagaa accacatgct 1450 Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe 455 460 taagagttgg acagtggagg accttcagaa gaggctcttg gccctggacc ccatgatgga 1510 gcaggagatt gaagagatcc ggcagaagta ccagtccaag cggcagccca tcctggatgc 1570 catagaggct aagaagagac ggcaacaaaa cttctgagca aggccaggct gtgagggccc 1630 cagctccacc caggctttgg gtgaattctg gatggcttgc ctcatgtttg ttagccagca 1690 cttctgctct gtcgtctctc cacagcacct ttgtgaactc aggaatgtgc gccagtggga 1750 agggctctct tgacagtcag cgtgccatct tgatgtgtgt atgtacattg gtcaggtata 1810 ttatctcaaa ggatttatat tggcgctttt aactcagagt tttaaacccc aggaacagag 1870 actcctagtt gagtgatagc tgggaaagtt ttacattgtc tgtttttctt ctcccaatag 1930 ctttcaattg ttctttctgg aagactttta aaaaaatata aatatgcata tatatatata 1990 aattataaat agattcccca cgcagtgtgg tggcatctct gtacaggtac agttttaaac 2050 ggtttgcctc ttttctgtaa gattatggta ctgtggaaca tgagggcaga ggacaccggg 2110 aggctgttag ggggtcactg aatcccagga gccaacctcc ccctttgcag ggctgcattt 2170 aaaaattagg tttgggacag ttcttgtacc gtggtttcag ccttgtgtgg tcatcactgg 2230 cttctggagc tattggtgat gtccaaggga aagctttgag agtttatgtt tactctttga 2290 gtcccaggag aagcctggca ccctctttgc aaattggcct ttgctctttc aatgcctttc 2350 atccatctcc actctctcaa ctgcctaaag tcacagcaca gatactgccc agtgccttaa 2410 gaggagacat gatctctacc agggactctc agcaaacacg ggactgtgtt cagtccacaa 2470 aggaaaagcg tttttgaagc tctcattgtt catgtaaaaa tcatacacgt ggcatgttgc 2530 tccacattcc ttacacacag gggtagaggg gattgctttt gtgacccacg ttcaaatatg 2590 tgactgtttt cttttctctt ttactgctaa gcagcctgga aaggataaat gaatattaga 2650 ctaagatttg ttttccagga ggctcaatct gaacacacag aatgtcagag ctggaaggga 2710 ctatagagat catctgatct gatcctcttg tacggatgat cgcaaaactg aggtgtagag 2770 aggggaatgg ccaaaatcac aaagcaagtt agcgttaaga gctgagacta gaattcaggg 2830 tcctcactcc caggccaccg aaccatgcag ccccttcttt gggggaagag acctgtgtca 2890 gtcttggtta attgttccag ggaaccttgc taacagaaac ttgctcttgc cttggctctt 2950 cagtagatga cctggctgta aagagattcc ctggacgagc cagatcattc agtttcagcg 3010 agtccttgag ctccacaaca tctaccagat atagcagaca agcacccatg gaggcaggtt 3070 tcgggcctga agcagatcag agggctttgc aaaagacagc atagagccat cttcctgcaa 3130 ctttacctct ttccctcaga tggggagcca tgactgggtt gcacctcagg atactgtaat 3190 ttgactccat aattgctttt gctcctgaaa cctgggaatc aatggaaagg cagggaatgt 3250 gcctcttctg tggccagatt ctgttatttg caattaaagc aagtttttaa aaaatgcaag 3310 aggcagttgt tagtcttcag ggcttggcaa ctgaaatagc tatgtggcgg atacggaaaa 3370 cagaggacaa tttgaggatc ttgctggaat aataaatgac agctaccatt tgttgagcac 3430 ctattatata tcaggcactg agctgggtag gctctaaact tcacaataac cctgtgactt 3490 aactacttta tctccatttt gtagttgaag aaataagttc agagagaaag attccttccc 3550 aaggtcatgc agctagtaaa tgatagaatc aggattcata gcatcactat agggggtcaa 3610 tatttacaca aaaaaggaaa gtcacaagcc tgtttaaaat gaagtgacca ccttttcttg 3670 catagactaa ataactcgaa ctggcatttt taggttggaa agacagctga attagtagtt 3730 aagtctgata gccaagtaag ttttaaaaac caaagcatcc aggatgcaca cccctgcacc 3790 atttgctgtg cgaattaata gttctgtctc tctctctctt tcttttttct ttttattctt 3850 tgagatggat tttcgctctt gtcgcccagg ctggagtaca atggcacgat cttggctcac 3910 tgcaacctcc gcctcccggg ttcaagcgat tcttctgctg ggattacagc atatgccacc 3970 atgcccagat tatttttttg tatttgtagt agagacgggg tttcaccatg tcagtcaggc 4030 tggtcttgaa ctcctgacct caggtgatcc acccgcctca gcctcccaca ctgctgggat 4090 tacaggcatg agccaccgct cctggcctct ctttcttttt taaacaaaga actttgcact 4150 tggccagaga ggaggagaaa gcccattttc tcccttccta agctagatcc aaataaaaga 4210 aagttcagtt ttcccccata actattcttg ggtcatgaac tttgatctgg agtttgtttt 4270 gtttcaggaa tgtgtgcacc cagcttgctg atccaacaaa gtctattgct taccagtcta 4330 gcttgatgaa gccttttggc cagaagtcaa tttgttttgg atcagagaaa tttcctgaca 4390 aggtatattt gttttctagt gacagaaagg caaaggaaca agtcctagtt gttgttgttg 4450 ttgttgaata ctaaatttaa gatatgtcag cttgctttca atgagccttg ggcttctgtt 4510 attgcttgag catttggaac tcgagcttcc agagaaattt gaggtcctcg cttgttctct 4570 gccttcaaga aacaatgacc tgattctgtc tttaaaaaaa aaatctcaga attctttttt 4630 tgtttgtgtt tttttttttg agacagagtc tcactctgtt gcccaggctg gagtgcagtg 4690 gcgccatctc ggctcactgc aacctccgcc tcccaggttc aagcaattct cctgcctcag 4750 cctcccaggt agctgccact acaggtgctg caccaccacg cccggctaat ttttgtattt 4810 ttagtagaga cagggtttca ccatattagc caggtgggtc ttgaactcct gaccttgtga 4870 tccacccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc ttgcctggcc 4930 aaaaatctca gaattcttta agactgtttt aattgctcca tcagtaattt tgaagcactt 4990 tccttttttt ttttcccctt tttgtccctt tccccaagcc accaattgga tggatgaatg 5050 tttgacgggg aagaggaagg gtaggaggat gcatggatga gtggatgagt ggatcgatgg 5110 atgtattgat aaatagatag aaccagtcat ctgaagcaac ttaagaattg tagccttgac 5170 tccttgagac tgtagatttc gatccaggaa acatttattt agcacctgcc agatgccaga 5230 aatttatacc atttaaaact cagtaagtct tttaaatatc aggaaggaga gaagcgacat 5290 catgatacat cctatgggta ttaaaaagcc aatagaatat tatgaataat tttatgctaa 5350 taaatttaac aacttcaaca tcataaacaa attccttgaa aaataaaaag taccaaaatt 5410 cattcaagaa gaaatagata ccagcctgag caacatggca aaatcccatc tctacaaaac 5470 atcaaaaaaa aaaaattagt cgggcatggt ggtgcacacc tgtaatccca gcttgtcagg 5530 aggctgaagt gggaggatca cctgagccca gggaggtcaa ggatgcagtg agccatggtc 5590 tcaccactgc actctagcct aggtgacaga atgagacccc gtctcaaaaa aaaagaagaa 5650 gtagataatc tgaatagccc tatatctata gaaacttaat agtgctggga gatataggta 5710 ttattatcct cattttacag atgtgaaaat tgaggctcag agaagtaaag tctattgctc 5770 aaggtcatgt ggctagaata tggcagagcc atgattcaga tccaggtctt ctgattctta 5830 ttccagtgtc ctttctagca taccatgttg cctctaaaga ttgcagctcc ttatttacta 5890 gaaaattgtt cctgcccaat ctacatctcc acctcacccc atcttttctt aagcactatg 5950 tttgtgtttt tatcagtatt atattcattg tctttggaat acatgttctt gtttgtgttt 6010 ggaaaaaaaa tctcttttac cagcttgcac tcggaccaac ttggaaaaaa aaagcttaaa 6070 tgtttttgct atgtacagtt taaaaatgtg aagtttgtag ctttaacttt ttgtaagaaa 6130 atctaataac actggcttaa gtgctgactt gaaatgctat tttgtaaggt ttggatgtaa 6190 gtaatcaatt gaggtcagca gtttgtatga gacatagctt cctccattgc ccccactcct 6250 tttttctttt ttaagtttga gatgcttcct gtgtttttat gttagaattg ttgttctcct 6310 tcttttcttc ttcctatacc tcatcacgtt tgttttaaat aaactgtcct ttggaccaca 6370 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 6405 <210> 14 <211> 462 <212> PRT <213> Homo sapiens <400> 14 Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys 1 5 10 15 Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val 20 25 30 Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile 35 40 45 His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu 50 55 60 Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys 65 70 75 80 Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr 85 90 95 Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp 100 105 110 Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr 115 120 125 Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg 130 135 140 Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu 145 150 155 160 Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp 165 170 175 Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala 180 185 190 Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp 195 200 205 Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr 210 215 220 Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro 225 230 235 240 Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp 245 250 255 Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala 260 265 270 Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser 275 280 285 Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg 290 295 300 Gln Glu Ser Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser 305 310 315 320 Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp 325 330 335 Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn 340 345 350 Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met 355 360 365 Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg 370 375 380 Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu 385 390 395 400 Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro 405 410 415 Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp 420 425 430 Tyr Glu Phe Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys 435 440 445 Ile Gln Asn Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe 450 455 460 <210> 15 <211> 1931 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (43)..(1503) <223> Mst1/STK4 gene <400> 15 cggcacgaga gtgagcgggt ctgggcggct gctggcagcg cc atg gag acg 51 Met Glu Thr 1 gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa 99 Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu 5 10 15 gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa 147 Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys 20 25 30 35 ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag 195 Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu 40 45 50 acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc 243 Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu 55 60 65 cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct 291 Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro 70 75 80 cat gta gtc aaa tat tat ggc agt tat ttt aag aac aca gac tta tgg 339 His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp 85 90 95 atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga 387 Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg 100 105 110 115 tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa 435 Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln 120 125 130 tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac 483 Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His 135 140 145 cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca 531 Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala 150 155 160 aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc 579 Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala 165 170 175 aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg 627 Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val 180 185 190 195 att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga 675 Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly 200 205 210 ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc 723 Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile 215 220 225 cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca 771 His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr 230 235 240 ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa 819 Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys 245 250 255 cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc 867 Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu 260 265 270 275 ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 915 Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg 280 285 290 gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc 963 Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser 295 300 305 cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat 1011 Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp 310 315 320 gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc 1059 Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly 325 330 335 act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att 1107 Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile 340 345 350 355 gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat 1155 Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn 360 365 370 gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc 1203 Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr 375 380 385 atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1251 Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu 390 395 400 aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1299 Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu 405 410 415 aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1347 Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe 420 425 430 435 ctt aag agt tgg aca gtg gag gac ctt cag aag agg ctc ttg gcc ctg 1395 Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu Leu Ala Leu 440 445 450 gac ccc atg atg gag cag gag att gaa gag atc cgg cag aag tac cag 1443 Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln Lys Tyr Gln 455 460 465 tcc aag cgg cag ccc atc ctg gat gcc ata gag gct aag aag aga cgg 1491 Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys Lys Arg Arg 470 475 480 caa caa aac ttc tgagcaa ggccaggctg tgagggcccc agctccaccc 1540 Gln Gln Asn Phe 485 aggctttggg tgaattctgg atggcttgcc tcatgtttgt tagccagcac ttctgctctg 1600 tcgtctctcc acagcacctt tgtgaactca ggaatgtgcg ccagtgggaa gggctctctt 1660 gacagtcagc gtgccatctt gatgtgtgta tgtacattgg tcaggtatat tatctcaaag 1720 gatttatatt ggcgctttta actcagagtt ttaaacccca ggaacagaga ctcctagttg 1780 agtgatagct gggaaagttt tacattgtct gtttttcttc tcccaatagc tttcaattgt 1840 tctttctgga agacttttaa aaaaatataa atatgcatat atatatataa attataaata 1900 gattccccac gcaggtggtg gcatctctgt a 1931 <210> 16 <211> 487 <212> PRT <213> Homo sapiens <400> 16 Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys 1 5 10 15 Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val 20 25 30 Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile 35 40 45 His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu 50 55 60 Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys 65 70 75 80 Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr 85 90 95 Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp 100 105 110 Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr 115 120 125 Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg 130 135 140 Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu 145 150 155 160 Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp 165 170 175 Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala 180 185 190 Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp 195 200 205 Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr 210 215 220 Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro 225 230 235 240 Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp 245 250 255 Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala 260 265 270 Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser 275 280 285 Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg 290 295 300 Gln Glu Ser Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser 305 310 315 320 Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp 325 330 335 Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn 340 345 350 Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met 355 360 365 Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg 370 375 380 Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu 385 390 395 400 Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro 405 410 415 Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp 420 425 430 Tyr Glu Phe Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu 435 440 445 Leu Ala Leu Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln 450 455 460 Lys Tyr Gln Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys 465 470 475 480 Lys Arg Arg Gln Gln Asn Phe 485 <210> 17 <211> 1299 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (75)..(572) <223> Clone no. LBFL306-EF3 <400> 17 gcggcggcgg cttctcgagt cctccccgac gcgtcctcta ggccagcgag ccccgcgctc 60 tccggtgacg gacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 107 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu 1 5 10 gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 155 Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His 15 20 25 cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 203 Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln 30 35 40 cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 251 Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp 45 50 55 acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 299 Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val 60 65 70 75 cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 347 Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr 80 85 90 gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 395 Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys 95 100 105 ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 443 Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys 110 115 120 gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 491 Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu 125 130 135 tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gat aac ccc aag 539 Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Asn Pro Lys 140 145 150 155 aaa ggc atc agg gtt ctg gag tgg ttg ttt gag tgacacag cacaaggcct 590 Lys Gly Ile Arg Val Leu Glu Trp Leu Phe Glu 160 165 tgatttcatc atgcttttgc tgtggatgta gtgtagcttg ctgaacaggt ttatttcaca 650 gagcagtgta cattcttgtc ttccagggga acttcaacat ggagttactt ttgatccctc 710 agttttaatt cagtgtctaa agcctgagaa atgccagtgg cctgacagca gcagacattg 770 cacaaaccca gggtttccaa gagtgtgccc agtttctctt gaacctccag aattgtcatc 830 tgaaccattt ctataacaat ggcatcttaa atgggggtca tcagaatgta tttcctaatc 890 atattagtgt gggaacaaat cgaaagagat gcttggaaga ctcagaagac tttggagtaa 950 agaaagctag aactgaaggt gagaccgctt tgcgggtggg aagagcacac ttatttttcc 1010 tttctgtaat atgttttctt tttatggctg agcgcacctt cgagatgaga ccttcacttc 1070 aggtggtaat gcgcctggtg gattgtgcgg tgacggtgga gatttctcct gtactgccac 1130 tgcgaagatg ggacacttaa caaaagggaa tgtgagggaa atactgatgg cccaagtgta 1190 aatgtctatg tggaactttt tgagcaccca tgtttacctg ccgtgaatta gattttttaa 1250 tttgttgtat ctgtttgaaa tatatctatt aaagaaaaaa aaaaaaaaa 1299 <210> 18 <211> 166 <212> PRT <213> Homo sapiens <400> 18 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser 1 5 10 15 Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp 20 25 30 Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala 35 40 45 His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp 50 55 60 Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala 65 70 75 80 Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala 85 90 95 His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile 100 105 110 Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro 115 120 125 Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu 130 135 140 Val Ala Asn Gly Ala His Val Asp Asn Pro Lys Lys Gly Ile Arg Val 145 150 155 160 Leu Glu Trp Leu Phe Glu 165 <210> 19 <211> 2451 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (78)..(1337) <223> Clone no. LBFL306-GC7 <400> 19 gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg 60 ctctccggtg acggacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 110 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu 1 5 10 gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158 Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His 15 20 25 cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 206 Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln 30 35 40 cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 254 Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp 45 50 55 acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 302 Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val 60 65 70 75 cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 350 Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr 80 85 90 gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 398 Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys 95 100 105 ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 446 Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys 110 115 120 gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 494 Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu 125 130 135 tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gac ctg aga aat 542 Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Leu Arg Asn 140 145 150 155 gcc agt ggc ctg aca gca gca gac att gca caa acc cag ggt ttc caa 590 Ala Ser Gly Leu Thr Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln 160 165 170 gag tgt gcc cag ttt ctc ttg aac ctc cag aat tgt cat ctg aac cat 638 Glu Cys Ala Gln Phe Leu Leu Asn Leu Gln Asn Cys His Leu Asn His 175 180 185 ttc tat aac aat ggc atc tta aat ggg ggt cat cag aat gta ttt cct 686 Phe Tyr Asn Asn Gly Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro 190 195 200 aat cat att agt gtg gga aca aat cga aag aga tgc ttg gaa gac tca 734 Asn His Ile Ser Val Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser 205 210 215 gaa gac ttt gga gta aag aaa gct aga act gaa gct caa agc ttg gat 782 Glu Asp Phe Gly Val Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp 220 225 230 235 tct gcc gtg cca ctc acg aat ggc gac aca gaa gac gat gct gac aaa 830 Ser Ala Val Pro Leu Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys 240 245 250 atg cac gtt gat agg gag ttt gct gtt gta aca gat atg aaa aac agt 878 Met His Val Asp Arg Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser 255 260 265 agc tcc gta tcg aat aca ttg aca aat gga tgt gtc atc aat gga cat 926 Ser Ser Val Ser Asn Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His 270 275 280 ttg gac ttc ccc tcc acg acc ccg ctc agt ggg atg gaa agc agg aat 974 Leu Asp Phe Pro Ser Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn 285 290 295 ggc cag tgc ttg aca gga act aac gga att agc agt gga tta gcc cca 1022 Gly Gln Cys Leu Thr Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro 300 305 310 315 gga cag ccg ttt ccg agt agc cag ggt tct ctc tgc att agt ggg act 1070 Gly Gln Pro Phe Pro Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr 320 325 330 gag gag cca gag aag acc ctg aga gct aac cct gag ttg tgc ggt tct 1118 Glu Glu Pro Glu Lys Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser 335 340 345 ctg cac ctg aac ggg agt cca agt agc tgc ata gcc agt agg cct tcc 1166 Leu His Leu Asn Gly Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser 350 355 360 tgg gtg gaa gac att ggg gat aac ctg tac tat gga cac tac cac ggg 1214 Trp Val Glu Asp Ile Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly 365 370 375 ttt ggg gac act gct gaa agc atc cca gaa ctg aac agt gtg gtc gag 1262 Phe Gly Asp Thr Ala Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu 380 385 390 395 cat tcc aag tcc gtg aag gtg cag gag cgg tac gac agt gcc gtg ctg 1310 His Ser Lys Ser Val Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu 400 405 410 ggc acc atg cac ctg cac cac ggc tcc tag agacgctgac ctggctctcg 1360 Gly Thr Met His Leu His His Gly Ser 415 420 gaaacgcagg agtccttcct ggtagccagc tcagaatacc catgtagcag caacttgaac 1420 gaatgtcaca acttgtacgt tttttatata cttcaacttt ctgaaaaagt aaacttcgac 1480 aagttcccag caactgcttg tttgtgcatg agtagggctt actaagtgca tagatgtttc 1540 tacagtgagg tgtccttttt ataaggtgca cttttggagt tcttctgatg ccaatctcaa 1600 cattgtcttt ttaatactgt caccagatat tgccattttt ctttttgtta aaagattata 1660 tgatcaagat aaattggggt ggtaaatcag gtgcctggta atttatctct ttgcacatgg 1720 gcatcatttt aaaaagcttg cttccactct tttctgtaga atttgacgga acacagctat 1780 ttccctatgc aaggtacagc cttacaaaga tttctgcagt gatttgtgtg aagaagagaa 1840 cgtttgtctt tttcaatgaa gctttgcaga tcaccatgtg gttgaaggtt ttagttgtgg 1900 acacagtggt ccctccttaa tgatgaagat cactgccttg ggcttcatgg aaaacaggcc 1960 cagcctgggg ctgcgtttgg atttattgtt tttattccac acttcctact tggtctctgg 2020 aagttttacc acatgtaaca gattccttta tatgtagtgg aaatcactat ttgtagaaac 2080 tgtcaggtca aaatatttaa ctgactgttg acatgtattt tcttttttcc ttgtttttgt 2140 tttttagggt tttctgcttt aagatatata ccactatgta tatccagtta actgagagaa 2200 ttttgactct cttaataaaa ctgcattaag tttttgattt tgtagaaatt agcttttgtc 2260 taggcaacta gtggttatac tctgcaaata ttgtaatgaa tttttacttt tttgattttt 2320 gtaataaaaa ttggtgcaga taaaatgtca aatgaacaaa ccagtgttct aagagtgtta 2380 ctaacatttt gttctaaaac tgtccttcac aaattgaata aaaaactctc acactcaaaa 2440 aaaaaaaaaa a 2451 <210> 20 <211> 420 <212> PRT <213> Homo sapiens <400> 20 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser 1 5 10 15 Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp 20 25 30 Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala 35 40 45 His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp 50 55 60 Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala 65 70 75 80 Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala 85 90 95 His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile 100 105 110 Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro 115 120 125 Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu 130 135 140 Val Ala Asn Gly Ala His Val Asp Leu Arg Asn Ala Ser Gly Leu Thr 145 150 155 160 Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln Glu Cys Ala Gln Phe 165 170 175 Leu Leu Asn Leu Gln Asn Cys His Leu Asn His Phe Tyr Asn Asn Gly 180 185 190 Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro Asn His Ile Ser Val 195 200 205 Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser Glu Asp Phe Gly Val 210 215 220 Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp Ser Ala Val Pro Leu 225 230 235 240 Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys Met His Val Asp Arg 245 250 255 Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser Ser Ser Val Ser Asn 260 265 270 Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His Leu Asp Phe Pro Ser 275 280 285 Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn Gly Gln Cys Leu Thr 290 295 300 Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro Gly Gln Pro Phe Pro 305 310 315 320 Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr Glu Glu Pro Glu Lys 325 330 335 Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser Leu His Leu Asn Gly 340 345 350 Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser Trp Val Glu Asp Ile 355 360 365 Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly Phe Gly Asp Thr Ala 370 375 380 Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu His Ser Lys Ser Val 385 390 395 400 Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu Gly Thr Met His Leu 405 410 415 His His Gly Ser 420 <210> 21 <211> 1194 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (78)..(737) <223> Clone no. LBFL-306-GE2 <400> 21 gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg 60 ctctccggtg acggacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 110 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu 1 5 10 gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158 Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His 15 20 25 cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 206 Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln 30 35 40 cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 254 Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp 45 50 55 acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 302 Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val 60 65 70 75 cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 350 Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr 80 85 90 gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 398 Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys 95 100 105 ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 446 Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys 110 115 120 gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 494 Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu 125 130 135 tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gag ttt att tca 542 Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Glu Phe Ile Ser 140 145 150 155 cag agc agt gta cat tct tgt ctt cca ggg gaa ctt caa cat gga gtt 590 Gln Ser Ser Val His Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val 160 165 170 act ttt gat ccc tca gtt tta att cag tgt cta aag cct gag aaa tgc 638 Thr Phe Asp Pro Ser Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys 175 180 185 cag tgg cct gac agc agc aga cat tgc aca aac cca ggg ttt cca aga 686 Gln Trp Pro Asp Ser Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg 190 195 200 gtg tgc cca gtt tct ctt gaa cct cca gaa ttg tca tct gaa cca ttt 734 Val Cys Pro Val Ser Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe 205 210 215 cta taa caatggcatc ttaaatgggg gtcatcagaa tgtatttcct aatcatatta 790 Leu 220 gtgtgggaac aaatcgaaag agatgcttgg aagactcaga agactttgga gtaaagaaag 850 ctagaactga aggtgagacc gctttgcggg tgggaagagc acacttattt ttcctttctg 910 taatatgttt tctttttatg gctgagcgca ccttcgagat gagaccttca cttcaggtgg 970 taatgcgcct ggtggattgt gcggtgacgg tggagatttc tcctgtactg ccactgcgaa 1030 gatgggacac ttaacaaaag ggaatgtgag ggaaatactg atggcccaag tgtaaatgtc 1090 tatgtggaac tttttgagca cccatgttta cctgccgtga attagatttt ttaatttgtt 1150 gtatctgttt gaaatatatc tattaaagaa aaaaaaaaaa aaaa 1194 <210> 22 <211> 220 <212> PRT <213> Homo sapiens <400> 22 Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser 1 5 10 15 Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp 20 25 30 Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala 35 40 45 His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp 50 55 60 Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala 65 70 75 80 Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala 85 90 95 His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile 100 105 110 Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro 115 120 125 Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu 130 135 140 Val Ala Asn Gly Ala His Val Glu Phe Ile Ser Gln Ser Ser Val His 145 150 155 160 Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val Thr Phe Asp Pro Ser 165 170 175 Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys Gln Trp Pro Asp Ser 180 185 190 Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg Val Cys Pro Val Ser 195 200 205 Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe Leu 210 215 220

Claims

(a) 서열번호 3, 5, 7, 9, 11, 13, 17 또는 19를 포함하는 분리된 핵산 분자; (b) 서열번호 4, 14 또는 18의 아미노산 서열을 코딩하는 분리된 핵산 분자; (c) 서열번호 3 또는 17의 전체 길이에 걸쳐 적어도 약 92%의 뉴클레오티드 서열 상동성을 갖고 위암에서 발현되는 단백질을 코딩하는 분리된 핵산 분자; (d) 서열번호 13의 전체 길이에 걸쳐 적어도 약 95%의 뉴클레오티드 서열 상동성을 갖고 위암에서 발현되는 단백질을 코딩하는 분리된 핵산 분자; 및 (e) (a), (b), (c) 또는 (d)의 핵산 분자의 상보물을 포함하는 분리된 핵산 분자:로 구성된 그룹으로부터 선택되는 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 3의 뉴클레오티드 174-584를 포함하는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 3의 뉴클레오티드 174-584로 구성되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 3의 뉴클레오티드 174-587을 포함하는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 5의 뉴클레오티드 38-892로 구성되는 핵산 분자; 및 서열번호 5의 뉴클레오티드 38-895로 구성되는 핵산 분자:로 구성된 그룹으로부터 선택되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 7의 뉴클레오티드 53-892로 구성되는 핵산 분자; 및 서열번호 7의 뉴클레오티드 53-895로 구성되는 핵산 분자:로 구성된 그룹으로부터 선택되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 9의 뉴클레오티드 65-892로 구성되는 핵산 분자; 및 서열번호 9의 뉴클레오티드 65-895로 구성되는 핵산 분자:로 구성된 그룹으로부터 선택되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 11의 뉴클레오티드 92-892로 구성되는 핵산 분자; 및 서열번호 11의 뉴클레오티드 92-895로 구성되는 핵산 분자:로 구성된 그룹으로부터 선택되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 13의 뉴클레오티드 49-1434를 포함하는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 13의 뉴클레오티드 49-1437로 구성되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 13의 뉴클레오티드 49-1437을 포함하는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 17의 뉴클레오티드 75-575를 포함하는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 17의 뉴클레오티드 75-575로 구성되는 것인 분리된 핵산 분자.
제1항에 있어서, 핵산 분자가 서열번호 17의 뉴클레오티드 75-572를 포함하는 것인 분리된 핵산 분자.
제1항 내지 제14항 중 어느 한 항에 있어서, 핵산 분자가 하나 이상의 발현 조절 요소에 작동 가능하게 연결되어 있는 분리된 핵산 분자.
제1항 내지 제14항 중 어느 한 항의 분리된 핵산을 포함하는 벡터.
제1항 내지 제14항 중 어느 한 항의 핵산 분자를 함유하도록 형질전환된 숙주 세포.
제16항의 벡터를 포함하는 숙주 세포.
제18항에 있어서, 숙주 세포가 원핵 숙주 세포와 진핵 숙주 세포로 구성된 그룹으로부터 선택되는 것인 숙주 세포.
제1항 내지 제14항 중 어느 한 항의 핵산 분자로 형질전환된 숙주 세포를 상기 핵산 분자에 의해 코딩되는 폴리펩티드 또는 단백질이 발현되는 조건 하에서 배양하는 것을 포함하는 폴리펩티드 또는 단백질의 제조방법.
제20항에 있어서, 숙주 세포가 원핵 숙주 세포 및 진핵 숙주 세포로 구성된 그룹으로부터 선택되는 것인 방법.
제21항의 방법에 의해 제조된 분리된 폴리펩티드 또는 단백질.
(a) 서열번호 4, 6, 8, 10, 12, 14 또는 18의 아미노산 서열을 포함하는 분리된 폴리펩티드 또는 단백질; (b) 서열번호 4와 적어도 약 92%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드 또는 단백질; (c) 서열번호 4의 아미노산 31-137로 구성되는 분리된 폴리펩티드 또는 단백질; (d) 서열번호 6, 8, 10 또는 12의 적어도 10개의 아미노산의 단편을 포함하는 분리된 폴리펩티드; (e) 서열번호 6, 8, 10 또는 12의 보존된 아미노산 치환을 포함하는 분리된 폴리펩티드; (f) 서열번호 6, 8, 10 또는 12의 자연 발생 아미노산 서열 변이체를 포함하는 분리된 폴리펩티드; (g) 서열번호 6, 8, 10 또는 12와 적어도 약 75%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드; (h) 서열번호 14와 적어도 약 95%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드 또는 단백질; 및 (i) 서열번호 18과 적어도 약 92%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드 또는 단백질:로 구성되는 그룹으로부터 선택되는 분리된 폴리펩티드 또는 단백질.
제23항의 폴리펩티드 또는 단백질 또는 서열번호 2의 아미노산 서열을 포함하는 분리된 폴리펩티드 또는 단백질과 결합하는 분리된 항체 또는 항원-결합 항체 단편.
제24항에 있어서, 항체가 모노클로날 또는 폴리클로날 항체인 항체.
핵산을 발현하는 세포를 약제에 노출시키고;

약제가 핵산의 발현을 조절하는지 여부를 결정하여, 단백질을 코딩하는 핵산의 발현을 조절하는 약제를 동정하는 것:

을 포함하는 제23항의 단백질, 서열번호 2, 20 또는 22의 아미노산 서열을 포함하는 단백질, 또는 Mst1 단백질 또는 Mst1 스플라이스 변이체 단백질을 코딩하는 핵산의 발현을 조절하는 약제를 동정하는 방법.
단백질을 발현하는 세포를 약제에 노출시키고;

약제가 단백질의 수준 또는 적어도 하나의 활성을 조절하는지 여부를 결정하여, 단백질의 수준 또는 적어도 하나의 활성을 조절하는 약제를 동정하는 것:

을 포함하는 제23항의 단백질, 서열번호 2, 20 또는 22의 아미노산 서열을 포함하는 단백질, 또는 Mst1 단백질 또는 Mst1 스플라이스 변이체 단백질의 수준 또는 적어도 하나의 활성을 조절하는 약제를 동정하는 방법.
제27항에 있어서, 약제가 단백질의 하나의 활성을 조절하는 것인 방법.
단백질을 가능한 결합 상대에 노출시키고;

가능한 결합 상대가 단백질과 결합하는지 여부를 결정하여, 단백질에 대한 결합 상대를 동정하는 것:

을 포함하는 제23항의 단백질 또는 서열번호 2의 아미노산 서열을 포함하는 단백질에 대한 결합 상대를 동정하는 방법.
단백질을 코딩하는 핵산의 발현을 조절하는 유효량의 약제를 투여하는 것을 포함하는, 제23항의 단백질, 서열번호 2, 20 또는 22의 아미노산 서열을 포함하는 단백질, Mst1 단백질 또는 Mst1 스플라이스 변이체를 코딩하는 핵산의 발현을 조절하는 방법.
단백질의 적어도 하나의 활성을 조절하는 유효량의 약제를 투여하는 것을 포함하는, 제23항의 단백질, 서열번호 2, 20 또는 22의 아미노산 서열을 포함하는 단백질, Mst1 단백질 또는 Mst1 스플라이스 변이체 단백질의 적어도 하나의 활성을 조절하는 방법.
제1항 내지 제14항 중 어느 한 항의 핵산을 함유하도록 변형된 비인간 형질전환 동물.
제32항에 있어서, 핵산 분자가 코딩된 단백질의 발현을 방지하는 돌연변이를 함유하는 것인 형질전환 동물.
제1항 내지 제14 항 중 어느 한 항의 핵산 분자 또는 Mst1 단백질 또는 Mst1 스플라이스 변이체 단백질을 코딩하는 핵산 분자, 또는 제23항의 단백질, 또는 서열번호 2, 20 또는 22의 아미노산 서열을 포함하는 단백질 또는 Mst1 단백질 또는 Mst1 스플라이스 변이체 단백질의 발현 수준을 결정하는 것을 포함하는, 대상에서 질병 상태를 진단하는 방법.
제34항에 있어서, 질병 상태가 위암인 방법.
제34항에 있어서, 질병 상태가 진행성 위암인 방법.
제34항에 있어서, 질병 상태가 악성 신생물인 방법.
제37항에 있어서, 악성 신생물이 연질 조직, 뼈, 유방, 자궁경부, 결장, 자궁내막, 식도, 신장, 후두, 간, 폐, 대망, 난소, 췌장, 직장, 갑상선, 자궁근층, 전립선, 피부, 소장, 방광, 지라 또는 위에서 발생하는 것인 방법.
제16항 내지 제21항, 제24항 및 제25항 중 어느 한 항에 있어서, 스플라이스 변이체가 서열번호 13 또는 서열번호 14의 것인 방법.
희석제, 및 (a) 서열번호 4, 6, 8, 10, 12, 14 ,18, 20 또는 22의 아미노산 서열을 포함하는 분리된 폴리펩티드 또는 단백질; (b) 서열번호 4와 적어도 약 92%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드 또는 단백질; (c) 서열번호 4의 아미노산 31-137로 구성되는 분리된 폴리펩티드 또는 단백질; (d) 서열번호 6, 8, 10 또는 12의 적어도 10개의 아미노산의 단편을 포함하는 분리된 폴리펩티드; (e) 서열번호 6, 8, 10 또는 12의 보존된 아미노산 치환을 포함하는 분리된 폴리펩티드; (f) 서열번호 6, 8, 10 또는 12의 자연 발생 아미노산 서열 변이체를 포함하는 분리된 폴리펩티드; (g) 서열번호 6, 8, 10 또는 12와 적어도 약 75%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드; (h) 서열번호 14와 적어도 약 95%의 아미노산 서열 상동성을 나타내는 분리된 폴리펩티드:로 구성되는 그룹으로부터 선택되는 분리된 폴리펩티드 또는 단백질을 포함하는 조성물.