KR102149070B1

KR102149070B1 - 조사적 세포 기반 분석 및 이의 사용

Info

Publication number: KR102149070B1
Application number: KR1020147030700A
Authority: KR
Inventors: 니븐 라진 나레인; 랑가프라사드 사란가라잔; 비벡 케이. 비쉬누다스; 민 두; 토니 왈쉬
Original assignee: 버그 엘엘씨
Priority date: 2012-04-02
Filing date: 2012-09-07
Publication date: 2020-10-15
Also published as: EA201491833A1; US10061887B2; WO2013151577A8; JP6189926B2; CA2869296A1; IL234920B; CN108048521A; EP2834366A4; MX357392B; WO2013151577A9; EA038600B1; KR20200105524A; BR112014024537A2; KR20140142357A; CN108048521B; JP2018033448A; CN110456035A; WO2013151577A1; SG11201406201YA; AU2012376214A1

Abstract

본 명세서에서는 모델 구축을 통해 생물학적 시스템 또는 과정(예를 들어, 암과 같은 질병 조건)을 분석하기 위한 발견 플랫폼 기술이 기술된다.

Description

조사적 세포 기반 분석 및 이의 사용{INTERROGATORY CELL-BASED ASSAYS AND USES THEREOF}

본 출원은 조사적 세포 기반 분석 및 이의 사용에 관한 것이다.

관련 출원

본 출원은 2012년 4월 2일 출원된 미국 예비 특허 출원 제 61/619326호; 2012년 7월 6일 출원된 미국 예비 특허 출원 제 61/668617호; 2012년 4월 4일 출원된 미국 예비 특허 출원 제 61/620305호; 2012년 6월 28일 출원된 미국 예비 특허 출원 제 61/665631호; 2012년 8월 1일 출원된 미국 예비 특허 출원 제 61/678596호; 및 2012년 8월 1일 출원된 미국 예비 특허 출원 제 61/678590호의 우선권을 주장하며, 각 출원의 전체 내용은 참조를 통해 본 명세서에 명시적으로 통합된다.

1964년 오늘날 분자생물학이라 불리는 분야의 선구자인 제임스 왓슨(James Watson)과 프란시스 크릭(Francis Crick)에 의해 DNA가 발견된 이후, 신약 개발이 크게 향상되었다. 분자생물학의 도구와 제품들로 인해 빠르고 상세하며 정확한 유전자 조절의 측정이 DNA 및 RNA 수준 모두에서 가능하게 되었다. 패러다임을 뒤바꾼 이 발견 이후 30년간 녹다운(knock-out) 동물 모델 및 핵심 효소결합 반응이 나타났고, 앞서 언급한 플랫폼으로부터 질병 메커니즘과 병리생리학을 새롭게 이해할 수 있게 되었다. 2000년 봄, 크레이그 벤토(Craig Ventor)와 프란시스 콜린스(Francis Collins)는 인간 게놈의 초기 염기 서열을 발표하였고, 과학계에는 새로운 의약품의 파고가 몰아치게 되었다.

게놈의 매핑은 즉각적으로, 예를 들어, 유전자 치료를 사용하여 알츠하이머 또는 파킨슨 씨 병을 일으키는 뇌의 퇴행적 과정을 역전시킴으로써 질병이 시작되기 이전에도 이를 통제할 수 있고, 또한 정상적인 조직 구조와 생리학적 상태를 복원시키면서도 종양 위치에 도입하여 질병을 근절시킬 수 있는 구조체를 만들 수 있다는 희망을 불러 일으켰다. 다른 사람들은 이러한 논쟁에서 더 나가 눈이나 머리 색깔, 키 등에 대해 원하는 대로 자손을 창출하는 개념을 제안하기도 하였다. 그러나, 10년이 지났지만, 아직도 많은 사람들이 유전자 치료의 지속 가능한 성공, 또는 심지어 유전학적 과정의 초보적 제어를 기다리고 있을 뿐, 이에 대한 가시적 경로는 보이지 않고 있다.

따라서, 최소한 구조체를 지지하는 것과는 독립적인 유전학은 최종적인 생리상태를 창출하지는 않는다는 것이 눈에 보이는 현실이다. 실제로, 전사 후 변형, 변이, 단일 뉴클레오타이드 다형성(SNP), 및 전사 변형 등과 같은 많은 과정들이 자연적 섭리로 주어진 유전자 및/또는 이 유전자의 부호화된 보완 단백질을 변화시킬 수 있으며, 따라서 이를 통해 질병 과정에 기여할 수 있다.

정보 시대가 도래하고 인터넷이 나타남에 따라 과도한 정보가 쏟아지고 있지만, 국제적 협동과 비평 또한 쉽게 이루어지게 되었다. 역설적이게도, 상기 언급된 현실은 과학계가 몇 개의 단순한 점들을 간과하는 원인이 될 수 있는데, 여기에는 신호 증폭의 통신과 세포 및/또는 조직 간의 교차 대화(상호 대화)가 무엇인가 잘못되었을 때 항상성 및 시정적 메커니즘을 위한 메시지를 발생토록 한다는 것이다.

이와 관련된 사항은 심장병(CVD)과 연관된 것으로, 이 질병은 미국 및 많은 선진국에서 주요 사망 요인으로 남아 있으며, 미국에서만 2.8명의 사망자 중 1명이 심장병과 관련되어 있다. 또한, CVD는 만성 신장 질환(미국에서 약 천9백만 사례), 만성 피로 증후군, 및 대사증후군에서의 핵심 요소와 같은 연관 합병증에 기여하는 병리 현상의 배경으로 작용한다. 진단법과 관련된 기술, 외과적 시술을 최소화하는 치료 기술, 수용 약제 혈관 삽입 및 효과적인 임상적 관리 등에서의 상당한 진보는 시술 심장학 분야에서 유래 없는 성장의 시기를 만들어 냈으며, 또한 보다 효과적인 CVD 관리를 가능하게 하였다. 그러나, CVD, 당뇨 및 주변 혈관 질병과 같은 연관된 보조 이병률과 관련된 질병 원인론은 아직 충분히 밝혀지지 않았다.

질병 조건(예를 들어, CVD)의 원인론과 같은 생물학적 과정에 포함된 메커니즘 및 경로를 탐구하고 핵심 조절 경로 및/또는 목표 분자(예를 들어, “약제로 치료할 수 있는 목표(drugable targets)”) 및/또는 보다 나은 질병 진단, 관리 및/또는 치료를 위한 표지 인자를 파악하기 위한 새로운 접근 방법들은 아직도 부족하다.

본 명세서에서 기술된 발명은 최소한 부분적으로는 네트워크 생물학, 게놈, 단백질체, 대사체 및 전사체에 대한 학문과 생체 정보학의 도구 및 방법론의 신규의 협업적 활용에 기반한 것으로서, 이들이 결합된다면, 암, 당뇨, 비만, 심장병, 및 신생 혈관 생성을 포함하여 선택된 질병 조건과 같은 관심의 대상인 생물학적 시스템을 조직적인 생물학 연구방법을 이용하여 연구하는데 사용될 수 있다. 첫 번째 단계로서, 질병 과정과 같은 다양한 생물학적 시스템을 탐구하기 위해 세포 모델링 시스템이 개발되었으며, 이 시스템은 다양한 질병 관련 환경 자극(예를 들어, 고혈당증, 저산소 상태, 면역 스트레스, 및 지질 과산화, 세포 밀도, 혈관 형성 작용 물질 및 억제 물질)을 겪는 질병 관련 세포들을 포함한다. 일부 실시예에서, 이러한 세포 모델링 시스템은 반응에 참여하는 다양한 세포 유형들(예를 들어 대동맥의 평활근 세포(HASMC), 기부 세관 신장 세포(HK-2), 대동맥 내피 세포(HAEC), 및 진피 섬유아세포(HDFa)) 사이의 세포 간 상호 대화 메커니즘을 포함한다. 세포 모델 시스템으로부터의 고성능 생물학적 해독은 기술들의 조합을 통해 얻어지며, 이러한 기술들은 예를 들어, 최신의 질량 분광학(LC/MSMS), 유동 세포 계수법, 세포-기반 분석, 및 기능적 분석 등이 포함된다. 고성능의 생물학적 해독은 생물정보학적 분석을 거쳐 생체 외, 생체 내, 및 컴퓨터 모의 모델링에 의해 합치되는 데이터 경향을 연구한다. 이로부터 비롯되는 매트릭스를 통해 상호 연관된 데이터 마이닝이 가능하며 이로부터 결정적인 압점(또는 “허브”)에 이를 수 있는 선형 및 비선형 회귀 분석이 개발되었다. 본 명세서에서 제시되는 이들 “허브”들은 신약 발견의 후보가 된다. 특히, 이들 허브들은 잠재적 약품 타겟 및/또는 질병 표지 인자를 나타낸다.

분별의 분자 서명은 질병의 시작과 발달에 이르는 조직의 마이크로환경에서의 변이를 지배하는 메커니즘에 대한 통찰력을 가지게 해 준다. 이들을 모두 통합하면, 이전에 언급된 기술 플랫폼들을 전략적 세포 모델링과 조합함으로써 견고한 지성적 방법을 채택하여 질병에 대한 보다 나은 이해를 확립하고 동시에 치료 수준을 임상적으로 확장시킬 수 있는 생물학적 표지 인자 라이브러리와 약품 후보 물질을 생성하는 것이 가능하게 된다.

또한, 이 접근 방식은 질병 진단 또는 시술에 유용할 뿐만 아니라, 둘 또는 그 이상의 세포 시스템이 반응하는 생물학적 시스템과 같이 사실상 생물학적 시스템 내의 모든 병리학적 또는 비병리학적 조건들에 일반적으로 적용할 수 있다. 예를 들어, 이 접근 방식은 약제의 독성에 연관되어 있거나 인과 관계를 가지는 메커니즘을 이해하는 통찰력을 얻는데 유용하다. 따라서 본 발명은 광범위한 스펙트럼의 설정에 일반적으로 적용될 수 있는 조사적 생물학적 평가를 위한 프레임워크를 제공한다.

본 발명의 플랫폼의 의미 있는 특징은 이러한 AI 기반 시스템이 생물학적 과정과 관련하여 알려진 생물학적 관계와 같은 해당 분야의 기존 지식에 의존하거나 이를 고려하지 않으면서(즉, 어떠한 데이터 포인트도 인위적이지 않으면서) 세포 모델 시스템으로부터 획득된 데이터 집합에 기반하고 있다는 것이다. 이에 따라, 이러한 플랫폼으로부터 생성되어 결과적으로 나타나는 통계적 모델은 편향되어 있지 않다. 예를 들어, 이로부터 얻어진 세포 모델 시스템 및 데이터 집합과 같은 본 발명의 플랫폼 및 그 구성 요소의 또 다른 의미 있는 특징은 이로부터 (예를 들어, 새로운 세포 및/또는 조건을 도입함으로써) 시간에 걸친 연속적인 세포 모델의 구축이 가능하다는 것이며, 이에 따라 생물학적 시스템 또는 과정에 대한 세포 모델로부터 생성된 초기의 “최초 세대”의 합치 인과 관계 네트워크가 세포 모델 자체의 진화에 따라 다중 생성 인과 관계 네트워크로 진화해 나갈 수 있다는 것이다(또한 델타 또는 델타-델타 네트워크가 이로부터 얻어진다). 이러한 방식으로, 세포 모델과 이 세포 모델로부터의 데이터 집합, 및 이 세포 모델로부터 플랫폼 기술 방법을 사용하여 생성된 인과 관계 네트워크 모두가 끊임없이 진화하고 이러한 플랫폼 기술로부터 얻은 이전의 지식 위에 구축될 수 있다.

본 발명은 생물학적 시스템의 조절 인자 식별 방법을 제공하며, 상기 방법은:

생물학적 시스템의 특징적 측면을 나타내기 위해 생물학적 시스템에 연관된 세포를 이용하여 생물학적 시스템에 대한 모델을 수립하는 단계;

상기 모델로부터 생물학적 시스템과 연관된 세포 내에서 단백질체의 전역적 변화를 나타내는 제 1 데이터 집합을 획득하는 단계;

상기 모델로부터 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 효소의 전역적 활성이 생물학적 시스템과 연관된 세포 내의 효소 대사 물질 또는 기질(substrate)에 미치는 영향을 포함하는 단계;

프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

상기 합치 인과 관계 네트워크로부터 생물학적 시스템에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 효소는 생물학적 시스템의 조절 인자로서 식별되는 단계를 포함한다.

특정 실시예에서, 제 1 데이터 집합은 단일 단백질체의 데이터 집합이다. 특정 실시예에서, 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 단일 기능적 활성 또는 세포 반응을 나타낸다. 특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 지질체적 데이터를 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 지질체적 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성을 포함한다.

특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체적, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체적, 대사체적, 전사체적, 게놈적 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향을 더 포함한다.

특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함한다. 특정 실시예에서, 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함한다.

특정 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향을 포함하며, 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다.

본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델은 생물학적 시스템과 연관된 세포의 생체 외 배양을 포함한다. 본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델은 제어 세포의 합치되는 생체 외 배양을 선택 사항으로 더 포함한다.

본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델의 세포의 생체 외 배양은 환경적 교란을 겪으며, 합치 제어 세포의 생체 외 배양은 환경적 교란을 겪지 않은 세포와 동일하다. 특정 실시예에서, 상기 생물학적 시스템의 모델에서의 환경적 교란은 생물체에 작용하는 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함한다. 특정 실시예에서, 상기 생물학적 시스템의 모델에서의 환경적 교란은 세포를 효소 활성 억제 인자와 접촉시키는 것을 포함한다. 특정 실시예에서, 생물학적 시스템의 모델 내의 효소 활성 억제 인자 는 키나아제 억제 인자다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10과 더 접촉시키는 것을 포함한다.

본 발명의 특정 실시예에서, 상기 생성 단계는 인공 지능 (AI) -기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 및 제 2 데이터 집합으로부터 수신한다. 본 발명의 특정 실시예에서, 상기 생성 단계에서 수립된 상기 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계의 예측에 대한 신뢰 수준을 제공하기 위해, 식별 단계 이전에, 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량된다.

본 발명의 특정 실시예에서, 상기 고유한 인과 관계는 생물학적 시스템과 연관된 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다. 특정 실시예에서, 상기 고유한 인과 관계는 환경적 교란을 겪은 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.

본 발명의 특정 실시예에서, 상기 식별된 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계이다. 특정 실시예에서, 상기 식별된 상기 고유한 인과 관계는 최소한 지질의 수준, 유전자의 발현, 및 하나 또는 그 이상의 기능적 활성 사이의 관계이며, 이때 상기 기능적 활성은 키나아제 활성이다.

본 발명은 질병 과정의 조절 인자 식별 방법을 제공하며, 상기 방법은:

질병 과정의 특징적 측면을 나타내기 위해 질병에 관련된 세포를 사용하여 질병 과정에 대한 모델을 수립하는 단계;

상기 모델로부터 제 1 데이터 집합을 획득하는 단계로서, 이때 상기 제 1 데이터 집합은 질병에 관련된 세포 내의 단백질체의 전역적 변화를 나타내는 단계;

상기 모델로부터 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 질병에 관련된 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 포함하는 단계;

상기 세포의 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 제 1 및 제 2 데이터 집합만을 기반으로 프로그래밍된 컴퓨터 장치를 사용하여 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

상기 합치 인과 관계 네트워크로부터 질병 과정에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계에 연관된 최소한 하나의 효소는 질병 과정의 조절 인자로서 식별되는 단계를 포함한다.

특정 실시예에서, 상기 제 1 데이터 집합은 단일 단백질체의 데이터 집합. 특정 실시예에서, 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 단일 기능적 활성 또는 세포 반응을 나타낸다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 지질체 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 지질체 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성을 포함한다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 포함한다.

본 발명의 특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며, 이때 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함한다. 특정 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함한다.

본 발명의 특정 실시예에서, 상기 질병 과정은 암, 당뇨, 비만, 심장병, 노화 관련 황반 변성, 당뇨성 망막증, 또는 감염성 질병이다. 특정 실시예에서, 상기 질병 과정은 신생 혈관 생성을 포함한다. 특정 실시예에서, 상기 질병 과정은 간세포 암종, 폐암, 유방암, 전립선암, 흑색종, 암종, 육종, 림프종, 백혈병, 비늘형의 세포암종(squamous cell carcinoma, 편평상피암), 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광암, 신장암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종, 또는 약제 저항형 암을 포함한다.

본 발명의 특정 실시예에서, 상기 질병 모델은 질병 세포의 생체 외 배양을 포함하며, 제어 또는 정상 세포의 합치되는 생체 외 배양을 선택적으로 더 포함한다. 특정 실시예에서, 상기 질병 세포의 생체 외 배양은 환경적 교란을 겪으며, 상기 합치된 제어 세포의 생체 외 배양은 환경적 교란을 겪지 않은 질병 세포와 동일하다. 특정 실시예에서, 상기 환경적 교란은 생체에 작용하는 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함한다. 특정 실시예에서, 상기 환경적 교란은 세포를 효소 활성 억제 인자와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 효소 활성 억제 인자는 키나아제 억제 인자다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10과 더 접촉시키는 것을 더 포함한다.

특정 실시예에서, 상기 질병 과정의 특징적 측면은 저산소 상태 조건, 고혈당 조건, 젖산 풍부 배양 조건, 또는 이들의 조합을 포함한다. 특정 실시예에서, 상기 생성 단계는 인공 지능(AI) 기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 및 제 2 데이터 집합으로부터 수신한다.

특정 실시예에서, 생성 단계에서 수립된 상기 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계에 대한 예측의 신뢰 수준을 제공하기 위해 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 식별 단계 이전에 모의 인과 관계 네트워크로 더욱 개량된다. 특정 실시예에서, 상기 고유한 인과 관계는 질병 세포의 모델 내에 고유하게 존재하며 합치된 제어 세포에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다. 특정 실시예에서, 상기 고유한 인과 관계는 환경적 교란을 겪은 세포 내에 고유하게 존재하며 합치된 제어 세포에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.

상기 모델로부터 세포 내에서 단백질체의 전역적 변화 및 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;

상기 모델로부터 하나 또는 그 이상의 기능적 활성 또는 생물학적 시스템과 연관된 세포의 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 전역 키나아제 활성 및/또는 상기 전역 키나아제 활성이 생물학적 시스템과 연관된 세포 내의 키나아제 대사 물질 또는 기질에 미치는 영향을 포함하는 단계;

프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

상기 합치 인과 관계 네트워크로부터 생물학적 시스템에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 키나아제는 생물학적 시스템의 조절 인자로서 식별되는 단계를 포함한다.

본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공하며,

상기 방법은 이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 조절 인자에 영향을 미쳐서, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 해주는 생체 작용 물질을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여(administrating)하는 단계를 포함한다.

본 발명은 대상 포유류에서의 질병을 진단 또는 예단하는 방법을 제공하며, 상기 방법은:

본 명세서에서 제공된 방법 중 어느 하나를 사용하여 식별된 하나 또는 그 이상의 조절 인자의, 대상으로부터 얻은 생물학적 표본 내에서의, 발현 또는 활성 수준을 결정하는 단계; 및

대상에서의 수준을 제어 표본에서의 하나 또는 그 이상의 조절 인자의 발현 수준 또는 활성과 비교하는 단계를 포함하며,

이때 대상에서의 수준과 제어 표본에서의 하나 또는 그 이상의 조절 인자의 발현 수준 또는 활성 사이의 차이는 대상이 질병에 걸렸거나, 질병이 진전될 상태에 있거나, 또는 질병에 대한 치료에 우호적으로 반응함을 나타내며, 이에 의해 대상 포유류의 질병을 진단하거나 예단할 수 있다.

본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별하는 방법을 제공하며, 상기 방법은:

대상 포유류로부터의 생물학적 표본을 검사 화합물에 접촉시키는 단계;

생물학적 표본 내에서 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 발현 수준을 결정하는 단계;

상기 생물학적 표본 내 하나 또는 그 이상의 조절 인자의 발현 수준을 검사 화합물과 접촉되지 않은 제어 표본과 비교하는 단계; 및

상기 생물학적 표본 내 하나 또는 그 이상의 조절 인자의 발현 수준을 조절하는 검사 화합물을 선택하는 단계를 포함하며,

이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별할 수 있다.

본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 방법을 제공하며,

상기 방법은 이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 치료적 화합물을 포함하는 약학적 조성물을 치료적으로 효과적인 양으로 투여하는 단계를 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방할 수 있다.

상기 방법은 이러한 방법을 필요로 하는 포유류에 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 어느 하나 또는 그 이상의 발현 또는 활성에 영향을 미치는 생체 작용 물질을 포함하는 약학적 조성물을 치료적으로 효과적인 양으로 투여하는 단계를 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.

대상으로부터 얻은 생물학적 표본 내에서 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 하나 또는 그 이상의 단백질의 발현 또는 활성 수준을 결정하는 단계; 및

대상 내에서의 상기 수준을 제어 표본 내 하나 또는 그 이상의 단백질의 발현 수준 또는 활성과 비교하는 단계를 포함하며,

이때 대상에서의 수준과 제어 표본에서의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성 사이의 차이는 대상이 질병에 걸렸거나, 질병이 진전될 상태에 있거나, 또는 질병에 대한 치료에 우호적으로 반응함을 나타내며, 이에 의해 대상 포유류의 질병을 진단하거나 예단할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.

생물학적 표본 내에서, TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 어느 하나 또는 그 이상의 단백질의 발현 수준을 결정하는 단계;

상기 생물학적 표본 내 하나 또는 그 이상의 단백질의 발현 수준을 검사 화합물과 접촉되지 않은 제어 표본과 비교하는 단계; 및

상기 생물학적 표본 내 하나 또는 그 이상의 단백질의 발현 수준을 조절하는 검사 화합물을 선택하는 단계를 포함하며,

이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.

본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:

(1) 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계;

(2) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;

(3) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계;

(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터, 및 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 상기 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 유전자, 지질, 단백질, 대사 물질, 전사체, 또는 SNP는 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.

(2) 상기 신생 혈관 생성에 대한 모델로부터 지질체 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;

(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 리피도믹스 데이터 및 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 상기 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 지질은 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.

특정 실시예에서, 상기 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 효소의 전역적 활성 및 신생 혈관 생성과 연관된 세포 내에서 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 나타낸다.

(2) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;

(3) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 키나아제를 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 상기 효소의 전역적 활성이 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 미치는 영향을 포함하는 단계;

(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 및 신생 혈관 생성과 연관된 세포의 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및

(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 효소는 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.

본 발명의 특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며 상기 효소의 전역적 활성이 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 미치는 영향은 세포의 인산 단백질체를 포함한다. 특정 실시예에서, 상기 효소의 전역적 활성은 전역 프로테아제 활성을 포함한다.

본 발명의 특정 실시예에서, 상기 조절 인자는 신생 혈관 생성을 자극하거나 촉진한다. 본 발명의 특정 실시예에서, 상기 조절 인자는 신생 혈관 생성을 억제한다.

특정 실시예에서, 신생 혈관 생성과 연관된 세포를 포함하는 상기 신생 혈관 생성에 대한 모델은 생체 외 세포 배양 신생 혈관 생성 모델, 쥐의 대동맥 미세 혈관 모델, 새로 태어난 생쥐의 망막 모델, 병아리 융모 요막(CAM) 모델, 각막 혈관 형성 성장 요소 주머니 모델, 피하 이식 혈관 형성 성장 요소 이식 모델, 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델, 및 종양 이식 모델로 이루어진 군으로부터 선택되며; 상기 신생 혈관 생성 모델은 제어 세포를 포함하는 신생 혈관 생성의 제어 모델을 선택적으로 더 포함한다. 특정 실시예에서, 상기 생체 외 배양 신생 혈관 생성 모델은 마트리겔(MATRIGEL®) 관 형성 분석, 이주 분석, 보이든(Boyden) 챔버 분석, 스크래치 분석으로 이루어지는 군으로부터 선택된다.

특정 실시예에서, 생체 외 배양 모델에서의 상기 신생 혈관 생성과 연관된 세포는 인간 내피의 혈관 세포(HUVEC)이다. 특정 실시예에서, 각막 혈관 형성 성장 요소 주머니 모델, 피하 해면 혈관 형성 성장 요소 이식 모델, 또는 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델에서의 상기 혈관 형성 성장 요소는 FGF-2 및 VEGF로 이루어진 군으로부터 선택된다.

본 발명의 특정 실시예에서, 상기 신생 혈관 생성의 모델 내의 세포는 환경적 교란을 겪으며, 신생 혈관 생성의 합치된 모델 내의 세포는 환경적 교란을 겪지 않은 세포와 동일하다. 특정 실시예에서, 상기 환경적 교란은 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 또는 변이의 도입, 및 유전학적 수정 또는 변이를 야기하는 매개 수단의 도입 및 국소 빈혈의 유도를 포함한다.

특정 실시예에서, 상기 제제는 혈관 형성 촉진 제제 또는 항혈관 형성 제제이다. 특정 실시예에서, 상기 혈관 형성 촉진 제제는 FGF-2 및 VEGF로 이루어진 군으로부터 선택된다. 특정 실시예에서, 상기 항혈관 형성 제제는 VEGF 억제 인자, 인테그린 억제 물질, 안지오스타틴, 엔도스타틴, 텀스타틴, 아바스틴, 넥사바(Sorafenib), 수니티니브, 파조파니브, 및 에버롤리머스, 용해성 VEGF-수용기, 안지오포이에틴 2, 트롬보스폰딘1, 트롬보스폰딘 2, 바소스타틴, 칼레티큘린, 프로트롬빈(크링글 도메인-2), 안티트롬빈 III 파편, 혈관 내피의 성장 억제 인자 (VEGI), 단백질 (FS-E)의 폴리스타틴 영역에 해당하는 산성 및 풍부한 시스테인 내 분비 단백질(SPARC) 및 SPARC 펩티드, 및 코엔자임 Q10으로 이루어지는 군으로부터 선택된다.

다른 실시예에서, 상기 제제는 효소 활성 억제 인자이다. 다른 실시예에서, 상기 제제는 키나아제 활성 억제 인자이다.

본 발명의 다른 실시예에서, 상기 제 1 데이터 집합은 게놈 데이터 집합 내 다수의 유전자의 단백질 및/또는 mRNA 발현 수준을 포함한다. 본 발명의 특정 실시예에서, 상기 제 1 데이터 집합 둘 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함한다. 본 발명의 특정 실시예에서, 상기 제 1 데이터 집합은 셋 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함한다.

본 발명의 다른 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포 외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다.

본 발명의 어떠한 실시예에서, 제 1 데이터 집합은 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터 중 하나와 같은 단일 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 두 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 세 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 네 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 다섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여섯 개의 데이터 집합일 수 있다.

본 발명의 다른 실시예에서, 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석 데이터로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함하는 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중 하나와 같은 단일 데이터 집합이다. 본 발명의 실시예 중 어느 하나에서, 상기 제 2 데이터 집합은 두 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 세 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 네 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 다섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 일곱 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여덟 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 아홉 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 열 개의 데이터 집합일 수 있다.

본 발명의 다른 실시예에서, 상기 효소 활성은 키나아제 활성일 수 있다. 본 발명의 다른 실시예에서, 상기 효소 활성은 프로테아제 활성일 수 있다.

본 발명의 특정한 실시예에서, 상기 단계(4)는 인공 지능 (AI) -기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 REFS(TM)을 포함한다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 데이터 집합 및 제 2 데이터 집합으로부터 수신한다. 특정 실시예에서, 상기 단계(4)에서 수립된 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계에 대한 예측의 신뢰 수준을 제공하기 위해 단계(5) 이전에 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량된다.

본 발명의 특정 실시예에서, 상기 고유한 인과 관계는 세포 내에 고유하게 존재하며, 합치된 제어 세포 내에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.

본 발명에서, 상기 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계로 식별된다.

특정 실시예에서, 상기 기능적 활성은 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 효소 활성, 주화성, 세포외 기질 퇴화, 및 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관으로 이루어지는 군으로부터 선택된다. 특정 실시예에서, 상기 기능적 활성은 키나아제 활성이다. 특정 실시예에서, 상기 기능적 활성은 프로테아제 활성이다.

본 발명의 특정 실시예에서, 상기 식별된 고유한 인과 관계는 최소한 지질의 수준, 유전자의 발현, 및 하나 또는 그 이상의 기능적 활성 사이의 관계이며, 이때 상기 기능적 활성은 키나아제 활성이다.

본 발명에서, 상기 방법은 신생 혈관 생성 내의 상기 식별된 고유한 인과 관계를 증명하는 단계를 더 포함할 수 있다.

본 발명은 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델을 제공하기 위한 방법을 제공하며, 상기 방법은:

신생 혈관 생성의 특징적 측면을 나타내기 위해, 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계로서, 상기 신생 혈관 생성에 대한 모델은 플랫폼 방법에서 사용된 데이터 집합을 생성하기에 유용한 단계를 포함하며;

이에 의해 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델을 제공한다.

본 발명은 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합 및 제 2 데이터 집합을 획득하기 위한 방법을 제공하며, 상기 방법은:

(1) 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합을 획득하는 단계로서, 상기 신생 혈관 생성에 대한 모델은 신생 혈관 생성과 연관된 세포를 포함하며, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함하는 단계;

(2) 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 2 데이터 집합을 획득하는 단계로서, 상기 제 2 데이터 집합은 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 단계를 포함하며;

이에 의해 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합 및 제 2 데이터 집합을 획득한다.

(1) 신생 혈관 생성에 대한 모델로부터 얻어진 제 1 데이터 집합 및 제 2 데이터 집합 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 상기 모델은 신생 혈관 생성과 연관된 세포를 포함하고, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내며; 상기 제 2 데이터 집합은 프로그래밍된 컴퓨터 장치를 사용하여 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내고, 상기 합치 인과 관계 네트워크의 생성은 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계;

(2) 상기 합치 인과 관계 네트워크로부터, 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 상기 고유한 인과 관계와 연관된 최소한 하나의 유전자, 지질, 단백질, 대사 물질, 전사체, 또는 SNP가 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함하며,

이에 의해 신생 혈관 생성의 조절 인자를 식별할 수 있다.

(1) 신생 혈관 생성에 대한 모델로부터 생성된 합치 인과 관계 네트워크를 제공하는 단계;

이에 의해 신생 혈관 생성의 조절 인자를 식별할 수 있다.

특정 실시예에서, 상기 합치 인과 관계 네트워크는 신생 혈관 생성에 대한 모델로부터 획득된 제 1 데이터 집합 및 제 2 데이터 집합 중에서 생성되고, 상기 모델은 신생 혈관 생성과 연관된 세포를 포함하고, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내며;

상기 제 2 데이터 집합은 프로그래밍된 컴퓨터 장치를 사용하여 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내고, 상기 합치 인과 관계 네트워크의 생성은 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는다.

특정 실시예에서, 상기 신생 혈관 생성에 대한 모델은 생체 외 세포 배양 신생 혈관 생성 모델, 쥐의 대동맥 미세 혈관 모델, 새로 태어난 생쥐의 각막 모델, 병아리 융모 요막(CAM) 모델, 각막 혈관 형성 성장 요소 주머니 모델, 피하 해면 혈관 형성 성장 요소 이식 모델, 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델, 및 종양 이식 모델로 이루어진 군으로부터 선택되며; 상기 신생 혈관 생성의 모델은 제어 세포를 포함하는 신생 혈관 생성의 합치된 제어 모델을 선택적으로 더 포함한다.

특정 실시예에서, 상기 제 1 데이터 집합은 리피도믹스 데이터를 포함한다. 특정 실시예에서, 상기 제 1 데이터 집합은 리피도믹스 데이터만을 포함한다.

특정 실시예에서, 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 효소의 전역적 활성, 및 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 영향을 포함한다.

특정 실시예에서, 상기 제 2 데이터 집합은 키나아제 활성 또는 프로테아제 활성을 포함한다. 특정 실시예에서, 제 2 데이터 집합은 키나아제 활성 또는 프로테아제 활성만을 포함한다.

특정 실시예에서, 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론 프로파일링, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 키나아제 활성, 및 프로테아제 활성; 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택된 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함한다.

본 발명의 특정 실시예에서, 상기 신생 혈관 생성은 질병 상태에 관련된다.

본 발명은 포유류 대상에서 신생 혈관 생성 조절 방법을 제공하며, 상기 방법은:

이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 조절 인자에 영향을 주는 생체 작용 물질을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여하여, 이에 의해 신생 혈관 생성을 조절하도록 하는 단계를 포함한다.

본 발명은 포유류 대상에서 조절된 신생 혈관 생성을 탐지하는 방법을 제공하며, 상기 방법은:

대상으로부터 얻어진 생물학적 표본 내에서의 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 결정하는 단계; 및

상기 수준, 활성, 또는 존재를 제어 표본 내에서의 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재와 비교하는 단계를 포함하며,

이때 대상에서의 상기 수준, 활성, 또는 존재와 제어 표본 내의 하나 또는 그 이상의 조절 인자의 존재 하에서의 상기 수준, 활성, 또는 존재 사이의 차이가 포유류 대상에서 신생 혈관 생성이 조절되었다는 것을 나타낸다.

본 발명은 대상 포유류에서 신생 혈관 생성을 조절하는 치료적 화합물을 식별하는 방법을 제공하며, 상기 방법은:

대상 포유류로부터의 생물학적 표본을 검사 화합물과 접촉시키는 단계;

생물학적 표본 내에서 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 발현 수준을 결정하는 단계;

생물학적 표본 내에서의 상기 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 상기 검사 화합물과 접촉하지 않은 제어 표본과 비교하는 단계; 및

생물학적 표본 내에서의 상기 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 조절하는 검사 화합물을 선택하는 단계를 포함하며,

이에 의해 대상 포유류에서 신생 혈관 생성을 조절하는 치료적 화합물을 식별하는 치료적 화합물을 식별할 수 있다.

본 발명은 대상 포유류에서 신생 혈관 생성을 조절하기 위한 방법을 제공하며, 상기 방법은:

이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 치료적 화합물을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여하여, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단할 수 있다.

특정 실시예에서, “환경적 교란”은 본 명세서에서 “외부 자극 성분”으로도 불리며, 치료용 제제를 의미한다. 특정 실시예에서, 이러한 외부 자극 성분은 소형 분자 (예를 들어, 5 kDa, 4 kDa, 3 kDa, 2 kDa, 1 kDa, 500 달톤, 또는 250 달톤 이하의 소형 분자)이다. 특정 실시예에서, 이러한 외부 자극 성분은 생물학적이다. 특정 실시예에서, 이러한 외부 자극 성분은 화학적이다. 특정 실시예에서, 이러한 외부 자극 성분은 세포에 대해 내생적이거나 외생적이다. 특정 실시예에서, 이러한 외부 자극 성분은 MIM 또는 에피시프터(epishifter)이다. 특정 실시예에서, 이러한 외부 자극 성분은 저산소 상태, 고혈당증, 고지질증, 고인슐린증, 및/또는 풍부한 젖산 조건과 같은 세포 시스템에 대한 스트레스 요소이다.

특정 실시예에서, 이러한 외부 자극 성분은 질병 조건을 치료하기 위한 치료용 제제 또는 치료용 제제 후보를 포함할 수 있으며, 여기에는 화학 치료용 제제, 단백질 기반 생물학적 제제, 항체, 융합 단백질, 소형 분자 약제, 지질, 다당류, 핵산 등이 포함된다.

특정 실시예에서, 이러한 외부 자극 성분은 저산소 상태, 고혈당 조건, (젖산 치료로 모방할 수 있는) 산성 환경 등을 포함하는 다양한 질병 조건 하에서 생체 내에서 자주 접하게 되는 하나 또는 그 이상의 스트레스 요소를 포함할 수 있다.

다른 실시예에서, 이러한 외부 자극 성분은 이하에서 정의되는 하나 또는 그 이상의 MIM 및/또는 에피시프터(epishifter)를 포함할 수 있다. 예시적 MIM은 코엔자임 Q10(본 명세서에서 CoQ10로도 기술됨) 및 비타민 B군 내 화합물, 또는 비타민 B군 내 화합물을 포함하는 뉴클레오시드, 모노뉴클레오타이드 또는 디뉴클레오타이드를 포함한다. 특정 실시예에서, 이러한 외부 자극은 CoQ10이 아니다. 특정 실시예에서, 이러한 외부 자극은 비타민 B 또는 비타민 B군 내 화합물이 아니다.

세포의 출력을 측정함에 있어서(단백질 발현, 지질 수준 등), 절대적 양(예를 들어, 발현 또는 전체 양)이나 상대적 수준 (예를 들어, 상대적 발현 수준 또는 양)이 사용될 수 있다. 일 실시예에서는, 절대적 양(예를 들어, 발현 또는 전체 양)이 사용된다. 일 실시예에서는, 상대적 수준 또는 양(예를 들어, 상대적 발현 수준 또는 양)이 사용된다. 예를 들어, 세포 시스템의 상대적 단백질 발현 수준을 결정하기 위해서는, 세포 시스템에 대한 외부 자극이 존재하거나 존재하지 않는 상태에서 세포 시스템 내에서 주어진 단백질의 양을 적절한 제어 세포 라인 또는 세포 라인들의 혼합물(예를 들어, 동일한 실험에 사용된 모든 세포) 및 주어진 배수 증가 또는 배수 감소 값과 비교할 필요가 있다. 통상의 기술자라면 유전자 및/또는 RNA 전사 수준, 지질의 수준, 또는 예를 들어, 세포 자살의 수준, 독성의 수준, 또는 본 명세서에서 기술된 ECAR 또는 OCR와 같은 어떠한 기능적 출력 등의 세포의 모든 출력 측정에서도 절대량 또는 상대량을 채택할 수 있다는 것을 인식할 것이다. 배수 증가에 대한 소정의 임계 수준(예를 들어, 최소한 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75나 100 또는 그 이상의 배수 증가), 또는 배수 감소에 대한 임계 수준(예를 들어, 최소한 0.9, 0.8, 0.75, 0.7, 0.6, 0.5, 0.45, 0.4, 0.35, 0.3, 0.25, 0.2, 0.15, 0.1 또는 0.05 배수로의 감소, 또는 90%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 또는 그 이하로의 감소)이 의미 있는 분별을 선택하기 위해 사용될 수 있으며, 의미 있는 분별을 위한 세포의 출력 데이터가 본 발명의 방법의 플랫폼 기술을 사용하는 데이터 집합(예를 들어, 제 1 및 제 2 데이터 집합)에 포함될 수 있다. 위의 목록에서 제시된 모든 값들은 범위의 상한 또는 하한으로서, 예를 들어, 1.5와 5 배 사이, 5와 10 배, 2와 5 배, 또는 0.9와 0.7 사이, 0.9와 0.5, 또는 0.7과 0.3 배 사이 등일 수 있으며, 본 발명의 일부로서 이해되어야 한다.

본 출원 전체에 걸쳐, 예를 들어 위에서 언급된 것과 같이 목록에서 제시되는 모든 값들은 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있다.

본 발명의 방법의 일 실시예에서, 인과 관계 네트워크 내에서 관찰된 모든 인과 관계가 생물학적 의미를 가지는 것은 아닐 수 있다. 본 발명의 조사적 생물학적 평가가 적용되는 어떠한 주어진 생물학적 시스템에 대해, 인과 관계(또한 이들과 관련된 유전자들)의 일부(또는 전부일 수 있음)는 특정한 생물학적 현안 문제에 대해 “결정론적”일 수 있는데, 예를 들어, 질병 조건(치료적 시술을 위한 잠재적 타겟)을 야기하는 것에 책임이 있거나 질병 조건(잠재적인 진단적 또는 예후의 요소)에 대한 생물학적 표지 인자이다. 일 실시예에서, 생물학적 시스템에 고유한 관찰된 인과 관계는 당면한 특정한 생물학적 문제에 대하여 결정론적이다. 일 실시예에서, 생물학적 시스템에 고유한 관찰된 모든 인과 관계 당면한 특정 문제에 대해 결정론적인 것은 아니다.

이러한 결정론적 인과 관계는 대상 방법의 최종 사용자가 선택할 수 있으며, 또는 이러한 관계는 REFS, DAVID-활성 비교 경로 분석 프로그램과 같은 생물정보학 소프트웨어 프로그램, 또는 KEGG 경로 분석 프로그램에 의해 선택될 수 있다. 특정 실시예에서, 하나 이상의 생물정보학 소프트웨어 프로그램이 사용되었으며, 둘 또는 그 이상의 생물정보학 소프트웨어 프로그램으로부터의 합치된 결과를 사용하는 것이 바람직하다.

본 명세서에서 사용되는, 세포의 출력의 “분별”은 세포의 출력의 어떠한 하나 또는 그 이상의 매개변수에서의 변화(예를 들어, 증가되거나 감소된 수준)를 포함한다. 특정 실시예에서, 이러한 분별은 mRNA 전사 내 분별, 단백질 발현, 단백질 활성, 대사 물질 / 중간 물질 수준, 및/또는 리간드-타겟 상호 반응으로 이루어지는 군으로부터 각각 독립적으로 선택된다. 예를 들어, 단백질 발현 수준에 대하여, 외부 자극 성분에 의한 치료 이전과 이후의 세포 시스템과 관련된 출력과 같은 두 세포의 출력 사이의 분별이 측정될 수 있으며, 질량 분광학 기반 측정과 같이 기술 분야에서 인식된 기술(예를 들어, iTRAQ, 2D-LC-MSMS 등)을 사용하여 정량화될 수 있다.

한 측면에서, 생물학적 시스템을 위한 세포 모델은 세포 간 상호 대화 시스템을 포함하며, 이때 외부 자극 성분이 있는 제 1 세포 환경을 가지는 제 1 세포 시스템은 제 1 수정된 세포 환경을 생성함으로써 제 2 세포 환경을 가지는 제 2 세포 시스템을 제 1 수정된 세포 환경에 노출하게 되어 상호 대화 세포 시스템이 확립된다.

일 실시예에서, 최소한 하나의 의미 있는 세포 간 상호 대화 분별이 상기 상호 대화 세포 시스템으로부터 생성되며; 최소한 하나의 결정론적 세포 간 상호 대화 분별이 식별되어 조사적 생물학적 평가가 발생하게 된다. 특정 실시예에서, 상기 최소한 하나의 의미있는 세포 간 상호 대화 분별은 다수의 분별이다.

특정 실시예에서, 최소한 하나의 결정론적 세포 간 상호 대화 분별이 최종 사용자에 의해 선택된다. 다른 방법으로서, 또 다른 실시예에서, 최소한 하나의 결정론적 세포 간 상호 대화 분별이 정량적 단백질체학 데이터에 기반한(예를 들어, REFS, KEGG 경로 분석 또는 DAVID-활성 비교적 경로 분석과 같은) 생물 정보학 소프트웨어 프로그램에 의해 선택된다.

특정 실시예에서, 이 방법은 제 1 세포 시스템을 위한 의미 있는 세포의 출력 분별을 생성하는 것을 포함한다.

특정 실시예에서, 분별은 mRNA 전사 내 분별, 단백질 발현, 단백질 활성, 대사 물질 / 중간 물질 수준, 및/또는 리간드-타겟 상호 반응로 이루어진 군에서 각각 독립적으로 선택된다.

특정 실시예에서, 제 1 세포 시스템 및 제 2 세포 시스템은 균일한 군집의 제 1 세포, 암 세포 라인, 또는 정상 세포 라인으로부터 독립적으로 선택된다.

특정 실시예에서, 제 1 수정된 세포 환경은 제 1 세포 시스템에 의해 제 1 세포 환경으로 분비된 요소를 포함하며, 결과적으로 제 1 세포 시스템을 외부 자극 성분과 접촉시키게 된다. 상기 요소는 분비된 단백질 또는 기타 신호 발생 분자들을 포함할 수 있다. 특정 실시예에서, 제 1 수정된 세포 환경은 실질적으로 원래의 외부 자극 성분을 가지지 않는다.

특정 실시예에서, 이러한 상호 대화 세포 시스템은 삽입 구획을 가지는 트랜스웰(transwell) 및 막으로 구분되는 웰(well) 구획을 포함한다. 예를 들어, 제 1 세포 시스템은 삽입 구획(또는 웰 구획)에서 성장할 수 있으며, 제 2 세포 시스템은 웰 구획(또는 삽입 구획)에서 성장할 수 있다.

특정 실시예에서, 이러한 상호 대화 세포 시스템은 제 1 세포 시스템을 성장시키기 위한 제 1 배양, 및 제 2 세포 시스템을 성장시키기 위한 제 2 배양을 포함한다. 이 경우에, 제 1 수정된 세포 환경은 제 1 세포 시스템으로부터 매체로 조건이 가해질 수 있다.

특정 실시예에서, 제 1 세포 환경 및 제 2 세포 환경은 동일할 수 있다. 특정 실시예에서, 제 1 세포 환경 및 제 2 세포 환경은 다를 수 있다.

특정 실시예에서, 상호 대화 세포 시스템은 제 1 세포 시스템 및 제 2 세포 시스템의 공생 배양을 포함한다.

본 발명의 방법은 임의의 개수의 “조사적 생물학적 평가”를 위해 사용되거나 이에 적용될 수 있다. 본 발명의 방법을 조사적 생물학적 평가에 적용함으로써 생물학적 시스템 또는 과정의 생물학적 시스템 또는 결정론적 세포 과정 “추진 인자”의 하나 또는 그 이상의 조절 인자를 식별할 수 있게 된다.

본 발명의 방법은 광범위한 범위의 조사적 생물학적 평가를 수행하기 위해 사용될 수 있다. 특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태를 진단하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능을 결정하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 약의 독성을 결정하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 단계를 구분하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품의 타겟을 식별하는 것이다.

본 명세서에서 사용되는, “조사적 생물학적 평가”는 생물학적 시스템의 하나 또는 그 이상의 조절 인자, 예를 들어, 환경적 교란 또는 외부 자극 성분, 또는 생물학적 시스템 또는 과정 특유의 고유한 인과 관계와 관련된 결정론적 세포 과정 “추진 인자”(예를 들어, 생물학적 경로, 또는 경로의 핵심 멤버, 또는 경로의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소)의 식별을 포함할 수 있다. 이는 상기 식별된 결정론적 세포 과정 추진 인자가 생체 내 동물 모델 및/또는 생체 외 조직 배양 실험을 포함하는 환경적 교란 또는 외부 자극 성분과 관련된 후속 이벤트에 필요한지의 여부 및/또는 이를 위해 충분한지의 여부를 테스트하거나 증명하기 위하여 설계된 추가적 단계를 더 포함한다.

특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 진단 또는 단계 파악이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 치료적 시술을 받을 수 있는 질병 표지 인자 또는 치료적 타겟 중 하나를 나타낸다. 본 발명의 조사적 생물학적 분석은 이론적으로 어떠한 질병 조건에도 적절하지만, 종양학 / 암 생물학, 당뇨, 비만, 심장병, 및 신경학적 조건들(특히, 제한 없이, 알츠하이머 병, 파킨슨씨 병, 헌팅턴 병, 루게릭 병(ALS), 및 노화 관련 신경 퇴행성 질환 등과 같은 퇴행성 신경 질환), 및 신생 혈관 생성과 연관된 조건들과 관련된 분야에 특히 유용한 것으로 밝혀질 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능의 결정이며, 이때 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 상기 식별된 조절 인자는 성공적인 약제의 전형적 특징일 수 있으며, 또한 MIM 또는 에피시프터(epishifter)와 같이 동일한 질병 조건을 치료하기 위한 추가적 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 감염을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 감염 상태를 유발하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 또한 감염 방지 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 예를 들어, 주어진 질병 프로필에 대한 약제와 같은 제제의 분자 효과에 대한 평가이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 하나 또는 그 이상의 생물학적 경로, 또는 경로(들)에서의 핵심 멤버, 또는 경로(들)의 멤버들의 핵심 조절 인자의 활성에 있어서의 증가 또는 감소일 수 있으며, 또한, 예를 들어, 주어진 질병에 대한 제제의 치료적 효능을 예측하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 예를 들어, 세포, 조직, 기관 또는 기관계에 대한 약제와 같은 제제의 독성 프로필에 대한 평가이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 예를 들어, 세포 독성과 같은 독성의 지표일 수 있으며, 또한 제제의 독성 프로필을 예측하고 식별하기 위해 사용될 수 있다. 일 실시예에서, 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 약제 또는 약제 후보의 심장 독성의 지표일 수 있으며, 또한 약제 또는 약제 후보의 독성 프로필을 예측하고 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 질병을 야기하는 원생동물, 균류, 박테리아, 저항 인자, 바이러스, 또는 독소와 같은 생물학적 무기에 의해 야기되는 질병 또는 질환을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자 예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 상기 질병 또는 질환을 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 또한 생물학적 방어 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품과 같은 노화 방지 제제의 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 노화 과정, 특히 피부에서의 노화 과정의 표지 인자 또는 지표일 수 있으며, 또한 노화 방지 제제를 식별하기 위해 사용될 수 있다.

본 발명의 방법에서 노화 방지 화장품의 타겟을 식별하기 위해 사용되는 노화에 대한 한 예시적 세포 모델에서, 상기 세포 모델은 예를 들어, 자외선(환경적 교란 또는 외부 자극 성분)으로 처리된 노화하는 상피의 세포, 및/또는 또한 선택적으로 자외선으로 처리된 신생아의 세포를 포함한다. 일 실시예에서, 노화를 위한 세포 모델은 세포 간 상호 대화 시스템을 포함한다. 노화 방지 화장품을 위한 타겟을 식별하기 위해 확립된 2-세포 상호 대화 시스템의 예시적인 일례에서, 노화되는 상피의 세포(제 1 세포 시스템)는 자외선 (외부 자극 성분)으로 처리되고, 신생아의 세포를 매체의 조건을 겪은 처리된 노화 상피의 세포에 접촉시킴으로써 신생아의 세포(제 2 세포 시스템) 내에서의 생기는 변화, 예를 들어, 단백질체의 변화 및/또는 기능적 변화와 같은 변화가 측정될 수 있으며, 예를 들어, 단백질체 변화를 종래의 정량적 질량 분광학으로 측정하거나, 노화에 고유한 인과 관계를 데이터로부터 생성된 인과 관계 네트워크로부터 식별할 수 있다.

또 다른 측면에서, 본 발명은 발견을 위한 플랫폼 기술을 사용하여 조사적 생물학적 평가를 수행하기 위한 키트를 제공하며, 상기 키트는 본 발명의 방법으로부터 생성된 인과 관계 네트워크의 대상인 분석 성분의 존재 여부의 탐지 및/또는 그 양의 정량화를 위한 하나 또는 그 이상의 반응 제제를 포함한다. 일 실시예에서, 상기 분석 성분은 생물학적 시스템에 독특한 인과 관계, 예를 들어, 생물학적 시스템 내의 독특한 인과적 관계와 관련된 유전자의 대상이다. 특정 실시예에서, 상기 분석 성분은 단백질이며, 상기 반응 제제는 단백질에 대한 항체, 단백질을 위한 라벨, 및/또는 고성능 분석(예를 들어, 질량 분광학 기반의 염기서열 결정)을 위한 단백질을 준비하기 위한 하나 또는 그 이상의 제제를 포함한다.

또 다른 측면에서, 본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공한다. 상기 방법은 이러한 방법을 필요로 하는 포유류에 치료적으로 효과적인 양의 약학적 조성을 투여하는 것을 포함하며, 상기 약학적 조성은 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 또는 활성에 영향을 미치며, 이에 따라 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 해 주는 생물학적으로 활성화된 물질을 포함한다. 일부 실시예에서, 이러한 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예들에서, 이러한 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 조성물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 증가시킨다. 또 다른 실시예에서, 상기 조성물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 감소시킨다.

또 다른 측면에서, 상기 기술은 대상 포유류의 질병을 진단하기 위한 방법을 제공한다. 상기 방법은 (i) 대상으로부터 획득한 생물학적 표본에서 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 또는 활성 수준을 결정하고, (ii) 대상에서의 수준을 제어 표본 내의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성과 비교하는 것을 포함하며, 이때 대상에서의 수준을 제어 표본 내의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성 사이의 차이는 대상이 질병을 겪고 있거나, 질병이 전개될 예후 상태에 있거나, 질병에 대한 치료에 우호적으로 반응하고 있음을 나타내며, 이에 따라 대상 포유류의 질병을 진단할 수 있다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예에서, 이러한 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 차이는 하나 또는 그 이상의 키나아제의 발현 및/또는 활성의 증가이다. 또 다른 실시예에서, 상기 차이는 하나 또는 그 이상의 키나아제의 발현 및/또는 활성의 감소이다.

또 다른 측면에서, 상기 기술은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 치료용 화합물을 식별하기 위한 방법을 제공한다. 상기 방법은 (i) 대상 포유류로부터의 생물학적 표본을 검사 화합물에 접촉시키고, (ii) 생물학적 표본 내에서 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 수준을 결정하며, (iii) 생물학적 표본 내의 하나 또는 그 이상의 단백질의 발현 수준을 검사 화합물에 접촉하지 않은 제어 표본의 수준과 비교하고, (iv) 생물학적 표본 내의 하나 또는 그 이상의 단백질의 발현 수준을 조절하는 검사 화합물을 선택하는 것을 포함하며, 이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 치료용 화합물을 식별하기 위한 치료적 화합물을 식별하게 된다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포 암종이다. 다양한 실시예에서, 상기 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 화합물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 증가시킨다. 또 다른 실시예에서, 상기 화합물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 감소시킨다.

또 다른 측면에서, 상기 기술은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공한다. 상기 방법은 본 발명의 방법을 필요로 하는 포유류에 치료적으로 효과적인 양의 약학적 조성을 투여하는 것을 포함하며, 상기 조성물은 상기 기술된 측면에 의해(즉, 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21을 사용하여) 식별된 치료적 화합물을 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 된다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예에서, 상기 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34개의 키나아제를 사용할 수 있다.

본 명세서에 기술된 모든 실시예는, 예시적으로만 설명된 실시예를 포함하여, 본 발명의 일반적인 기술의 일부로 이해되어야 하며, 본 명세서에서 명시적으로 배제되거나 부적절한 것으로 기술되지 않는 한 다른 실시예와 조합할 수 있다.

본 발명의 개시의 다양한 실시예들은 아래의 다음과 같은 도면을 참조하여 설명된다:
도 1은 치료제를 식별하기 위한 접근 방식의 예시도이다.
도 2는 암의 시스템 생물학 및 다중 생리학적 상호 반응 출력 조절의 결과의 예시도이다.
도 3은 MIMS를 사용한 생물학적 관련성의 체계적 조사에 대한 예시도이다.
도 4는 조사 생물학적 질의를 가능케 하기 위한 암 네트워크 모델링의 예시도이다.
도 5는 조사 생물학 플랫폼 기술의 예시도이다.
도 6은 본 플랫폼 기술에서 채택한 기술의 예시도이다.
도 7은 데이터 수집, 데이터 통합, 및 데이터 마이닝을 포함하는 본 발명의 플랫폼의 구성 요소를 개략적으로 나타낸다.
도 8은 “체학(omics)” 캐스케이드로부터의 반응 데이터의 MIMS 및 수집을 사용한 체계적 조사를 개략적으로 나타낸다.
도 9는 정상 및 당뇨성 상태를 나타내는 생체 외 모델을 구축하기 위해 채택되는 구성 요소를 개략적으로 나타낸다.
도 10은 질병 생리병리학과 관련하여 단백질의 인과 네트워크를 생성하기 위해 사용되는 정보학 플랫폼 REFS™를 개략적으로 나타낸다.
도 11은 당뇨성 상태 대 정상적 상태 및 MIMS에 의한 치료에 의해 정상적 상태로 회복된 당뇨성 노드에서의 분별 네트워크의 생성을 위한 접근 방식을 개략적으로 나타낸다.
도 12는 당뇨성 상태 대 정상적 상태에서의 대표적인 분별 네트워크이다.
도 13은 노드 및 연관된 관심 있는 간선(중앙의 노드 1)을 개략적으로 나타낸다. 각 간선과 연관된 상기 세포 기능성이 도시된다.
도 14는 일부 실시예에 따른 예시적 방법의 고 수준 흐름도이다.
도 15A-15D는 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 구성 요소 및 과정에 대한 고 수준의 개략적 예시도이다.
도 16은 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 과정의 흐름도이다.
도 17은 본 명세서에서 기술된 예시적 실시예를 실시하기에 적절한 예시적 컴퓨팅 환경을 개략적인 묘사이다.
도 18은 예 1에 기술된 사례 연구 설계의 예시도이다.
도 19는 하향 노드에 대한 CoQ10 치료의 효과를 도시한다.
도 20은 CoQ10 치료가 암 세포 라인 HepG2에서 LDHA의 발현을 감소시킴을 보여 준다.
도 21은 구축된 모든 모델 중에서, 70% 파편 빈도에서 Paca2, HepG2 및 THLE2 세포 라인으로부터의 데이터에 기반한 REFS 합치된 네트워크의 예시적 단백질 상호 반응을 도시한다.
도 22는 두 암 세포 라인 내에서 LDHA 발현 시뮬레이션에 반응하는 단백질이 본 플랫폼 기술을 사용하여 식별되었음을 보여 준다.
도 23은 LDHA - PARK7 네트워크의 진정 경로 보조(Ingenuity Passway Assist®) 분석이 TP53를 상향 허브로 식별함을 보여 준다.
도 24는 SKMEL28 암 세포 라인에서 TP53 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 25는 SKMEL28 암 세포 라인에서 세포 자살을 실현하는 BCL-2 단백질의 변경된 발현과 연관된 TP53의 활성화와 SKMEL28 내의 Bcl-2, Bax 및 카스파제3 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 26은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다.
도 27은 ECAR 및 OCR을 추진하는 암- 건강 표본 분별(델타-델타) 네트워크이다. 각 추진 인자는 간선의 두께로 표현되는 종단점에 대한 분별 효과를 가진다. 사이토스케이프(Cytoscape)에서 간선의 두께는 배수 변화의 강도를 나타낸다.
도 28은 IPA를 사용하는 조사적 플랫폼 기술 출력으로부터의 PARK7 매핑 및 연관된 노드를 보여 준다: 회색 모양은 IPA로 가져온 조사적 플랫폼 기술 출력으로부터의 PARK7과 연관된 모든 노드를 나타낸다. 채워지지 않은 모양은 (이름과 함께) 완전한 맵을 생성하기 위해 IPA에 의해 통합된 새로운 연결이다.
도 29는 본 발명의 조사 플랫폼 기술을 예시하며, PARK7과 연관된 노드의 신규의 연관을 보여 준다. 대시 라인으로 나타낸 간선은 노드를 가지나 IPA 내의 중간 물질 노드를 가지지 않는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다. 점선으로 나타낸 간선은 노드를 가지나 IPA 내에서 서로 다른 중간 물질 노드를 가지는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다.
도 30은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. NG∩HG 델타 네트워크 내 NG로부터의 고유한 간선들을 HG∩HGT1 델타 네트워크 내 HGT1의 고유한 간선들과 비교한다. NG 및 HGT1의 교집합 내의 간선들은 T1에 의해 NG로 회복된 HG 간선이다.
도 31은 NG∩HG 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 당뇨성 간선들의 델타-델타 네트워크 이다.
도 32는 정상 지질 상태 ∩ 고지질증 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 고지질증 간선들의 델타-델타 네트워크이다.
도 33은 질병 및 약제 치료 내 지방산 운명의 변화를 개략적으로 나타낸다. ATP 생성을 위한 자유 지방산(FFA)의 활용과 막 생물학 교란에 대한 반응으로서 막 리모델링 사이의 균형이 약제 유도 심장 독성과 관련된다.
도 34는 당뇨성 심장근 세포에서의 약제 유도 독성을 연구하기 위해 사용된 실험적 설계 및 모델링 매개변수를 개략적으로 나타낸다.
도 35는 당뇨성 심장근 세포 내의 인간 미토콘드리아의 약제 처리(T)에 의한 에너지 대사 유전자의 전사적 네트워크 및 발현의 조절 장애를 나타낸다: 구조 분자(R)는 유전자 발현을 정상화시킨다.
도 36: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포로부터의 미토콘드리아 내 GPAT1 및 TAZ의 발현을 유도하였다. 구조 분자와 조합하여(T+R) GPAT1 및 TAZ의 수준이 정상화되었다. B. G3P 로부터 TAG의 합성을 보여준다.
도 37: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 OCR (산소 소모율)을 감소시켰다. 구조 분자(T+R)가 OCR을 정상화한다. B. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 ATP 합성을 억제한다.
도 38은 약제 치료에 의해 하향 조절된 단백질의 GO 주석을 보여준다. 미토콘드리아의 에너지 대사에 포함된 단백질은 약제 치료에 의해 하향 조절되었다.
도 39는 델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. 양 모델이 당뇨성 환경에 있을 때 T 대 UT로부터의 고유한 간선을 비교한다.
도 40은 약제 유도 독성의 생리병리학을 추진하는 잠재적 단백질 허브 및 네트워크를 나타내는 개략도이다.
도 41은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하는 방법의 예시도이다.
도 42는 ENO1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 ENO1 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 44는 넥사바(Sorafenib)로 처리한 HepG2에서 LDHA 활성의 상당한 감소를 도시한다.
도 45는 AI 기반 REFS™ 시스템을 사용하여 결과적인 데이터 집합을 분석함으로써 생산될 수 있는 인과적 분자의 상호 반응 네트워크를 예시한다.
도 46은 베이지안(Bayesian) 네트워크 추정 알고리즘을 채택하는 다중체적 데이터의 통합이 어떻게 간세포 암종에서의 신호 전달 경로의 이해로 귀결되는지를 예시한다. 노란색 사각형은 전사후 수정(인산) 데이터를 나타내며, 파란색 삼각형은 활성 기반(키나아제) 데이터를, 녹색 원은 단백질체 데이터를 나타낸다.
도 47은 간세포 암종에서의 신호 전달 경로에서의 자동 조절과 역 피드백 조절이 어떻게 플랫폼에 의해 추정될 수 있는지를 예시한다. 사각형은 PMT(인산) 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타내며, 사각형은 활성 기반(키나아제) + 단백질체학 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타낸다.
도 48 내지 51은 플랫폼에 의해 추정된 신호 전달 경로에서의 도출된 인과적 연관의 예시도이다. 키나아제 동형 단백질은 대표적인 사각형과 원으로 나타내어 졌으며, 연결기에 의해 나타나는 인과적 연관을 보여 준다.
도 52A와 B는 (A) 융합성 또는 (B) 하위융합성 배양에서 성장한 인간 배꼽의 정맥 내피의 세포(HUVEC)자 표시된 농도 범위의 CoQ10으로 24시간 동안 처리되었음을 보여 준다. 융합성 세포는 '정상' 세포와 매우 유사함에 반해 하위 융합성 세포는 증식 세포의 혈관 형성 표현형을 매우 유사하게 나타낸다. 융합성 배양에서, 농도를 증가시킨 CoQ10의 첨가는 EC의 보다 밀접한 연관, 연장 및 정렬을 가져왔다. 5000μM은 원형화된 세포에서 미묘한 증가를 가져 왔다.
도 53A-C는 HUVEC 세포의 융합성 (A) 및 하위 융합성 (B) 배양이 100 또는 1500μM CoQ10으로 24시간 동안 처리되고 요오드화프로피디엄 양성 세포 사멸제 세포에 대해 분석된 것을 도시한다. CoQ10 융합에서 처리된 EC를 보호하는 경향이 있으며, 반면에 하위-융합성 세포는 CoQ10에 민감하고 1500μM CoQ10에서 증가하는 세포 자살을 보여 주었다. (C) 하위-융합성 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)의 대표적인 히스토그램을 도시한다.
도 54A-C는 HUVEC 세포의 하위 융합성 배양이 100 또는 1500μM CoQ10으로 72시간 동안 처리되고 요오드화프로피디엄 통합 분석(G2/M 위상 DNA를 탐지)을 사용하여 세포의 개수(A) 및 증식(B) 모두에 대한 분석을 도시한다. 높은 농도의 CoQ10는 세포의 개수에서 상당한 감소를 가져 왔으며 EC 증식에 대한 투여량에 의존하는 효과를 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 증식이 낮아지는 것을 보여 주는 세포 사이클의 G2/M 위상 내의 세포에 대한 대표적인 세포 증식 게이팅의 히스토그램[제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)]이 (C)에 도시되었다.
도 55는 HUVEC 세포가 "스크래치" 분석을 사용하는 이주를 위해 검사되는 융합으로 성장하였음을 보여 준다. 100 또는 1500μM의 CoQ10가 스크래치 시 가해졌으며 정리된 영역의 폐쇄가 48시간에 걸쳐 모니터링되었다. 100μM의 CoQ10가 제어 표본에 비해 내피의 폐쇄를 지연시켰다. 1500μM CoQ10를 추가하면 48시간 까지도 폐쇄가 방지되었다(데이터 미도시).
도 56는 3-D 마트리겔 형태의 튜브에서 시간에 따라 성장하는 내피의 세포를 보여 준다. 관 형성에 대한 100μM 및 1500 μM CoQ10의 분별 효과가 관찰되었다. 저해된 세포에서 세포로의 연관 및 초기 관 구조의 붕괴가 1500 μM CoQ10에 상당히 발생하였다. 도시된 영상 72시간에 촬영되었다.
도 57A-B는 하위융합성 및 융합성 배양 내에서 성장한 내피의 세포가 CoQ10의 존재 또는 부재 하에 정상 및 혈중 산소 감소 조건에서 성장하였음을 보여 준다. CoQ10 및 저산소 상태에 대한 반응으로서 산화질소(NO)(A) 및 반응성 산소 종(ROS)(B)의 생성이 분석되었다.
도 58A-D는 지정된 성장 조건 하에서 미토콘드리아의 산소 소모를 분석하기 위해 내피의 세포가 CoQ10의 존재 또는 부재 하에서 하위 융합성 또는 융합성 배양에서 성장되는 것을 도시한다. 전체 OCR의 평가(A); 미토콘드리아의 OCR(B); ATP 생산(C); ECAR(D)이 도시된다.

I. 개요

본 발명의 예시적 실시예들은 질병 생리병리학 또는 신생 혈관 생성과 같은 광범위한 범위의 생물학적 과정들을 이해할 수 있는 도구이며 질병 과정을 가능하게 하는 요소들을 포함하여 이러한 생물학적 과정의 기반이 되는 핵심적 분자의 추진 인자인 조사적 생물학 플랫폼(“플랫폼”)을 사용하여 수행될 수 있는 방법들을 통합한다. 일부 예시적 실시예들에는 이 플랫폼의 최소한 일부 또는 전체를 통합할 수 있는 시스템이 포함된다. 일부 예시적 방법들은 이 플랫폼의 최소한 일부 또는 전체를 채택할 수 있다. 이 플랫폼을 포함하는 일부 예시적 실시예의 목표와 목적은 일반적인 예시의 목적으로 이하에서 개략적으로 설명된다:

i) 생물학적 과정(예를 들어, 질병 과정, 신생 혈관 생성)의 임계 성분의 추진 인자로서 이들이 전반적인 생물학적 과정에 관계되는 특정한 분자 서명을 창출한다.

ii) 다른 생물학적 단계(예를 들어, 정상적 상태)에 대하여 특정 생물학적 상태(예를 들어, 질병 상태, 신생 혈관 생성 상태)를 구분하는 분별 분자 서명을 식별하고, 두 생물학적 상태 간의 변화(예를 들어, 정상 상태에서 질병 상태 또는 신생 혈관 생성 상태로의)의 메커니즘을 중재하는 서명 또는 분자 객체 전체에 대한 이해를 발전시키는데 도움을 줄 수 있는, 생물학적 과정과 관련된 분자 서명 또는 분별 맵을 생성한다.

iii) 생물학적 과정의 외부 제어를 위한 잠재적 시술 타겟으로서(예를 들어, 허브를 잠재적 치료적 타겟 또는 신생 혈관 생성의 조절을 위한 타겟으로 사용), 또는 문제가 되는 생물학적 과정을 위한 잠재적 생물학적 표지 인자로서(예를 들어, 예후 및/또는 치료 진단(theranostics)에서의 사용에서의 질병에 특정한 생물학적 표지 인자 및 혈관 형성 특정한 표지 인자)의 분자 활성 “허브”의 역할을 조사한다.

이 플랫폼을 포함하는 일부 예시적 방법들은 다음 특성 중 하나 또는 그 이상을 포함할 수 있다:

1) 하나 또는 그 이상의 모델, 바람직하게는 생체 외 모델 또는 실험실 모델(예를 들어, CAM 모델, 각막 주머니 모델, 마트리겔(MATRIGEL®) 모델)에서 생물학적 과정과 연관된 세포를 사용하여 생물학적 과정(예를 들어, 질병 과정, 혈관 형성 과정) 및/또는 생물학적 과정(예를 들어, 질병 생리학 및 생리병리학, 신생 혈관 생성의 생리학)의 구성 요소에 대한 모델링. 예를 들어, 상기 세포는 문제가 되는 생물학적 과정에 정상적으로 참여하는 인간에서 유래한 세포일 수 있다. 상기 모델은 해당 생물학적 과정(예를 들어, 질병, 신생 혈관 생성)에 특정된 여러 세포의 알림 신호 / 조건 / 교란을 포함할 수 있다. 이상적으로, 상기 모델은 생물학적 (질병, 신생 혈관 생성) 조건의 정적 평가가 아닌 여러(질병, 신생 혈관 생성) 상태 및 플럭스(flux) 성분을 나타낸다.

2) 해당 분야에서 알려진 수단을 사용한 mRNA 및/또는 단백질 서명의 프로파일링. 예를 들어, 정량적 중합효소 연쇄 반응 (qPCR) 및 질량 분광학(MS)과 같은 단백질체학 분석 도구. 이러한 mRNA 및 단백질 데이터 집합은 환경 / 교란에 대한 생물학적 반응을 나타낸다. 적용할 수 있고 가능한 경우에, 리피도믹스, 대사체학, 및 전사체학 데이터 또한 문제가 되는 생물학적 과정을 위한 보조적 또는 대체적 수단으로 통합?? 수 있다. SNP 분석은 때때로 과정에서 사용할 수 있는 또 다른 구성 요소이다. 이는, 예를 들어, SNP 또는 특정한 변이가 생물학적 과정에 영향을 미치는 지의 여부를 조사하는데 도움이 될 수 있다. 이들 변수들은 생물학적 과정을 정적인 “순간 상태(snapshot)” 또는 동적 과정의 표현 중 하나로 기술하기 위해 사용될 수 있다.

3) 신호 및 교란에 대한 하나 또는 그 이상의 세포 반응의 평가로서, 생명 에너지론 프로파일링, 세포 증식, 세포 자살, 및 기관계 기능을 포함하나 이에 한정되지 않음. 진정한 유전자형-표현형 연관이 ATP, ROS, OXPHOS, 시호스(Seahorse) 분석, 카스파제 분석, 이주 분석, 주화성 분석, 관 형성 분석 등과 같은 기능적 모델을 채택함으로써 실현된다. 이러한 세포 반응들은 생물학적 과정(또는 이들의 모델)에서의 mRNA / 단백질 발현, 및 상기 2)에서 기술된 다른 관련 상태의 해당 상태(들)에 대한 세포의 반응을 나타낸다.

4) 상기 3)에서 단백질체학으로 이렇게 획득한 기능적 분석 데이터 및 상기 2)에서 획득한 기타 데이터를 통합하고, 인과 관계에 의해, 인공 지능(AI) 기반 정보학 시스템 또는 플랫폼에 의해 추진되는 단백질 연관을 결정. 이러한 AI 기반 시스템은 생물학적 과정에 대한 기존 지식에 의존하지 않고 상기 2) 및/또는 3)에서 획득한 데이터 집합에, 바람직하게는 상기 데이터 집합에만 기반한다. 바람직하게는, 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 잘려나가지 않는다. 그 대신, 획득된 모든 데이터 단백질연관의 결정을 위한 AI 시스템으로 공급된다. 상기 통합 과정의 한 목표 또는 출력은 서로 다른 생물학적 상태(예를 들어, 질병 상태 대 정상적 상태) 사이의 하나 또는 그 이상의 분별 네트워크(다른 경우에 본 명세서에서 “델타 네트워크”로 또는 일부 경우에는 경우가 의미하는 바에 따라 “델타-델타 네트워크”로 불릴 수 있다)이다.

5) 활성의 각 허브를 잠재적 치료적 타겟 및/또는 생물학적 표지 인자로 탐구하기 위한 AI 기반 정보학 플랫폼으로부터의 출력에 대한 프로파일링. 이러한 프로파일링은 어떠한 실제 수중 실험실 실험에 의존하지 않고 획득한 데이터 집합에 기반한 컴퓨터 시뮬레이션만으로 수행될 수 있다.

6) 분자의 및 세포 기술을 채택하여 활성의 허브를 증명. 이러한 수중 실험실 세포-기반 실험에 의한 출력에 대한 정보 취득 이후 증명은 선택 사항일 수 있으나, 완전히 순환적인 조사를 창출하는데 도움이 될 것이다.

상기 개략적으로 설명된 것 중 어느 하나 또는 모든 접근 방식이 최소한 부분적으로는 특정한 적용의 특성에 따라 생물학적 과정에 대해 특정하게 적용될 수 있다. 즉, 상기 개략적으로 설명된 것 중 하나 또는 그 이상의 접근 방식이 생략되거나 수정될 수 있으며, 하나 또는 그 이상의 추가적인 접근 방식이 특정한 적용에 따라 채택될 수 있다.

상기 플랫폼을 예시하는 여러 개략적 예시가 제공된다. 특히, 상기 플랫폼을 사용하여 치료제를 식별하기 위한 예시적 접근 방식의 예시가 도 1에서 묘사된다. 암 및 통합된 다중 생리학적 상호 반응 출력 조절의 결과의 시스템 생물학에 대한 예시가 도 2에서 묘사된다. MIMS를 사용한 생물학적 관련성의 체계적 조사의 예시가 도 3에서 묘사된다. 조사적 생물학적 질의를 가능하게 하기 위한 암 네트워크의 모델링의 예시가 도 4에서 묘사된다.

상기 플랫폼에서 채택된 조사적 생물학 플랫폼 및 기술의 예시가 도 5 및 6에서 묘사된다. 데이터 수집, 데이터 통합, 및 데이터 마이닝을 포함하는 상기 플랫폼의 구성요소의 개략적 표현이 도 7에서 묘사된다. MIMS 및 “체학(omics)” 증폭으로부터의 반응 데이터의 수집을 이용한 체계적 조사에 대한 개략적 표현이 도 8에서 묘사된다.

도 14는 예시적 방법(10)에 대한 고 수준의 흐름도로서, 예시적 방법을 수행하기 위해 사용될 수 있는 예시적 시스템의 구성 요소를 나타낸다. 초기에, 일반적으로 생물학적 과정과 연관된 세포를 사용하여 생물학적 과정 (예를 들어, 질병 과정) 및/또는 생물학적 과정 (예를 들어, 질병 생리학 및 생리병리학)의 구성 요소를 위한 모델(예를 들어, 생체 외 모델)을 수립한다(단계 12). 예를 들어, 상기 세포는 생물학적 과정(예를 들어, 질병)에 정상적으로 참여하는 인간으로부터 유래된 세포일 수 있다. 세포 모델은 생물학적 과정(예를 들어, 질병)에 특유한 여러 세포 단서, 조건, 및/또는 교란을 포함할 수 있다. 이상적으로, 상기 세포 모델은 생물학적 과정의 정적 평가가 아닌 생물학적 과정(예를 들어, 질병)의 여러 (질병) 상태 및 플럭스 성분을 나타낸다. 상기 비교 세포 모델은 제어 세포 또는 정상(예를 들어, 질병이 없는) 세포를 포함할 수 있다. 이 세포 모델의 추가적인 설명은 이하 제 III.A절 및 IV절에서 주어진다.

제 1 데이터 집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 알려진 과정 또는 시스템(예를 들어, 정량적 중합효소 연쇄 반응(qPCR) 및 질량 분광학(MS)과 같은 단백질체학 분석 도구)을 사용하여 다수의 유전자(예를 들어, mRNA 및/또는 단백질 서명)의 발현 수준을 나타내는 정보를 포함한다(단계 16).

제 3 데이터 집합은 비교 생물학적 과정을 위한 세포 모델로부터 얻어 진다(단계 18). 상기 제 3 데이터 집합은 비교 세포 모델로부터의 비교 세포 내의 다수의 유전자의 발현 수준을 나타내는 정보를 포함한다.

본 발명의 방법의 특정 실시예에서, 이들 제 1 및 제 3 데이터 집합은 본 명세서에서 총체적으로 생물학적 시스템과 연관된 세포(비교 세포를 포함하는 모든 세포) 내에서 다수의 유전자의 발현 수준을 나타내는 “제 1 데이터 집합”으로 통칭된다.

제 1 데이터 집합 및 제 3 데이터 집합 하나 또는 그 이상의 mRNA 및/또는 단백질 서명 분석 시스템(들)로부터 얻어질 수 있다. 제 1 및 제 3 데이터 집합 내의 상기 mRNA 및 단백질 데이터는 환경 및/또는 교란에 대한 생물학적 반응을 나타낼 수 있다. 적용 또는 가능한 경우, 리피도믹스, 대사체, 및 전사체 데이터가 상기 생물학적 과정에 대한 보조적이거나 대체적 수단으로서 통합될 수 있다. SNP 분석은 상기 과정에서 때때로 사용될 수 있는 또 다른 구성 요소이다. 이는, 예를 들어, 단일 뉴클레오타이드 다형성(SNP) 또는 특정한 변이가 생물학적 과정에 영향을 미치는지를 조사하는데 도움이 될 것이다. 이러한 데이터 변수는 정적 “순간 상태(snapshot)” 또는 동적 과정의 표현 중 하나로서 생물학적 과정을 기술하는데 사용될 수 있다. 세포 내 다수의 유전자의 발현 수준을 나타내는 정보에 관한 추가적인 설명은 이하 제 III.B절에서 주어진다.

제 2 데이터 집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 세포의 기능적 활성 또는 반응을 나타내는 정보를 포함한다(단계 20). 마찬가지로, 제 4 데이터집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 비교 세포의 기능적 활성 또는 반응을 나타내는 정보를 포함한다(단계 22).

본 발명의 방법의 특정 실시예에서, 이들 제 2 및 제 4 데이터 집합은 본 명세서에서 총체적으로 생물학적 시스템과 관련된 세포(비교 세포를 포함하는 모든 세포)의 기능적 활성 또는 세포 반응을 나타내는 “제 2 데이터 집합”으로 통칭한다.

하나 또는 그 이상의 기능적 분석 시스템이 기능적 활성 또는 세포 또는 비교 세포의 반응에 관한 정보를 얻기 위해 사용될 수 있다. 신호 및 교란에 대한 기능적 세포 반응과 관련된 상기 정보는 생물에너지론 프로파일링, 세포 증식, 세포 자살, 및 기관계의 기능을 포함하나 이에 한정되지는 않는다. 과정 및 경로에 대한 기능적 모델(예를 들어, 아데노신 3 인산(ATP), 활성 산소종(ROS), 산소 첨가 인산화(OXPHOS), 시호스(Seahorse) 분석, 카스파제 분석, 이주 분석, 주화성 분석, 관 형성 분석 등)들이 진정한 유전자형-표현형 연관을 얻기 위해 채택될 수 있다. 상기 기능적 활성 또는 세포 반응은 mRNA / 단백질 발현의 해당 상태(들) 및 기타 관련된 적용 조건 또는 교란에 대한 반응에서 생물학적 과정(또는 이들의 모델) 내 세포의 반응을 나타낸다. 세포의 기능적 활성 또는 반응을 나타내는 정보 획득에 대한 추가적 정보는 이하 제 III.B절에서 제공된다.

상기 방법은 또한 컴퓨터로 구현된 세포 및 제어 세포 내에서의 생물학적 과정의 모델을 생성하는 것을 포함한다. 예를 들어, 다수의 유전자 발현 수준 및 기능적 활성 또는 세포 반응 사이의 하나 또는 그 이상의 (예를 들어, 이들의 모임) 인과 관계의 베이지안(Bayesian) 네트워크가 제 1 데이터 집합 및 제 2 데이터 집합으로부터 세포 모델(“생성된 세포 모델 네트워크”)에 대해 생성될 수 있다(단계 24). 상기 생성된 세포 모델 네트워크는, 개별적으로 또는 총체적으로, 관계에 대한 정량적 확률적 방향 정보를 포함한다. 상기 생성된 세포 모델 네트워크는 제 1 데이터 및 제 2 데이터 집합으로부터의 정보를 제외하고는 유전자 발현 및/또는 기능적 활성 또는 세포 반응 사이의 알려진 생물학적 관계에 기반하지 않는다. 상기 하나 또는 그 이상의 생성된 세포 모델 네트워크는 총체적으로 합치된 세포 모델 네트워크라 칭할 수 있다.

예를 들어, 다수의 유전자 발현 수준 및 기능적 활성 또는 세포 반응 사이의 하나 또는 그 이상의 (예를 들어, 이들의 모임) 인과 관계의 베이지안(Bayesian) 네트워크가 제 1 데이터 집합 및 제 2 데이터 집합으로부터 비교 세포 모델(“생성된 비교 세포 모델 네트워크”)에 대해 생성될 수 있다(단계 26). 상기 생성된 비교 세포 모델 네트워크는, 개별적으로 또는 총체적으로, 관계에 대한 정량적 확률적 방향 정보를 포함한다. 상기 생성된 세포 네트워크는 제 1 데이터 및 제 2 데이터 집합으로부터의 정보를 제외하고는 유전자 발현 및/또는 기능적 활성 또는 세포 반응 사이의 알려진 생물학적 관계에 기반하지 않는다. 상기 하나 또는 그 이상의 생성된 비교 세포 모델 네트워크는 총체적으로 합치된 세포 모델 네트워크라 칭할 수 있다.

상기 생성된 세포 모델 네트워크 및 생성된 비교 세포 모델 네트워크는 인공 지능(AI) 기반 정보학 플랫폼을 사용하여 창출할 수 있다. 생성된 세포 모델 네트워크의 창출, 생성된 비교 세포 모델 네트워크의 창출 및 AI 기반 정보학 시스템에 대한 보다 자세한 사항은 이하 제 III.C절 및 도 2A-3에 대한 설명에서 주어진다.

다른 많은 AI 기반 플랫폼 또는 시스템이 정량적 확률적 방향 정보를 포함하는 인과 관계의 베이지안(Bayesian) 네트워크를 생성하기 위해 사용될 수 있음을 인식하여야 한다. 본 명세서에서 기술된 특정 예들이 특정한 상용으로 사용할 수 있는 시스템, 즉, GNS(캠브리지, MA)로부터의 REFS™ (역 엔지니어링/정방향 시뮬레이션)을 채택하였지만, 실시예는 이에 한정되지 않는다. 일부 실시예를 구현하기에 적절한 AI 기반 시스템 또는 플랫폼은 입력 변수(예를 들어, 제 1 및 제 2 데이터 집합)들 사이의 인과 관계를 잠재적, 확립된 생물학적 관계 및/또는 증명된 생물학적 관계에 대한 어떠한 기존의 지식에도 의존하지 않고 입력 데이터에만 기반하여 확립하기 위해 수학적 알고리즘을 채택한다.

예를 들어, REFS™ AI 기반 정보학 플랫폼은 실험적으로 도출된 가공되지 않았거나(원래의) 또는 최소한으로 처리된 입력 생물학적 데이터(예를 들어, 유전학적, 게놈 관련, 후성유전학, 단백질체, 대사체, 임상적 데이터)를 활용하며, 분자가 완전한 시스템 내에서 서로 어떻게 반응하는지를 결정하기 위해 수 조 회의 계산을 빠르게 수행한다. REFS™ AI 기반 정보학 플랫폼은 입력 데이터를 기반으로 기반이 되는 생물학적 시스템을 정량적으로 나타내는 컴퓨터로 구현된 컴퓨터 모의 세포 모델(예를 들어, 생성된 세포 모델 네트워크)을 생성하기 위한 목표로 역 엔지니어링 과정을 수행한다. 또한, 가설과 관련하여 연관된 신뢰 수준을 수반하는 예측을 얻어내기 위해, 기반이 되는 생물학적 시스템에 대한 가설이 개발되고 컴퓨터로 구현된 세포 모델를 기반으로 빠르게 모의될 수 있다.

이러한 접근 방식을 사용하여, 생물학적 시스템이 어떠한 환자가 주어진 치료 식이 요법에 반응할지를 결정하는 생물학적 시스템(예를 들어, 질병)의 상세한 메카니즘, 효과적인 시술 전략, 및/또는 임상적 생물학적 표지 인자를 알아내기 위한 “시술” 이 모의되는 정량적 컴퓨터로 구현된 세포 모델로 나타내어 진다. 알려진 생물학의 모델링에 기반한 접근 방식뿐만 아니라 종래의 생물정보학 및 통계적 접근 방식은 일반적으로 이러한 유형의 통찰을 제공하지 못한다.

상기 생성된 세포 모델 네트워크 및 상기 생성된 비교 세포 모델 네트워크가 만들어진 후에, 이들은 각각 비교된다. 생성된 세포 모델 네트워크의 최소한 일부에 존재하는 하나 또는 그 이상의 인과 관계, 및 상기 생성된 비교 세포 모델 네트워크에 부재하거나 최소한 하나의 의미 있는 다른 매개변수를 가지는 인과 관계가 식별된다(단계 28). 이러한 비교는 결과적으로 네트워크의 생성을 일으킬 수 있다. 이러한 비교, 식별, 및/또는 분별(델타) 네트워크 생성은 분별 네트워크 생성 모듈을 사용하여 수행될 수 있으며, 이 모듈은 이하 제 III.D절 및 도 26의 설명과 관련하여 보다 상세히 기술된다.

일부 실시예에서, 입력 데이터 집합은 하나의 세포 유형 및 하나의 비교 세포 유형으로부터 유래하며, 이는 하나의 세포 유형에 기반한 세포 모델 네트워크들의 모임 및 하나의 비교 제어 세포 유형에 기반한 또 다른 비교 세포 모델 네트워크들의 모임을 생성할 수 있다. 분별이 한 세포 유형의 네트워크들의 모임과 비교 세포 유형(들)의 네트워크들의 모임 사이에 수행될 수 있다.

다른 실시예에서, 입력 데이터 집합은 다중 세포 유형(예를 들어, 둘 또는 그 이상의 암 세포 유형, 예를 들어, 서로 다른 혈관 형성 촉진 자극에 의해 유도된 서로 다른 신생 혈관 생성 상태에서의 둘 또는 그 이상의 세포 유형), 다중 비교 세포 유형(예를 들어, 둘 또는 그 이상의 정상, 암세포가 아닌 유형, 둘 또는 그 이상의 비혈관 형성 및 혈관 형성 세포 유형)으로부터 유래된다. 세포 모델 네트워크들의 모임은 각각의 세포 유형 및 각각의 비교 세포 유형에 대해 개별적으로 생성되고, 또한/또는 다중 세포 유형 및 다중 비교 세포 유형으로부터의 데이터가 각자의 합성 데이터 집합으로 결합될 수 있다. 상기 합성 데이터 집합은 다중 세포 유형(합성 데이터)에 해당하는 네트워크들을 모임 및 다중 비교 세포 유형(비교 합성 데이터)에 해당하는 네트워크들의 또 다른 모임을 생성할 수 있다. 분별이 비교 합성 데이터에 대한 네트워크들의 모임과 비교하여 합성 데이터에 대한 네트워크들의 모임에 수행될 수 있다.

일부 실시예에서, 분별은 두 개의 서로 다른 분별 네트워크 사이에서 수행될 수 있다. 이 출력은 델타-델타 네트워크로 불릴 수 있으며, 이하 도 26과 관련하여 설명된다.

정량적 관계 정보 생성된 세포 모델 네트워크의 각 관계에 대해 식별될 수 있다(단계 30). 마찬가지로, 생성된 비교 세포 모델 네트워크 내에서의 각 관계에 대한 정량적 관계 정보가 식별될 수 있다(단계 32). 관계에 대한 상기 정량적 정보는 인과율을 나타내는 방향, 관계에 대한 통계적 불확실성의 척도(예를 들어, 커브 아래 면적(Area Under the Curve: AUC) 통계적 측정), 및/또는 관계의 강도에 대한 정량적 양(예를 들어, 배수)의 발현을 포함할 수 있다. 생성된 세포 모델 네트워크 내의 상기 여러 관계는 잠재적 치료적 타겟 및/또는 생물학적 표지 인자로서의 활성 네트워크 내의 각 허브를 탐구하기 위해 정량적 관계 정보를 사용하여 프로파일링될 수 있다. 이러한 프로파일링은 실제의 수중 실험실 실험에 의존하지 않고 완전히 생성된 세포 모델 네트워크로부터의 결과에 기반한 컴퓨터 시뮬레이션으로 수행할 수 있다.

일부 실시예에서, 활성 네트워크 내의 허브는 분자 및 세포 관련 기술을 채택하여 증명될 수 있다. 수중 실험실 세포 기반 실험에 의한 출력에 대해 이러한 사후 정보 인증을 수행할 필요는 없지만, 이는 완전히 순환적인 조사를 수행하는데 도움이 될 것이다. 도 15는 예시적 AI 기반 정보학 시스템 (예를 들어, REFS™ AI 기반 정보학 시스템) 및 AI 기반 시스템 과 조사적 생물학 플랫폼 (“플랫폼”)의 기타 요소 또는 부분 사이의 상호 반응의 기능성의 단순화된 고 수준의 표현을 개략적으로 묘사한다. 도 15A에서, 약제의 투여, 치료의 실행, 단백질 발현, mRNA 발현, 및 기타 다수의 연관된 기능적 조치들(OCR, ECAR과 같은)과 같은 생물학적 과정 (예를 들어, 질병 모델)에 대한 모델로부터 얻어진 여러 데이터 집합들이 AI 기반 시스템으로 공급된다. 도 15B에서 보인 바와 같이, 입력 데이터 집합으로부터, AI-시스템은 생물학적 과정 (예를 들어, 질병), 베이지안(Bayesian) 파편 일람표(도 15B)로 불리는 과정에서의 분자의 메커니즘을 추진하는 변수들(단백질, 지질 및 대사 물질)을 포함하는 “네트워크 파편들”의 라이브러리를 생성한다.

도 15C에서, 상기 AI 기반 시스템은 라이브러리에서 네트워크 파편의 부분 집합을 선택하여 상기 파편으로부터 초기 시도 네트워크를 구성한다. 상기 AI 기반 시스템은 또한 라이브러리에서 네트워크 파편의 다른 부분 집합을 선택하여 또 다른 초기 시도 네트워크를 구성한다. 결과적으로 라이브러리 내 네트워크 파편의 서로 다른 부분 집합들로부터 초기 시도 네트워크들의 모임(예를 들어, 1000개의 네트워크)이 생성된다. 이 과정은 병행 모임 샘플링이라 부를 수 있다. 모임 내의 각각의 시도 네트워크는 라이브러리로부터의 추가적인 네트워크 파편의 추가, 차감 및 대입에 의해 진화하거나 최적화된다. 추가적인 데이터가 얻어지는 경우, 이 추가적인 데이터는 라이브러리 내 네트워크 파편들로 통합될 수 있으며 각 시도 네트워크의 진화를 통해 시도 네트워크의 모임들로 통합될 수 있다. 최적화/진화 과정이 완료된 이후, 이 시도 네트워크들의 모임은 생성된 세포 모델 네트워크로서 기술될 수 있다.

도 15D에서 보인 바와 같이, 생성된 세포 모델 네트워크들의 모임은 생물학적 시스템의 거동을 시뮬레이션하기 위해 사용될 수 있다. 상기 시뮬레이션은 수중 실험실 세포-기반, 또는 동물-기반 실험에 의해 증명될 수 있는 조건의 변화에 대한 생물학적 시스템의 거동을 예측하기 위해 사용될 수 있다. 또한, 생성된 세포 모델 네트워크에서의 관계의 정량적 매개변수는 생성된 세포 모델 네트워크 내 다른 노드에 대한 영향을 관찰하면서 시뮬레이션된 교란을 각 노드 개별적으로 적용함으로써 시뮬레이션 기능성을 사용하여 추출할 수 있다. 이에 대한 보다 상세한 사항은 이하 제 III.C절에서 설명된다.

도 2A-2D에서 묘사된 AI 기반 정보학 시스템 자동화된 역 엔지니어링 과정은 편향되지 않고 체계적인 컴퓨터 기반 세포 모델 네트워크인 생성된 세포 모델 네트워크들의 모임을 생성한다.

상기 역 엔지니어링은 데이터 내에서의 분자의 측정과 관심의 대상인 표현형 결과 사이의 확률 방향적 네트워크 연결을 결정한다. 분자의 측정에서의 변동은 이러한 객체들 및 종단점들에서의 변화 사이의 확률적인 원인 결과 관계를 학습할 수 있게 해 준다. 플랫폼의 기계 학습적 성격은 또한 끊임없이 진화하는 데이터 집합에 기반한 훈련 및 예측을 가능하게 해 준다.

데이터 내에서의 분자 측정들 사이의 네트워크 연결은 “확률적”이며, 이는 부분적으로 이러한 연결이 컴퓨터 알고리즘에 의해 “학습된” 관찰된 데이터 집합들 사이의 상호 관계에 기반할 수 있기 때문이다. 예를 들어, 단백질 X의 발현 수준과 단백질 Y의 발현 수준이 긍정적 또는 부정적으로 상호 관련되어 있다면, 데이터 집합의 통계적 분석을 기반으로, 단백질 X 및 Y 사이의 네트워크를 수립하도록 인과 관계가 지정될 수 있다. 이러한 추정 상의 인과 관계의 신뢰성은 이러한 연결의 확률로써 정의될 수 있으며, p-값(예를 들어, p < 0.1, 0.05, 0.01, 등)으로 측정될 수 있다.

데이터 내에서의 분자 측정들 사이의 네트워크 연결은 “방향성”을 가지며, 이는 부분적으로 역 엔지니어링 과정으로 결정되는 분자 측정들 사이의 네트워크 연결이 연결된 유전자 / 단백질 사이의 관계의 원인과 결과를 반영함으로써 이로 인해 한 단백질의 발현 수준을 올리는 것이 상기 연결이 발현을 촉진하는지 저지하는지에 따라 다른 단백질의 발현 수준을 올리거나 내릴 수 있기 때문이다.

데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “정량적”이며, 이는 부분적으로, 이 과정에 의해 결정되는 분자의 측정 사이의 네트워크 연결 이 기존의 데이터 집합 및 이 데이터와 연관된 확률적 척도에 기반한 컴퓨터 시뮬레이션으로 모의될 수 있기 때문이다. 예를 들어, 분자의 측정들 사이에 확립된 네트워크 연결에서, 주어진 단백질(네트워크 내의 “노드”)의 발현 수준을 증가 또는 감소시키는 것이(예를 들어, by 1, 2, 3, 5, 10, 20, 30, 50,100-배수 또는 그 이상) 이론적으로 가능할 수 있으며, 이의 네트워크 내의 다른 연결된 단백질에 대한 영향을 정량적으로 모의할 수 있다.

데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “편향되지 않으며(unbiased)”, 이는 최소한 부분적으로는 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 배제되지 않기 때문이며, 부분적으로는 상기 네트워크 연결이 문제가 되는 생물학적 과정에 대한 기존의 지식을 참조하지 않고 입력 데이터에만 기반하기 때문이다.

데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “체계적”이며 (또한 편향되지 않으며), 이는 부분적으로 모든 입력 변수들 사이의 모든 잠재적 연결이 예를 들어, 쌍 단위의 방식으로 체계적으로 탐구되었기 때문이다. 이러한 체계적인 탐구를 실행하기 위한 컴퓨터 연산에 대한 의존은 입력 변수의 개수가 증가할수록 기하학적으로 늘어난다.

일반적으로, 보통 약 1,000개에 이르는 네트워크의 모임이 모든 측정된 개체들 사이의 확률적, 인과적, 정량적 관계를 예측하기에 충분하다. 네트워크들의 모임은 데이터 내의 불확실성을 포획하며 각 모델 예측에 대한 신뢰도 척도의 계산을 가능하게 한다. 네트워크들의 모임을 함께 사용하여 생성된 예측에서, 모임 내 개별적 네트워크로부터의 예측에 있어서의 차이는 예측 내의 불확실성의 정도를 나타낸다. 이러한 특성은 상기 모델로부터 생성된 임상적 반응의 예측에 대한 신뢰성 척도를 지정할 수 있게 해준다.

모델들이 일단 역 엔지니어링되면, 질병 조건과 같은 문제가 되는 생물학적 과정에 대한 핵심 분자의 추진 인자를 결정하기 위해 추가적인 시뮬레이션 질의가 모델들의 모임에 수행될 수 있다.

정상 및 당뇨성 상태들을 나타내는 표본적 생체 외 모델을 구축하기 위해 채용된 구성 요소의 개략적 묘사가 도 9에 도시되었다. 질병 생리병리학과 관련하여 단백질의 인과 네트워크를 생성하기 위해 사용되는 정보학 플랫폼 REFS™의 개략적 표현이 도 10에서 묘사된다. 당뇨성 상태 대 정상적 상태 및 MIMS에 의한 치료에 의해 정상적 상태로 회복된 당뇨성 노드에서의 분별 네트워크의 생성을 위한 접근 방식은 도 11에서 개략적으로 묘사된다. 당뇨성 상태 대 정상적 상태에서의 대표적인 분별 네트워크는 도 12에서 묘사된다. 노드 및 연관된 관심 있는 간선(중앙의 노드 1) 및 각 간선과 연관된 상기 세포 기능성이 도 13에서 도시된다.

본 발명을 위에서 일반적으로 기술하였으므로, 이하의 명세서 부분들에서는 본 명세서에서 기술된 방법을 사용하여 분석될 수 있는 하나 또는 그 이상의 특정한 생물학적 시스템을 가지는 상기 일반적인 발명의 여러 측면 또는 요소에 대한 보다 상세한 설명이 제공될 것이다. 그러나, 이하 예시적 목적으로 사용된 특정한 생물학적 시스템들은 본 발명을 한정하기 위한 것이 아닌 것으로 이해되어야 한다. 반대로, 대체적 시스템 및 수정된 시스템을 포함하여 다른 별개의 생물학적 시스템들 및 이들과 균등한 사항들 또한 마찬가지로 본 발명의 플랫폼 기술을 사용하여 분석될 수 있을 것이다.

II . 정의

본 명세서에서 사용되며 특정한 의도로 정의되었으나 본 명세서의 다른 절에서 아직 정의되지 않은 특정 용어들을 여기에서 정의한다.

본 명세서에서 사용된 용어 “하나” 및 “하나의”는 영문 명세서의 관사에 해당하며 본 명세서에서 하나 또는 하나 이상(즉, 최소한 하나)의 문법적 객체를 나타낸다. 예로써, “한 요소”는 하나의 요소 또는 하나 이상의 요소를 의미한다.

용어 “포함하는”은 본 명세서에서 “포함하나 이에 한정되지 않는”의 의미로 사용되며, 이들 용어들은 서로 교차적으로 사용된다.

용어 “또는”은 본 명세서에서 용어 “및/또는”의 의미로 사용되며, 다르게 명확하게 지정되지 않는 한 이들 용어들은 서로 교차적으로 사용된다.

용어 “와 같은”은 본 명세서에서 용어 “와 같은 그러나 이에 한정되지 않는”의 의미로 사용되며, 이들 용어들은 서로 교차적으로 사용된다.

“대사 경로”는 한 화합물을 다른 화합물로 변환하고 세포 기능을 위한 중간 단계와 에너지를 제공하는 일련의 효소 중재 반응들을 말한다. 이러한 대사 경로는 선형 또는 환형 또는 분지형일 수 있다.

“대사 상태”는 주어진 시점에서 건강 또는 질병 상태와 관련하여 다양한 화학적, 생물학적 지표에 의해 측정되는 특정한 세포, 다중 세포 또는 조직 환경의 분자의 내용물을 말한다.

“신생 혈관 생성” 이미 존재하는 혈관으로부터의 새로운 혈관의 성장을 포함하는 생리학적 과정을 말한다. 신생 혈관 생성의 최소한 혈관 내피의 세포의 증식, 일반적으로 화학요법 제제에 대한 반응으로서 혈관 내피의 세포의 이주, 일반적으로 기질 금속 단백질 분해 효소의 생성으로 인한 세포 외 기질의 퇴화, 기질 금속 단백질 분해 효소 생성, 관상 형성, 혈관 루멘 형성, 혈관 분출, 일반적으로 인테그린 발현인 접착 분자 발현, 및 분화를 포함한다. 배양 시스템(예를 들어, 일차원 대 삼차원) 및 세포 유형에 따라, 여러 측면의 신생 혈관 생성이 생체 내뿐만 아니라 생체 외에서 성장한 세포에서 관찰될 수 있다. 혈관 형성 세포 또는 혈관 형성 세포의 특성 중 최소한 하나의 특성을 보이는 세포는 위에서 설명한 특성 중 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 그 이상의 특성을 보인다. 신생 혈관 생성의 조절 인자는 위에서 설명한 특성 중 최소한 하나를 증가 또는 감소시킨다. 신생 혈관 생성은 혈관의 자생적 형성인 맥관 생성이나 기존의 혈관이 나뉘어져 새로운 혈관이 형성되는 세포의 영양분 삽입 성장(intussusception)을 나타내는 용어와는 다른 것이다.

용어 “미세 배열”은 종이, 나일론 또는 다른 유형의 막, 필터, 칩, 유리 슬라이드, 또는 기타 다른 적절한 고체 지지체와 같은 기질 상에서 합성된 별개의 폴리뉴클레오타이드, 올리고뉴클레오타이드, 폴리펩티드(예를 들어, 항체) 또는 펩티드의 배열을 말한다.

용어 “질환” 및 “질병”은 포괄적으로 사용되며 신체의 어떠한 부분, 기관 또는 체계(이들의 임의의 조합)가 정상적 구조 또는 기능으로부터 벗어나는 것을 말한다. 특정한 질병은 생물학적, 화학적 및 물리적 변화를 포함하는 특유한 증상 및 신호에 의해 발현되고, 때때로 다양한 다른 요소들과 관련되어 있으며, 이러한 요소들은 인구 통계학적, 환경적, 고용 관련, 유전학적 및 의학적 이력과 관련된 요소들을 포함하나 이에 한정되지는 않는다. 특정한 특유 신호, 증상, 및 관련 요소들이 진단적 정보를 생성하기 위해 다양한 방법으로 정량 측정될 수 있다.

용어 “발현”은 DNA와 같은 폴리뉴클레오타이드로부터 폴리펩티드가 생산되는 과정을 포함한다. 이 과정은 유전자의 mRNA로의 전사 및 이 mRNA의 폴리펩티드로의 번역을 포함할 수 있다. 용어가 사용되는 문맥에 따라, “발현”은 RNA, 단백질 또는 둘 모두의 생산을 말할 수 있다.

용어 “유전자의 발현 수준” 또는 “유전자 발현 수준”은 pre-mRNA 발생기의 전사체(들), 전사체 처리 중간체, 성숙한 mRNA(들) 및 퇴행 산물뿐만 아니라 mRNA의 수준, 또는 세포 내 유전자에 의해 부호화된 단백질의 수준을 말한다.

용어 “조절”은 반응의 상향 조절(즉, 활성화 또는 자극), 하향 조절(즉, 금지 또는 억제), 또는 이 둘의 조합 또는 각각을 말한다. “조절 인자”는 조절을 수행하는 화합물 또는 분자이며, 예를 들어, 작용 물질, 억제 물질, 활성 인자, 자극 인자, 억제 인자, 또는 금지 인자일 수 있다.

표현 “조절 인자에 대한 영향”은 조절 인자의 발현을 변화시키거나, 그 수준을 변화시키거나, 또는 그 활성을 변화시키는 것으로 이해된다.

본 명세서에서 사용되는 용어 “트롤라민”은 트롤라민 NF, 트리에탄올아민, TEAlan^®, TEAlan 99%, 트리에탄올아민, 99%, 트리에탄올아민, NF 또는 트리에탄올아민, 99%, NF를 말한다. 이러한 용어들은 본 명세서에서 교차적으로 사용될 수 있다.

용어 “게놈”은 생물학적 객체(세포, 조직, 기관, 시스템, 기관계)의 유전학적 정보 전체를 말한다. 이는 DNA 또는 RNA(예를 들어, 특정 바이러스에서) 중 하나에서 부호화된다. 게놈은 유전자 및 DNA 부호화되지 않은 염기서열 모두를 포함한다.

용어 “단백질체”는 주어진 시점에 게놈, 세포, 조직, 또는 기관계에 의해 표현되는 단백질의 전체 집합을 말한다. 보다 특정적으로, 이는 주어진 시점에 정의된 조건 하에서 주어진 유형의 세포 또는 기관계에서 발현된 단백질의 전체 집합을 말할 수 있다. 단백질체는, 예를 들어, 유전자의 대체적 이어 맞추기 및/또는 (글리코실화 또는 인산화와 같은) 전사 후 변형으로 인한 단백질 이형체를 포함할 수 있다.

용어 “전사체”는 주어진 시점에 하나 또는 군집으로 된 세포로부터 생산된 mRNA, rRNA, tRNA, 마이크로 RNA, 다이서 기질 RNA, 및 기타 비 코딩 RNA를 포함하는 전사된 RNA 분자의 전체 집합을 말한다. 이 용어는 주어진 기관계 내의 전체 집합의 전사체에, 또는 특정한 세포 유형에 존재하는 특정한 전사체의 부분 집합에 적용될 수 있다. 주어진 세포 라인(변이는 제외)에 대략적으로 고정되어 있는 게놈과는 달리, 전사체는 외부 환경적 조건에 따라 변화할 수 있다. 이는 세포 내의 모든 mRNA 전사체를 포함하기 때문에, 전사체는 주어진 시점에 활성으로 발현되고 있는 유전자를 반영하나, 전사적 감쇄와 같은 mRNA 퇴화 현상은 제외한다.

전사체학의 연구는, 발현 프로파일링으로도 불리며, 주어진 세포 군집 내에서 mRNA의 발현 수준을 검사하며, 때로는 DNA 미세 배열 기술에 기반한 고성능 기술을 사용한다.

용어 “대사체”는 단일 기관계와 같은 생물학적 표본에서 주어진 시점에 주어진 조건 하에서 발견되는 (대사적 중간 물질, 호르몬 및 기타 신호 생성 분자, 및 2차 대사 물질과 같은) 소형 분자 대사 물질들의 완전한 집합을 말한다. 상기 대사체는 동적이며, 매 초마다 변화할 수 있다.

용어 “지질체”는 주어진 시점에 주어진 조건 하에서 단일 기관계와 같은 생물학적 표본 내에서 발견되는 지질들의 전체 집합을 말한다. 지질체는 동적이고, 매 초마다 변화할 수 있다.

용어 “상호 작용체”는 연구 중인 생물학적 시스템(예를 들어, 세포) 내의 분자의 상호 반응들의 전체 집합을 말한다. 이는 방향성을 가진 그래프로 보여 질 수 있다. 분자의 상호 반응은 다른 생화학적 그룹(단백질, 핵산, 지질, 탄수화물 등)에 속하는 분자들 사이에서, 또한 주어진 그룹 내부 에서 일어날 수 있다. 단백질체학의 관점에서 기술하면, 상호 작용체는 단백질-단백질 상호 반응 네트워크(PPI), 또는 단백질 상호 반응 네트워크(PIN)를 말한다. 광범위하게 연구된 또 하나의 유형의 상호 작용체는 단백질-DNA 상호작용체 (전사 요소(또한 DNA 또는 염색질 조절 단백질)에 의해 형성된 네트워크) 및 이들의 타겟 유전자이다.

용어 “세포의 출력”은 매개변수, 바람직하게는 세포 상태와 관련된 측정가능한 매개변수의 수집을 포함하며 다음을 포함한다(이에 한정되지는 않는다): (예를 들어, RT-PCR, qPCR, 미세 배열 등으로 측정 가능한) 하나 또는 그 이상의 유전자의 전사의 수준, (예를 들어, 질량 분광학 또는 서부 블롯에 의해 측정 가능한) 하나 또는 그 이상의 단백질에 대한 발현 수준, (예를 들어, 기질 변환률로서 측정 가능한) 하나 또는 그 이상의 효소 또는 단백질의 절대적 활성 또는 (예를 들어, 최대 활성에 대한 % 값으로 측정 가능한) 상대적 활성, 하나 또는 그 이상의 대사 물질 또는 중간 물질의 수준, (예를 들어, 산소 소모율 또는 OCR에 의해 측정 가능한) 산소 첨가 인산화의 수준, (예를 들어, 외부 세포 산화율 또는 ECAR에 의해 측정 가능한) 해당 과정의 수준, 리간드-타겟 결합 또는 상호 반응의 정도, 세포 외 분비 분자의 활성 등. 세포의 출력은 소정 개수의 타겟 유전자 또는 단백질 등에 대한 데이터를 포함할 수 있으며, 또는 모든 탐지 가능 유전자 또는 단백질에 대한 전역 평가를 포함할 수 있다. 예를 들어, 어떠한 특정한 단백질이 표본 또는 세포 군집 내에서 발현될지에 대한 사전 지식 없이 주어진 표본 또는 세포 군집 내에서 발현된 모든 탐지 가능 단백질을 식별하고, 또한/또는 정량화하기 위해 질량 분광학이 사용될 수 있다.

본 명세서에서 사용되는, “세포 시스템”은 균일하거나 불균일한 세포의 군집을 포함한다. 세포 시스템 내의 상기 세포는 자연적 또는 생리학적 환경 하에서 생체 내에서 성장하거나, 예를 들어, 제어된 조직 배양 환경과 같은 생체 외에서 성장하고 있을 수 있다. 시스템 내의 상기 세포는 상대적으로 균일하거나(예를 들어, 70%, 80%, 90%, 95%, 99%, 99.5%, 99.9% 이상으로 균일), 또는 보통 밀접한 근접성의 생체 내에서 성장하는 것으로 발견되는 세포 유형, 또는 예를 들어, 근거리 분비 또는 다른 먼 거리의 세포 간 통신을 통해 또 다른 생체 내 세포 유형과 반응할 수 있는 세포 유형과 갈은 둘 또는 그 이상의 세포 유형을 포함할 수 있다. 세포 시스템 내의 상기 세포는 암 세포 라인, 불멸의 세포 라인, 또는 정상 세포 라인을 포함하는 확립된 세포 라인으로부터 도출되거나 주된 세포 또는 살아 있는 조직 또는 기관으로부터 분리된 세포일 수 있다.

세포 시스템 내의 세포는 일반적으로 영양분, 기체(산소 또는 CO₂ 등), 화학제품, 또는 세포의 거동에 영향을 미치는 조건을 제공할 수 있는 단백질계 / 비단백질계 자극 물질을 제공할 수 있는 “세포 환경”과 접촉한다. 상기 세포 환경은 정의된 화학적 성분 및/또는 다소 잘 정의되지 않은 조직 추출물 또는 혈청 성분을 가지는 화학적 매체일 수 있으며, 세포가 성장하는 특정한 pH, CO₂ 내용물, 압력, 및 온도를 포함할 수 있다. 대체적 방법으로, 상기 세포 환경은 자연적이거나 또는 특정한 세포 시스템에 대해 생체 내에서 발견되는 생리학적 환경일 수 있다.

특정 실시예에서, 세포 환경은 생물학적 시스템 또는 과정의 한 측면, 예를 들어, 질병 상태, 과정, 또는 환경을 시뮬레이션하는 조건을 포함한다. 이러한 배양 조건들은, 예를 들어, 고혈당증, 저산소 상태, 또는 젖산 풍부 조건을 포함한다. 몇 개의 이러한 조건들이 본 명세서에서 기술된다.

특정 실시예에서, 특정한 세포 시스템에 대한 세포 환경은 또한 수용기의 유형 또는 세포 표면 상의 리간드 및 이들 각각의 활성, 탄수화물 또는 지질 분자의 특성, 막의 극성이나 흐름성, 특정 막 단백질의 뭉친 상태 등과 같은 세포 시스템의 특정한 세포 표면 특성을 포함한다. 이러한 세포 표면 특성들은 다른 세포 시스템에 속하는 세포와 같은 근접한 세포들의 기능에 영향을 줄 수 있다. 그러나, 다른 특정한 실시예에서, 상기 세포 시스템의 세포 환경은 세포 시스템의 세포 표면 특성을 포함하지 않는다.

상기 세포 환경은 “수정된 세포 환경”이 되도록 변경될 수 있다. 변경은 하나 또는 그 이상의 “외부 자극 성분”을 세포 환경에 추가하는 것을 포함하는 세포 환경에서 발견되는 하나 또는 그 이상의 성분에 있어서의 변화(예를 들어, 증가 또는 감소)를 포함할 수 있다. 상기 환경적 교란 또는 외부 자극 성분은 세포 환경에 내생적이거나(예를 들어, 상기 세포 환경이 일정 수준의 자극제를 포함하고, 그 이상의 자극제가 그 수준을 증가시키기 위해 첨가됨), 세포 환경에 외생적(예를 들어, 상기 자극제가 변경 이전의 세포 환경에 대체적 방법으로 존재하지 않음)일 수 있다. 상기 세포 환경은 외부 자극 성분을 추가함으로써 야기되는 2차적 변화에 의해 더 변경될 수 있으며, 이는 상기 외부 자극 성분이 세포 시스템에 의해 세포 환경으로 분비된 분자를 포함하여 세포 시스템의 세포의 출력을 변화시킬 수 있기 때문이다.

본 명세서에서 사용되는 “외부 자극 성분”은 본 명세서에서 “환경적 교란”으로도 불리며, 세포의 기능에 영향을 줄 수 있는 어떠한 외부의 물리적 및/또는 화학적 자극을 포함한다. 이는 어떠한 대형 또는 소형의 기관 관련 또는 기관 내의 분자, 자연적이거나 합성된 화학 물질, 온도의 전이, pH 변화, 복사, 빛(UVA, UVB 등), 마이크로 웨이브, 초음파, 전기 전류, 변경되거나 변경되지 않은 자기장 등을 포함할 수 있다.

용어 “MIM ( Multidimensional Intra Cellular Molecule: 다차원 세포 내 분자)”은 신체에 의해 자연적으로 생산되고 또한/또는 인간의 최소한 하나의 세포에 존재하는 내생 분자의 분리된 버전 또는 합성적으로 생산된 버전이다. MIM은 세포 내로 진입할 수 있으며, 상기 세포 내로의 진입은 분자의 생물학적으로 활성화된 부분이 세포 내로 완전히 들어가는 한, 완전하거나 부분적인 세포 내로의 진입을 포함한다. MIM는 세포 내에서 신호 형질 도입 및/또는 유전자 발현 메커니즘을 유도할 수 있다. MIM은 분자들이, 예를 들어, 약 전달과 같은 치료적 효과 및 담체 효과를 모두 가지므로 다차원적이다. MIM는 또한 분자들이 질병 상태에서는 특정 방식으로 정상적 상태에서는 이와 다른 방식으로 행동하므로 다차원적이다. 예를 들어, CoQ-10의 경우, VEGF의 존재 하에서 흑색종 세포에 대한 CoQ-10의 투여는 결과적으로 감소된 수준의 Bcl2를 야기하며, 이는 다시 흑색종 세포에 대한 감소된 종양 형성 가능성을 야기한다. 반면에, 정상적인 섬유아세포에서는, CoQ-10 및 VEFG의 보조 투여가 Bcl2의 수준에 영향을 미치지 않는다.

일 실시예에서, MIM은 또한 에피시프터이며, 또 다른 실시예에서, MIM은 에피시프터가 아니다. 또 다른 실시예에서, MIM은 하나 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 또 다른 실시예에서, MIM은 둘 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 추가적인 실시예에서, MIM은 셋 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 추가적인 또 다른 실시예에서, MIM은 상기 기술한 기능 모두로 특징지워진다. 해당 분야의 통상의 기술자는 본 발명의 MIM이 둘 또는 그 이상의 내생 분자의 혼합물을 포함하는 것으로 의도되었다는 것을 인식할 수 있을 것이며, 이때 상기 혼합물은 하나 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 혼합물 내의 상기 내생 분자는 혼합물이 MIM으로서 기능할 수 있는 비율로 존재한다.

MIM은 지질 기반 또는 비지질 기반 분자일 수 있다. MIM의 예는 CoQ10, 아세틸 Co-A, 팔미틸 Co-A, L-카르니틴, 예를 들어, 타이로신, 페닐알라닌 및 시스테인과 같은 아미노산을 포함하나 이에 한정되지는 않는다. 일 실시예에서, 상기 MIM은 소형 분자이다. 본 발명의 일 실시예에서, 상기 MIM은 CoQ10가 아니다. MIM은 본 명세서에서 상세히 기술된 분석 방법을 사용하여 해당 분야의 통상의 기술자에 의해 통상적으로 식별될 수 있다. MIM은 미국 특허 12/777,902 (US 2011-0110914)에서 보다 상세히 기술되며, 그 전체 내용은 본 명세서에 참조로써 명시적으로 통합된다.

본 명세서에서 사용되는, “에피메타볼릭 시프터(에피대사적 시프터)” (에피시프터: epi-shifter)는 건강한(또는 정상의) 상태로부터 질병 상태로의 대사 전이 및 그 반대의 전이를 조절함으로써 이에 의해 인간에서의 세포, 조직, 기관, 시스템 및/또는 숙주의 건강을 유지하거나 재확립하는 분자이다. 에피시프터는 조직의 마이크로환경 내에서 정규화를 촉발시킬 수 있다. 예를 들어, 에피시프터는 세포에 첨가되거나 이로부터 고갈되었을 때 세포의 마이크로환경(예를 들어, 대사 상태)에 영향을 줄 수 있는 모든 분자를 포함한다. 해당 분야의 통상의 기술자는 본 발명의 에피시프터가 둘 또는 그 이상의 분자의 혼합물도 또한 포함하도록 의도된 것임을 인식할 수 있을 것이며, 이때 상기 혼합물은 상기 기술한 기능들 중 하나 또는 그 이상으로 특징지워진다. 상기 혼합물 내의 분자들은 혼합물이 에피시프터로 기능하도록 하는 비율로 존재한다. 에피시프터의 예는 CoQ-10; 비타민 D3; 피브로넥틴과 같은 ECM 성분; TNFa 또는 어떠한 인터루킨, 예를 들어, IL-5, IL-12, IL-23와 같은 면역조절 인자; 혈관 형성 요소; 및 세포 사멸 요소를 포함하나 이에 한정되지는 않는다.

일 실시예에서, 상기 에피시프터는 또한 MIM이다. 일 실시예에서, 상기 에피시프터는 CoQ10가 아니다. 에피시프터는 본 명세서에 상세하게 기술된 분석을 사용하여 해당 분야에서의 기술들 중 하나로써 통상적으로 식별될 수 있다. 에피시프터는 미국 특허 12/777,902(US 2011-0110914)에 보다 상세하게 설명되며, 그 전체 내용은 참조로써 본 명세서에 명시적으로 통합된다.

각 용어가 나타나는 시점의 적용에 있어서 정의되지 않은 용어들은 해당 분야의 통상의 전문가들이 보통 이해하는 의미를 가진다.

III . 본 플랫폼 기술의 예시적 단계 및 구성 요소

단지 예시의 목적으로, 본 발명의 플랫폼 기술의 다음 단계들이 암 모델로부터 획득된 데이터를 통합하기 위해, 또한 암의 발병을 추진하는 신규의 단백질 / 경로를 식별하기 위해 사용되는 예시적 활용으로서 이하의 본 명세서에서 기술될 수 있다. 이러한 분석의 결과로 얻어지는 관계적 맵은 암과 관련된 진단적 / 예후적 표지 인자뿐만 아니라 암 치료 타겟을 제공한다. 그러나, 본 플랫폼 기술은 어떠한 생물학적 시스템 또는 과정에도 일반적으로 적용될 수 있으며, 및 특정한 암 또는 기타 특정 질병 모델에 한정되지 않는다.

추가적으로, 하기의 설명이 일 부분에서는 비연속적인 단계로 기술되기는 하지만, 이는 예시적 목적 및 단순성을 위한 것이며, 따라서 실제로는 순서 및/또는 단계간의 구분을 그렇게 엄격히 규정하는 것은 아니다. 또한, 본 발명의 단계들은 분리되어 수행될 수 있으며, 본 명세서에서 제공되는 발명은 본 발명의 플랫폼 기술의 개별적 단계들을 하나 또는 그 이상(예를 들어, 어느 하나, 둘, 셋, 넷, 다섯, 여섯 또는 일곱 개의 모든 단계)의 단계들의 조합뿐만 아니라 이들을 각각 분리하여 포함하기 위한 것이며, 상기 단계들은 남아 있는 단계들에 관계없이 독립적으로 수행될 수 있다.

본 발명은 또한 본 발명의 플랫폼 기술이 모든 측면을 별개의 성분들과 및 본 발명의 실시예로서 포함하도록 의도된 것이다. 예를 들어, 상기 생성된 데이터 집합들은 본 발명의 실시예로서 의도된 것이다. 추가적인 예로서, 상기 생성된 인과 관계 네트워크, 생성된 합치 인과 관계 네트워크, 및/또는 생성된 모의 인과 관계 네트워크 또한 본 발명의 실시예로서 의도된 것이다. 생물학적 시스템에서 특유한 것으로 식별된 상기 인과 관계는 본 발명의 실시예로서 의도된 것이다. 또한, 특정한 생물학적 시스템에 대한 상기 필요에 따라 구축된 모델 또한 본 발명의 실시예로서 의도된 것이다. 예를 들어, 질병 상태 또는 과정에 대한 필요에 따라 구축된 모델, 예를 들어, 신생 혈관 생성에 대한 모델, 암, 비만/당뇨/심장병에 대한 세포 모델, 또는 약제의 독성 (예를 들어, 심장 독성)에 대한 필요에 따라 구축된 모델과 같은 필요에 따라 구축된 모델 또한 본 발명의 실시예로서 의도된 것이다.

A. 필요에 따른 모델(custom model) 구축

본 플랫폼 기술의 제 1 단계는 생물학적 시스템 또는 과정에 대한 모델을 수립하는 것이다.

1. 신생 혈관 생성 모델

신생 혈관 생성의 생체 외 및 생체 내 모델 모두가 알려져 있다. 예를 들어, 인간 배꼽의 제대혈관 내피 세포(HUVEC)를 사용하는 생체 외 모델이 예에서 상세히 기술된다. 간단하게 설명하면, HUVEC가 하위-융합성 배양에서 성장하면, 이는 혈관 형성 세포의 특성을 보인다. HUVEC가 융합성 배양에서 성장하면, 이는 혈관 형성 세포의 특성을 보이지 않는다. 내피의 세포 증식, 이주 및 분화를 포함하는 혈관 형성 캐스케이드에서의 대부분의 단계는 생체 외에서 분석될 수 있다. 증식 연구는 세포 계수, 티미딘 통합, 또는 세포 증식을 위한(PCNA 의 측정에 의한) 면역 조직화학 검사 염색 또는 (단말 디옥시뉴클레이타이딜 전달 효소-중재 dUTP 닉 말단 라벨링 또는 투넬(Tunel) 분석에 의한) 세포 사멸에 기반한 것이다. 주화성은 막 필터로 구분되는 상부 및 하부 웰로 구성되는 보이든(Boyden) 챔버 내에서 검사될 수 있다. 화학 주화성 용액은 하부 웰에 위치하고, 세포는 상부 웰에 추가되며, 배양 기간 후에 화학 주화성 자극 쪽으로 이주해 온 세포가 막의 하부 표면에서 계수된다. 세포 이주는 하기 예에서 제공되는 “스크래치(scratch)” 분석을 사용하여서도 연구될 수 있다. 분화는 이차원 및 삼차원 응결, 콜라겐 겔 및 마트리겔을 포함하는 서로 다른 ECM 성분의 내피의 세포를 배양함으로써 생체 외 유도가 가능하다. 미세 혈관 또한 3차원 피브린 겔 내에 삽입된 생쥐 대동맥의 링으로부터 성장한 것으로 밝혀 졌다. 매트릭스 금속 단백질 분해효소 발현은 지모겐 분석에 의해 분석될 수 있다.

망막의 맥관 구조는 생쥐가 탄생할 때 완전히 형성되지 않는다. 혈관 성장 및 신생 혈관 생성의 이 모델에서 상세히 연구되어 왔다. 단계적 상태의 망막이 정상적 생물학적 과정으로서의 신생 혈관 생성을 분석하기 위해 사용될 수 있다.

병아리 융모 요막(CAM) 측정은 해당 분야에서 잘 알려져 있다. 초기의 병아리 배아는 성숙한 면역 시스템이 결여되어 있으며, 따라서 종양 유도 신생 혈관 생성 연구를 위해 사용된다. 조직 그라프트는 달걀 껍질에 만들어진 창을 통해 CAM 상에 위치한다. 이는 구현 후 4일 내에 혈관의 그라프트 쪽으로의 전형적인 반지름 방향의 재배치와 그라프트 근처 혈관의 분명한 증가를 야기하였다. 그라프트로 들어가는 혈관들은 스테레오 현미경 하에서 계수된다. 시험 물질의 항-혈관 형성 또는 혈관 형성 활성을 분석하기 위해, 상기 화합물은 느리게 생성되는 중합체 펠릿에서 생성되어 젤라틴 스폰지로 흡수되거나, 또는 플라스틱 디스크 상에서 공기로 건조된 후 CAM 상에 심어 진다. 페트리 접시 내의 껍질 없는 배아의 배양을 포함하는 CAM 분석의 다양한 이형, 및 서로 다른 정량화 방법들(즉 방사능으로 라벨링된 프롤린을 사용한 기반 막의 생체합성 비율 측정, 현미경 또는 영상 분석 하의 혈관의 개수 세기)이 기술되었다.

각막은 생체 내 혈관 현장을 제공한다. 따라서, 연곽으로부터 각막 지질로 통과하는 혈관은 새로이 형성된 것으로 식별될 수 있다. 혈관 형성 반응을 유도하기 위해, 혈관 형성 물질(즉 VEGF의 FGF-2)을 포함하는 느린 분비의 중합체 펠릿[즉 폴리-2-하이드록시에틸-메타크릴레이트(하이드론) 또는 에틸에네비닐 아세테이트 공중합체(ELVAX)]이 쥐의 각막 지질 내에 생성된 "주머니"에 이식되었다. 또한, 광범위한 조직, 세포, 세포 추출물 및 조건을 겪은 매체가 각막 내에서 이들의 신생 혈관 생성의 효과에 대해 조사되었다. 혈관 반응 각막에 인디아 잉크를 관류시킨 이후 컴퓨터 영상 분석에 의해 정량 측정될 수 있다. 각막은 수확되어 본 명세서에서 제공된 플랫폼 방법을 이용하여 분석될 수 있다.

마트리겔(MATRIGEL®)은 엥겔브레스-홀름-스왐(Engelbreth-Holm-Swarm) 쥐과 동물 육종으로 알려진 생쥐의 기반 막 종양 기질이다. 이는 라미닌, 콜라겐 유형 IV, 헤파란 황화물, 피브린 및 성장 요소를 포함하는 기반 막 단백질의 복잡한 혼합물이며, EGF, TGF-b, PDGF 및 IGF-1을 포함한다. 이는 원래 내피의 생체 외 세포 분화를 연구하기 위해 개발되었다. 그러나, 마트리겔(MATRIGEL®)-함유 FGF-2는 생쥐의 피하에 주입될 수 있다. 마트리겔(MATRIGEL®)은 4°C에서 액화되지만 37°C에서 고체 겔을 형성하여 성장 요소를 포획함으로써 분비가 서서히 일어나게 한다. 일반적으로 10일 후에, 이 마트리겔(MATRIGEL®) 플러그가 제거되며 신생 혈관 생성이 플러그 부분에서 조직학적으로 또는 형태측정세포학적으로 정량화된다. 마트리겔(MATRIGEL®) 플러그는 본 명세서에서 제공된 플랫폼 방법을 사용하여 수확되고 분석될 수 있다.

2. 생체 외 질병 모델

생물학적 시스템 또는 과정의 일례로 암을 들 수 있다. 다른 복잡한 생물학적 과정 또는 시스템과 마찬가지로, 암은 다중의 특유 측면으로 특징지울 수 있는 복잡한 병리학적 조건을 가지고 있다. 예를 들어, 높은 성장 속도로 인해, 많은 암 세포들이 저산소 조건에서도 성장할 수 있도록 적응되며, 상향 조절된 해당 과정 및 감축된 산화적 인산화 대사 경로를 가진다. 결과적으로, 암 세포는 잠재적 약제의 의한 치료와 같은 환경적 교란에 대해, 정상 세포가 동일한 치료에 대한 반응과 비교하여 다르게 반응할 수 있다. 따라서, 정상 세포의 반응과 비교하여 약 치료에 대한 암의 독특한 반응을 판독하는 것이 관심의 대상이 될 것이다. 이러한 목적을 위해, 암 세포의 환경, 예를 들어, 생체 내 종양 내의 암 세포의 조건을 매우 근사하게 나타내는 세포 배양 조건을 생성함으로써 환경조건을 시뮬레이션하거나, 암 세포의 다른 성장 조건을 분리함으로써 암 성장의 여러 측면을 모방하는 주문형 암 모델이 수립될 수 있다.

이러한 암 “환경”, 또는 성장 스트레스 조건 중 하나는 고형 종양 내에서 일반적으로 발견되는 저산소 상태이다. 저산소 상태는 해당 분야에 알려진 방법을 세포 내에서 사용하여 세포 내에서 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업 기체 혼합물로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 소정의 기간 후, 예를 들어, 저산소 상태 처리 후 24시간 후에, 추가적인 외부 자극 성분들(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부 존재 하에서 효과를 측정할 수 있다.

마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 방식의 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 소정의 시간, 예를 들어, 24 시간에서 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비 존재 하에서 약 12.5 mM의 최종 젖산 농도로 조사될 수 있다.

고혈당증은 보통 당뇨에서 발견되는 조건이다; 그러나, 많은 암 세포들이 자신들의 주된 에너지 원으로서 글루코스에 의존하기 때문에 고혈당증은 어느 정도 암 성장의 일 측면을 모방한다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 등급의 글루코스를 적절한 매체에 첨가하는 것을 포함할 수 있다.

암 성장의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 암 모델에서 별도로 조사되고 또한/또는 함께 조합될 수 있다. 일 실시예에서, 암 성장 / 조건의 서로 다른 측면들을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 일 실시예에서, 개별적 조건 및, 추가적으로, 암 성장 / 조건의 서로 다른 측면들을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 1과 20 사이, 1과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10과 50 사이의 서로 다른 조건들일 수 있다.

세포를 처리하기 위해 사용될 수 있는 조건들의 몇 개의 예시적 조합들이 여기에 열거된다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합들이 형성될 수 있다.

1. 매체만 존재

2. 50 μM CTL 코엔자임 Q10 (CoQ10)

3. 100 μM CTL 코엔자임 Q10

4. 12.5 mM 젖산

5. 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10

6. 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10

7. 저산소 상태

8. 저산소 상태 + 50 μM CTL 코엔자임 Q10

9. 저산소 상태 + 100 μM CTL 코엔자임 Q10

10. 저산소 상태 + 12.5 mM 젖산

11. 저산소 상태 + 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10

12. 저산소 상태 + 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10

13. 매체 + 22 mM 글루코스

14. 50 μM CTL 코엔자임 Q10 + 22 mM 글루코스

15. 100 μM CTL 코엔자임 Q10 + 22 mM 글루코스

16. 12.5 mM 젖산 + 22 mM 글루코스

17. 12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10

18. 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10

19. 저산소 상태 + 22 mM 글루코스

20. 저산소 상태 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10

21. 저산소 상태 + 22 mM 글루코스 + 100 μM CTL 코엔자임 Q10

22. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스

23. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10

24. 저산소 상태 + 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10

하나 또는 그 이상의 정상 세포 라인(예를 들어, THLE2 및 HDFa)이 제어로서 단백질 또는 경로(이하 참조)에 고유한 암을 식별하기 위해 비슷한 조건에서 배양된다. 상기 제어는 상기 기술된 비교 세포 모델일 수 있다.

단일 암 세포 유형과는 반대로, 같거나 다른 근원의 다중 암 세포들(예를 들어, 암 라인 PaCa2, HepG2, PC3 및 MCF7)이 암 모델에 포함될 수 있다. 특정한 상황에서 서로 다른 암 세포들(예를 들어, HepG2 및 PaCa2) 사이의 상호 대화 또는 ECS 실험이 다양한 상호 관련된 목적을 위해 수행될 수 있다.

상호 대화를 포함하는 일부 실시예에서, 상기 세포 모델에 수행된 실험은 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태(국소 빈혈)) 하에서 세포 상태 또는 하나의 세포 시스템 또는 군집(예를 들어, 간 암종 세포 HepG2)의 기능에 대한 또 다른 세포 시스템 또는 군집(예를 들어, 췌장 관련 암 PaCa2)에 의한 조절을 결정하도록 설계된다. 전형적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자(예를 들어, 소형 약제 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고글루코스 환경)와 같은 외부 자극 성분에 접촉된다. 반응에서, 제 1 세포 시스템 / 군집 변화는 그 전사체, 단백질체, 대사체, 및/또는 상호 작용체로서, 세포의 내부 및 외부에서 쉽게 탐지될 수 있는 변화에 이르게 한다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNA에서의 전사 수준에 의해 측정될 수 있다; 단백질체에서의 변화는 다수의 타겟 단백질의 발현 수준에 의해 측정될 수 있다; 또한 대사체 내 변화는 특히 주어진 대사 물질에 대해 설계된 분석을 통한 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서의 상기 기준 변화는, 최소한 특정 분비 대사 물질 또는 단백질에 대해서는, 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호작용체의 조절을 포함하는 제 2 세포 시스템 / 군집에 대한 이들의 영향에 의해 측정될 수 있다. 따라서, 상기 실험들은 서로 다른 치료 조건 하에서 제 2 세포 시스템 / 군집에 제 1 세포 시스템 / 군집에 의해 분비된 관심있는 분자(들)의 영향을 식별하기 위해 사용될 수 있다. 상기 실험들은 또한 예를 들어, 단백질체학의 분별 선별에 의해 제 1 세포 시스템 (외부 자극 성분 치료에 대한 반응으로)에서 또 다른 세포 시스템으로의 신호 전달의 결과로 조절되는 어떠한 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 제 2 세포 시스템들 사이의 상호 효과 또한 분석될 수 있도록 역 설정에 대해서도 적응될 수 있다. 일반적으로, 이러한 유형의 실험에 대해, 세포 라인 쌍의 선택은 근원, 질병 상태 및 세포 기능 등과 같은 요소에 크게 기반한다.

2-세포 시스템이 일반적으로 이러한 유형의 실험적 설정에 관련되기는 하지만, 예를 들어, 각각의 별개의 세포 시스템을 별도의 고형 지지체에 고정시킴으로써 유사한 실험들이 둘 이상의 세포 시스템에 대해서도 설계될 수 있다.

일단 필요에 따른 모델이 구축되면, 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제로 치료되거나 치료되지 않은 것과 같은 하나 또는 그 이상의 “교란”이 시스템에 적용될 수 있다. 이에 대해서는 도 15D을 참조한다. 질병 관련 암 세포 및 질병 관련 정상 제어 세포에 대한 영향을 포함하여 이러한 교란이 시스템에 미치는 영향은 이하 제 III.B절에 기술된 해당 분야에서 알려진 다양한 방법 또는 특정 시행자의 수단을 사용하여 측정될 수 있다.

예시적 실험에서, 암 라인 PaCa2, HepG2, PC3 과 MCF7, 및 정상 세포 라인 THLE2과 HDFa는 각 고혈당증, 저산소 상태, 및 젖산 풍부 조건과 함께 이들 조건들 모두 또는 둘 또는 셋으로 조합된 조건을 겪게 되며, 이와 함께 환경적 교란, 특히 코엔자임 Q10에 의한 치료가 추가되거나 추가되지 않을 수 있다.

상기 필요에 따라 구축된 세포 모델은 본 명세서에서 기술된 단계들을 수행함으로써, 본 발명의 플랫폼 기술의 단계들에 걸쳐서 생물학적 시스템에 고유한 인과 관계를 궁극적으로 식별하기 위해 확립되어 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자는 생물학적 과정에 대해 초기의, “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 필요에 따라 구축된 세포 모델이, 예를 들어, 추가적인 암 또는 정상 세포 라인 및/또는 추가적인 암 조건을 도입함으로써 시간이 지남에 따라 지속적으로 진화 또는 확장될 수 있음을 이해할 것이다. 진화된 세포 모델로부터의 추가적인 데이터, 즉, 세포 모델의 새롭게 추가된 부분(들)로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 세포 모델로부터 수집된 상기 새로운 데이터, 즉, 새롭게 추가된 부분(들)로부터의 세포 모델이 이후 이전에 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해, "제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 데이터 집합에 도입될 수 있다. 생물학적 시스템에 고유한 새로운 인과 관계는 이제 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 상기 세포 모델의 진화는 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 새롭고 또한/또는 보다 신뢰성있는 생물학적 시스템의 조절 인자에 대한 통찰을 제공한다.

필요에 따라 구축된 세포 모델의 추가적 예들이 본 명세서에서 상세히 설명된다.

B. 데이터 수집

일반적으로, 두 가지 유형의 데이터가 특정 필요에 따라 구축된 모델 시스템으로부터 수집될 수 있다. 이러한 데이터의 한 유형(예를 들어, 제 1 데이터 집합, 제 3 데이터 집합)은 보통 DNA, RNA, 단백질, 지질 등과 같은 특정 마크로 분자의 수준에 관련된다. 이러한 범주의 예시적 데이터 집합은 단백질체의 데이터(예를 들어, 표본으로부터의 모든 또는 실질적으로 모든 측정 가능한 단백질의 발현에 관련된 정성적 및 정량적 데이터)이다. 다른 유형의 데이터는 일반적으로 제 1 유형의 데이터에서의 변화의 결과로 나타나는 표현형 변화를 반영하는 기능적 데이터(예를 들어, 제 2 데이터 집합, 제 4 데이터 집합)이다.

일부 실시예에서, 제 1 유형의 데이터에 대해 정량적 중합효소 연쇄 반응(qPCR) 및 단백질체학이 정량적 중합효소 연쇄 반응(qPCR) 및 단백질체학에 의한 세포 mRNA 및 단백질 발현에서의 변화를 프로파일링하기 위해 수행된다. 전체 RNA는 상용의 RNA 분리 키트를 사용하여 분리될 수 있다. cDNA 합성에 뒤이어, 상용으로 사용 가능한 신생 혈관 생성, 세포 자살, 및 당뇨와 같은 질병 영역 또는 세포 과정에 대한 특정한 qPCR 배열(예를 들어, SA 바이오사이언스로부터의 제품), 이 제조사의 사용 지침에 따라 유전자의 사전 정의된 집합을 프로파일링하기 위해 채택될 수 있다. 예를 들어, Biorad cfx-384 증폭 시스템이 모든 전사 관련 프로파일링 실험에 사용될 수 있다. 데이터 수집(Ct)에 뒤이어, 최종 배수 변화에 걸친 제어가 제조사의 프로토콜에서 설명된 δCt 방법을 사용하여 결정될 수 있다. 단백질체의 표본 분석은 이후의 절에서 설명된 대로 수행될 수 있다.

대상 방법은 유사한 성격의 수 백 개의 표본을 가지는 대규모의 고 출력 성능의 정량적 단백질체의 분석을 채용할 수 있으며, 및 세포의 출력 분별을 식별하기 위해 필요한 데이터를 제공한다.

이러한 목적으로 사용하기에 적절한 몇 개의 기술들이 해당 분야에 알려져 있다. 예시적 기술로서, 질량 분광학과 조합된 iTRAQ 분석이 아래에서 간단히 소개된다.

정량적 단백질체학 접근 방식은 펩티드 식별 및 정량화를 위해 8-plex iTRAQ 반응 제제 및 2D-LC MALDI MS/MS를 사용한 안정된 동위원소 라벨링에 기반한다. 이러한 기술을 사용한 정량화는 상대적이다: 펩티드 및 단백질은 기준 표본에 대한 상대적 존재 비율로서 지정된다. 다중 iTRAQ 실험에서의 통상의 기준 표본들이 다중의 iTRAQ 실험에 걸쳐 표본의 비교를 용이하게 해 준다.

예를 들어, 이 분석 방법 체계를 구현하기 위해, 여섯 개의 주요 표본 및 두 개의 제어 풀 표본이 제조사의 제안에 따라 하나의 8-plex iTRAQ 혼합물로 결합될 수 있다. 이러한 여덟 개 표본의 혼합물은 다시 일차원에서의 강한 양이온 교환 (SCX), 및 이차원에서의 역위상 HPLC로 구성되는 이차원 액체 크로마토그래피로 분리될 수 있으며, 질량 분광학적 분석으로 분석될 수 있다.

채택 가능한 예시적 실험실 과정에 대한 간단한 검토가 본 명세서에서 제공된다.

단백질 추출: 세포는 프로테아제를 금지 인자로 하여 8 M 요소 용균 버퍼에 용해되어(서모 사이언티픽 홀트(Thermo Scientific Halt) 프로테아제 금지 인자, EDTA 없음) 얼음 위에서 매 10 분 마다 5초간의 버텍스로서 30 분 간 배양할 수 있다. 5 초 단위로 초음파 처리하여 용균을 완수할 수 있다. 세포 용해물은 세포 조각을 제거하기 위해 14000 x g에서 15분 간(4 °C) 원심 분리될 수 있다. 단백질 농도를 결정하기 위해 브래폴드(Bradford) 분석이 수행될 수 있다. 각 표본으로부터의 100ug 단백질이 환원(10mM Di티오트레이톨 (DTT), 55 °C, 1 시간), 알킬화(25 mM 이오도 아세타마이드, 실온, 30 분)되고 트립신으로 소화될 수 있다(1:25 w/w, 200 mM 트리에틸암모늄 탄산수소염 (TEAB), 37 °C, 16시간).

세크리톰 표본 준비: 1) 일 실시예에서, 상기 세포는 혈청이 없는 매체에서 배양될 수 있다: 조건을 겪은 매체는 냉동 건조기에 의해 농축되고, 환원되며(10mM 디티오트레이톨 (DTT), 55 °C, 1 시간), 알킬레이트화되고(25 mM 이오도 아세타마이드, 실온, 30분 간 배양), 이후 아세톤 침전에 의해 제염된다. 농축되어 조건을 겪은 매체로부터의 동일한 양의 단백질이 트립신 (1:25 w/w, 200 mM 트리에틸암모늄 탄산수소염(TEAB), 37 °C, 16시간)으로 소화될 수 있다.

일 실시예에서, 상기 세포는 혈청을 포함하는 매체에서 배양될 수 있다: 매체의 부피는 3k MWCO Vivaspin 기둥(GE 헨스케어 라이프(Healthcare Life) 사이언스)을 사용하여 감소시킬 수 있고, 이후 1xPBS(인비트로젠)로서 재구성될 수 있다. 혈청 알부민은 조건 매체를 최적화하여 적용시키기 위해 버퍼-교환과 더불어 제조사의 지침에 따라 알부보이드(AlbuVoid) 기둥(Biotech Support Group, LLC)을 사용하여 모든 표본으로부터 고갈시킬 수 있다.

iTRAQ 8 Plex 라벨링 : 실험적 설정에서 각각의 트립신 소화로부터의 부분 표본은 함께 모아 제어 표본의 풀을 형성할 수 있다. 각 표본 및 제어 표본들의 풀로부터의 동등한 부분 표본들은 iTRAQ 8 Plex 반응 제제에 의해 제조사의 프로토콜(AB Sciex)에 따라 라벨링될 수 있다. 상기 반응은 결합되어, 진공으로 건조되고, 0.1% 포름산을 첨가하여 다시 현탁한 후, LC-MS/MS에 의해 분석될 수 있다.

2D- NanoLC - MS / MS : 라벨링된 모든 펩티드 혼합물들은 온라인 2D-나노 LC에 의해 분리되고 전극 분사 탠덤 질량 분광학으로 분석될 수 있다. 상기 실험은 나노 전기 분광 이온 소스를 장착한 LTQ 오비트랩 벨로스(오비트랩 벨로스(Velos)) 질량 분광계(Thermo Electron, Bremen, 독일)에 연결된 엑시겐트(Eksigent) 2D NanoLC 울트라 시스템 상에서 수행될 수 있다.

상기 펩티드 혼합물은 4 μL / min의 흐름으로 5 cm SCX 기둥(PolyLC, 콜롬비아, MD 제 300μm ID, 5μm, 폴리설포에틸 아스타르트마이드 기둥)으로 주입되어 10 이온 교환 용출 세그먼트에서 C18 트랩 기둥(메서추세츠, 워본 뉴오브젝티브(New Objective) 사의 2.5 cm, 100μm ID, 5μm, 300 A ProteoPep II)으로 녹여서 분리되고 H2O/0.1%FA로 5분 간 세척될 수 있다. 이러한 분리는 이후 15 cm 용융 실리카 기둥(메서추세츠, 워본 뉴오브젝티브 사의75μm ID, 5μm, 300 A ProteoPep II)에 대해 300 nL/min에서 2-45% B (H2O /0.1%FA (용매 A) 및 ACN /0.1%FA (용매 B))의 기울기를 사용하여 120분 간 더 수행될 수 있다.

완전 주사 MS 스펙트럼(m/z 300-2000)이 오비트랩 내에서 30,000의 해상도로 획득될 수 있다. 가장 강렬한 이온(10에 이름)이 고 에너지 C-트랩 분리(HCD)를 사용하여 연속적으로 분리될 수 있으며 30 초 간 동적으로 배제될 수 있다. HCD는 1.2 Da의 분리 폭으로 수행될 수 있다. 결과적으로 나타나는 파편 이온은 오비트랩 내에서 7500의 해상도로 주사될 수 있다. LTQ 오비트랩 벨로스(Velos)는 파운데이션 1.0.1의 엑스칼리버(Xcalibur) 2.1에 의해 제어될 수 있다.

펩티드/단백질 식별 및 정량화: 펩티드 및 단백질은 스위스프로트(SwissProt) 데이터베이스에 대해 마스코트 탐색 엔진을 탑재한 단백질체 발견용 소프트웨어(Thermo Electron)를 사용하는 자동화된 데이터베이스 탐색에 의해 식별될 수 있다. 탐색 매개변수는 MS 허용치에 대해 10 ppm, MS2 허용치에 대해 0.02 Da, 및 2개까지의 분할 손실을 허용하는 완전한 트립신 소화를 포함할 수 있다. 카르바미도메틸화(C)가 고정된 조절로서 설정될 수 있다. 산화(M), TMT6, 및 탈아미드화(NQ)가 동적 조절로서 설정될 수 있다. 펩티드 및 단백질 식별은 마스코트 상당 임계(p<0.05)로써 필터링될 수 있다. 상기 필터는 99%의 단백질 식별 신뢰 수준(1% FDA)으로 허용될 수 있다.

단백질체 발견 소프트웨어는 보고자 이온에 대한 보정 요소를 적용할 수 있으며, 모든 정량 측정 채널이 존재하지 않는 경우에는 모든 정량 측정값을 거부할 수 있다. 상대적 단백질 정량 측정은 중간 강도의 정규화를 통해 성취할 수 있다.

제 2 유형의 데이터에 대해, 일부 예시적 실시예에서, 암 및 정상 모델의 생명 에너지론적 프로파일링은 해당 과정 및 산소 첨가 인산화 성분의 이해를 가능하도록 하기 위해 시호스(Seahorse™) XF24 분석기를 채택할 수 있다.

특히, 세포는 시호스(Seahorse) 배양 플레이트 상에서 최적의 밀도로 놓여질 수 있다. 이들 세포들은 100 μl의 매체 내에 놓여지거나 치료 후 37^oC 배양기에서 5% CO₂로 유지될 수 있다. 두 시간 후에, 세포가 24개 웰 플레이트에 부착되면, 추가적인 150 μl의 매체 또는 치료 용액 중 하나가 추가될 수 있으며 플레이트는 배양 인큐베이터 내에 하루 밤 동안 놓여질 수 있다. 이러한 두 단계의 뿌리는 절차는 세포들이 배양 플레이트 내에 고르게 분포될 수 있게 해 준다. 산소 및 pH를 함유하는 시호스(Seahorse) 카트리지는 CO₂를 포함하지 않는 37^oC의 배양기 내의 조정액 내에서 하루밤 동안 수화시킬 수 있다. 세 개의 미토콘드리아 약제가 일반적으로 카트리지의 세 포트에 적재된다. 올리고마이신, 복합체 III 금지 인자, FCCP, 공역 방지제 및 로테논, 복합체 I 금지 인자가 카트리지의 포트 A, B 및 C로 각각 적재될 수 있다. 모든 재고 약제가 버퍼링되지 않은 DMEM 매체 내에서 10x의 농도로 준비될 수 있다. 상기 카트리지는 분석 전에 먼저 CO₂를 포함하지 않는 배양기 내에서 미토콘드리아의 화합물로 약 15분 간 배양될 수 있다. 배양 플레이트는 글루코스를 포함하는 DMEM 기반 버퍼링되지 않은 매체에서 정상 성장 매체에서 발견되는 농도로 세척될 수 있다. 이 세포들은 630 ul의 버퍼링되지 않은 매체로 적층될 수 있으며 사전 조정된 카트리지를 장착한 시호스(Seahorse) 기기에 놓여지기 전에 CO₂를 포함하지 않는 배양기 내에서 평형의 맞추어질 수 있다. 이 기기는 포트를 통한 약제의 투입이 시작되기 전에 기반을 형성하기 위해 혼합, 대기 및 측정의 사이클로 이루어지는 세 개-네 개의 루프에서 동작할 수 있다. 다음 약제가 도입되기 전에 두 개의 루프가 있을 수 있다.

OCR(산소 소모율) 및 ECAR(세포 외 산화율)는 7 ul 챔버 내의 전극에 의해 기록될 수 있으며, 상기 해마 배양 플레이트에 밀어 넣어지는 카트리지를 사용하여 생성될 수 있다.

C. 데이터 통합 및 컴퓨터 모의 모델 생성

적합한 데이터 집합이 얻어지면, 컴퓨터로 구현된 통계적 모델의 데이터 집합 및 세대의 통합이 AI 기반 정보학 시스템 또는 플랫폼 (예를 들어, REFS™ 플랫폼)을 사용하여 수행될 수 있다. 예를 들어, 예시적 AI 기반 시스템은 대사적 종단점(ECAR/OCR)의 핵심 추진 인자로서 단백질 연관의 시뮬레이션-기반 네트워크를 생성할 수 있다. 이에 대해서는 도 15를 참조한다. REFS™ 시스템에 대한 상세한 배경 설명은 징(Xing) 등의 “네트워크 앙상블 시뮬레이션을 사용한 류머티스 관절염과 관련된 유전학적 및 유전자 발현 데이터 예측 유전자의 인과적 모델링” PLoS Computational Biology, 제 7권. 제 3판, 1-19 (2011년 3월) (e100105) 및 페리왈(Periwal)의 미국 특허 제 7,512,497호에서 찾아볼 수 있으며, 각 문서의 내용은 참조로써 본 명세서에 전체적으로 통합된다. 이전에 기술된 설명에서, 상기 REFS™ 시스템은 본질적으로 입력 변수들(예를 들어, 단백질 발현 수준, mRNA 발현 수준, 및 시호스(Seahorse) 배양 플레이트 상에서 측정된 OCR / ECAR 값과 같이 이에 해당하는 기능적 데이터)들 사이의 인과 관계를 확립하기 위해 수학적 알고리즘을 채택하는 AI 기반 시스템이다. 이 과정은 어떠한 잠재적이고, 확립되고 또한/또는 증명된 생물학적 관계에 대한 기존 지식을 고려하지 않고 입력 데이터에만 기반할 수 있다.

특히, 본 발명의 플랫폼의 상당한 이점은 상기 AI 기반 시스템이 생물학적 과정과 관련된 분야에서의 기존 지식에 의존하거나 이를 고려하지 않고 세포 모델로부터 얻어진 데이터 집합에 기반한다는 것이다. 또한, 바람직하게는, 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 잘려나가지 않으며, 그 대신, 획득된 모든 데이터가 단백질 연관을 결정하기 위한 AI 시스템으로 공급된다. 이에 따라, 상기 플랫폼에서 생성되어 결과로 나타나는 통계적 모델은 어떠한 알려진 생물학적 관계도 고려하지 않기 때문에 편향되지 않는다.

특히, 단백질체학 및 ECAR/OCR으로부터의 데이터가 AI 기반 정보 시스템으로 입력될 수 있으며, 상기 설명된 데이터 연관에 기반한 통계적 모델을 구축한다. 이 후, 단백질 연관의 시뮬레이션-기반 네트워크가 다음 방법을 사용하여 치료 및 조건을 포함하는 각 질병 대 정상 시나리오에 대해 도출된다.

상기 생성된(예를 들어, 최적화되거나 진화한) 네트워크의 구축을 위한 예시적 과정의 상세한 설명은 도 16과 관련한 기술 아래 나타난다. 상기 기술한 바와 같이, 단백질체 및 기능적 세포 데이터로부터의 데이터는 AI 기반 시스템으로 입력된다(단계 210). 상기 입력 데이터는 가공되지 않았거나 최소한으로 가공된 데이터일 수 있으며, 정규화(예를 들어, 가변 위치 함수 또는 내부 표준을 사용하여)를 포함할 수 있는 사전 처리 단계를 거친다(단계 212). 상기 사전 처리는 사라진 데이터 값들을 (예를 들어, K-최접근 이웃(K-NN) 알고리즘을 사용하여) 충당하는 과정을 포함할 수 있다(단계 212).

사전 처리된 데이터는 네트워크 파편 라이브러리를 구축하기 위해 사용된다(단계 214). 상기 네트워크 파편은 가능한 측정된 변수(입력 데이터)의 모든 소형 집합들(예를 들어, 2-3 원소 집합 또는 2-4 원소 집합) 사이의 정량적, 연속적 관계를 정의한다. 파편 내 변수들 사이의 관계는 선형, 로지스틱, 다항 분포형, 우성 또는 열성의 동형 접합적 등의 관계일 수 있다. 각 파편에서의 관계는 후보 관계가 얼마나 입력 데이터에 주어질 수 있는 지를 반영하고, 또한 관계에 수학적 복잡성으로 인한 벌칙을 부과하는 베이지안(Bayesian) 확률적 스코어에 지정된다. 입력 데이터로부터 추정되는 가능한 모든 쌍 및 삼각 관계(또한 일부 실시예에서 사각 관계도 가능)에 대한 스코어를 부과함으로써, 라이브러리 내의 가장 유망한 파편이 식별될 수 있다(유망한 파편). 관계의 정량적 매개변수 또한 입력 데이터를 기반으로 계산될 수 있으며 각 파편에 대해 저장될 수 있다. 파편 일람표 내의 여러 모델 유형이 사용될 수 있으며, 여기에는 선형 회귀, 로지스틱 회귀, (분산의 분석) ANOVA 모델, (공분산의 분석) ANCOVA 모델, 비선형/다항 회귀 모델 및 균등 비 매개 변수 회귀가 포함되나 이에 한정되지는 않는다. 모델 매개변수에 대한 사전 가정에서 걸(Gull) 분포 또는 모델에서 사용된 매개변수의 개수에 관련된 베이지안(Bayesian) 정보 기준(BIC) 벌칙이 가정될 수 있다. 네트워크 추정 과정에서, 초기 시험 네트워크 모임 내의 각 네트워크는 파편 라이브러리 내 파편들의 부분 집합으로부터 구축된다. 초기 시험 네트워크들의 모임 내의 각 초기 시험 네트워크는 라이브러리 내 다른 파편들의 부분 집합으로부터 구된다(단계 216).

베이지안(Bayesian) 네트워크 및 네트워크 파편의 기반을 이루는 징(Xing) 외, “류머티스 관절염과 관련된 유전학적 및 유전자 발현 데이터 예측의 네트워크 앙상블 시뮬레이션을 사용한 인과적 모델링” PLoS Computational Biology, 제 7권. 제 3판, 1-19 (2011년 3월) (e100105)에 기반한 수학적 표현에 대한 개요가 이하에서 설명된다.

임의 변수

를 가지는 다중 변량 시스템 많은 수의 매개변수 Θ를 포함하는 다중 변량 확률 분포 함수

에 의해 특성화될 수 있다. 상기 다중 변량 확률 분포 함수는 요소로 표현되어 다음과 같은 국지적 조건 확률 분포의 곱으로 나타낼 수 있다:

,

여기서, 각 변수

는

로 표현되는 이에 대한

부모 변수가 주어졌을 때 비하강 변수와 무관하다. 요소에 의한 표현 이후, 각 국지적 확률 분포는 자신의 매개변수 Θi를 가진다.

상기 다중 변량 확률 분포 함수는 각 특정한 요소화 및 해당 매개변수가 별개의 확률적 모델인 다른 방법으로 요소화될 수 있다. 각각의 특정한 요소화(모델)는 각 변수

에 대한 정점 및 국지적 조건 분포

에서 변수를 사이의 의존성을 나타내는 정점들을 잇는 방향을 가지는 간선을 가지는 방향성 아크릴 그래프(Directed Acrylic Graph: DAC)로 표현할 수 있다. 각각 정점을 가지고 방향성 간선과 연관된 DAG의 하위 그래프는 네트워크 파편들이다.

모델은 주어진 입력 데이터에 대해 가장 유망한 요소화 및 가장 유망한 매개변수를 결정함으로써 진화하거나 최적화된다. 이는 “베이지안(Bayesian) 네트워크의 학습” 또는, 달리 표현하면, 입력 데이터의 훈련 집합이 주어졌을 때, 입력 데이터에 가장 잘 합치되는 네트워크를 찾는 것이라 할 수 있다. 이는 입력 데이터에 대해 각 네트워크를 평가하는 스코어링 함수를 사용하여 성취된다.

입력 데이터가 주어졌을 때 베이지안(Bayesian) 프레임워크가 요소화의 확률을 결정하기 위해 사용된다. 베이즈의 법칙에 따르면, 데이터의 확률, P(D),이 모델 전체에 걸쳐 일정하다고 가정하면, 데이터 D가 주어진 모델 가정,

,에 대해 데이터의 후반 확률의 곱에 비례한다고 하면,

에 모델의 사전 확률,

을 곱한 값이다. 이는 다음과 같은 식으로 표현된다:

.

모델을 가정하는 데이터의 후반 확률은 매개변수들의 이전 분포에 대한 데이터 확률의 적분이다:

.

모든 모델들이 동일한 확률을 가진다고 가정하면(즉, P(M)가 상수인 경우), 데이터 D가 주어졌을 때, 모델 후반 확률, M,은 다음과 같이 각 네트워크 파편 M_i에 대한 매개변수에 대한 적분의 곱으로 요소화될 수 있다:

.

상기 식에서 중요한 상수 항이 생략되었음을 주목해야 한다. 일부 실시예에서, 모델의 조건부 확률

의 음의 로그를 취하는 베이지안(Bayesian) 정보 기준(BIC)이 다음과 같이 각 모델의 “스코어”를 정하기 위해 사용될 수 있다:

,

여기서 모델 M에 대한 전체 스코어 S _tot 는 각각의 국지적 네트워크 파편의 국지적 스코어 S _i 의 합이다. BIC는 각 개별적 네트워크 파편의 스코어를 결정하기 위한 표현을 더 제공한다:

여기서 κ(M _i )은 모델 M _i 내에서 합치되는 매개변수의 개수이며 N은 표본(데이터 포인트)의 개수이다. S _MLE (M _i )은 네트워크 파편에 대한 확률 함수의 음의 로그로서 이 함수는 각각의 네트워크 파편에 대해 사용된 기능적 관계로부터 계산될 수 있다. BIC 스코어에 대해, 스코어가 낮을 수록, 모델이 입력 데이터에 합치할 확률이 높아진다.

상기 시도 네트워크들의 모임은 전역적으로 최적화되며, 이는 네트워크의 최적화 또는 진화로 설명될 수 있다(단계 218). 예를 들어, 상기 시도 네트워크들은 메트로폴리스 몬테카를로 샘플링 알고리즘을 사용하여 진화되거나 최적화될 수 있다. 시뮬레이션된 아닐링 또한 국지적 변환을 통해 모임 내 시험 네트워크를 최적화하거나 진화시키기 위해 사용될 수 있다. 아닐링 과정을 시뮬레이션하는 예에서, 각 시험 네트워크는 라이브러리로부터 네트워크 파편을 추가하고, 시험 네트워크로부터 네트워크 파편을 제거하며, 네트워크 파편을 차감하거나 달리 네트워크 토폴로지를 변경시킴으로써 변화되며, 이 후 네트워크에 대한 새로운 스코어가 계산된다. 일반적으로 말하면, 스코어가 개선되면, 변화가 유지되고 스코어가 나빠지면 변화는 거부된다. “온도” 매개변수는 유지되는 스코어를 악화시키는 일부 국지적 변화를 허용하여, 국지적 최소값들을 피하기 위한 최적화 과정에 도움을 주게 된다. “온도” 매개변수는 최적화/진화 과정이 수렴하도록 하기 위해 시간이 지남에 따라 감소된다.

네트워크 추정 과정의 전부 또는 일부는 서로 다른 시험적 네트워크들에서 병렬로 수행될 수 있다. 각 네트워크는 별도의 프로세서 및/또는 별도의 컴퓨터 장치들에서 병렬로 최적화될 수 있다. 일부 실시예에서, 상기 최적화 과정은 병렬로 동작하는 수백 내지 수천 개의 프로세서가 통합된 수퍼 컴퓨터에서 수행될 수 있다. 정보는 병렬 프로세서에서 수행되는 최적화 과정들 사이에서 공유될 수 있다.

상기 최적화 과정은 전체적인 점수에 대한 임계 표준을 충족시키지 못하는 특정 네트워크를 모임으로부터 제거하는 네트워크 필터를 포함할 수 있다. 제거된 네트워크는 새로운 초기 네트워크로 교체될 수 있다. 또한 “확장성이 없는(scale free)” 특정 네트워크 또한 모임으로부터 제거될 수 있다. 네트워크들의 모임이 최적화되거나 진화한 이후에, 그 결과는 생성된 세포 모델 네트워크들의 모임으로 불릴 수 있으며, 총체적으로 생성된 합치 네트워크로 불릴 수 있다.

D . 정량적 관계 정보를 추출하고 예측하기 위한 시뮬레이션

생성된 세포 모델 네트워크에서의 각 관계에 관련된 정량적 매개변수 정보를 추출하기 위해 시뮬레이션이 사용될 수 있다(단계 220). 예를 들어, 정량적 정보 추출을 위한 시뮬레이션은 각각 10배의 노드 네트워크 내의 교란(증가하거나 감소하는)와 모델 내 다른 노드들(예를 들어, 단백질)에 대한 사후 분포의 계산을 포함할 수 있다. 종단점은 t-검사에 의해 그룹 당 100개 표본의 가정과 비교되며, 0.01은 잘라내는 것을 의미 한다. 상기 t-검사 통계는 100회의 t-검사의 중간값이다. 이러한 시뮬레이션 기술의 사용을 통해, 예측의 강도를 나타내는 AUC(곡선 아래 면적) 및 종단점을 구동하는 노드의 컴퓨터 모의 세기를 나타내는 배수 변화가 네트워크의 모임 내 각 관계에 대해 생성된다.

지역 컴퓨터 시스템의 관계 정량화 모듈이 AI 기반 시스템이 교란을 수행하도록 지도하고 AUC 정보 및 배수 정보를 추출하기 위해 채택될 수 있다. 상기 추출된 정량적 정보는 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화 및 AUC를 포함할 수 있다. 일부 실시예에서, 필요에 따라 구축된 R 프로그램 이 상기 정량적 정보를 추출하기 위해 사용될 수 있다.

일부 실시예에서, 생성된 세포 모델 네트워크의 모임은 시뮬레이션을 통해 조건에서의 변화에 대한 반응을 예측하기 위해 사용될 수 있으며, 이는 추후에 수중 실험실 세포-기반 또는 동물-기반 실험에 의해 증명될 수 있다.

AI 기반 시스템의 출력은 정량적 관계 매개변수 및/또는 다른 시뮬레이션 예측(222)일 수 있다.

E. 분별(델타) 네트워크의 생성

분별 네트워크 생성 모듈이 생성된 세포 모델 네트워크와 생성된 비교 세포 모델 네트워크 사이의 분별(델타) 네트워크를 생성하기 위해 사용될 수 있다. 상기 설명한 바와 같이, 일부 실시예에서, 상기 분별 네트워크는 생성된 세포 모델 네트워크 및 생성된 비교 세포 모델 네트워크 내에서의 관계의 모든 정량적 매개변수를 비교한다. 상기 분별 네트워크 내의 각 관계에 대한 정량적 매개변수는 비교에 기반한 것이다. 일부 실시예에서, 분별이 델타-델타 네트워크로 칭해지는 여러 분별 네트워크들 사이에서 수행될 수 있다. 델타-델타 네트워크의 예는 이하 예 부분에서 도 26과 관련하여 설명된다. 상기 분별 네트워크 생성 모듈은 프로그램이거나 PERL로 작성된 스크립트일 수 있다.

F. 네트워크의 시각화

네트워크 및 분별 네트워크의 모임에 대한 관계 값들은 네트워크 시각화 프로그램(예를 들어, 사이토스케이프(Cytoscape) 컨소시엄으로부터의 복잡한 네트워크 분석 및 시각화를 위한 사이토스케이프 오픈 소스 플랫폼)을 사용하여 시각화될 수 있다. 상기 네트워크의 시각적 묘사에 있어서, 각 간선(예를 들어, 단백질을 연결하는 각 선분)의 두께는 배수 변화의 강도를 나타낸다. 상기 간선들은 또한 방향적 지시 인과성일 수 있으며, 각 간선은 연관된 예측 신뢰 수준을 가진다.

G. 예시적 컴퓨터 시스템

도 17은 일부 실시예에서 AI 기반 정보학 시스템과 통신하기 위해, 분별 네트워크를 생성하기 위해, 네트워크를 시각화하기 위해, 데이터를 보관하고 저장하기 위해, 또한/또는 사용자와 상호 반응하기 위해 채택될 수 있는 예시적 컴퓨터 시스템/환경을 개략적으로 묘사한다. 상기 설명된 대로, AI 기반 정보학 시스템을 위한 계산은 상기 예시적 컴퓨터 시스템과 직접적 또는 간접적으로 반응하는 수백 또는 수천 개의 병렬 프로세서를 가지는 별도의 수퍼 컴퓨터로 수행될 수 있다. 상기 환경은 관련 주변 장치를 가진 컴퓨터 장치(100)를 포함한다. 상기 컴퓨터 장치(100) 는 본 명세서에서 밝힌 여러 방법, 또는 상기 방법의 일부를 수행하기 위한 실행 가능 코드(150)를 구현하기 위한 프로그래밍이 가능하다. 상기 컴퓨터 장치(100)는 하드 드라이브, CD-ROM, 또는 기타 비휘발성 컴퓨터 판독 가능 매체와 같은 저장 장치(116)를 포함한다. 상기 저장 장치(116)는 운영 체제(118) 및 기타 관련 소프트웨어를 저장한다. 상기 컴퓨터 장치(100)는 메모리(106)를 더 포함할 수 있다. 상기 메모리(106)는 컴퓨터 시스템 메모리 또는 DRAM, SRAM, EDO RAM 등과 같은 임의 접근 메모리를 포함할 수 있다. 상기 메모리(106)는 또한 다른 유형의 메모리, 또는 이들의 조합을 포함할 수 있다. 상기 컴퓨터 장치(100)는 저장 장치(116) 및/또는 메모리(106) 내에 실행 가능 코드(150)의 각 부분을 구현하고 처리하기 위한 명령어를 저장할 수 있다.

상기 실행 가능 코드(150)는 상기 AI 기반 정보학 시스템(190)과 통신하기 위한 코드, 분별 네트워크(예를 들어, 분별 네트워크 생성 모듈)를 생성하기 이한 코드, 상기 AI 기반 정보학 시스템으로부터 정량적 관계 정보(예를 들어, 관계 정량화 모듈)를 추출하기 위한 코드 및 네트워크를 시각화하기 위한 코드(예를 들어, 사이토스케이프(Cytoscape))를 포함할 수 있다.

일부 실시예에서, 컴퓨터 장치(100)는 상기 AI 기반 정보학 시스템(190)(예를 들어, REFS를 실행하기 위한 시스템)과 직접적으로 또는 간접적으로 통신할 수 있다. 예를 들어, 상기 컴퓨터 장치(100)는 데이터 파일(예를 들어, 데이터 프레임)은 상기 AI 기반 정보학 시스템(190)에 네트워크를 통해 전송함으로써 AI 기반 정보학 시스템(190)과 통신할 수 있다. 또한, 상기 컴퓨터 장치(100)는 AI 기반 정보학 시스템(190)으로의 인터페이스 및 실행 명령을 제공하는 실행 가능 코드(150)를 가질 수 있다.

일부 실시예에서, 상기 컴퓨터 장치(100)는 입력 데이터 집합에 대한 데이터를 제공하는 하나 또는 그 이상의 실험적 시스템(180)과 직접적 또는 간접적으로 통신할 수 있다. 데이터를 생성하기 위한 실험적 시스템(180)은 질량 분광학 기반 단백질체학, 미세 배열 유전자 발현, qPCR 유전자 발현, 질량 분광학 기반 대사체학, 및 질량 분광학 기반 리피도믹스, SNP 미세 배열, 기능적 분석의 패널, 및 기타 체외 생물학 플랫폼 및 기술을 위한 시스템을 포함할 수 있다.

컴퓨터 장치(100)는 또한 메모리(106)에 저장된 소프트웨어 및 시스템 하드웨어 제어를 위한 다른 프로그램을 실행하기 위한 프로세서(102)를 포함하며, 하나 또는 그 이상의 추가적인 프로세서(들)(102)를 포함할 수 있다. 상기 프로세서(102) 및 상기 프로세서(들)(102) 각각은 단일 코어 프로세서 또는 다중 코어(104 및 104) 프로세서일 수 있다. 컴퓨터 장치(100)에서 가상화를 채용하여 컴퓨터 장치 내의 기반 구조 및 자원을 동적으로 공유하도록 할 수 있다. 가상화된 프로세서는 저장 장치(116)에 저장된 실행 가능 코드(150) 및 다른 소프트웨어와 함께 사용될 수 있다. 가상화 기계(114)는 상기 프로세스가 다중이 아닌 단일 컴퓨터 자원만을 사용하는 것처럼 보이도록 다중 프로세서에서 동작하는 프로세스를 다루기 위해 제공될 수 있다. 다중 가상 기계는 하나의 프로세서에서도 사용할 수 있다.

사용자는 사용자 인터페이스(124) 또는 기타 인터페이스를 보여 줄 수 있는 컴퓨터 모니터와 같은 시각적 디스플레이 장치(122)를 통해 컴퓨터 장치(100)와 통신할 수 있다. 상기 디스플레이 장치(122)의 사용자 인터페이스(124)는 가공되지 않은 데이터, 네트워크의 시각적 표현 등을 보여줄 수 있다. 상기 디스플레이 장치(122)는 또한 예시적 실시예(예를 들어, 저장 장치(116)에 대한 아이콘)의 다른 측면 또는 요소들을 보여 줄 수 있다. 상기 컴퓨터 장치(100)는 키보드 또는 다중 포인트 터치 인터페이스(108) (예를 들어, 터치 스크린) 및 포인팅 장치(110) (예를 들어, 마우스, 트랙볼 및/또는 트랙 패드)와 같이 사용자로부터 입력을 받기 위한 I/O 장치를 포함할 수 있다. 상기 키보드(108) 및 상기 포인팅 장치(110) 는 시각적 디스플레이 장치(122) 및/또는 상기 컴퓨터 장치(100)에 유선 및/또는 무선 연결로 연결될 수 있다.

상기 컴퓨터 장치(100)는 네트워크 장치(126)와 상호 작용할 수 있는 근거리 통신망(LAN), 원거리 통신망(WAN) 또는 표준 전화선, LAN 또는 WAN 연결(예를 들어, 802.11, T1, T3, 56kb, X.25), 광대역 연결(예를 들어, ISDN, 프레임 릴레이, ATM), 무선 연결, 제어기 영역 네트워크(CAN), 또는 상기의 일부 또는 모든 조합을 포함하나 이에 한정되지는 않는 다양한 연결을 통한 인터넷 네트워크 인터페이스(112)를 포함할 수 있다. 상기 네트워크 인터페이스(112)는 내장 네트워크 어댑터, 네트워크 인터페이스 카드, PCMCIA 네트워크 카드, 카드 버스 네트워크 어댑터, 무선 네트워크 어댑터, USB 네트워크 어댑터, 모뎀 또는 컴퓨터 장치(100)가 어떠한 유형의 네트워크와도 통신할 수 있게 하며 본 명세서에서 기술된 동작을 수행할 수 있도록 해주기에 적절한 기타 장치를 포함할 수 있다.

또한, 상기 컴퓨터 장치(100)는 워크스테이션, 데스크탑 컴퓨터, 서버, 노트북, 핸드헬드 컴퓨터 또는 통신이 가능하며 본 명세서에서 기술된 동작을 수행하기에 충분한 프로세서 파워와 메모리 용량을 가지는 다른 형태의 연산 또는 전기 통신 장치와 같은 컴퓨터 시스템일 수 있다.

상기 컴퓨터 장치(100)는 마이크로소프트의 모든 버전의 윈도우즈 운영 체제, 서로 다른 판의 유닉스 및 리눅스 운영 체제, 매킨토시 컴퓨터를 위한 모든 버전의 맥 오에스, 모든 임베디드 운영 체제, 모든 실시간 운영 체제, 모든 오픈 소스 운영 체제, 모든 사적으로 보유한 운영 체제, 모바일 컴퓨터 장치를 위한 모든 운영 체제, 또는 상기 컴퓨터 장치에서 구동되며 본 명세서에서 기술된 동작을 수행하는 기타 다른 운영 체제 등의 어떠한 운영 체제(118)에서도 구동할 수 있다. 상기 운영 체제는 네이티브 모드 또는 에뮬레이션 모드에서 동작할 수 있다.

IV . 생물학적 시스템에 대한 모델 및 그 사용

A. 생물학적 시스템을 위한 모델 수립

모든 생물학적 시스템 또는 과정은 시각적으로 서로 다른 세포 유형 및/또는 기관 시스템들 사이의 복잡한 상호 반응을 포함한다. 한 세포 유형 또는 기관에서의 핵심 기능의 교란은 다른 상호 반응 세포 유형 및 기관에 대한 이차 효과로 이어질 수 있으며, 이러한 하방 흐름의 변화는 다시 초기 변화로 피드백되어 더 복잡한 상황을 야기할 수 있다. 따라서, 생물학적 시스템 또는 과정에 대한 보다 완전하고 전역적인 시각을 가지기 위해서는 주어진 생물학적 시스템 또는 과정을 세포 유형 또는 기관의 쌍 사이의 상호 반응과 같은 구성 요소로 분할하여 이들 구성 요소 사이의 상호 반응을 체계적으로 탐구하는 것이 도움이 된다.

이에 따라, 본 발명은 생물학적 시스템에 대한 세포 모델을 제공한다. 이러한 목적을 위해, 출원인들은 본 발명의 발견 플랫폼 기술에서 채택된 다양한 예시적 생물학적 시스템에 대한 세포 모델을 구축하였다. 출원인들은 생물학적 시스템에 고유한 인과 관계를 포함하는 합치 인과 관계 네트워크를 생성하기 위해 본 발명의 발견 플랫폼 기술을 사용하여 세포 모델에 대한 실험을 수행하였으며, 이에 의해 특정한 생물학적 시스템 또는 과정에 대해 중요한 “조절 인자” 또는 핵심 분자의 “추진 인자”를 식별하였다.

본 발명의 플랫폼 기술 및 그 구성 요소의 의미있는 이점 중 하나는, 예를 들어, 세포 모델로부터 획득한 상기 필요에 따라 구축된 세포 모델 및 데이터 집합에서, 생물학적 시스템 또는 과정에 대해 생성된 초기의 “제 1 세대” 합치 인과 관계 네트워크가, 예를 들어, 추가적인 세포 라인/유형 및/또는 추가적인 조건의 도입에 의해 시간이 지남에 따라 지속적으로 진화 또는 확장할 수 있다는 것이다. 진화한 세포로부터의 추가적인 데이터, 즉, 세포 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 세포 모델, 즉, 세포 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 생물학적 시스템에 고유한 새로운 인과 관계는 이 후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 세포 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 생물학적 시스템의 조절 인자로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다. 이러한 방식으로, 세포 모델로부터의 데이터 집합과 본 플랫폼 기술 방법을 사용하여 세포 모델로부터 생성된 인과 관계 네트워크의 양 세포 모델 모두가 지속적으로 진화하여 상기 플랫폼 기술로부터 획득한 이전의 지식을 확대해 나갈 수 있게 된다.

이에 따라, 본 발명은 본 플랫폼 기술에서 채택된 세포 모델로부터 생성된 합치 인과 관계 네트워크를 제공한다. 이들 합치 인과 관계 네트워크는 제 1 세대의 합치 인과 관계 네트워크, 또는 다중 세대의 합치 인과 관계 네트워크, 예를 들어, 2,3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20번째 또는 이를 초과하는 세대의 합치 인과 관계 네트워크일 수 있다. 또한, 본 발명은 본 플랫폼 기술에서 채택된 세포 모델로부터 생성된 합치된 모의 인과 관계 네트워크를 제공한다. 이들 합치된 모의 인과 관계 네트워크는 제 1 세대의 합치된 모의 인과 관계 네트워크, 또는 다중 세대의 합치된 모의 인과 관계 네트워크, 예를 들어, 두 번째^,세 번째, 네 번째, 다섯 번째, 여섯 번째, 일곱 번째, 여덟 번째, 아홉 번째, 열 번째, 열한 번째, 열두 번째, 열세 번째, 열네 번째, 열다섯 번째, 열여섯 번째, 열일곱 번째, 열여덟 번째, 열아홉 번째, 스무 번째 또는 이를 초과하는 모의된 세대의 합치 인과 관계 네트워크들일 수 있다. 본 발명은 본 발명의 합치 인과 관계 네트워크로부터 생성된 델타 네트워크 및 델타-델타 네트워크를 더 제공한다.

생물학적 시스템 또는 과정에 대한 필요에 따라 구축된 세포 모델은 생물학적 시스템과 관련된 하나 또는 그 이상의 세포를 포함한다. 생물학적 시스템/과정에 대한 상기 모델은 생물학적 시스템 또는 과정의 특징적 측면을 모방하는 조건(예를 들어, 세포 배양 조건)을 생성함으로써 생물학적 시스템의 환경, 예를 들어, 암 세포의 생체 내 환경을 모의하기 위해 수립될 수 있다.

동일하거나 다른 근원의 다중 세포들은, 단일 세포 유형과는 반대로, 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50 또는 그 이상의 서로 다른 세포 라인 또는 세포 유형들이 세포 모델에 포함된다. 일 실시예에서, 상기 세포는 모두 동일한 유형, 예를 들어, 모두 유방암 세포 또는 식물 세포이거나, 서로 달리 수립된 세포 라인, 예를 들어, 서로 달리 수립된 유방암 세포 또는 식물 세포의 세포 라인일 수 있다. 앞의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 세포 라인 또는 세포 유형일 수 있다.

본 발명의 세포 모델에 포함될 수 있는 세포 유형에는 인간 세포, 동물 세포, 포유류 세포, 식물 세포, 효모, 박테리아, 또는 균류가 포함되나 이로 한정되지는 않는다. 일 실시예에서, 본 세포 모델의 세포는 암 세포 또는 박테리아에 의해 또는 바이러스에 의해 감염된 세포, 질병에 걸린 세포를 포함할 수 있다. 일 실시예에서, 본 세포 모델의 세포는 당뇨, 비만 또는 심장병 상태에 관련된 세포와 같은 질병과 연관된 세포, 예를 들어, 대동맥의 평활근 세포 또는 간 세포를 포함할 수 있다. 해당 분야의 통상의 기술자라면 예를 들어, 질병 상태/과정과 같은 특정한 생물학적 상태/과정에 포함되거나 관련된 이들 세포들, 및 이러한 모든 세포들이 본 발명의 세포 모델에 포함된다는 것을 인식할 수 있을 것이다.

본 발명의 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 교란되지 않은 세포일 수 있다. 또 다른 실시예에서, “제어 세포”는 정상 세포, 예를 들어, 질병에 걸리지 않은 세포일 수 있다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 제어 세포들이 상기 세포 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 제어 세포 라인 또는 제어 세포 유형일 수 있다. 일 실시예에서, 상기 제어 세포는 모두 같은 유형이지만 해당 세포 유형의 다르게 확립된 세포 라인일 수 있다. 일 실시예에서, 하나 또는 그 이상의 정상, 예를 들어, 질병에 걸리지 않은 세포 라인이, 제어로서, 생물학적 상태 또는 과정에 고유한 단백질 또는 경로를 식별하기 위해 유사한 조건에서 배양되고, 또한/또는 세포 모델의 주된 세포로서 동일한 교란에 노출된다.

본 발명의 필요에 따라 제작된 세포 모델은 또한 생물학적 상태 또는 과정의 특징적 측면을 모방하는 조건을 포함할 수 있다. 예를 들어, 종양 환경 생체 내의 암 세포의 조건, 또는 심장병을 앓는 환자의 대동맥의 평활근 세포의 조건을 매우 가깝게 근사하는 세포 배양 조건이 선택될 수 있다. 일부 경우에, 상기 조건은 스트레스 조건이다. 여러 조건 / 스트레스 인자가 본 발명의 세포 모델에서 채택될 수 있다. 일 실시예에서, 이들 스트레스 인자 / 조건들은 세포 시스템에 대한 “교란”, 예를 들어, 외부 자극을 구성할 수 있다. 한 예시적 스트레스 조건은 저산소 상태로서, 이는, 예를 들어, 고형 종양 내에서 일반적으로 발견되는 조건이다. 저산소 상태는 해당 분야에서 알려진 방법들을 사용하여 유도할 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA) 내에 위치시킴으로써 유도할 수 있다. 그 효과는 저산소 상태 치료 이후 소정의시간, 예를 들어, 24 시간 후에 추가적인 외부 자극 성분들(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비존재 하에서 측정될 수 있다. 마찬가지로, 젖산 치료는 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 약 12.5 mM의 최종 젖산 농도에서 소정의 시간, 예를 들어, 24시간에서, 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부재 하에서 조사될 수 있다. 고혈당증은 암뿐만 아니라 당뇨에서도 발견되는 조건이다. 대상 세포를 치료하기 위해 사용될 수 있는 전형적인 고혈당 조건은 매체 내 글루코스의 최종 농도를 약 22 mM로 하기 위해 적절한 매체에 첨가된 10% 배양 등급 글루코스를 포함한다. 고지혈증은, 예를 들어, 비만 및 심장병에서 발견되는 조건이다. 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 포함하는 매체에서 배양함으로써 제공될 수 있다. 고인슐린증은, 예를 들어, 당뇨에서 발견되는 조건이다. 고인슐린증 조건은 세포를 1000 nM 인슐린을 포함하는 매체에서 배양함으로써 유도될 수 있다.

개별적 조건들이 본 발명의 필요에 따라 구축된 세포 모델에서 별개로 조사되거나 함께 조사되거나 두 조사를 병행할 수 있다. 일 실시예에서, 생물학적 시스템의 서로 다른 특성적 측면을 반영하거나 시뮬레이션하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50개 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 세포 모델에서 조사되었다. 일 실시예에서, 개별적 조건 및, 추가적으로 생물학적 시스템의 서로 다른 특성적 측면을 반영하거나 시뮬레이션하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50개 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 세포 모델에서 조사되었다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10과 50 사이의 서로 다른 조건일 수 있다.

일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란”이 상기 시스템에 적용될 수 있다. 도 15D를 참조한다. 이러한 교란이 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.

상기 필요에 따라 구축된 세포 모델은 예를 들어, “환경적 교란” 또는 “외부 자극 성분”과 같은 교란에 노출될 수 있다. 이러한 “환경적 교란” 또는 “외부 자극 성분”은 세포 환경에 내생적(예를 들어, 세포 환경이 일정 수준의 자극제를 포함하고 수준을 증가시키기 위해 그 이상의 자극제가 추가됨)이거나, 세포 환경에 외생적(예를 들어, 자극제/교란이 변이 이전의 세포 환경에 전반적으로 존재하지 않음)일 수 있다. 상기 세포 환경은 환경적 교란 또는 외부 자극 성분의 추가의 결과로 나타나는 이차적 변화에 의해 더 변경될 수 있으며, 이는 외부 자극 성분이 세포 시스템에 의해 세포 환경으로 분비된 분자를 포함하여 세포 시스템의 세포의 출력을 변화시킬 수 있기 때문이다. 상기 환경적 교란 또는 외부 자극 성분은 세포 기능에 영향을 미칠 수 있는 어떠한 외부 물리적 및/또는 화학적 자극을 포함할 수 있다. 이는 자연적이거나 합성된 화학 물질인 어떠한 크거나 작은 기관 또는 기관 내 분자의, 온도 변화, pH 변화, 복사, 빛(UVA, UVB 등), 마이크로웨이브, 초음파, 전기 전류, 조절되거나 조절되지 않는 자기장 등을 포함할 수 있다. 상기 환경적 교란 또는 외부 자극 성분은 또한 유전학적 수정 / 변이를 야기하는 도입된 유전학적 수정 또는 변이 또는 매개 수단(예를 들어, 벡터)을 포함할 수 있다.

(i) 상호 대화 세포 시스템

둘 또는 그 이상의 세포 시스템들 간의 상호 반응이 조사되는 것이 바람직한 특정한 상황에서, “상호 대화 세포 시스템”이, 예를 들어, 제 1 세포 시스템의 수정된 세포 환경을 제 2 세포 시스템에 접촉도록 하여 제 2 세포 시스템의 세포 출력에 영향을 줌으로써 형성될 수 있다.

본 명세서에서 사용되는, “상호 대화 세포 시스템”은 둘 또는 그 이상의 세포 시스템을 포함하며, 제 2 세포 시스템 내의 최소한 하나의 세포의 출력이 변화되거나 영향을 받도록 이 시스템 내에서 상기 최소한 하나의 세포 시스템의 세포 환경이 이차 세포 시스템과 접촉하게 된다. 특정 실시예에서, 상기 상호 대화 세포 시스템 내의 세포 시스템은 직접 접촉할 수 있다. 다른 실시예에서, 어떠한 세포 시스템도 서로 직접적으로 접촉하지 않는다.

예를 들어, 특정 실시예에서, 상기 상호 대화 세포 시스템은 제 1 세포 시스템이 삽입체 내에서 성장하고 제 2 세포 시스템이 해당 웰 구획에서 성장하는 트랜스웰의 형태일 수 있다. 상기 2-세포 시스템은 동일하거나 서로 다른 매체에 접촉시킬 수 있으며, 매체 성분의 일부 또는 전부를 교환할 수 있다. 한 세포 시스템에 추가된 외부 자극 성분은 한 세포 시스템에 의해 실질적으로 흡수될 수 있고, 또한/또는 다른 세포 시스템에 분산될 기회를 가지기 이전에 저하될 수 있다. 대체적 방법으로, 상기 외부 자극 성분은 결과적으로 상기 2 세포 시스템의 평형에 접근해 가거나 이에 도달할 수 있다.

특정 실시예에서, 상기 상호 대화 세포 시스템은 각 세포 시스템이 자신의 매체 및/또는 배양 조건(온도, CO₂ 내용물, pH 등)을 가지거나, 유사하거나 동일한 배양 조건을 가지는 별도로 배양된 세포 시스템의 형태를 채택할 수 있다. 상기 2-세포 시스템은, 예를 들어, 조건을 겪은 매체를 한 세포 시스템에서 취하여 다른 세포 시스템과 접촉케 함으로써 서로 접촉할 수 있다. 2-세포 시스템 사이의 직접적인 세포-세포 간 접촉 또한 필요한 경우 수행될 수 있다. 예를 들어, 2-세포 시스템의 세포들은 필요한 경우 어떠한 포인트에서 공생 배양될 수 있고, 상기 공생 배양된 세포 시스템은 이후 최소한 하나의 세포 시스템 내의 세포가 정렬 가능한 표지 인자 또는 라벨(예를 들어 안정되게 발현된 형광 표지 인자 단백질 GFP)을 가지게 될 때, 예를 들어, FACS 정렬에 의해 분리될 수 있다.

마찬가지로, 특정 실시예에서, 상기 상호 대화 세포 시스템은 단순한 공생 배양일 수 있다. 상기 공생 배양 내의 처리된 세포를 다른 세포 시스템의 세포와 배양시키기 전에, 하나의 세포 시스템 내에서의 세포의 선택적 치료가 먼저 해당 세포 시스템 내의 세포를 처리함으로써 실시될 수 있다. 상기 공생 배양 상호 대화 세포 시스템 설정은, 예를 들어, 외부 자극 성분에 의한 제 1 세포 시스템의 자극 이후에 제 1 세포 시스템에서의 세포 표면 변화에 의해 야기된 2차 세포 시스템에 대한 영향을 연구하는 것이 바람직한 경우에 도움이 될 수 있다.

본 발명의 상호 대화 세포 시스템은 특정한 소정의 외부 자극 성분의 하나 또는 양 세포 시스템의 세포의 출력에 대한 영향을 탐구하기에 특히 적절하다. 이러한 자극이 (자극이 직접적으로 접촉되는) 제 1 세포 시스템에 미치는 일차적 영향은 제 1 세포 시스템이 상기 외부 자극과 접촉하기 이전과 이후의 세포의 출력(예를 들어, 단백질 발현 수준)을 비교함으로써 결정될 수 있으며, 이는, 본 명세서에서 사용되는 표현에서는, “(상당한) 세포의 출력 분별”로 불릴 수 있다. 이러한 자극이 제 2 세포 시스템에 미치는 부차적 효과는 (이의 세크리톰과 같은)제 1 세포 시스템의 수정된 세포 환경을 통한 중재이며, 이 또한 마찬가지로 측정될 수 있다. 이때, 예를 들어, 제 2 세포 시스템의 단백질체와의 비교가 제 1 세포 시스템에 대한 외부 자극 치료가 행해진 제 2 세포 시스템의 단백질체 및 제 1 세포 시스템에 대한 외부 자극 치료가 행하여 지지 않은 제 2 세포 시스템의 단백질체 사이에서 수행될 수 있다. (단백질체 또는 관심 대상인 다른 세포의 출력에서) 상당한 변화가 관찰되는 경우 이는 “상당한 세포 간 상호 대화 분별”로 불릴 수 있다.

(단백질 발현과 같은) 세포의 출력 측정을 수행함에 있어서, 절대적 발현량 또는 상대적 발현 수준이 사용될 수 있다. 예를 들어, 제 2 세포 시스템의 상대적 단백질 발현 수준을 결정하기 위해, 제 1 세포 시스템에 대한 외부 자극이 존재하거나 존재하지 않는 제 2 세포 시스템 내의 주어진 단백질의 양이 세포 라인의 적절한 제어 세포 라인 및 혼합물 및 주어진 배수 증가 또는 배수 감소값과 비교될 수 있다. 이러한 배수 증가(예를 들어, 최소한 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75 또는 100 또는 그 이상의 배수 증가) 또는 배수 감소(예를 들어, 최소한 0.95, 0.9, 0.8, 0.75, 0.7, 0.6, 0.5, 0.45, 0.4, 0.35, 0.3, 0.25, 0.2, 0.15, 0.1 또는 0.05 배수, 또는 90%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 또는 그 이하로의 감소)에 대한 소정의 임계 수준이 상당한 세포 간 상호 대화 분별을 선택하기 위해 사용될 수 있다. 상기 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위, 예를 들어, 1.5와 5 배 사이, 2와 10배 사이, 1과 2배 사이, 또는 0.9와 0.7배 사이의 상한 또는 하한일 수 있다.

본 출원 전체에 걸쳐, 목록으로 제시된 모든 값들, 예를 들어, 위에서 기술된 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있다.

이를 예시하기 위해, 심장병 모델의 측면을 모방하기 위해 수립된 한 예시적인 2-세포 시스템에서, 심장 평활근 세포 라인(제 1 세포 시스템)이 저산소 상태 조건 (외부 자극 성분)에 의해 처리되고, 신장 세포를 심장 평활근의 조건을 겪은 매체에 접촉시킨 결과로 발생하는 신장 세포 라인(제 2 세포 시스템)에서의 단백질체 변화가 통상의 정량적 질량 분광학에 의해 측정될 수 있다. 이들 신장 세포에서의 상당한 세포 간 상호 대화 분별이 적절한 제어(예를 들어, 저산소 상태 조건으로 처리되지 않은 마찬가지로 배양된 심장 평활근 세포의 조건을 겪은 매체와 접촉한 마찬가지로 배양된 신장 세포)와의 비교를 기반으로 결정될 수 있다.

관찰된 모든 상당한 세포 간 상호 대화 분별이 생물학적 의미를 가지지 않을 수 있다. 대상의 조사적 생물학적 평가가 적용된 주어진 생물학적 시스템에 대해, 일부(또는 모두일 수 있음)의 상당한 세포 간 상호 대화 분별은 문제가 되는 특정한 생물학적 문제에 대해 “결정론적”일 수 있다, 예를 들어, 질병 조건(치료적 시술을 위한 잠재적 타겟)을 야기하는 것에 책임이 있거나 질병 조건(잠재적 진단적 또는 예후의 요소)에 대한 생물학적 표지 인자이다.

이러한 결정론적 상호 대화 분별은 해당 방법의 최종 사용자에 의해 선택되거나, DAVID-활성 비교 경로 분석 프로그램, 또는 KEGG 경로 분석 프로그램과 같은 생물정보학 소프트웨어 프로그램에 의해 선택될 수 있다. 특정 실시예에서, 하나 이상의 생물정보학 소프트웨어 프로그램이 사용되며, 둘 또는 그 이상의 생물정보학 소프트웨어 프로그램으로부터의 합치된 결과를 사용하는 것이 바람직하다.

본 명세서에서 사용되는 세포의 출력의 “분별”은 세포의 출력의 하나 또는 그 이상의 매개변수들에서의 차이(예를 들어, 증가되거나 감소된 수준)를 포함한다. 예를 들어, 단백질 발현 수준에 대해, 외부 자극 성분에 의한 치료 이전 및 이후의 세포 시스템과 연관된 출력과 같은 두 세포의 출력사이의 분별이 질량 분광학 기반 분석(예를 들어, iTRAQ, 2D-LC-MSMS 등)과 같이 해당 분야에서 알려진 기술을 사용하여 측정되고 정량화될 수 있다.

(ii) 암 특정 모델

생물학적 시스템 또는 과정의 한 예는 암이다. 다른 복잡한 생물학적 과정 또는 시스템과 마찬가지로, 암은 다양한 여러 측면에 의해 특징지워지는 복잡한 병리학적 조건이다. 예를 들어, 그 높은 성장률로 인해, 많은 암 세포들이 저산소 상태 조건에서 성장하도록 적응되며, 상향 조절된 해당 과정 및 감소된 산소 첨가 인산화 대사 경로를 가진다. 결과적으로, 암 세포는 잠재적 약제에 의한 치료와 같은 환경적 교란에 대해, 동일한 치료에 대한 정상 세포의 반응과 비교하여, 다르게 반응할 수 있다. 따라서, 정상 세포의 반응과 비교하여 암의 약제 치료에 대한 고유한 반응을 판독하는 것이 관심사일 수 있다. 이러한 목적으로, 적절한 암 세포 라인을 선택하고 질병 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 창출함으로써, 필요에 따라 제작된 암 모델이 암 세포의 환경, 예를 들어, 종양 생체 내 환경을 모의하기 위해 수립될 수 있다. 예를 들어, 세포의 조건을 매우 가깝게 근사하거나, 종양 생체 내 암 성장의 여러 측면을 모방하는 세포 배양 조건이 암 세포의 서로 다른 성장 조건을 분리함으로써 선택될 수 있다.

단일 암 세포 유형과 반대로 동일하거나 서로 다른 근원을 가지는 다중 암 세포(예를 들어, 암 라인 PaCa2, HepG2, PC3 및 MCF7)이 상기 암 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 다른 암 세포 라인 또는 암 세포 유형이 상기 암 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 암 세포 라인 또는 세포 유형일 수 있다.

일 실시예에서, 상기 암 세포들은 모두 동일한 유형, 예를 들어, 모두 유방암 세포이지만, 세포 라인들은 예를 들어, 다르게 수립된 유방암의 세포 라인과 같이, 다르게 수립된 암세포 라인이다.

상기 암 모델에 포함될 수 있는 암 세포 유형의 예는 폐암, 유방암, 전립선암, 흑색종, 비늘형의 세포암종, 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광 암, 신장 암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종을 포함하나 이에 한정되지는 않는다. 일 실시예에서, 약제 저항 암 세포가 상기 암 모델에 포함될 수 있다. 암 모델에 포함될 수 있는 세포 라인의 특정 예는 PaCa2, HepG2, PC3 및 MCF7 세포를 포함하나 이에 한정되지는 않는다. 다수의 암 세포 라인들이 해당 분야에서 알려져 있으며, 이러한 암 세포 라인이 본 발명의 암 모델에 포함될 수 있다.

본 발명의 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 또는 교란되지 않은 암 세포이다. 또 다른 실시예에서, “제어 세포”는 정상의, 암에 걸리지 않은 세포일 수 있다. 다수의 정상의, 암에 걸리지 않은 세포 라인 중 어느 하나가 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 상기 정상 세포는 하나 또는 그 이상의 THLE2 및 HDFa 세포이다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 정상 세포 유형이 상기 암 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 정상 세포 라인 또는 세포 유형일 수 있다. 일 실시예에서, 상기 정상 세포는 모두 동일한 유형, 예를 들어, 모두 건강한 상피의 또는 유방 세포이거나, 다르게 수립된 세포 라인, 예를 들어, 다르게 수립된 상피의 또는 유방 세포의 세포 라인일 수 있다. 일 실시예에서, 제어로서, 하나 또는 그 이상의 정상적인 비 암 세포 라인(예를 들어, THLE2 및 HDFa)들이 암에 고유한 단백질 또는 경로를 식별하기 위해 비슷한 조건 하에서 배양될 수 있고, 또한/또는 세포 모델의 암 세포와 동일한 교란에 노출될 수 있다.

필요에 따라 구축된 암 모델은 또한 암적 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 포함할 수 있다. 예를 들어, 암 세포의 서로 다른 성장 조건들을 분리해 냄으로써 세포 배양 조건을 종양 환경 생체 내 암 세포의 조건을 매우 가깝게 근사하거나, 암 성장의 여러 측면을 모방하도록 선택할 수 있다. 일부 경우에 상기 세포 배양 조건은 스트레스 조건일 수 있다.

이러한 암 “환경”, 또는 스트레스 조건 중 하나는 저산소 상태로서, 고형 종양에서 일반적으로 발견되는 조건이다. 저산소 상태는 세포 내에서 해당 분야에 알려진 방법을 사용하여 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO₂, 2% O₂ 및 93% 질소를 포함하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 효과는 소정의 시간 이후, 예를 들어, 저산소 상태 치료 후 24시간 이후에, 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 측정될 수 있다.

마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 높은 활성의 해당 과정을 가지는 세포 환경을 모방한다. 젖산 유도 스트레스는 약 12.5 mM의 최종 젖산 농도에서 소정의 시간, 예를 들어, 24시간에 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 검사될 수 있다.

고혈당증은 보통 당뇨에서 발견되는 조건이다; 그러나, 많은 암 세포들이 자신들의 주요 에너지 원으로서 글루코스에 의존하기 때문에 고혈당증은 또한 어느 정도 암 성장의 한 측면을 모방한다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 등급 글루코스를 적절한 매체에 추가하는 것을 포함할 수 있다.

암 성장의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 암 모델에서 별도로 조사되고, 또한/또는 함께 조합되어 조사될 수 있다. 일 실시예에서, 서로 다른 측면의 암 성장 / 조건을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 일 실시예에서, 서로 다른 측면의 암 성장 / 조건을 반영하거나 모의하는 개별적 조건들 및, 이에 추가하여, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 앞의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10와 50 사이의 서로 다른 조건일 수 있다.

일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란” 이 상기 시스템에 적용될 수 있다. 도 15D를 참조한다. 이러한 교란이 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.

예시적 실험에서, 환경적 교란, 특히 코엔자임 Q10에 의한 치료가 존재하거나 존재하지 않는 상황에서, 암 라인 PaCa2, HepG2, PC3과 MCF7, 및 정상 세포 라인 THLE2과 HDFa는 각 고혈당증, 저산소 상태, 및 젖산 풍부 조건 및, 세 조건 중 둘 또는 셋의 조합의 조건을 겪게 된다. 본 명세서의 이하에서는 교란, 코엔자임 Q10 치료가 존재하거나 존재하지 않는 상황에서의 이러한 조건들의 예시적 조합이 열거되며, 이들은 암 세포 모델의 암 세포 및/또는 제어(예를 들어, 정상) 세포를 치료하는데 사용될 수 있다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합이 쉽게 형성될 수 있다.

1. 매체만 존재

2. 50 μM CTL 코엔자임 Q10

3. 100 μM CTL 코엔자임 Q10

4. 12.5 mM 젖산

5. 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10

6. 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10

7. 저산소 상태

8. 저산소 상태 + 50 μM CTL 코엔자임 Q10

9. 저산소 상태 + 100 μM CTL 코엔자임 Q10

10. 저산소 상태 + 12.5 mM 젖산

11. 저산소 상태 + 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10

12. 저산소 상태 + 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10

13. 매체 + 22 mM 글루코스

14. 50 μM CTL 코엔자임 Q10 + 22 mM 글루코스

15. 100 μM CTL 코엔자임 Q10 + 22 mM 글루코스

16. 12.5 mM 젖산 + 22 mM 글루코스

17. 12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10

18. 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10

19. 저산소 상태 + 22 mM 글루코스

20. 저산소 상태 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10

21. 저산소 상태 + 22 mM 글루코스 + 100 μM CTL 코엔자임 Q10

22. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스

특정한 상황에서, 서로 다른 암 세포들(예를 들어, HepG2 및 PaCa2) 사이의 상호 대화 또는 ECS 실험은 다양한 상호 연관된 목적을 위해 수행될 수 있다. 상호 대화를 포함하는 일부 실시예에서, 세포 모델에 대해 수행된 실험들은 특정 세포 시스템 또는 군집(예를 들어, 간암종 세포 HepG2)의 세포의 상태 또는 기능에 대한 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태(국소 빈혈)) 하의 또 다른 세포 시스템 또는 군집 (예를 들어, 췌장 관련 암 PaCa2)에 의한 조절을 결정하도록 설계되었다. 일반적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자 (예를 들어, 소형 약 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고 글루코스 환경)과 같은 외부 자극 성분과 접촉된다. 반응에서, 제 1 세포 시스템 / 군집은그 전사체, 단백질체, 대사체, 및/또는 상호작용체를 변화시키며, 세포의 내부와 외부 모두에서 쉽게 탐지될 수 있는 변화에 이르게 된다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNAs의 전사 수준에 의해 측정될 수 있고, 단백질체에서의 변화 다수의 타겟 단백질들의 발현 수준에 의해 측정될 수 있으며, 대사체에서의 변화는 특히 주어진 대사 물질에 대해 설계된 분석에 의해 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서 최소한 특정한 분비 대사 물질 또는 단백질에 대한 위의 기준적 변화 또한 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호 작용체의 조절을 포함하여 이들이 제 2 세포 시스템 / 군집에 미치는 영향에 의해 측정될 수 있다. 따라서, 상기 실험은 제 1 세포 시스템 / 군집에 의해 분비된 관심 있는 분자(들)가 서로 다른 치료 조건 하의 제 2 세포 시스템 / 군집에 미치는 영향을 식별하기 위해 사용될 수 있다. 상기 실험은 또한 제 1 세포 시스템(외부 자극 성분 치료에 대한 반응으로)으로부터 또 다른 세포 시스템으로의, 예를 들어, 단백질체학의 분별 선별에 의한 신호 전달의 결과로 조절되는 어느 하나의 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 반대의 설정에 적응되어, 두 세포 시스템 사이의 상호 효과 또한 분석되도록 할 수도 있다. 이러한 유형의 실험에 있어서, 일반적으로 세포 라인의 쌍은 근원, 질병 상태 및 세포의 기능과 같은 요소에 크게 좌우된다.

2-세포 시스템이 이러한 유형의 실험 설정에 일반적으로 포함되기는 하지만, 둘 이상의 세포 시스템에 대해서도, 예를 들어, 각각의 분리된 세포 시스템을 별도의 고체 지지체에 고정시킴으로써 유사한 실험을 설계할 수 있다.

상기 필요에 따라 구축된 암 모델은 본 명세서에서 기술된 단계들을 수행함으로써 본 발명의 플랫폼 기술의 전 단계에 걸쳐 생물학적 시스템에 고유한 인과 관계를 궁극적으로 식별하기 위해 수립되거나 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자라면, 초기의 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 암 모델이, 예를 들어, 추가적인 암 또는 정상 세포 라인 및/또는 추가적인 암 조건의 도입에 의해 시간이 지남에 따라 “지속적으로 진화 또는 확장할 수 있다”는 것을 인식할 수 있을 것이다. 진화한 암 모델로부터의 추가적인 데이터, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 암 모델, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 암 상태(또는 암 상태의 교란에 대한 반응에 고유한)에 고유한 새로운 인과 관계는 이 후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 암 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 암 상태의 결정론적 추진 인자 (또는 조절 인자)로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다.

(iii) 당뇨/비만/심장병 세포 모델

생물학적 시스템 또는 과정의 다른 예는 당뇨, 비만 및 심장병이다. 암과 마찬가지로, 당뇨, 비만 및 심장병과 관련된 질병 상태는 다중의 특이한 측면으로 특징지워지는 복잡한 병리학적 조건을 가진다. 당뇨/비만/ 심장병의 발병을 추진하는 단백질/경로가 관심사일 수 있다. 정상 세포의 반응과 비교하여 당뇨/비만/심장병의 약제 치료와 관련된 세포의 고유한 반응을 판독하는 것이 관심사일 수도 있다. 이러한 목적을 위해, 적절한 세포 라인을 선택하고 및 질병 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 생성함으로써 질병 관련 세포가 경험하는 환경을 모의하기 위한 필요에 따라 구축된 당뇨/비만/심장혈관 모델이 수립될 수 있다. 예를 들어, 고혈당증, 고지혈증, 고인슐린증, 저산소 상태 또는 젖산이 풍부한 조건을 매우 가까이 근사하는 세포 배양 조건이 선택될 수 있다.

당뇨/비만/심장병과 관련된 어떠한 세포도 당뇨/비만/심장병 모델에 포함될 수 있다. 당뇨/비만/심장병과 관련된 세포의 예는, 예를 들어, 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC) 및 기부 관상 세포(예를 들어, HK2)를 포함한다. 단일 세포 유형과는 달리, 같거나 다른 근원의 다중 세포 유형이 당뇨/비만/심장병 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 세포 유형들이 상기 당뇨/비만/심장병 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 세포의 세포 유형일 수 있다. 일 실시예에서, 상기 세포들은 모두 동일한 유형, 예를 들어, 모두 지방 세포이지만, 세포 라인들은 예를 들어, 다르게 수립된 지방 세포의 세포 라인과 같이, 다르게 수립된 지방 세포의 세포 라인이다. 당뇨/비만/심장병 상태와 관련되는 다수의 다른 세포 유형이 해당 분야에서 알려져 있으며, 이러한 어떠한 세포도 본 발명의 당뇨/비만/심장병 모델에 포함될 수 있다.

본 발명의 당뇨/비만/심장병 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 또는 교란되지 않은 질병 관련 세포, 예를 들어, 고지질증 또는 고인슐린증 조건에 노출된 세포이다. 또 다른 실시예에서, “제어 세포”는 상피 세포와 같은 질병과 관련되지 않은 세포일 수 있다. 다수의 질병과 관련되지 않은 세포 중 어느 하나가 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 질병에 관련되지 않은 세포 유형이 세포 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 질병에 관련되지 않은 세포 라인 또는 세포 유형일 수 있다. 일 실시예에서, 상기 질병에 관련되지 않은 세포는, 예를 들어, 모두 건강한 상피의 또는 유방 세포와 같이 모두 같은 유형이지만, 다르게 수립된 세포 라인, 예를 들어, 다르게 수립된 상피의 또는 유방 세포의 세포 라인일 수 있다. 일 실시예에서, 당뇨/비만/심장병에 고유한 단백질 또는 경로를 식별하기 위해 하나 또는 그 이상의 질병과 관련되지 않은 세포 라인들이 제어로서 유사한 조건 하에서 배양되고, 또한/또는 세포 모델의 질병과 관련된 세포와 동일한 교란에 노출된다.

필요에 따라 구축된 당뇨/비만/심장병 모델은 또한 당뇨/비만/심장병의 상태 또는 과정의 (이의 생리병리학을 나타내는) 특징적 측면을 모방하는 세포 배양 조건을 포함할 수 있다. 예를 들어, 세포 배양 조건을 환경 생체 내 당뇨/비만/심장병과 관련된 세포의 조건을 매우 가깝게 근사하거나, 당뇨/비만/심장병의 여러 측면을 모방하도록 선택할 수 있다. 일부 경우에 상기 세포 배양 조건은 스트레스 조건일 수 있다.

당뇨/ 비만/ 심장병의 생리병리학을 나타내는 예시적 조건은, 예를 들어, 어느 하나 또는 그 이상의 저산소 상태, 젖산 풍부 조건, 고혈당증, 고 리미드 증세 및 고인슐린증을 포함한다. 저산소 상태는 세포 내에서 해당 분야에 알려진 방법을 사용하여 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO₂, 2% O₂ 및 93% 질소를 포함하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 효과는 소정의 시간 이후, 예를 들어, 저산소 상태 치료 후 24시간 이후에, 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 측정될 수 있다.

마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 방식의 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 소정의 시간, 예를 들어, 24 시간에서 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비 존재 하에서 약 12.5 mM의 최종 젖산 농도로 조사될 수 있다. 고혈당증은 당뇨에서 발견되는 조건이다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 급 글루코스를 적절한 매체에 추가하는 것을 포함할 수 있다. 고지혈증은 비만 및 심장병에서 발견되는 조건이다. 이러한 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 함유하는 매체 내에서 배양함으로써 제공될 수 있다. 고인슐린증은 당뇨에서 발견되는 조건이다. 이러한 고인슐린증 조건 세포를 1000 nM 인슐린을 함유하는 매체에서 배양함으로써 유도될 수 있다.

당뇨/ 비만/ 심장병의 생리병리학을 나타내는 추가적 조건은, 예를 들어, 하나 또는 그 이상의 감염, 소포체 스트레스, 미토콘드리아의 스트레스 및 퍼옥시즘 스트레스이다. 세포 내의 감염과 유사한 조건을 생성하는 방법은 해당 분야에서 알려져 있다. 예를 들어, 감염 조건은 세포를 TNF알파 및/또는 IL-6의 존재 하에서 배양함으로써 모의될 수 있다. 소포체 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 소포체 스트레스를 모의하는 조건은 세포를 탭시가긴 및/또는 트니카미신의 존재 하에서 배양함으로써 생성될 수 있다. 미토콘드리아의 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 미토콘드리아의 스트레스를 모의하는 조건은 세포를 라파미신 및/또는 갈락토제의 존재 하에 배양함으로써 생성될 수 있다. 퍼옥시즘 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 퍼옥시즘 스트레스를 모의하는 조건은 세포를 낙엽산의 존재 하에 배양함으로써 생성될 수 있다.

당뇨/비만/심장병의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 별도로 조사되고, 또한/또는 함께 조합되어 조사될 수 있다. 일 실시예에서, 서로 다른 측면의 당뇨/비만/심장병을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 조사된다. 일 실시예에서, 서로 다른 측면의 당뇨/비만/심장병을 반영하거나 모의하는 개별적 조건들 및, 이에 추가하여, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 조사된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10와 50 사이의 서로 다른 조건일 수 있다.

일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란” 이 상기 시스템에 적용될 수 있다. 이에 대해 도 15D를 참조한다. 이러한 교란이 당뇨/비만/심장병 관련 세포를 포함하여 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.

예시적 실험에서, 각각의 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC) 및 기부 관상 세포(HK2)는 각각의 고혈당증, 저산소 상태, 고지혈증, 고인슐린증, 및 젖산 풍부 조건과 함께 이들 각 조건의 둘, 셋, 넷 및 다섯 개의 조합의 조건을 겪게 되며, 추가적으로, 환경적 교란의 존재 또는 비 존재 하에서, 코엔자임 Q10로서 특별하게 치료된다. 암 모델과 관련하여 위에서 설명한 조건들의 예시적 조합과 더불어, 본 명세서의 이하 기술에서 일부 추가적인 조건들의 교란의 존재 또는 부존재 하에서의 예시적 조합이 열거되며, 이들은, 예를 들어, 당뇨/비만/심장병 세포 모델의 당뇨/비만/심장병 관련 세포(및/또는 제어 세포)를 치료하기 위해 사용될 수 있는 코엔자임 Q10 치료이다. 이는 단순히 예시적인 목적으로 제시된 것이며, 해당 분야의 통상의 기술자라면 당뇨/ 비만/ 심장병의 생리병리학을 나타내는 상기 언급한 조건들의 개별적 및/또는 조합이 세포 모델에서 출력 데이터 집합을 생성하기 위해 채택될 수 있다는 것을 인식할 수 있을 것이다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합들이 쉽게 형성될 수 있다.

1. 매체만 존재

2. 50 μM CTL 코엔자임 Q10

3. 100 μM CTL 코엔자임 Q10

4. 0.15 mM 나트륨 팔미테이트

5. 0.15 mM 나트륨 팔미테이트 + 50 μM CTL 코엔자임 Q10

6. 0.15 mM 나트륨 팔미테이트 + 100 μM CTL 코엔자임 Q10

7. 1000 nM 인슐린

8. 1000 nM 인슐린 + 50 μM CTL 코엔자임 Q10

9. 1000 nM 인슐린 + 100 μM CTL 코엔자임 Q10

10. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트

11. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트 + 50 μM CTL 코엔자임 Q10

12. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트 + 100 μM CTL 코엔자임 Q10

특정한 상황에서, 서로 다른 질병 관련 세포들(예를 들어, HASMC 및 HK2 세포, 또는 간 세포 및 지방 세포) 사이의 상호 대화 또는 ECS 실험은 다양한 상호 연관된 목적을 위해 수행될 수 있다. 상호 대화를 포함하는 일부 실시예에서, 세포 모델에 대해 수행된 실험들은 특정 세포 시스템 또는 군집(예를 들어, 간 세포)의 세포의 상태 또는 기능에 대한 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태, 고지혈증, 고인슐린증) 하의 또 다른 세포 시스템 또는 군집 (예를 들어, 지방 세포)에 의한 조절을 결정하도록 설계되었다. 일반적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자 (예를 들어, 소형 약 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고 글루코스 환경)과 같은 외부 자극 성분과 접촉된다. 반응에서, 제 1 세포 시스템 / 군집은 그 전사체, 단백질체, 대사체, 및/또는 상호작용체를 변화시키며, 세포의 내부와 외부 모두에서 쉽게 탐지될 수 있는 변화에 이르게 된다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNAs의 전사 수준에 의해 측정될 수 있고, 단백질체에서의 변화 다수의 타겟 단백질들의 발현 수준에 의해 측정될 수 있으며, 대사체에서의 변화는 특히 주어진 대사 물질에 대해 설계된 분석에 의해 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서 최소한 특정한 분비 대사 물질 또는 단백질에 대한 위의 기준적 변화 또한 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호 작용체의 조절을 포함하여 이들이 제 2 세포 시스템 / 군집에 미치는 영향에 의해 측정될 수 있다. 따라서, 상기 실험은 제 1 세포 시스템 / 군집에 의해 분비된 관심있는 분자(들)가 서로 다른 치료 조건 하의 제 2 세포 시스템 / 군집에 미치는 영향을 식별하기 위해 사용될 수 있다. 상기 실험은 또한 제 1 세포 시스템(외부 자극 성분 치료에 대한 반응으로)으로부터 또 다른 세포 시스템으로의, 예를 들어, 단백질체학의분별 선별에 의한 신호 전달의 결과로 조절되는 어느 하나의 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 반대의 설정에 적응되어, 두 세포 시스템 사이의 상호 효과 또한 분석되도록 할 수도 있다. 이러한 유형의 실험에 있어서, 일반적으로 세포 라인의 쌍은 근원, 질병 상태 및 세포의 기능과 같은 요소에 크게 좌우된다.

상기 필요에 따라 구축된 당뇨/비만/심장병 모델은 본 명세서에서 기술된 단계들을 수행함으로써 본 발명의 플랫폼 기술의 전 단계에 걸쳐 당뇨/비만/심장병 상태에 고유한 인과 관계를 궁극적으로 식별하기 위해 수립되거나 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자라면, 암 모델과 마찬가지로, 초기의 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 당뇨/비만/심장병 모델이, 예를 들어, 추가적인 질병 관련 세포 라인 및/또는 추가적인 질병 관련 조건의 도입에 의해 시간이 지남에 따라 “지속적으로 진화 또는 확장할 수 있다”는 것을 인식할 수 있을 것이다. 진화한당뇨/비만/심장병 모델로부터의 추가적인 데이터, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 암 모델, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 당뇨/비만/심장병 상태(또는 당뇨/비만/심장병 상태의 교란에 대한 반응에 고유한)에 고유한 새로운 인과 관계는 이후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 당뇨/비만/심장병 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 당뇨/비만/심장병 상태의 결정론적 추진 인자(또는 조절 인자)로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다.

B. 조사적 생물학적 평가를 위한 세포 모델의 사용

본 발명에서 제공되는 방법 및 세포 모델은 임의의 개수의 “조사적 생물학적 평가”를 위해 사용되거나 이에 적용될 수 있다. 조사적 생물학적 평가를 의한 본 발명의 방법의 사용은 생물학적 시스템의 “조절 인자” 또는 결정론적 세포 과정 “추진 인자”의 식별을 빠르게 수행하도록 해 준다.

본 명세서에서 사용되는, “조사적 생물학적 평가”는 생물학적 시스템의 하나 또는 그 이상의 조절 인자, 예를 들어, 환경적 교란 또는 외부 자극 성분과 연관된 결정론적 세포 과정 “추진 인자”(예를 들어, 생물학적 경로, 또는 경로의 핵심 멤버, 또는 경로의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소), 또는 생물학적 시스템 또는 과정에 고유한 특유 인과 관계의 식별을 포함한다. 이는 상기 식별된 결정론적 세포 과정 추진 인자가 생체 내 동물 모델 및/또는 생체 외 조직 배양 실험을 포함하는 환경적 교란 또는 외부 자극 성분과 연관된 하향 이벤트에 필요하고, 또한/또는 충분한 지를 검사하거나 증명하기 위해 설계된 추가적 단계를 더 포함할 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 진단 또는 단계 파악이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 치료적 시술을 받을 수 있는 질병 표지 인자 또는 치료적 타겟을 나타낸다. 상기 대상의 조사적 생물학적 평가는 이론적으로는 어떠한 질병 조건에도 적절하지만, 종양학 / 암 생물학, 당뇨, 비만, 심장병, 및 신경학적 조건(특히 한정됨이 없이 알츠하이머 질병, 파킨슨 씨 병, 헌팅턴 질병, 루게릭 병(ALS), 및 노화 관련 신경 퇴행성 질환과 같은 퇴행성 신경 질병)과 같은 영역에서 특히 유용한 것으로 밝혀질 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능의 결정이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자 (예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 성공적인 약제의 전형적 특징이며, 다시 MIM 또는 에피시프터(epishifter)와 같은 동일한 질병 조건을 치료하기 위한 추가적 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 감염(예를 들어, 박테리아 또는 바이러스 감염)을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 감염 상태를 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 다시 항 감염 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 주어진 질병 프로필에서 제제, 예를 들어, 약제의 분자에 대한 효과에 대한 평가이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 하나 또는 그 이상의 생물학적 경로, 또는 경로(들)의 핵심 멤버, 또는 경로(들)의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소일 수 있으며, 또한, 예를 들어, 주어진 질병에 대한 제제의 치료적 효능을 예측하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 제제, 예를 들어, 약제의 세포, 조직, 기관 또는 기관계에 대한 독성의 프로필의 평가이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 독성, 예를 들어, 세포 독성의 지표이며, 다시 제제의 독성의 프로필을 예측하거나 식별하기 위해 사용될 수 있다. 일 실시예에서, 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 약제 또는 약제 후보의 심장 독성의 지표일 수 있으며, 이는 다시 약제 또는 약제 후보의 심장 독성 프로필을 예측하거나 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 질병 야기 원생동물, 균류, 박테리아, 대항체, 바이러스, 또는 독소와 같은 생물학적 무기에 의해 야기되는 질병 또는 질환을 예방하거나 치료하기 이한 제약 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 상기 질병 또는 질환을 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 이는 다시 생물학적 방어 제제를 식별하기 위해 사용될 수 있다.

특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품과 같은 노화 방지 제제의 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 상기 노화 과정, 특히 피부에서의 노화 과정의 표지 인자 또는 지표일 수 있으며, 이는 다시 노화 방지 제제의 식별을 위해 사용될 수 있다.

노화 방지 화장품에 대한 타겟을 식별하기 위한 본 발명의 방법에서 사용된 하나의 예시적 세포 모델에서, 상기 세포 모델은 노화하는 상피의 세포, 즉, 예를 들어, 자외선 (환경적 교란 또는 외부 자극 성분)으로 처리된 세포, 및/또는 역시 선택적으로 자외선으로 처리된 신생아의 세포를 포함한다. 일 실시예에서, 노화에 대한 세포 모델은 세포 간 상호 대화 시스템을 포함한단. 노화 방지 화장품에 대한 타겟을 식별하기 위해 수립된 한 예시적 2-세포 상호 대화 시스템, 노화하는 상피 세포(제 1 세포 시스템)는 자외선(외부 자극 성분)으로 처리될 수 있으며, 신생아의 세포(제 2 세포 시스템)에서의 변화, 예를 들어, 신생아의 세포를 상기 처리된 노화하는 상피의 세포의 조건이 가해진 매체에 접촉시킨 결과로 발생하는 단백질체의 변화 및/또는 기능적 변화가 측정될 수 있으며, 이때, 예를 들어, 단백질체 변화는 통상의 정량적 질량 분광학을 사용하여 측정될 수 있거나, 노화에 고유한 인과 관계는 데이터로부터 생성된 인과 관계 네트워크로부터 식별될 수 있다.

V. 단백체 표본 분석

특정 실시예에서, 본 발명의 방법은 유사한 성격의 수 백개의 표본의 대규모의 고 성능 출력 정량적 단백질체의 분석을 채택하며, 세포의 출력 분별을 식별하기 위해 필요한 데이터를 제공한다.

이러한 목적으로 사용하기에 적절한 기술들이 해당 분야에서 다수 인식되고 있다. 예시적 기술로서, 질량 분광학을 사용한 조합에서의 iTRAQ 분석이 이하에서 간단히 설명된다.

iTRAQ 기술을 사용한 상대적 정량화의 기준 표본을 제공하기 위해, 다중 QC 풀이 생성된다. 각 표본의 부분 표본으로 구성되는 두 개의 분리된 QC 풀이, 각각 QCS1 및 QCS2로 표기되는 세포 #1 및 세포 #2 표본 및 상층액 및 펠릿에 대한 각각의 QCP1 및 QCP2 으로부터 생성된다. 두 세포 라인에 걸친 단백질 농도 비교를 가능하게 하기 위해, 상기 기술된 QC 풀로부터의 세포 펠릿 부분 표본이 동일한 부피로 결합되어 기준 표본(QCP)을 생성한다.

정량적 단백체 접근 방법은 8-plex iTRAQ 반응 제제를 사용하는 안정된 동위원소 라벨링 및 펩티드 식별 및 정량화를 위한 2D-LC MALDI MS/MS에 기반한다. 이러한 기술을 사용한 정량화는 상대적이다: 펩티드 및 단백질은 기준 표본에 상대적인 존재 비율이 지정된다. 다중 iTRAQ 실험에서의 공통된 기준 표본이 다중 iTRAQ 실험에 걸쳐 표본의 비교를 쉽게 수행할 수 있도록 해준다.

이러한 분석 방법 체제를 구현하기 위해, 여섯 개의 주요 표본 및 두 개의 제어 풀 표본이 하나의 8-plex iTRAQ 혼합물로 결합되며, 이때 상기 제어 풀 표본은 제조사의 제시에 따라 113 및 117 반응 제제로 라벨링된다. 이러한 여덟 개 표본의 혼합물은 이후 다음과 같은 이차원 액체 크로마토그래피에 의해 분별된다; 제 1 차원에서의 강한 양이온 교환 (SCX), 및 제 2 차원에서의 역위상 HPLC. 상기 HPLC 용해 분리물은 MALDI 플레이트 상에서 직접적으로 구분되며, 상기 플레이트는 MDS SCIEX/AB 4800 MALDI TOF/TOF 질량 분광계 상에서 분석된다.

추가적인 정보가 부재한 상황에서, 단백질 발현에서 가장 중요한 변화는 다른 치료 조건 하에서 동일한 세포 유형의 변화인 것으로 가정한다. 이러한 이유로, 세포#1 및 세포#2로부터의 주요 표본들은 별도의 iTRAQ 혼합물에서 분석된다. 세포#1 대 세포#2 표본 내에서의 단백질 발현의 비교를 보다 쉽게 하기 위해, 보편적 QCP 표본이 주요 표본 또는 세포 라인 특정 QC 표본(QC1 및 QC2)에 의해 점유되지 않는 가용한 “iTRAQ 슬롯”에서 분석된다.

채택된 실험실 절차가 아래에서 간단히 검토된다.

A. 세포 상층액 표본으로부터의 단백질 추출

세포 상층액 표본(CSN)에 대해, 배양 매체로부터의 단백질이 매우 과량으로 배양된 세포에서 분비된 단백질 상에 존재한다. 이러한 배경을 감소시키기 위한 시도로서, 전면에 존재하는 단백질의 고갈이 구현된다. 특정한 친화성 기둥이 소과 또는 말의 혈청 단백질에 대해서는 사용할 수 없기 때문에, 항인간 IgY14 기둥이 사용되었다. 항체가 인간 단백질에 대해 가해지는 동안, 항체의 다중 복제성 특성에 의해 제공되는 광범위한 특정성이 사용된 세포 배양 매체 내에 존재하는 소 및 말의 단백질의 고갈을 성취할 것으로 예상된다.

CSN QC 물질의 200-μl 부분 표본이 뒤따르는 물질에서의 전체 단백질 농도를 결정하기 위한 연구(바이신코닉 산(BCA) 분석)를 시작하기 전에 10-mL IgY14 고갈 기둥 상에 적재된다. 이후 적절한 양의 40 μg 전체 단백질을 함유하는 고갈 부분을 성취하기 위해 적재 부피가 선택된다.

B . 세포 펠릿으로부터의 단백질 추출

세포 #1 및 세포 #2의 부분 표본이 BGM에서의 조직 표본의 분석에 사용되는 “표준” 용균 버퍼 내에 용해되고, 전체 단백질 내용물이 BCA 분석에 의해 결정된다. 이들 대표적인 세포 용해물의 단백질 내용들이 확립되면, 모든 세포 펠릿 표본(제 1.1절에서 기술된 QC 표본을 포함)들이 세포 용해물로 처리된다. 약 40 μg의 전체 단백질 양의 용해물이 과정의 작업 절차에서 흐르게 된다.

C . 질량 분광학을 위한 표본 준비

표본 준비는 표준 작업 절차를 따르며 다음과 같이 구성된다:

단백질의 환원 및 알킬화

역 위상 컬럼에서의 단백질 세척(세포 펠릿에만 적용)

트립신에 의한 소화

iTRAQ 라벨링

강한 양이온 교환 크로마토그래피 - 여섯 부분의 수집(아질란트(Agilent) 1200 시스템)

HPLC 분별 및 MALDI 플레이트의 위치 식별(Dionex Ultimate3000/Probot 시스템)

D. MALDI MS 및 MS / MS

HPLC-MS는 일반적으로 온라인 ESI MS/MS 전략을 채택한다. BG 의약품은 동일한 표본을 여러 번 주입할 필요가 없이 결과적으로 주 표본에 걸쳐 관측된 단백질 집합의 보다 나은 일치를 가져올 수 있는 오프라인 LC-MALDI MS/MS 플랫폼을 사용한다. 모든 iTRAQ 혼합물에 걸친 첫 번째 데이터 수집 절차에 이어, 펩티드 부분이 MALDI 타겟 플레이트에 계속 남아 있기 때문에, 상기 표본은 타겟이 맞추어진 제 1 획득에서 얻은 지식으로부터 도출된 MS/MS 획득 패턴을 사용하여 두 번째로 분석될 수 있다. 이러한 방식으로, 식별된 모든 단백질에 대한 최대 관찰 빈도를 성취할 수 있다(이상적으로, 모든 단백질은 모든 iTRAQ 혼합에서 측정되어야 한다).

E. 데이터 처리

BGM 단백질체학 작업 흐름 내에서의 데이터 처리 과정은 각각의 iTRAQ 혼합에 대해 개별적으로 완수되는 예비 펩티드 식별 및 정량화와 같은 절차(제 1.5.1절) 및 프로젝트를 위한 데이터 획득이 완료될 때까지는 완수되지 않는 단백질에 대한 펩티드의 최종 지정 및 단백질의 최종 정량화와 같은 과정(제 1.5.2절)으로 나누어질 수 있다.

BGM 단백질체학 내에서의 주요 데이터 처리 단계는 다음과 같다:

마스코트(매트릭스 과학) 데이터베이스 탐색 엔진을 사용한 펩티드 식별

자동화된 실험실 내 마스코트 ID 증명

펩티드의 정량화 및 단백질의 사전 정량화

최종 데이터 집합의 전문가 큐레이션

자동화된 PVT 도구를 사용한 각 혼합물로부터 공통된 집합의 단백질로의 펩티드의 최종 지정

극단치 제거 및 단백질의 최종 정량화

(i) 개별적 iTRAQ혼합물의 데이터 처리

각각의 iTRAQ 혼합물이 작업 흐름을 통해 처리됨에 따라 MS/MS 스펙트럼이 정량화 정보의 초기 평가와 함께 펩티드 및 단백질 식별을 위한 특정회사의 BGM 소프트웨어 도구를 사용하여 분석된다. 이러한 사전 분석 결과를 바탕으로, 혼합물 내 각 주요 표본에 대한 작업 흐름의 질이 BGM 성능 척도에 대해 결정된다. 주어진 표본 (또는 혼합물)이 특정한 최소 척도를 통과하지 못하고 추가적인 물질을 사용할 수 있는 경우, 해당 표본은 전체적으로 반복 수행되며 이러한 작업 흐름의 2차적 수행에서 얻은 데이터가 최종 데이터 집합에 통합된다.

(ii) 펩티드 식별

MS/MS 스펙트럼이 돼지의 트립신과 같은 통상의 오염 염기서열을 사옹하여 증폭된 인간, 소과 동물 및 말의 염기서열을 포함하는 유니프롯(Uniprot) 단백질 염기서열 데이터베이스에 대해 탐색된다. 마스코트 탐색 매개변수의 상세 사항은, 수정의 완전한 목록을 포함하여, 표 3에서 주어진다.

표 3 : 마스코트 검색 매개변수

전구체 질량 허용치	100 ppm
파편 질량 허용치	0.4 Da
변수 수정	N-항 iTRAQ8 라이신 iTRAQ8 시스 카르바미도메틸 파이로-글루 (N-항) 파이로-카르바미도 메틸 시스(N-항) 탈아미드화(N에 한함) 산화(M)
효소 특정성	완전한 트립신
허용되는 소실된 트립신 부위의 개수	2
고려되는 펩티드 순위	1

마스코트 탐색이 완료된 이후, 자동 증명 절차가 특정한 마스코트 펩티드 합치를 촉진(즉, 증명)하기 위해 사용된다. 타당한 합치와 타당하지 않은 합치 사이의 구분은 예상된 마스코트 스코어에 상대적인 성취한 마스코트 스코어 및 랭크 1 펩티드와 랭크 2 펩티드 마스코트 스코어 사이의 차이에 기반한다. 펩티드가 iTRAQ 혼합물 내에서 단일 단백질에 합치되는 여러 팹티드 중 하나이거나 상기 펩티드가 이전에 증명된 펩티드의 카탈로그 내에 존재하는 경우, 증명에 필요한 기준은 다소 완화된다.

(iii) 펩티드 및 단백질 정량화

각 혼합물에 대한 증명된 펩티드들의 집합은 각 혼합물에 대해 사전 단백질 정량화 척도를 계산하기 위해 활용된다. 펩티드 비율은 증명된 각 펩티드에 대한 iTRAQ 라벨(즉, m/z 114, 115, 116, 118, 119, 또는 121)로부터의 피크 영역을 기준 풀(QC1 또는 QC2)의 피크 영역의 최선의 표현으로 나눔으로써 계산된다. 이러한 피크 영역은 양 표본 과정 QC 허용 기준에 의해 제공되는 113 및 117 피크의 평균이다. 사전 단백질 비율은 해당 단백질에 합치하는 모든 “유용한” 증명된 펩티드의 중간 비율을 계산함으로써 결정된다. “유용한” 펩티드는 완전하게 iTRAQ 라벨링되며(모든 N-단말이 라이신 또는 파이로글루(PyroGlu)로 라벨링됨) 완전하게 시스테인 라벨링된다(즉, 모든 Cys 잔여부가 카바미도 메틸 또는 N-단말 Pyro-cmc로써 알킬화된다).

(iv) 획득 후 처리

MS/MS 데이터 획득의 모든 일단의 절차가 프로젝트 내의 각 혼합물에 대해 완료되면, 상기 데이터는 각각의 주 표본으로부터의 결과들이 서로 간단하고 의미있게 비교되도록 하기 위한 목적을 가지는 하기 논의되는 세 단계를 사용하여 수집, 분석된다.

(v) 펩티드 염기 서열의 단백질로의 전역 지정

펩티드 염기서열을 단백질 접근 번호에 최종적으로 지정하는 것은 특정 회사의 단백질 증명 도구(PVT)로써 수행된다. 상기 PVT 절차는 프로젝트에서 식별된 펩티드의 전체 집합을 기술하기 위한 최소한으로 반복되는 최선의 단백질 집합을 결정한다. 이는 균일한 분류 체계로부터의 데이터를 다루기 위한 자동화된 절차이다.

상층액 실험을 위한 단백질 지정은 데이터베이스 내 혼합된 독성의 복잡함을 처리하기 위해 수동으로 조절된다. 자동화된 패러다임이 소와 말의 혈청 대체 매체에서 성장한 세포 배양에 대해서는 타당하지 않기 때문에, 주어진 단백질의 소스의 애매함을 최소화하기 위해 보다 광범위한 수동 조절이 필요하다.

(vi) 펩티드 비율의 정규화

각 표본에 대한 펩티드 비율은 반데좀펠(Vandesompele) 외, 게놈 생물학, 2002, 3(7), 연구 0034.1-11의 방법을 기반으로 정규화된다. 이 절차는 세포 펠릿 측정에만 적용된다. 상층액 표본에 대해서는, 매체로부터 유래하는 펩티드 식별에 대한 가장 큰 기여를 고려하여 정량적 데이터가 정규화되지 않는다.

(vii) 단백질 비율의 최종 계산

표준 통계적 극단치 제거 절차가 로그 변환 데이터 집합에서 1.96 σ 수준을 초과하는 각 단백질 매체 비율 근처로부터의 극단치를 제거하기 위해 사용된다. 이러한 제거 과정에 이어, 단백질 비율의 최종 집합이 (재)계산된다.

VI . 본 발명의 표지 인자 및 그 이용

본 발명은, 최소한 부분적으로는, 질병 과정과 같은 생물학적 시스템, 또는 치료용 제제와 같은 교란에 대한 생물학적 시스템의 반응과 관련된 신규의 생물학적 표지 인자의 식별에 기반한 것이다.

특히, 본 발명은 예에서 설명된 표지 인자(이하, “표지 인자” 또는 “본 발명의 표지 인자”라 한다)에 관한 것이다. 본 발명은 상기 표지 인자에 의해 부호화되거나 이에 해당하는 핵산 및 단백질(이하, 각각 “표지 인자 핵산” 및 “표지 인자 단백질”이라 한다)을 제공한다. 이러한 표지 인자들은 질병 상태를 진단하고, 질병 상태를 예단하며, 다양한 질병 상태에 대한 약제 타겟을 개발하고, 독성, 바람직하게는 약제로 유도되는 독성, 예를 들어, 심장 독성의 존재를 선별하며, 독성을 야기하거나 독성을 야기할 위험이 있는 제제를 식별하고, 약제로 유도되는 독성을 경감하고 예방할 수 있는 제제를 식별하며, 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하고, 약제로 유도되는 심장 독성을 예측하는 표지 인자를 식별하는데 특히 유용하다.

"표지 인자"는 정상 또는 건강한 조직 또는 세포 내의 발현 수준으로부터 변경된 조직 또는 세포 내의 발현 수준이 암, 당뇨, 비만, 심장 혈관계 질병, 또는 약제로 유도되는 독성, 예를 들어, 심장 독성과 같은 독성 상태와 같은 질병 상태에 연관되는 유전자이다. “표지 인자 핵산”은 본 발명의 표지 인자에 의해 부호화되거나 해당 표지 인자인 핵산(예를 들어, mRNA, cDNA)이다. 이러한 표지 인자 핵산은 본 발명의 표지 인자인 특정 유전자의 전체 또는 일부의 염기서열, 또는 이러한 염기서열의 보완체를 포함하는 DNA(예를 들어, cDNA)를 포함한다. 이러한 염기서열은 해당 분야의 통상의 기술자에게 알려져 있으며, 예를 들어, NIH 정부 퍼브메드(pubmed) 웹사이트에서 찾아 볼 수 있다. 상기 표지 인자 핵산은 또한 본 발명의 유전자 표지 인자의 전체 또는 일부의 염기서열 또는 이러한 염기서열의 보완체를 포함하는 RNA를 포함하며, 이때 모든 티미딘 잔여부는 우리딘 잔여부로 대체된다. “표지 인자 단백질”은 본 발명의 표지 인자에 의해 부호화된 단백질 또는 이에 해당하는 단백질이다. 표지 인자 단백질은 본 발명의 단백질의 표지 인자의 전체 또는 일부의 염기서열을 포함한다. 이러한 염기서열은 해당 분야의 통상의 기술자에게 알려져 있으며, 예를 들어, NIH 정부 퍼브메드(pubmed) 웹사이트에서 찾아 볼 수 있다. 용어 “단백질” 및 “폴리펩티드"는 교차적으로 사용된다.

“질병 상태 또는 독성 상태 연관" 신체 체액은 환자의 신체 내에 있을 때 육종 세포를 접촉하거나 지나가는 액체, 또는 육종 세포로부터 나온 세포 또는 단백질를 지나갈 수 있는 액체이다. 예시적 질병 상태 또는 독성 상태 연관 신체 체액은 혈액(예를 들어 전체혈액, 혈청, 혈소판이 제거된 혈액)을 포함하며, 아래에서 보다 상세히 설명된다. 질병 상태 또는 독성 상태 연관 신체 체액은 전체혈액, 혈청, 혈소판이 제거된 혈액, 림프, 전립선 액, 소변 및 정액에 한정되지 않는다.

표지 인자의 "정상" 발현 수준은 인간 대상 또는 질병 상태 또는 독성 상태를 겪지 않는 환자의 세포의 표지 인자의 발현 수준이다.

표지 인자의 “과도 발현” 또는 “보다 높은 수준의 발현”은 제어 표본(예를 들어, 질병 상태 또는 독성 상태, 예를 들어, 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성과 연관된 표지 인자를 가지지 않는 건강한 대상으로부터의 표본)내에서 발현 수준, 바람직하게는 여러 제어 표본의 표지 인자들의 평균 발현 수준과 비교하여, 발현을 분석하기 위해 채택된 분석의 표준 오류보다 큰 검사 표본에서의 발현 수준을 말하며, 바람직하게는 최소한 두 배, 보다 바람직하게는 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 배의 발현 수준을 말한다.

표지 인자의 “발현의 저수준”은 제어 표본(예를 들어, 질병 상태 또는 독성 상태, 예를 들어, 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성과 연관된 표지 인자를 가지지 않는 건강한 대상으로부터의 표본)내에서 발현 수준, 바람직하게는 여러 제어 표본의 표지 인자들의 평균 발현 수준과 비교하여, 최소한 두 배, 보다 바람직하게는 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 배 낮은 검사 표본 내 발현 수준을 말한다.

"전사된 폴리뉴클레오타이드" 또는 “뉴클레오타이드 전사체”는 본 발명의 표지 인자 및 정상적 전사 후 처리(예를 들어 이어 맞추기)의 전사, 존재하는 경우, RNA 전사체의 전사, 및 RNA 전사체의 역 전사에 의해 만들어 지는 전부 또는 일부의 성숙한 mRNA와 보완 또는 상동인 폴리뉴클레오타이드 (예를 들어 mRNA, hnRNA, cDNA, 또는 이러한 RNA 또는 cDNA의 유사체)이다.

"보완"은 두 핵산 가닥의 영역 또는 동일한 핵산 가닥의 두 영역 사이의 넓은 개념의 염기서열 보완성을 말한다. 제 1 핵산 영역의 아데닌 잔여부가 제 1 영역과 역으로 평행한 제 2 핵산 영역의 잔여부와, 상기 잔여부가 티민 또는 우라실인 경우, 특정한 수소 결합("기반 페어링")을 형성할 수 있는 것으로 알려져 있다. 마찬가지로, 제 1 핵산 가닥의 사이토신 잔여부가 제 1 가닥과 역으로 평행한 제 2 핵산 가닥의 잔여부와, 상기 잔여부가 구아닌인 경우, 기반 페어링을 할 수 있는 것으로 알려져 있다. 핵산의 제 1 영역은 동일 핵산이나 다른 핵산의 제 2 영역에 대해, 두 영역이 역 평행한 방식으로 배열되었을 때, 제 1 영역의 최소한 하나의 뉴클레오타이드 잔여부가 제 2 영역의 잔여부와 기반 페어링을 할 수 있는 경우, 보완적이다. 바람직하게는, 제 1 영역은 제 1 부분을 포함하고 제 2 영역은 제 2 부분을 포함하며, 이에 의해 제 1 및 제 2 부분이 역으로 평행하게 배열되었을 때, 제 1 부분의 뉴클레오타이드 잔여부의 최소한 약 50%, 바람직하게는 최소한 약 75%, 최소한 약 90%, 또는 최소한 약 95%가 제 2 부분의 뉴클레오타이드 잔여부와 기반 페어링을 할 수 있다. 보다 바람직하게는, 제 1 부분의 모든 뉴클레오타이드 잔여부가 제 2 부분의 뉴클레오타이드 잔여부와 기반 페어링을 할 수 있다.

본 명세서에서 사용되는 "상동"은 동일한 핵산 가닥의 두 영역 사이 또는 두 개의 서로 다른 핵산 가닥의 영역 사이의 뉴클레오타이드 염기서열의 유사성을 말한다. 두 영역 모두에서의 뉴클레오타이드 잔여부 위치가 동일한 뉴클레오타이드 잔여부에 의해 점유되면, 이 영역들은 이 위치에서 상동으로 된다. 두 영역에서 각 위치의 최소한 하나의 뉴클레오타이드 잔여부 위치가 동일한 잔여부에 의해 점유되는 경우, 제 1 영역은 제 2 영역에 상동이다. 두 영역 사이의 상동은 동일한 잔여부에 의해 점유되는 두 영역의 뉴클레오타이드 잔여부 위치의 전반부에 대해 표현된다. 예를 들어 설명하면, 뉴클레오타이드 염기서열 5'-ATTGCC-3'을 가지는 영역과 뉴클레오타이드 염기서열 5'-TATGGC-3'을 가지는 영역은 50%의 상동을 공유한다. 바람직하게는, 제 1 영역은 제 1 부분을 포함하고 제 2 영역의 제 2 부분을 포함하며, 이에 의해 각 부분의 최소한 약 50%, 바람직하게는 최소한 약 75%, 최소한 약 90%, 또는 최소한 약 95%의 뉴클레오타이드 잔여부 위치가 동일한 잔여부에 의해 점유된다. 보다 바람직하게는, 각 부분에서 모든 뉴클레오타이드 잔여부 위치는 동일한 뉴클레오타이드 잔여부에 의해 점유된다.

“본 발명의 단백질”은 표지 인자 단백질 및 이들의 파편; 이형 표지 인자 단백질 및 이들의 파편; 최소한 15 아미노산 세그먼트의 표지 인자 또는 이형 표지 인자 단백질을 포함하는 펩티드 및 폴리펩티드; 및 표지 인자 또는 이형 표지 인자 단백질, 또는 최소한 15 아미노산 세그먼트의 표지 인자 또는 이형 표지 인자 단백질을 포함하는 융합 단백질을 포괄한다.

본 발명은 특히 본 발명의 표지 인자 단백질의 표지 인자 단백질 및 파편에 결합하는 항체, 항체 파생체 및 항체 파편을 더 제공한다. 본 명세서에서 다르게 특정되지 않는 한, 용어 “항체” 및 “항체”는 상기 기술한 모든 파편 및 파생체뿐만 아니라 넓은 범위로 자연적으로 발생하는 형태의 항체(예를 들어, IgG, IgA, IgM, IgE)와 단일 체인 항체와 같은 재조합 항체, 키메릭 및 인간화된 항체 및 다중-특정 항체를 포함하며, 이들 파편 및 파생체는 최소한 하나의 항원적 결합 부위를 가진다. 항체 파생체는 항체와 켤레인 단백질 또는 화학적 성분을 포함할 수 있다.

특정 실시예에서, 본 발명의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, CANX, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된 하나 또는 그 이상의 유전자(또는 단백질)을 포함한다. 일부 실시예에서, 상기 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물, 스물다섯, 설흔 또는 그 이상의 이전 유전자들(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술된 유전자 (또는 단백질)일 수 있다.

일 실시예에서, 본 발명의 표지 인자는 암과 연관되거나 이에 포함된 유전자 또는 단백질이다. 이러한 암에 포함된 유전자 또는 단백질은, 예를 들어, HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및/또는 CANX를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물 또는 그 이상의 이전에 언급한 유전자(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술된 유전자(또는 단백질)일 수 있다.

일 실시예에서, 본 발명의 표지 인자는 약제로 유도되는 독성에 연관되거나 이에 포함된 유전자 또는 단백질을 포함한다. 약제로 유도되는 독성에 포함되는 이러한 유전자 또는 단백질은, 예를 들어, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및/또는 TAZ를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열 개의 상기 언급한 유전자(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술한 유전자(또는 단백질)일 수 있다.

A. 표지 인자와 관련된 심장 독성

본 발명은, 최소한 부분적으로는, 약제로 유도되는 심장 독성과 연관된 신규의 생물학적 표지 인자의 식별에 기반한다. 본 발명은, 최소한 부분적으로는, 코엔자임 Q10가 약제로 유도되는 심장 독성을 경감하거나 예방할 수 있 발견에 더 기반한다.

이에 따라, 본 발명은 독성을 야기하거나 이를 야기할 위험성이 있는 제제를 파악하기 위한 방법을 제공한다. 일 실시예에서, 상기 제제는 약제 또는 약제 후보이다. 일 실시예에서, 상기 독성은 약제로 유도되는 독성, 예를 들어, 심장 독성이다. 일 실시예에서, 상기 제제는 당뇨, 비만 또는 심장혈관 질환을 치료하기 위한 제약 또는 제약 후보이다. 이들 방법에서는, 한 쌍의 표본(약제 치료를 겪지 않은 제 1 표본 및 약제 치료를 겪은 제2 표본) 내에서 하나 또는 그 이상의 생물학적 표지 인자/단백질의 양이 분석된다. 일 실시예에서, 제 1 표본과 비교할 때, 제 2 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 상기 약제가 약제로 유도되는 독성, 예를 들어, 심장 독성을 야기하거나 야기할 위험이 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ으로 이루어지는 군에서 선택된다. 본 발명의 방법은 해당 분야의 통상의 기술자들이 약제로 유도되는 심장 독성을 야기할 위험성이 있는 약제를 식별하기 위해 사용하는 다른 방법과 함께 실시될 수 있다.

이에 따라, 한 측면에서, 본 발명은 약제로 유도되는 독성 (예를 들어, 심장 독성)을 야기하거나 야기할 위험이 있는 약제를 식별하기 위한 방법을 제공하며, 상기 방법은 (i) 약제로 치료하기 이전의 세포 표본에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 (ii) 약제로 치료한 이후 얻어진 제 2 세포 표본에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준과 비교하는 것을 포함하며; 이때 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군으로부터 선택되고; 제 1 표본과 비교하여 제 2 표본 내 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 상기 약제가 약제로 유도되는 독성(예를 들어, 심장 독성)을 야기하거나 야기할 위험이 있음을 나타낸다.

일 실시예에서, 상기 약제로 유도되는 독성은 약제로 유도되는 심장 독성이다. 일 실시예에서, 상기 세포는 심장혈관 시스템의 세포, 예를 들어, 심장근세포이다. 일 실시예에서, 상기 세포는 당뇨성 심장근 세포이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장병 치료를 위한 약제 또는 후보 약제이다.

일 실시예에서, 제 1 표본과 비교할 때, 제 2 표본 내의 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자의 발현 수준에서의 조절(예를 들어, 증가 또는 감소)은 상기 약제가 약제로 유도되는 독성을 야기하거나 야기할 위험이 있음을 나타낸다.

약제로 유도되는 독성을 감소시키거나 예방할 수 있는 제제를 식별하기 위한 방법 또한 본 발명에 의해 제공된다. 일 실시예에서, 상기 약제로 유도되는 독성은 심장 독성이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장혈관 질환을 치료하기 위한 약제 또는 약제 후보이다. 이들 방법에서, 세 표본(약제 치료를 겪지 않은 제 1 표본, 약제 치료를 겪은 제2 표본, 및 약제 치료 및 제제 처리를 모두 겪은 제 3 표본) 내의 하나 또는 그 이상의 생물학적 표지 인자의 양이 분석된다. 제 1 표본과 비교할 때 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자와 거의 같은 발현 수준은 상기 제제가 약제로 유도되는 독성, 예를 들어, 약제로 유도되는 심장 독성을 감소시키거나 예방할 수 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된다.

본 명세서에서 기술된 상기 방법들을 사용하여, 다양한 분자들, 특히 세포막을 통과하기에 충분히 작은 분자들을 포함하는 분자들이 예를 들어, 본 발명의 표지 인자의 발현 및/또는 활성을 증가 또는 감소시키는 등의 조절을 하는 분자들을 식별하기 위해 선별될 수 있다. 이렇게 식별된 화합물은 대상에서의 약제로 유도되는 독성을 감소시키거나, 완화시키거나 예방하기 위해 대상에 제공될 수 있다.

이에 따라, 또 다른 측면에서, 본 발명은 약제로 유도되는 독성을 감소시키거나 예방할 수 있는 제제를 식별하는 방법을 제공하며, 상기 방법은 (i) 독성 유도 약제에 의한 치료 이전에 획득된 제 1 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; (ii) 독성 유도 약제에 의한 치료 이후에 획득된 제 2 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; (iii) 독성 유도 약제 및 제제에 의한 치료 이후에 획득된 제 3 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; 및 (iv) 상기 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 제 1 표본과 비교하는 단계로서; 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 단계를 포함하며; 제 1 표본과 비교하여 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 거의 동일한 발현 수준은 상기 제제가 약제로 유도되는 독성을 감소시키거나 예방할 수 있음을 나타낸다.

일 실시예에서, 상기 약제로 유도되는 독성은 약제로 유도되는 심장 독성이다. 일 실시예에서, 상기 세포는 심장혈관 시스템의 세포, 예를 들어, 심장근 세포이다. 일 실시예에서, 상기 세포는 당뇨성 심장근 세포이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장병 치료를 위한 약제 또는 후보 약제이다.

일 실시예에서, 제 1 표본과 비교할 때, 제 3 표본 내의 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자와 거의 동일한 발현 수준은 상기 약제가 약제로 유도되는 독성을 감소시키거나 예방할 수 있음을 나타낸다.

본 발명은 본 발명의 방법을 필요로 하는 대상에서 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하는 방법을 더 제공하며, 상기 방법은 대상(예를 들어, 포유류, 인간, 또는 인간이 아닌 동물)에 본 명세서에서 제공된 선별 방법에 의해 식별된 제제를 투여하는 단계를 포함하며, 이에 의해 대상에서 약제로 유도되는 심장 독성을 완화하거나 예방한다. 일 실시예에서, 상기 제제는 이미 심장 독성 유도 약제로 치료를 받은 대상에 투여된다. 일 실시예에서, 상기 제제는 심장 독성 유도 약제에 의한 대상의 치료와 동시에 대상에 투여된다. 일 실시예에서, 상기 제제는 심장 독성 유도 약제에 의한 대상의 치료 이전에 대상에게 투여된다.

본 발명은 본 발명의 방법을 필요로 하는 대상에서 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하는 방법을 더 제공하며, 상기 방법은 대상(예를 들어, 포유류, 인간, 또는 인간이 아닌 동물)에 코엔자임 Q10을 투여하는 단계를 포함하며, 이에 의해 대상에서 약제로 유도되는 심장 독성을 완화하거나 예방한다. 일 실시예에서, 상기 코엔자임 Q10은 이미 심장 독성 유도 약제로 치료를 받은 대상에 투여된다. 일 실시예에서, 상기 코엔자임 Q10은 심장 독성 유도 약제에 의한 대상의 치료와 동시에 대상에 투여된다. 일 실시예에서, 상기 코엔자임 Q10은 심장 독성 유도 약제에 의한 대상의 치료 이전에 대상에게 투여된다. 일 실시예에서, 상기 약제로 유도되는 심장 독성은 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어진 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자의 발현의 조절과 연관된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이의 상기 기술한 유전자(또는 단백질)일 수 있다.

본 발명은 예를 들어, 약제로 유도되는 심장 독성과 같은 심장 독성에 대한 예측적 표지 인자로서 유용한 생물학적 표지 인자(예를 들어, 유전자 및/또는 단백질)를 더 제공한다. 이들 생물학적 표지 인자들은 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ를 포함한다. 그러나, 해당 분야의 통상의 기술자라면 본 명세서에 제공된 방법을 채택하여, 예를 들어, 예 3에 기술된 방법을 사용하되 심장 독성을 유도하는 것으로 알려진 다른 약제를 사용하여 약제로 유도되는 심장 독성을 예측할 수 있는 추가적인 생물학적 표지 인자를 인식할 수 있을 것이다. 본 발명의 예시적 약제로 유도되는 심장 독성 생물학적 표지 인자는 아래에서 기술된다.

GRP78 및 GRP75는 글루코스 반응 단백질로도 불린다. 이들 단백질은 심장근세포의 내형질/근소포체 스트레스(ER 스트레스)와 연관되어 있다. SERCA, 또는 내형질근소포체 칼슘 ATP 분해 효소는 심장 세포 내의 Ca2+ 항상성을 조절한다. 이들 ATP 분해 효소에서 교란이 일어나면 심장 기능 이상 및 심장 질환을 일으킬 수 있다. 본 명세서에서 제공된 데이터를 기반으로, GRP75 와 GRP78 및 이들을 둘러싸는 간선들은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들이다.

TIMP1은 TIMP 금속단백질 분해효소 금지 인자 1로도 불리며, MMP와 연관되어 세포 외 기질의 리모델링과 관련된다. TIMP1 발현은 심장의 섬유 형성과 상호 관련되어 있으며, 혈관 내피의 세포의 저산소 상태 또한 TIMP1 발현을 유도한다. 본 명세서에서 제공된 데이터를 기반으로, TIMP1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자이다.

PTX3는 펜트락신 3로도 불리며, C군의 반응성 단백질(CRP)에 속하고, 심장의 감염 조건의 좋은 표지 인자이다. 그러나, 플라스마 PTX3 또한 패혈증 또는 기타 의학적 조건으로 인한 대표적인 체계적 감염 반응을 나타낸다. 본 명세서에서 제공된 데이터를 기반으로, PTX3 심장 기능 또는 심장 독성의 신규의 표지 인자일 수 있다. 또한, 네트워크 내의 PTX 3와 연관된 간선들 또한 생물학적 표지 인자의 신규의 패널을 형성할 수 있다.

HSP76는 HSPA6로도 불리며, 내피의 세포 및 B 림포사이트 내에서 유일하게 발현되는 것으로 알려져 있다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, HSP76은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자일 수 있다.

PDIA4, PDIA1은 단백질 이황화 이성질화 효소 A 군 단백질로도 불리며, GRP와 마찬가지로 ER 스트레스 반응과 관련되어 있다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, 이들 단백질들은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들일 수 있다.

CA2D1는 또한 칼슘 채널, 전압 의존, 알파 2/델타 하위 단위로 불린다. 이 알파-2/델타 소단위의 전위-의존 칼슘 채널은 칼슘 흐름 밀도 및 칼슘 채널의 활성/비활성 동역학을 조절한다. CA2D1은 심장에서의 여기-수축 결합에서 중요한 역할을 한다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, CA2D1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자일 수 있다.

GPAT1은 네 개의 알려진 글리세롤-3-인산염 아실전달 효소 동형 단백질 중 햐나이며, 미토콘드리아의 외막에 위치하여, 카르니틴 팔미토일 전달 효소-1과의 상호 조절을 가능하게 해 준다. GPAT1은 인슐린 및 SREBP-1c에 의해 전사와 관련하여 상방으로 조절되며 AMP-활성 단백질 키나아제에 의해 급격하게 하방으로 조절되어, 트리실글리세롤 합성에서의 역할과 일관성을 유지하게 된다. 본 명세서에서 제공된 데이터를 기반으로, GPAT1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들이다.

TAZ는 타파진으로도 불리며, 심장 및 골격 근육에서 고도로 발현한다. TAZ는 심장 리핀의 대사에 관련되어 있으며 인산지질-라이소인산지질 아실 전달 효소로서 기능한다. 타파진 인산지질 심장리핀(CL)의 리모델링 및 미토콘드리아 내부 막의 신호 지질에 책임이 있다. 본 명세서에서 제공된 데이터를 기반으로, TAZ는 약제로 유도되는 심장 독성의 신규의 예측 인자이다.

B. 표지 인자와 관련된 암

본 발명의 최소한 부분적으로는 암과 관련된 신규의 생물학적 표지 인자의 식별에 기반한다. 이러한 암과 관련된 표지 인자는, 예를 들어, HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및/또는 CANX를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 상기 표지 인자들 중 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물 또는 그 이상의 조합이다.

이에 따라, 본 발명은 암을 유발하거나 암을 유발할 위험이 있는 제제를 식별하기 위한 방법을 제공한다. 일 실시예에서, 상기 제제는 약제 또는 약제 후보이다. 이들 방법에서는, 한 쌍의 표본(약제 치료를 겪지 않은 제 1 표본 및 약제 치료를 겪은 제2 표본) 내에서 하나 또는 그 이상의 생물학적 표지 인자/단백질의 양이 분석된다. 제 1 표본과 비교하여 제 2 표본 내 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 약제가 암을 야기하거나 암을 야기할 위험이 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군에서 선택된다. 본 발명의 방법은 해당 분야의 통상의 기술자들이 암을 야기할 위험성이 있는 약제를 식별하기 위해 사용하는 다른 방법과 함께 실시될 수 있다.

한 측면에서, 본 발명은 대상에서 암을 치료하기 위한 치료의 효능을 분석하는 방법을 제공하며, 상기 방법은 최소한 치료 식이 요법의 일부를 대상에게 시행하기 이전에 얻어진 제 1 표본 내에 존재하며 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군에서 선택되는 하나 또는 그 이상의 표지 인자의 발현 수준을 최소한 치료 식이 요법의 일부를 대상에게 시행한 이후 얻어진 제 2 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 단계를 포함하며, 이때 제 1 표본과 비교하여 제 2 표본에서의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 치료가 대상에 대한 암을 치료하는데 효과적임을 나타낸다.

일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.

또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.

일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.

일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형 이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.

일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.

본 발명은 대상이 암에 걸려 있는지를 분석하는 방법을 제공하며, 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하고, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어진 군으로부터 선택되며; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상이 암에 걸렸는지를 나타내며, 이에 의해 상기 대상이 암에 걸렸는지를 분석한다.

일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다.

일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 대상에서 암이 발병할 지를 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상에서 암이 발병할 것으로 예단되는 것을 나타내며, 이에 의해 상기 대상에서 암이 발병할 것으로 추정되는지를 예단한다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 대상에서 암이 재발할지를 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상에서 암이 재발할 것임을 나타내며, 이에 의해 상기 대상에서 암이 재발할 것을 예단한다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 암이 걸린 대상의 생존을 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상의 생존을 나타내며, 이에 의해 상기 암에 걸린 대상이 생존할 것으로 예단한다..

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 대상에서 암의 진전을 모니터링하기 위한 방법을 더 제공하며, 상기 방법은 최소한 치료 식이 요법의 일부를 대상에게 시행하기 이전에 얻어진 제 1 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 최소한 치료 식이 요법의 일부를 대상에게 시행한 이후 얻어진 제 2 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 단계를 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군으로부터 선택되며, 이에 의해 대상에서의 암의 진전을 모니터링한다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 대상에서 암을 치료하기 위한 화합물을 식별하기 위한 방법을더 제공하며, 상기 방법은 대상으로부터 생물학적 표본을 획득하는 단계; 상기 생물학적 표본을 검사 화합물과 접촉시키는 단계; 및 대상으로부터 획득한 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 단계로서, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어진 군으로부터 긍정적 배수 변화 및/또는 부정적 배수 변화로서 선택되는 단계; 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 적절한 제어 표본과 비교하는 단계; 및 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 부정적 배수 변화로서 감소시키는 검사 화합물 및/또는 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 긍정적 배수 변화로서 증가시키는 검사 화합물을 선택하는 단계를 포함하며, 이에 의해 대상에서 암을 치료하기 위한 화합물을 식별할 수 있다.

일 실시예에서, 상기 대상은 인간이다.

일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.

본 발명은 암을 치료하기 위한 치료의 효능을 분석하는 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암을 치료하기 위한 치료의 효능을 분석하는 키트의 사용 지침을 포함한다.

본 발명은 대상이 암에 걸렸는지를 분석하는 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상이 암에 걸렸는지를 분석하는 키트의 사용 지침을 포함한다.

본 발명은 대상에서 암이 진전될 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서 암이 진전될 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.

본 발명은 대상에서 암이 재발할 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서 암이 재발할 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.

본 발명은 암의 재발을 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암의 재발을 예단하기 위한 키트의 사용 지침을 포함한다.

본 발명은 암에 걸린 대상이 생존할 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암에 걸린 대상이 생존할 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.

본 발명은 대상에서의 암의 진전을 모니터링하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서의 암의 진전을 모니터링하기 위한 키트의 사용 지침을 포함한다.

본 발명의 키트는 대상으로부터의 생물학적 표본, 제어 표본, 및/또는 환경적 영향을 미치는 화합물을 획득하는 수단을 더 포함한다.

최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 수단은 표본 내의 전사된 폴리뉴클레오타이드 또는 이의 부분을 분석하기 위한 수단 및/또는 표본 내의 단백질 또는 이의 부분을 분석하기 위한 수단을 포함할 수 있다.

일 실시예에서, 상기 키트는 다수의 표지 인자의 발현 수준을 결정하기 위한 반응 제제를 포함한다.

본 발명의 여러 측면은 이하의 하부 절에서 보다 상세히 설명된다.

C. 분리된 핵산 분자

본 발명의 일 측면은 분리된 핵산 분자에 관한 것으로서, 여기에는 표지 인자 단백질 또는 그 일부를 부호화하는 핵산이 포함된다. 본 발명의 분리된 핵은 또한 표지 인자 핵산 분자, 및 표지 인자 핵산 분자의 파편를 식별하기 위한 잡종 형성 탐침으로 사용하기에 충분한 핵산 분자, 예를 들어, 표지 인자 핵산 분자의 증폭 또는 변이를 위한 PCR 프라이머로 사용하기에 적절한 핵산 분자를 포함한다. 본 명세서에서 사용되는, 용어 "핵산 분자" 는 DNA 분자(예를 들어, cDNA 또는 게놈 DNA) 및 RNA 분자(예를 들어, mRNA) 및 DNA 유사체, 또는 뉴클레오타이드 유사체를 사용하여 생성된RNA를 포함하는 것으로 의도된 것이다. 상기 핵산 분자는 단일 가닥 또는 이중 가닥일 수 있으나, 바람직하게는 이중 가닥 DNA이다.

"분리된" 핵산 분자는 핵산 분자의 자연적 소스 내에 존재하는 다른 핵산 분자로부터 분리된 분자이다. 일 실시예에서, "분리된" 핵산 분자에는 핵산이 도출되는 기관계의 게놈 DNA 내의 핵산의 측면에 자연적으로 부착되는(즉, 핵산의 5' 및 3' 단에 위치하는 염기서열) 염기서열(바람직하게는 단백질-부호화 염기서열)이 존재하지 않는다. 예를 들어, 다양한 실시예에서, 상기 분리된 핵산 분자는 약 5 kB, 4 kB, 3 kB, 2 kB, 1 kB, 0.5 kB 또는 0.1 kB 미만의 핵산이 도출되는 세포의 게놈 DNA 내의 핵산 분자의 측면에 자연적으로 부착되는 뉴클레오타이드 염기서열을 포함할 수 있다. 또 다른 실시예에서, cDNA 분자와 갈은 "분리된" 핵산 분자는 세포 물질, 또는 재조합 기술로 생산된 경우 배양 매체가 실질적으로 존재하지 않을 수 있으며, 또는 실질적으로 화학적 전구체 또는 화학적으로 합성된 경우 다른 화학 물질이 실질적으로 존재하지 않을 수 있다. 세포 물질이 실질적으로 존재하지 않는 핵산 분자는 약 30%, 20%, 10%, 또는 5% 미만의 비상동 핵산을 가지는 핵산 분자(본 명세서에서 "오염 야기 핵산"으로도 불린다)의 생산을 포함한다.

본 발명의 핵산 분자는 표준 분자생물학 기술 및 본 명세서에서 기술된 데이터베이스 기록 내의 염기서열 정보를 사용하여 분리될 수 있다. 이러한 핵산 염기서열의 전부 또는 일부를 사용하여, 본 발명의 핵산 분자는 표준 잡종 형성 및 복제 기술 (예를 들어, 샘브룩(샘브룩(Sambrook)) 외, ed., 분자의 복제: 실험실 매뉴얼, 제 2판, 콜드 스프링 하버 출판사, 콜드 스프링 하버, NY, 1989, 에 설명된 기술)을 사용하여 분리될 수 있다.

본 발명의 핵산 분자는 cDNA, mRNA, 또는 템플릿 및 적절한 올리고뉴클레오타이드 프라이머로서의 게놈 DNA를 사용하여 표준 PCR 증폭 기술에 따라 증폭될 수 있다. 이렇게 증폭된 상기 핵산은 적절한 벡터로 복제되고 DNA 염기서열 분석에 의해 특성화될 수 있다. 또한, 본 발명의 핵산 분자의 전부 또는 일부에 해당하는 뉴클레오타이드가 표준적 합성 기술, 예를 들어, 자동화된 DNA 합성기를 사용하여 준비될 수 있다.

또 다른 바람직한 실시예에서, 본 발명의 분리된 핵산 분자는 표지 인자 핵산의 뉴클레오타이드 염기서열 또는 표지 인자 단백질을 부호화하는 핵산의 뉴클레오타이드 염기서열을 보완하는 뉴클레오타이드 염기서열을 가지는 핵산 분자를 포함한다. 주어진 뉴클레오타이드 염기서열에 보완적인 핵산 분자는 자신이 주어진 뉴클레오타이드 염기서열에 대해 잡종을 형성할 수 있는 주어진 뉴클레오타이드 염기서열에 충분히 보완적이며, 이에 의해 안정된 듀플렉스를 형성한다.

또한, 본 발명의 핵산 분자는 핵산 염기서열의 일부만을 포함할 수 있으며, 이때 전체 길이의 핵산 염기서열은 표지 인자 핵산을 포함하거나 표지 인자 단백질을 부호화한다. 이러한 핵산은, 예를 들어, 탐침 또는 프라이머로 사용될 수 있다. 상기 탐침/프라이머는 일반적으로 하나 또는 그 이상의 실질적으로 정제된 올리고뉴클레오타이드로서 사용된다. 상기 올리고뉴클레오타이드는 일반적으로 엄격한 조건 하에서 최소한 약 7개, 바람직하게는 약 15개, 보다 바람직하게는 약 25, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 또는 400 또는 그 이상의 연속된 본 발명의 핵산의 뉴클레오타이드들의 잡종을 형성하는 뉴클레오타이드 염기서열의 영역을 포함한다.

본 발명의 핵산 분자의 염기서열에 기반한 탐침은 본 발명의 하나 또는 그 이상의 표지 인자에 해당하는 전사체 또는 게놈적 염기서열을 탐지하는데 사용될 수 있다. 상기 탐침은 여기에 부착된 라벨의 그룹, 예를 들어, 방사성 동위원소, 형광 화합물, 효소, 또는 효소 보조 요소를 포함한다. 이러한 탐침은, 예를 들어, mRNA 수준을 탐지하거나 또는 단백질을 부효하하는 유전자가 변이 또는 삭제되었는지를 결정하는 등의 방법으로 대상으로부터의 세포 표본 내의 단백질을 부호화하는 핵산 분자의 수준을 측정함으로써 단백질을 잘못 발현하는 세포 또는 조직을 식별하기 위한 진단적 검사 키트의 일부로서 사용될 수 있다.

본 발명은, 유전학적 코드의 퇴화로 인해, 표지 인자 단백질을 부호화하며 따라서 동일한 단백질을 부호화하는 핵산의 뉴클레오타이드 염기서열과 다른 핵산 분자를 더 포함한다.

해당 분야의 통상의 기술자라면 아미노산 염기서열에서의 변화에 이르게 하는 DNA 염기서열 다형성이 군집(예를 들어, 인간 군집) 내에 존재할 수 있음을 인식할 것이다. 이러한 유전학적 다형성은 대립 형질 변이로 인해 군집 내의 개별 객체에 존재할 수 있다. 대립 유전자는 주어진 유전학적 발생 장소에서 대체적 방법으로 발생하는 유전자 군 내의 한 유전자이다. RNA 발현 수준에 영향을 주는 DNA 다형성 또한 존재하여 해당 유전자의 전반적 발현 수준에 (예를 들어, 조절 또는 퇴화에 영향을 줌으로써) 영향을 줄 수 있다는 것 또한 인식될 수 있을 것이다.

본 명세서에서 사용되는, 표현 "대립 형질 이형"은 주어진 발생 위치에서 발생하는 뉴클레오타이드 염기서열 또는 상기 뉴클레오타이드 염기서열에 의해 부호화되는 폴리펩티드를 말한다.

본 명세서에서 사용되는, 용어 "유전자" 및 "재조합 유전자"는 본 발명의 표지 인자에 해당하는 폴리펩티드를 부호화하는 개방형 읽기 프레임을 포함하는 핵산 분자를 말한다. 이러한 자연적 대립 형질 변이는 일반적으로 주어진 유전자의 뉴클레오타이드 염기서열 내에서 1-5% 의 변이라는 결과를 가져 온다. 대체적인 대립 유전자는 관심의 대상인 유전자에 대한 다수의 다른 개별적 방법에 의한 염기서열 결정으로 식별될 수 있다. 이는 다양한 객체에서의 동일한 유전학적 발생 위치를 식별하기 위한 잡종 형성 탐침을 사용하여 쉽게 수행된다. 이러한 뉴클레오타이드 변이 및 결과적으로 나타나는 아미노산 다형성 또는 자연적 대립 형질 변이의 결과로서 기능적 활성을 변화시키지 않는 변이들의 어느 일부 또는 전부는 본 발명의 범위 내에 있는 것으로 의도된 것이다.

또 다른 실시예에서, 본 발명의 분리된 핵산 분자 는 최소한 7, 15, 20, 25, 30, 40, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 550, 650, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 2000, 2200, 2400, 2600, 2800, 3000, 3500, 4000, 4500, 또는 그 이상의 길이를 가지는 뉴클레오타이드를 포함하며 엄격한 조건 하에서 표지 인자 핵산으로 또는 표지 인자 단백질을 부호화하는 핵산으로 잡종을 형성한다. 본 명세서에서 사용되는, 용어 "엄격한 조건 하에서의 잡종 형성"는 상호 간에 최소한 60%(65%, 70%, 바람직하게는 75%)가 동일한 뉴클레오타이드 염기서열들이 상호 간에 잡종화되어 존재하는 잡종 형성 및 세척을 위한 조건을 설명하는 것으로 의도된 것이다. 이러한 엄격한 조건들은 해당 분야의 통상의 기술자에게 알려져 있으며 분자생물학의 현재의 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), N.Y. (1989)의 제 6.3.1-6.3.6 절에서 찾아볼 수 있다. 엄격한 잡종 형성 조건의 바람직한, 비 한정적인 예는 약 45^oC의 6X 염화나트륨/구연산나트륨(SSC)에서의 잡종 형성 및 이후의 50-65^oC에서의 0.2X SSC, 0.1% SDS에 의한 한 번 또는 그 이상의 세척이다.

군집 내에 존재할 수 있는 자연적으로 발생하는 본 발명의 핵산 분자의 대립 형질 변이와 더불어, 통상의 기술자는 염기서열 변화가 변이를 통해 도입되어 이에 의해 부호화된 단백질의 생물학적 활성을 변화시키지 않으면서 이로 인해 부호화된 단백질의 아미노산 염기서열에서의 변화를 야기될 수 있음을 또한 인식할 수 있을 것이다. 예를 들어, 아미노산 대체로 이르는 뉴클레오타이드 대체를 "비본질적" 아미노산 잔여부에서 수행할 수 있다. "비본질적" 아미노산 잔여부는 가공되지 않은 유형의 염기서열로부터 생물학적 활성을 변화시키지 않고 변경될 수 있는 잔여부이며, 반면에 "본질적" 아미노산 잔여부는 생물학적 활성을 필요로 한다. 예를 들어, 보존되지 않는 아미노산 잔여부 또는 여러 종들의 상동 중 부분 보존되는 아미노산 잔여부는 활성에 대해 비본질적일 수 있으며, 따라서 변경을 위한 타겟이 될 수 있을 것이다. 대체적인 방법으로, 여러 종들의 상동(예를 들어, 쥐과 동물 및 인간) 간에 보존되는 아미노산 잔여부는 활성에 대해 본질적이며 따라서 변경을 위한 타겟이 되지 않을 것이다.

이에 따라, 본 발명의 또 다른 측면은 활성에 대해 본질적이지 않은 아미노산 잔여부에서의 변화를 포함하는 이형 표지 인자 단백질을 부호화하는 핵산 분자에 관련된 것이다. 이러한 이형 표지 인자 단백질은 아미노산 염기서열에서 자연적으로 발생하는 표지 인자 단백질과 다르지만, 여전히 생물학적 활성을 보유한다. 일 실시예에서, 이러한 이형 표지 인자 단백질은 표지 인자 단백질의 아미노산 염기서열과 최소한 40%가 동일하고, 또한 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%가 동일한 아미노산 염기서열이다.

이형 표지 인자 단백질을 부호화하는 분리된 핵산 분자는 표지 인자 핵산의 뉴클레오타이드 염기서열에 하나 또는 그 이상의 뉴클레오타이드 대체, 추가 또는 삭제를 도입하여 하나 또는 그 이상의 아미노산 잔여부 대체, 추가, 또는 삭제가 부호화된 단백질에 도입되도록 함으로써 생성될 수 있다. 변이는 부위 방향성의 돌연변이 유발 및 PCR-중재 돌연변이 유발과 같은 표준 기술에 의해 도입될 수 있다. 바람직하게는, 보수적인 아미노산 대체는 하나 또는 그 이상의 예측된 비본질적 아미노산 잔여부에서 일어난다. "보존적인(conservative) 아미노산 대체"는 아미노산 잔여부가 유사한 사이드 체인을 가지는 아미노산 잔여부로 교체되는 대체이다. 유사한 사이드 체인을 가지는 아미노산 잔여부의 군들이 해당 분야에서 정의되어 있다. 이들 군들은 기본 사이드 체인(예를 들어, 라이신, 아르지닌, 히스티딘), 산성 사이드 체인(예를 들어, 아스파르트 산, 글루타민 산), 대전되지 않은 극섬 사이드 체인(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 타이로신, 시스테인), 비극성 사이드 체인(예를 들어, 알라닌, 발린, 루신, 이소루신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타 분지 사이드 체인(예를 들어, 트레오닌, 발린, 이소루신) 및 방향족 사이드 체인(예를 들어, 타이로신, 페닐알라닌, 트립토판, 히스티딘)을 가지는 아미노산을 포함한다. 대체적 방법으로, 변이는 포화 돌연변이 유발 등에 의해 부호화 염기서열의 전부 또는 일부를 따라 임의적으로 도입될 수 있으며, 그 결과로 나타나는 변이는 활성을 유지하는 변이를 식별하기 위해 생물학적 활성에 대해 선별될 수 있다. 돌연변이 유발에 이어, 부호화된 단백질은 재조합적으로 발현될 수 있으며 단백질의 활성이 결정될 수 있다.

본 발명은 안티센스 핵산 분자, 즉, 본 발명의 센스 핵산에 보완적인분자, 예를 들어, 이중 가닥 표지 인자 cDNA 분자의 부호화 가닥에 보완적이거나 표지 인자 mRNA 염기서열에 보완적인 분자를 포괄한다. 이에 따라, 본 발명의 안티센스는 본 발명의 센스 핵산에 수소 결합(즉, 아닐링)될 수 있다. 상기 안티센스 핵산은 전체 부호화 가닥, 또는 이의 일부에만, 예를 들어, 단백질 부호화 영역의 전부 또는 일부(또는 개방 판독 프레임)에 보완적일 수 있다. 안티센스 핵산 분자는 표지 인자 단백질을 부호화하는 뉴클레오타이드 염기서열의 부호화 가닥의 비부호화 영역의 전부 또는 일부에도 안티센스일 수 있다. 상기 비부호화 영역("5' 및 3' 비번역 영역")은 부호화 영역 측면에 부착되며 아미노산으로 번역되지 않는 5' 및 3' 염기서열이다.

안티센스 올리고뉴클레오타이드는, 예를 들어, 길이에서 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 또는 50 또는 그 이상인 뉴클레오타이드일 수 있다. 본 발명의 안티센스 핵산은 해당 분야에서 알려진 화학적 합성 및 효소 결찰(ligation) 반응을 사용하여 구성될 수 있다. 예를 들어, 안티센스 핵산(예를 들어, 안티센스 올리고뉴클레오타이드)은 자연적으로 발생하는 뉴클레오타이드 또는 분자의 생물학적 안정성을 증가시키도록 또는 안티센스 및 센스 핵산 사이에 형성된 듀플렉스의 물리적 안정성을 증가시키도록 설계된 다양하게 수정된 뉴클레오타이드를 사용하여 화학적으로 합성될 수 있으며, 예를 들어, 포스페트로티오이트 파생체 및 아크리딘 대체 뉴클레오타이드가 사용될 수 있다. 안티센스 핵산을 생성하기 위해 사용될 수 있는 수정된 뉴클레오타이드의 예는5-불화우라실, 5-브롬화우라실, 5-염화우라실, 5-요오드화우라실, 하이포크산틴, 크산틴, 4-아세틸사이토신, 5-(카르복시하이드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 베타-D-갈락토실쿠에신, 이노신, N6-아이소펜텐이레이드나인, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2- 메틸라데닌, 2-메틸구아닌, 3-메틸사이토신, 5-메틸사이토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-마노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-아이소펜텐이레이드나인, 우라실-5-옥시아세틱산(v), 와이부톡소신, 수도우라실, 퀘오신, 2-티오사이토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세틱 한 메틸에스테르, 우라실-5-옥시아세틱 산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 및 2,6-디아미노퓨린을 포함한다. 대체적 방법으로, 상기 안티센스 핵산은 그 안에서 핵산이 안티센스 방향으로 하위 복제되는 발현 벡터를 사용하여 생물학적으로 생산될 수 있다(즉, 다음 절에서 더 설명되는 것 처럼 삽입된 핵산으로부터 전사된 RNA가 관심 대상 타겟 핵산으로 안티센스 방향이다).

본 명세서에서 사용되는, “핵산” 금지 인자는 타겟의 발현의 감소의 결과를 가져오는 타겟 유전자로부터의 최소한 일부의 RNA 전사체의 잡종을 형성함으로써 타겟의 발현에서의 감소를 야기하는 임의의 핵산 기반 금지 인자이다. 핵산 금지 인자는, 예를 들어, 단일 가닥 핵산 분자, 예를 들어, 안티센스 핵산, 및 siRNA, shRNA, dsiRNA와 같은 이중 가닥핵산(예를 들어, 미국 특허 공보 제 20070104688호 참조)을 포함한다. 본 명세서에서 사용되는, 이중 가닥 핵산 분자는 최소한 12 개, 바람직하게는 최소한 15개 이상의 뉴클레오타이드 이중 가닥으로 설계된다. 이중 가닥 핵산 분자는 자기 자신을 잡종화하기 위해 설계된 단일 핵산 가닥, 예를 들어, shRNA일 수 있다. 타겟의 핵산 금지 인자는 분리된 핵산으로 투여될 수 있는 것으로 이해되어야 한다. 대체적 방법으로, 상기 핵산 금지 인자는 세포 내에 금지 인자를 생산하기 위한 발현 구조체로서 투여될 수 있다. 특정 실시예에서, 상기 핵산 금지 인자는 활성 및/또는 핵산 금지 인자의 안정성을 개선하기 위한 하나 또는 그 이상의 화학적 수정을 포함한다. 이러한 수정은 해당 분야에서 잘 알려져 있다. 사용되는 상기 특정한 수정은, 예를 들어, 핵산 금지 인자의 유형에 따라 달라질 것이다.

안티센스 핵산 치료용 제제인 단일 가닥 핵산 치료제는 일반적으로 16 내지 30의 길이를 갖는 뉴클레오타이드를 포함하며, 배양 또는 기관계 내의 타겟 세포에서의 타겟 핵산 염기서열에 보완적이다.

안티센스 핵산, 화학적 수정, 및 치료적 사용에 대한 특허가 제공되며, 예를 들어, 화학적으로 수정된 RNA-포함 치료적 화합물에 대한 미국 특허 제 5,898,031호, 및 이들 화합물을 치료용 제제로 사용하는 방법에 대한 미국 특허 제 6,107,094호가 있다. 단일 가닥으로 화학적으로 수정된 RNA 유사 화합물을 투여하여 환자를 치료하는 방법에 대한 미국 특허 제 7,432,250호; 및 단일 가닥으로 화학적으로 수정된 RNA 유사 화합물을 포함하는 약학 성분에 대한 미국 특허 제 7,432,249호. 미국 특허 제 7,629,321호는 다수의 RNA 뉴클레오시드 및 최소한 하나의 화학적 수정을 가지는 단일 가닥 올리고뉴클레오타이드를 사용하여 타겟 mRNA를 쪼개는 방법에 대한 것이다. 본 단락에 기술된 이들 각 특허들은 참조에 의해 본 명세서에 통합된다.

많은 실시예에서, 상기 듀플렉스 영역은 길이가 15-30인 뉴클레오타이드 쌍이다. 일부 실시예에서, 상기 듀플렉스 영역은 길이가 17-23인 뉴클레오타이드 쌍, 길이가 17-25인 뉴클레오타이드 쌍, 길이가 23-27인 뉴클레오타이드 쌍, 길이가 19-21인 뉴클레오타이드 쌍, 또는 길이가 21-23인 뉴클레오타이드 쌍이다.

특정 실시예에서, 각 가닥은 15-30개의 뉴클레오타이드를 가진다.

본 발명의 방법에서 사용될 수 있는 RNAi 제제는 예를 들어, in 2011년 11월 18일에 출원된 미국 예비 출원 제 61/561,710호, 2010년 9월 15일에 출원된 국제 출원 제 PCT/US2011/051597호, 및 PCT 국제 공개 WO 2009/073809에 개시된 화학적 수정이 가해진 제제를 포함하며, 그 전체 내용은 참조에 의해 본 명세서에 통합된다.

“RNAi 제제,” “이중 가닥 RNAi 제제,” 이중-가닥 RNA(dsRNA) 분자는 “dsRNA 제제,” “dsRNA”, “siRNA”, “iRNA 제제”로도 불리고, 본 명세서에서 교차적으로 사용되며, 두 개의 반대로 평행하고 실질적으로 보완적인 하기에서 정의 되는 핵산 가닥을 포함하는 듀플렉스 구조를 가지는 리보핵산 분자 복합체를 말한다. 본 명세서에서 사용되는, RNAi 제제는 또한 dsiRNA(예를 들어, 본 명세서에 참조로써 통합된 US 특허 공고 20070104688 참조)를 포함한다. 일반적으로, 각 가닥의 대다수의 뉴클레오타이드는 리보뉴클레오타이드이지만, 본 명세서에서 기술된 각 가닥 또는 양 가닥은 또한 하나 또는 그 이상의 비 리보뉴클레오타이드, 예를 들어, 디옥시리보뉴클레오타이드 및/또는 수정된 뉴클레오타이드를 포함할 수 있다. 또한, 본 명세서에서 사용된 “RNAi 제제”는 화학적으로 수정된 리보뉴클레오타이드를 포함할 수 있으며; RNAi 제제는 다중 뉴클레오타이드에서의 실질적 수정을 포함할 수 있다. 이러한 수정은 본 명세서에서 개시되거나 해당 분야에서 알려진 모든 유형의 수정을 포함할 수 있다. siRNA 유형 분자에 사용되는 이러한 모든 수정이 본 명세서 및 청구항의 목적을 위한 “RNAi 제제”에 포괄적으로 포함된다.

듀플렉스 구조를 형성하는 두 가닥은 하나의 큰 RNA 분자의 서로 다른 부분이거나, 이들 각각이 분리된 RNA 분자일 수 있다. 이러한 두 가닥이 하나의 큰 분자의 일부인 경우, 따라서 한 가닥의 3' 종단과 듀플렉스 구조를 형성하는 각각의 다른 가닥의 5'종단 사이에서 끊기지 않는 뉴클레오타이드 체인으로 연결되어 있는 경우, 이러한 연결 RNA 체인은 “헤어핀 루프”라 불린다. 두 가닥이 3'종단의 한 가닥과 듀플렉스 구조를 형성하는 각각의 다른 가닥의 5'종단 사이의 끊기지 않는 뉴클레오타이드 체인이 아닌 다른 수단으로 공유결합적으로 연결되어 있는 경우, 이러한 연결 구조는 “링커”라 불린다. RNA 가닥들은 동일하거나 다른 개수의 뉴클레오타이드를 가질 수 있다. 기반 쌍의 최대 개수는 dsRNA의 가장 짧은 가닥 내의 뉴클레오타이드의 개수에서 듀플렉스 내에 존재하는 모든 오버행을 뺀 수이다. 듀플렉스 구조와 더불어, RNAi 제제는 하나 또는 그 이상의 뉴클레오타이드 오버행을 포함할 수 있다. 용어 “siRNA”는 또한 본 명세서에서 상기 기술한 RNAi 제제를 말하는 것으로 사용된다.

또 다른 측면에서, 상기 제제는 단일-가닥의 안티센스 RNA 분자이다. 안티센스 RNA 분자는 타겟 mRNA 내의 염기서열에 보완적이다. 안티센스 RNA는 mRNA에 염기 짝짓기를 함으로써 화학양론적 방식으로 번역을 억제하고 번역 체계를 물리적으로 차단할 수 있다. Dias, N. 외, (2002) Mol 암 Ther 1:347-355 참조. 상기 안티센스 RNA 분자는 약 15-30개의 타겟 mRNA에 보완적인 뉴클레오타이드를 가질 수 있다. 예를 들어, 상기 안티센스 RNA 분자는 표 1의 안티센스 염기서열 중 하나로부터의 최소한 15, 16, 17, 18, 19, 20 또는 그 이상의 인접한 뉴클레오타이드의 염기서열을 가질 수 있다.

용어 “안티센스 가닥”은 실질적으로 타겟 염기서열에 보완적인 영역을 포함하는 이중 가닥 RNAi 제제의 가닥을 말한다. 본 명세서에서 사용되는, 용어 관심 대상 단백질을 “부호화하는 mRNA 부분에 보완적인 영역”은 단백질을 부호화하는 타겟 mRNA 염기서열 부분에 실질적으로 보완적인 안티센스 가닥 상의 영역을 말한다. 보완성의 영역이 타겟 염기서열에 완전히 보완적이지 않은 경우, 이러한 비합치는 대부분 단말 영역에서 감수하게 되며, 이것이 존재하는 경우, 일반적으로 단말 영역 또는 영역들, 예를 들어, 5'및/또는 3'단말의 6, 5, 4, 3, 또는 2 뉴클레오타이드 내에 존재한다.

본 명세서에서 사용되는 용어 “센스 가닥”은 안티센스 가닥의 영역에 실질적으로 보완적인 영역을 포함하는 dsRNA의 가닥을 말한다.

다양한 실시예에서, 본 발명의 핵산 분자는, 예를 들어, 분자의 안정성, 잡종 형성, 또는 용해성을 개선하기 위해 염기 비결합 성분, 당 비결합 성분 또는 인산염 백본에서 수정될 수 있다. 예를 들어, 핵산의 데옥시리보스 인산염 백본이 펩티드 핵산을 생성하기 위해 수정될 수 있다(Hyrup 외, 1996, Bio 기관 ic & Medicinal Chemistry 4(1): 5-23 참조). 본 명세서에서 사용되는, 용어 "펩티드 핵산" 또는 "PNA"는 그 안에서 데옥시리보스 인산염 백본이 수도펩티드 백본으로 교체되고 네 개의 자연적 핵 염기만이 유지되는 핵산 모방체, 예를 들어, DNA 모방체를 말한다. PNA의 중성 백본은 낮은 이온 강도의 조건에서 DNA 및 RNA에 대한 특정한 잡종 형성을 허용하는 것으로 밝혀 졌다. PNA 올리고머의 합성은 Hyrup 외 (1996), 상기 설명과 같음; Perry-O'Keefe 외 (1996) Proc . Natl . Acad . Sci . USA 93:14670-675에 기술된 표준 고체 상태 펩티드 합성 프로토콜을 사용하여 수행될 수 있다.

PNA는 치료적 및 진단적 적용에 사용될 수 있다. 예를 들어, PNA는, 예를 들어, 전사 또는 번역 억제 또는 금지형 복제를 유도함으로써 유전자 발현의 염기서열-특정한 조절을 위한 항센스 또는 항유전자 제제로서 사용될 수 있다. PNA는 또한, 다른 효소들과 조합하여 사용되는 경우 인위적 제한 효소, 예를 들어, S1 뉴클레아제(Hyrup (1996), 상기 설명과 같음)로서 또는 DNA 염기서열 및 잡종 형성을 위한 탐침 또는 프라이머(하이럽(Hyrup), 1996, 상기 설명과 같음; 피에리오키페(Perry-O'Keefe) 외, 1996, Proc . Natl . Acad . Sci. USA 93:14670-675)로서, 예를 들어, 유전자 내에서 예를 들어, PNA 방향적 PCR 클램핑에 의한 단일 염기 쌍 변이를 분석하기 위해 사용될 수 있다.

또 다른 실시예에서, PNA는, 예를 들어, 이들의 안정성 또는 세포 흡수를 개선시키기 위해 친유성 또는 기타 도움이 되는 군을 PNA에 부착시킴으로써, PNA-DNA 키메라를 형성함으로써, 또는 리포솜 또는 해당 분야에서 알려진 약 전달에 관한 기타 기술을 사용함으로써 수정될 수 있다. 예를 들어, PNA 및 DNA의 유익한 특성을 결합시킬 수 있는 PNA-DNA 키메라가 생성될 수 있다. 이러한 키메라는 DNA 식별 효소, 예를 들어, PNA 부분이 고 결합 친화성 및 특정성을 제공하면서 리보뉴클레아제 H 및 DNA 중합효소가 DNA 부분과 반응할 수 있게 해 준다. PNA-DNA 키메라는 염기 스태킹, 핵염기 사이의 결합의 개수 및 방향의 관점에서 선택된 적절한 길이의 링커를 사용하여 결합될 수 있다(하이럽(Hyrup), 1996, 상기 설명과 같음). PNA-DNA 키메라의 합성은 하이럽(Hyrup)(1996), 상기 설명과 같음, 및 핀(Finn) 외 (1996) Nuclear Acids Res. 24(17):3357-63에 설명된 대로 수행될 수 있다. 예를 들어, DNA 체인이 고체 지지체 상에 표준 인산라미다이트 결합 화학 및 수정된 뉴클레오시드 유사체를 사용하여 합성될 수 있다. 5'-(4-메톡시트리틸)아미노-5'-데옥시-티미딘 인산라미다이트와 같은 화합물은 PNA와 DNA의 5' 단말 사이의 링크로 사용될 수 있다(마그(Mag) 외, 1989, Nuclear Acids Res. 17:5973-88). PNA 단량체는 5' PNA 세그먼트 및 3' DNA 세그먼트와 키메릭 분자를 생성하기 위해 다시 단계별로 결합될 수 있다(핀(Finn) 외, 1996, Nuclear Acids Res. 24(17):3357-63). 대체적 방법으로, 키메릭 분자는 5' DNA 세그먼트 및 3' PNA 세그먼트로 합성될 수 있다(피터세르(Peterser) 외, 1975, Bioorganic Med . Chem . Lett . 5:1119-11124).

다른 실시예에서, 상기 올리고뉴클레오타이드는 펩티드(예를 들어, 생체 내 숙주 세포 수용기 타겟팅을 위해)와 같은 다른 부착된 그룹 또는 세포 막 사이의 이동을 쉽게 해 주는 제제(예를 들어, 레스팅거(Letsinger) 외, 1989, Proc . Natl . Acad . Sci . USA 86:6553-6556; 라마이트리(Lemaitre) 외, 1987, Proc . Natl . Acad . Sci . USA 84:648-652; PCT 국제 공개 WO 88/09810 참조), 또는 혈액-뇌 장막(예를 들어, PCT 국제 공개 WO 89/10134 참조)을 포함할 수 있다. 또한, 올리고뉴클레오타이드는 잡종 형성-촉발 분리 제제(예를 들어, 크롤(Krol) 외, 1988, Bio /기술s 6:958-976 참조) 또는 삽입 제제(예를 들어, 존(Zon), 1988, Pharm . Res . 5:539-549 참조)로 수정될 수 있다. 이러한 목적으로, 상기 올리고뉴클레오타이드는 또 다른 분자, 예를 들어, 펩티드, 잡종 형성 촉발 교차 연결 제제, 이송 제제, 잡종 형성 촉발 분리 제제 등과 켤레를 이룰 수 있다.

본 발명은 또한 분자의 비컨이 표본 내 본 발명의 핵산의 존재를 정량 측정하기에 유용하도록 본 발명의 핵산에 보완적인 최소한 하나의 영역을 가지는 분자의 비컨 핵산을 포함한다. "분자의 비컨" 핵산은 한 쌍의 보완 영역을 포함하며 형광단 및 이와 연관된 형광 소광제를 가지는 핵산이다. 상기 형광단 및 소광제는 보완 영역이 서로 아닐링될 때 형광단의 형광이 소광제에 의해 소광되는 방향으로 핵산의 다른 부분과 연관되어 있다. 핵산의 보완 영역이 서로 아닐링되지 않을 때는, 형광단의 형광은 감소된 정도로 소광된다. 분자의 비컨 핵산은, 예를 들어, 미국 특허 5,876,930에 기술되어 있다.

D. 분리된 단백질 및 항체

본 발명의 일 측면은 표지 인자 단백질 또는 이의 파편에 대하여 항체를 높이기 위한 면역원으로 사용하기에 적절한 폴리펩티드 파편뿐만 아니라 분리된 표지 인자 단백질 및 이의 생물학적으로 활성화된 부분에 관한 것이다. 일 실시예에서, 상기 본래의 표지 인자 단백질은 표준 단백질 정제 기술을 사용하는 적절한 정제 방법을 사용하여 세포 또는 조직 소스로부터 분리될 수 있다. 또 다른 실시예에서, 표지 인자 단백질의 전체 또는 세그먼트를 포함하는 단백질 또는 펩티드는 재조합 DNA 기술에 의해 생산된다. 단백질 또는 펩티드와 같은 재조합 발현에 대한 대체적 방법이 표준 펩티드 합성 기술을 사용하여 화학적으로 합성될 수 있다.

"분리된" 또는 "정제된" 단백질 또는 이의 생물학적으로 활성화된 부분은 이로부터 단백질이 도출되는 세포 물질 또는 세포 또는 조직 소스로부터의 기타 오염 단백질이 실질적으로 존재하지 않거나, 화학적으로 합성되었을 때 화학적 전구체 또는 다른 화학 물질이 실질적으로 존재하지 않는다. "세포 물질이 실질적으로 존재하지 않는다"는 언어 표현은 단백질이 자신이 분리된 세포의 세포 성분으로부터 분리되거나 재조합적으로 생산되는 단백질의 준비를 포함한다. 따라서, 세포 물질이 실질적으로 존재하지 않는 단백질은 약 30%, 20%, 10%, 또는 5%(건조 중량 기준)의 비상동 단백질(본 명세서에서는 "오염 단백질"로도 불림)을 가지는 단백질의 준비를 포함한다. 단백질 또는 이의 생물학적으로 활성화된 부분이 재조합적으로 생산되는 경우, 배양 매체가 실질적으로 없는 것, 즉, 배양 매체가 준비된 단백질 부피의 약 20%, 10%, 또는 5% 미만을 나타내는 것이 또한 바람직하다. 단백질이 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학 물질이 실질적으로 없는 것, 즉, 단백질이 단백질의 합성에 관련된 화학적 전구체 또는 다른 화학 물질로부터 분리되는 것이 바람직하다. 이에 따라 이러한 단백질의 준비는 화학적 전구체 또는 관심있는 폴리펩티드가 아닌 다른 화합물을 약 30%, 20%, 10%, 5% (건조 중량 기준) 미만으로 포함하도록 한다.

표지 인자 단백질의 생물학적으로 활성화된 부분은 표지 인자 단백질의 아미노산 염기서열에 충분히 동일하거나 이로부터 도출되는 아미노산 염기서열을 포함하는 폴리펩티드를 포함하며, 이는 완전한 길이의 단백질보다 적은 수의 아미노산을 포함하고 해당하는 완전한 길이의 단백질의 최소한 하나의 활성을 보인다. 일반적으로, 생물학적으로 활성화된 부분은 자신과 상응하는 완전한 길이의 단백질의 최소한 하나의 활성의 도메인 또는 모티프를 포함한다. 본 발명의 단백질의 표지 인자에서 생물학적으로 활성화된 부분은 예를 들어, 10, 25, 50, 100 또는 그 이상의 길이를 가지는 아미노산인 폴리펩티드일 수 있다. 또한, 표지 인자 단백질의 다른 영역이 삭제되는 다른 생물학적으로 활성화된 부분이 재조합 기술로 제조되고 표지 인자 단백질의 자연적 형태의 하나 또는 그 이상의 기능적 활성에 대해 평가될 수 있다.

바람직한 표지 인자 단백질은 상기 예들에서 기술된 임의의 유전자를 부호화하는 염기서열을 포함하는 뉴클레오타이드 염기서열에 의해 부호화된다. 다른 유용한 단백질들은 실질적으로 이러한 염기서열 중 하나와 동일하며(예를 들어, 최소한 약 40%, 바람직하게는 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%) 상응하는 자연적으로 발생하나 자연적 대립 형질 변이 또는 돌연변이 유발로 인해 다른 아미노산 염기서열을 가지는 표지 인자 단백질의 기능적 활성을 가진다.

두 아미노산 염기서열 또는 두 핵산의 백분율 유사성을 결정하기 위해, 상기 염기서열들은 최적의 비교를 위한 목적으로 정렬된다(예를 들어, 제 2 아미노산 또는 핵산 염기서열과의 최적의 정렬을 위해 제 1 아미노산 또는 핵산 염기서열의 염기서열에 간격이 도입될 수 있다). 상응하는 아미노산 위치 또는 뉴클레오타이드 위치의 아미노산 잔여부 또는 뉴클레오타이드가 이후 비교될 수 있다. 제 1 염기서열 내의 위치가 제 2 염기서열 내 상응하는 위치와 동일한 아미노산 잔여부 또는 뉴클레오타이드에 의해 점유되었을 때는, 상기 분자들은 해당 위치에서 동일하다. 바람직하게는, 두 염기서열 사이의 백분율 유사성은 전역 정렬을 이용하여 계산된다. 대체적 방법으로, 두 염기서열 사이의 백분율 유사성은 국지적 정렬을 이용하여 계산된다. 두 염기서열 사이의 백분율 유사성은 염기서열에 의해 공유되는 동일한 위치의 개수의 함수이다(즉, % 동일성 = 동일한 위치의 개수/전체 위치 개수(예를 들어, 중첩 위치) x100). 일 실시예에서 상기 두 염기서열은 동일한 길이를 가진다. 또 다른 실시예에서, 상기 두 염기서열은 동일한 길이를 갖지 않는다.

두 염기서열 사이의 백분율 유사성 결정은 수학적 알고리즘을 사용하여 성취될 수 있다. 두 염기서열의 비교를 위해 사용되는 바람직한, 비한정적인 수학적 알고리즘의 예는 다음과 같다: 칼린(Karlin)과 (Altschul)의 알고리즘(1990) Proc . Natl . Acad . Sci. USA 87:2264-2268, 칼린(Karlin)과 (Altschul)의 수정된 알고리즘(1993) Proc . Natl . Acad. Sci . USA 90:5873-5877. 이러한 알고리즘은 BLASTN 및 BLASTX 프로그램, 알스철(Altschul) 외 (1990) J. Mol . Biol . 215:403-410에 통합되었다. BLAST 뉴클레오타이드 탐색은 본 발명의 핵산 분자에 상동인 뉴클레오타이드 염기서열을 얻기 위해 BLASTN 프로그램, 점수 = 100, 단어 길이 = 12,을 사용하여 수행될 수 있다. BLAST 단백질 탐색은 본 발명의 단백질 분자에 상동인 아미노산 염기서열을 얻기 위해 BLASTP 프로그램, 점수 = 50, 단어 길이 = 3,으로 수행될 수 있다. 비교의 목적으로 간격을 가지는 정렬을 얻기 위해서는, Gapped BLAST라 불리는 새로운 버전의 BLAST 알고리즘을 알스철(Altschul) 외 (1997) Nuclear Acid Res . 25:3389-3402에 설명된 대로 활용할 수 있으며, 이 알고리즘은 프로그램 BLASTN, BLASTP 및 BLASTX에 대해 간격을 가지는 국지적 정렬을 수행할 수 있다. 대체적 방법으로, 분자들 사이의 먼 관계를 탐지하는 PSI-Blast가 반복적 탐색을 수행하기 위해 사용될 수 있다. BLAST Gapped BLAST, 및 PSI-Blast 프로그램을 활용할 때, 각 프로그램들의 기본 매개변수들(예를 들어, BLASTX 및 BLASTN)이 사용될 수 있다. http://www.ncbi.nlm.nih.gov 참조. 염기서열의 비교를 위해 활용되는 또 다른 바람직한 비 한정적인 수학적 알고리즘의 예는 마이어스(Myers)와 밀러(Miller)(1988) CABIOS 4:11-17의 알고리즘이다. 이러한 알고리즘은 GCG 염기서열 정렬 소프트웨어 패키지의 일부인 ALIGN 프로그램(버전 2.0)에 통합되었다. 아미노산 염기서열의 비교를 위해 ALIGN 프로그램을 사용할 때는, PAM120 중량 잔여부 테이블, 12의 간격 길이 벌칙, 및 4의 간격 벌칙이 사용될 수 있다. 국지적 염기서열 유사성 및 정렬의 영역을 식별하기 위한 또 다른 유용한 알고리즘으로 FASTA 알고리즘이 있으며, 피어슨(Pearson)과 (Lipman) (1988) Proc . Natl . Acad . Sci . USA 85:2444-2448에 설명되어 있다. 뉴클레오타이드 또는 아미노산 염기서열의 비교를 위해 FASTA 알고리즘을 사용할 때는, PAM120 중량 잔여부 테이블이, 예를 들어, k-tuple 값을 2로 하여 사용될 수 있다.

두 염기서열 사이의 백분율 유사성은 상기 설명한 것과 유사한 기술을 사용하여 또는 간격을 허용하거나 허용하지 않으면서 결정될 수 있다. 백분율 유사성을 계산함에 있어, 정확히 합치되는 것만 계수된다.

본 발명은 또한 표지 인자 단백질 또는 이의 세그먼트를 포함하는 키메릭 또는 융합 단백질을 제공한다. 본 명세서에서 사용되는, "키메릭 단백질" 또는 "융합 단백질"은 비상동 폴리펩티드(즉, 표지 인자 단백질이 아닌 폴리펩티드)에 서로 작용하도록 연결된 표지 인자 단백질의 전부 또는 일부(바람직하게는 생물학적으로 활성화된 부분)를 포함한다. 융합 단백질 내에서, 용어 "작용하도록 연결된"이란 표지 인자 단백질 또는 이의 세그먼트 및 비상동 폴리펩티드가 프레임 내에서 서로 융합되어 있음을 나타내기 위한 것이다. 상기 비상동 폴리펩티드는 표지 인자 단백질 또는 세그먼트의 아미노-단말 또는 카르복실-단말에 융합될 수 있다.

하나의 유용한 융합 단백질은 표지 인자 단백질 또는 세그먼트가 GST 염기서열의 카르복실 단말로 융합되는 GST 융합 단백질이다. 이러한 융합 단백질은 본 발명의 재조합 폴리펩티드의 정제를 쉽게 하도록 할 수 있다.

또 다른 실시예에서, 상기 융합 단백질은 자신의 아미노 단말에서 비상동 신호 염기서열을 포함한다. 예를 들어, 표지 인자 단백질의 자연적인 신호 염기서열은 제거되고 또 다른 단백질의 신호 염기서열로 교체될 수 있다. 예를 들어, 바큐로바이러스 덮개 단백질의 gp67 분비성 염기서열이 비상동 신호 염기서열(아우스벨(Ausubel) 외, ed., 분자생물학에서의 현재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), NY, 1992)로 사용될 수 있다. 진핵 세포 비상동 신호 염기서열의 다른 예는 멜리틴 및 인간 태반의 알칼리 포스타파아제(스트라타 유전자; 라 졸라(La Jolla), 캘리포니아)의 분비성 염기서열을 포함한다. 또 다른 예에서, 유용한 원핵 세포 비상동 신호 염기서열은 phoA 분비성 신호(샘브룩(Sambrook) 외, 상기 설명과 같음) 및 상기 단백질 A 분비성 신호(Pharmacia Biotech; 피카타웨이, 뉴저지)를 포함한다.

또 다른 실시예에서, 상기 융합 단백질은 표지 인자 단백질의 전부 또는 일부가 면역 글로불린 단백질 군의 소속 단백질로부터 도출된 염기서열로 융합되는 면역 글로불린 융합 단백질이다. 본 발명의 상기 면역 글로불린 융합단백질들은 약학적 성분으로 통합되어 세포(수용기)의 표면에서 리간드 (용해성 또는 막 부착성)와 단백질 사이의 상호 반응을 억제하기 위해 대상에게 투여될 수 있으며, 이로써생체 내 신호 형질 도입을 억제한다. 상기 면역 글로불린 융합 단백질은 표지 인자 단백질의 유사한 리간드의 생물학적 유용성에 영향을 주기 위해 사용될 수 있다. 리간드/수용기 상호 반응의 금지는 증식성 및 분할성 질환을 치료하고 세포 생존을 조절(예를 들어 촉진 또는 억제)하는데 모두 치료적으로 유용할 수 있다. 또한, 본 발명의 상기 면역 글로불린 융합 단백질들은 대상 내의 표지 인자 단백질 에 대한 항체를 생산하고 리간드를 정제하며 및 선별 분석에서 리간드에 의한 표지 인자 단백질의 상호 반응을 억제하는 분자를 식별하기 위해 면역원으로서 사용될 수 있다.

본 발명의 키메릭 및 융합단백질들은 표준 재조합 DNA 기술에 의해 생성될 수 있다. 또 다른 실시예에서, 상기 융합 유전자는 자동화된 DNA 합성기를 포함하는 통상적인 기술을 사용하여 합성될 수 있다. 대체적 방법으로, 유전자 파편의 PCR 증폭이 두 연속된 유전자 파편 간의 보완적 오버행을 일으키는 앵커 프라이머를 사용하여 수행될 수 있으며, 이들은 다시 아닐링되고 재증폭되어 키메릭 유전자 염기서열을 생성할 수 있다(예를 들어, Ausubel 외, 상기 설명과 같음 참조). 또한, 융합 비결합 성분(예를 들어, GST 폴리펩티드)을 부호화하는 많은 발현 벡터들이 이미 상용으로 사용 가능하다. 핵산을 부호화하는 본 발명의 폴리펩티드는 융합 비결합 성분이 프레임 내에서 본 발명의 폴리펩티드에 결합되도록 이러한 발현 벡터로 복제될 수 있다.

신호 염기서열이 표지 인자 단백질의 분비 및 분리를 촉진하기 위해 사용될 수 있다. 신호 염기서열은 일반적으로 하나 또는 그 이상의 쪼개지는 이벤트에서 분비되는 동안 일반적으로 성숙한 단백질로부터 쪼개지는 소수성 아미노산의 스코어에 의해 특징지워진다. 이러한 신호 펩티드는 성숙한 단백질로부터의 신호 염기서열이 분비성 경로를 통과하면서 쪼개지는 것을 허용하는 처리 부위를 포함한다. 따라서, 본 발명은 신호 염기서열이 이로부터 단백질 가수 분해적으로 쪼개진 단백질(즉, 분리 산물)뿐만 아니라 표지 인자 단백질, 융합 단백질 또는 이의 신호 염기서열을 가지는 세그먼트에 관한 것이다. 일 실시예에서, 신호 염기서열을 부호화하는 핵산 염기서열은 발현 벡터 내에서 표지 인자 단백질 또는 이의 세그먼트와 같은 관심 대상 단백질에 작용 가능하게 연결된다. 이러한 상기 신호 염기서열은 발현 벡터가 변환되어 가는 진핵 세포 숙주 등으로부터 단백질의 분비를 일으키며, 상기 신호 염기서열은 이후에 또는 동시에 쪼개진다. 이 단백질은 세포외 매체로부터 해당 분야에 알려진 방법으로 쉽게 정제될 수 있다. 대체적 방법으로, 상기 신호 염기서열은 GST 도메인과 같이 정제를 촉진하는 염기서열을 사용하여 관심 대상 단백질에 연결될 수 있다.

본 발명은 또한 표지 인자 단백질의 이형에 관한 것이다. 이러한 이형은 작용 물질(mimetics) 또는 억제 물질 중의 하나로서 작용하는 변경된 아미노산 염기서열을 가지고 있다. 이형은, 예를 들어, 비연속적 점 변이 또는 절단과 같은 돌연변이 유발에 의해 생성될 수 있다. 작용 물질은 자연적으로 발생하는 형태의 단백질의 생물학적 활성과 실질적으로 동일하거나 이의 부분 집합인 활성을 가진다. 단백질의 억제 물질은 자연적으로 발생하는 형태의 단백질의 하나 또는 그 이상의 활성, 예를 들어, 관심 대상 단백질을 포함하는 세포 신호 전달 캐스케이드의 하향 또는 상향 요소로의 완전한 결합을 억제할 수 있다. 따라서, 제한된 기능의 이형에 의한 치료를 통해 특정한 생물학적 효과를 이끌어 낼 수 있다. 이형에 의한 자연적으로 발생하는 형태의 단백질의 생물학적 활성의 부분 집합에 의한 대상의 치료는 자연적으로 발생하는 형태의 단백질에 의한 치료에 비해 대상에서 일어나는 부작용을 줄일 수 있다.

작용 물질(mimetics) 또는 억제 물질 중 하나로서 기능하는 표지 인자 단백질의 이형은 작용 물질 또는 억제 물질 활성에 대한 본 발명의 단백질의 변이, 예를 들어, 절단 변이의 조합적 라이브러리의 선별에 의해 식별될 수 있다. 일 실시예에서, 다양화된 이형의 라이브러리가 조합적 돌연변이 유발에 의해 핵산 수준에서 생성되며 다양화된 유전자 라이브러리에 의해 부호화된다. 이형의 다양화된 라이브러리는, 예를 들어, 합성 올리고뉴클레오타이드의 혼합물을 잠재적 단백질 염기서열의 디제너레이트 집합이 개별적 폴리펩티드, 또는, 대체적 방법으로, 보다 큰 융합 단백질(예를 들어, 파지 전시)의 집합으로 발현되도록 유전자 염기서열로 효소적으로 묶어냄으로써 생산될 수 있다. 디제너레이트 올리고뉴클레오타이드 염기서열로부터 표지 인자 단백질의 잠재적 이형의 라이브러리를 생산하기 위해 사용될 수 있는 다양한 방법이 존재한다. 디제너레이트 올리고뉴클레오타이드를 합성하기 위한 방법이 해당 분야에서 알려져 있다(예를 들어, 나랑(Narang), 1983, Tetrahedron 39:3; 이타쿠라(Itakura) 외, 1984, Annu . Rev . Biochem. 53:323; 이타쿠라(Itakura) 외, 1984, 사이언스 198:1056; 이케(Ike) 외, 1983 Nucliear Acid Res . 11:477 참조).

추가적으로, 표지 인자 단백질의 세그먼트의 라이브러리가 이형 표지 인자 단백질 또는 이의 세그먼트의 선별 및 이후의 선택을 위한 폴리펩티드의 다양화된 군집을 생성하기 위해 사용될 수 있다. 예를 들어, 부호화 염기서열 파편의 라이브러리가 상성이 분자 당 오직 한 번만 일어나는 조건에서 관심의 대상인 부호화 염기서열의 이중 가닥 PCR 파편을 뉴클레아제에 의해 처리함으로써 생성될 수 있으며, 이에 따라 이중 가닥 DNA를 변성시키고, 서로 다른 상성의 제품으로부터의 센스/안티센스 쌍을 포함할 수 있는 이중 가닥 DNA를 형성하기 위해 DNA를 재생하며, S1 뉴클레아제에 의한 치료에 의해 재형성된 듀플렉스로부터 단일 가닥 부분을 제거하고, 결과적으로 발생하는 파편 라이브러리를 발현 벡터로 묶어 준다. 이 방법에 의해, 여러 크기의 관심이 있는 단백질의 아미노 단말 및 내부 파편을 부호화하는 발현 라이브러리가 도출될 수 있다.

해당 분야에서 점 변이 또는 절단에 의해 만들어진 조합적 라이브러리의 유전자 산물을 선별하고, 선택된 특성을 가지는 유전자 산물을 위한 cDNA 라이브러리를 선별하기 위한 다양한 기술이 알려져 있다. 대형 유전자 라이브러리의 선별을 위해 가장 널리 사용되는 기술은 고성능 출력 분석에 알맞은 방법으로서, 일반적으로 유전자 라이브러리의 복제 가능 발현 벡터로의 복제, 결과적으로 벡터의 라이브러리를 생산하는 적절한 세포 변형, 및 조합적 유전자를 원하는 활성의 탐지가 이로부터의 산물이 탐지되는 유전자를 부호화하는 벡터의 분리를 촉진시키는 조건에서 발현시키는 것을 포함한다. 돌연변이 유발(REM)의 재귀적 모임은, 라이브러리 내의 기능적 변이의 빈도를 향상시키는 기술로서, 본 발명의 단백질의 이형을 식별하기 위해 선별 분석과 조합되어 사용할 수 있다(아킨(Arkin) 및 유르반(Yourvan), 1992, Proc . Natl . Acad . Sci . USA 89:7811-7815; 델그레이브(Delgrave) 외, 1993, 단백질 엔지니어링 6(3):327- 331).

본 발명의 또 다른 측면은 본 발명의 단백질에 대한 항체에 관한 것이다. 바람직한 실시예에서, 상기 항체는 특히 표지 인자 단백질 또는 이의 파편에 결합한다. 본 명세서에서 교차적으로 사용되는 용어 "항체" 및 "항체들"은 면역 글로불린 분자의 면역학적으로 활성화된 부분을 포함하는 파편 및 이의 파생체(즉, 이러한 부분은 특히 표지 인자 단백질, 예를 들어, 표지 인자 단백질의 항원 결정 부위와 같은 항원에 결합하는 항원 결합 부위를 포함한다)뿐만 아니라 면역 글로불린 분자를 말한다. 특히 본 발명의 단백질에 결합하는 항체는 단백질에 결합하는 항체이지만, 실질적으로 표본 내 다른 분자, 예를 들어, 자연적으로 단백질을 포함하는 생물학적 표본에는 결합하지 않는다. 면역 글로불린 분자의 면역학적으로 활성화된 부분의 예는 단일 체인 항체(scAb), F(ab) 및 F(ab')₂파편을 포함하나 이에 한정되지는 않는다.

본 발명의 분리된 단백질 또는 이의 파편은 항체를 생성하기 위한 면역원으로 사용될 수 있다. 완전한 길이의 단백질이 사용되거나, 대체적 방법으로, 본 발명은 면역원으로 사용할 수 있는 항원적 펩티드 파편을 제공한다. 본 발명의 단백질의 상기 항원적 펩티드는 본 발명의 단백질들 중 하나의 아미노산 염기서열의 최소한 8(바람직하게는 10, 15, 20, 또는 30 또는 그 이상)개의 아미노산 잔여부를 포함하며, 단백질의 최소한 하나의 항원 결정 부위를 포괄하여 펩티드에 대해 올라간 항체가 단백질과 특정한 면역 복합체를 형성하도록 한다. 항원적 펩티드가 포괄하는 바람직한 항원 결정 부위는 단백질의 표면상에 위치한 영역, 예를 들어, 친수성 영역이다. 소수성 염기서열 분석, 친수성 염기서열 분석, 또는 유사한 분석들이 친수성 영역을 식별하기 위해 사용될 수 있다. 바람직한 실시예에서, 분리된 표지 인자 단백질 또는 이의 파편이 면역원으로 사용된다.

면역원은 일반적으로 토끼, 염소, 생쥐 또는 기타 포유류 또는 척추 동물과 같이 적절한(즉, 면역 능력을 가진) 대상이 면역력을 가지게 함으로써 항체를 준비하는데 사용된다. 적절한 면역원의 준비는, 예를 들어, 재조합적으로 발현되거나 화학적으로 합성된 단백질 또는 펩티드를 포함한다. 상기 준비는 프로인드(Freund)의 완전하거나 불완전한 보조제와 같은 보조제, 또는 유사한 면역 자극 인자의 제제를 더 포함할 수 있다. 바람직한 면역원 성분은, 예를 들어, 본 발명의 단백질의 재조합 발현을 위한 비인간 숙주 세포를 사용하여 만들어진 면역원 성분과 같은 인간 단백질 외에는 포함하지 않는 성분이다. 이러한 방식에서, 결과적인 항체 성분이 감소하거나 본 발명의 단백질외의 다른 어떠한 인간 단백질의 결합도 가지지 않는다.

본 발명은 다중 복제 및 단일 복제 항체를 제공한다. 본 명세서에서 사용되는 용어 "단일 복제 항체" 또는 "단일 복제 항체 성분"은 특정한 항원 결정 부위와 면역적으로 반응할 수 있는 오직 한 종의 항원 결합 부위만을 포함하는 항체 분자의 군집을 말한다. 바람직한 다중 복제 및 단일 복제 항체 성분은 본 발명의 단백질에 대한 항체에 대해서 선택된 성분이다. 특히 바람직한 다중 복제 및 단일 복제 항체 준비는 표지 인자 단백질 또는 이의 파편에 대한 항체만을 포함하는 것이다.

다중 복제 항체는 적절한 대상을 면역원으로서의 본 발명의 단백질에 고정시킴으로써 제조될 수 있다. 면역화된 대상에서 상기 항체의 시간이 지남에 따른 역가는 고정화된 폴리펩티드를 사용하는 효소 결합 면역 흡수 분석(ELISA)과 같은 표준 기술에 의해 모니터링될 수 있다. 면역화 후 적절한 시간 후, 예를 들어, 상기 특정한 항체 역가가 최고일 때, 항체 생산 세포가 대상으로부터 획득되어, 콜러(Kohler) 및 밀스타인(Milstein) (1975) 네이처 256:495-497에 원래 기술된 하이브리도마 기술, 인간 B 세포 하이브리도마 기술(코즈보르(Kozbor) 외, 1983, Immunol . Today 4:72 참조), EBV-하이브리도마 기술 (콜(Cole) 외, pp. 77-96 In 단일 복제 항체 및 암 치료, Alan R. Liss, Inc., 1985 참조) 또는 트리오마 기술과 같은 표준 기술에 의해 단일 복제 항체(mAb)를 생산하기 위해 사용될 수 있다. 하이브리도마를 제조하기 위한 상기 기술은 잘 알려져 있다(일반적으로 면역학에서의 현재 프로토콜, 콜리건(Coligan) 외 ed., 존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 1994 참조). 단일 복제 본 발명의 항체를 생산하는 하이브리도마 세포들이, 예를 들어, 표준 ELISA 분석을 사용하여, 관심있는 폴리펩티드에 결합하는 항체에 대한 하이브리도마 배양 상층액을 선별함으로써 탐지된다.

단일 복제 항체-분비 하이브리도마를 생산하는 것에 대한 대체적 방법으로, 본 발명의 단백질에 대항하는 단일 복제 항체가 식별될 수 있으며, 재조합으로 조합된 면역 글로불린 라이브러리(예를 들어, 항체 파지 전시 라이브러리)를 관심있는 폴리펩티드로 선별함으로써 분리될 수 있다. 파지 전시 라이브러리를 생성하고 선별하기 위한 키트가 상업적으로 사용 가능하다(예를 들어, 파마시아의 재조합 파지 항체 시스템, 카탈로그 제 27-9400-01호; 및 스트라타 유전자 SurfZAP 파지 디스플레이 키트, 카탈로그 제 240612호). 추가적으로, 방법 및 반응 제제의 예, 특히 항체 디스플레이 라이브러리의 생성과 선별에 사용할 수 있는 예는, 예를 들어, 미국 특허 제 5,223,409호; PCT 국제 공개 WO 92/18619; PCT 국제 공개 WO 91/17271; PCT 국제 공개 WO 92/20791; PCT 국제 공개 WO 92/15679; PCT 국제 공개 WO 93/01288; PCT 국제 공개 WO 92/01047; PCT 국제 공개 WO 92/09690; PCT 국제 공개 WO 90/02809; 푸쉬(Fuchs) 외(1991) Bio /기술 9:1370-1372; 헤이(Hay) 외(1992) Hum . Antibod . Hydromas 3:81-85; 휴즈(Huse) 외(1989) 사이언스 246:1275- 1281; 그리피스(Griffiths) 외(1993) EMBO J. 12:725-734에서 찾아 볼 수 있다.

본 발명은 또한 특히 본 발명의 단백질에 결합하는 재조합 항체를 제공한다. 바람직한 실시예에서, 상기 재조합 항체는 특히 표지 인자 단백질 또는 이의 파편에 결합한다. 재조합 항체는 인간 및 비인간 부분을 모두 포함하는 키메릭 및 인간화된 단일 복제 항체, 단일 체인 항체 및 다중 특정 항체를 포함하나 이에 한정되지는 않는다. 키메릭 항체는 쥐과 동물 mAb로부터 도출된 변수 영역과 인간 면역 글로불린 상수 영역과 같이 다른 부분들이 다른 동물 종으로부터 도출되는 분자이다. (예를 들어, 참조에 의해 전체적으로 본 명세서에 통합된 카빌리(Cabilly) 외, 미국 특허 제 4,816,567호; 및 보스(Boss) 외, 미국 특허 제 4,816,397호 참조). 단일 체인 항체는 하나의 항원 결합 부위를 가지며 단일 폴리펩티드를 포함한다. 이들은 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: 래드너(Ladner) 외, 미국 특허 제 4,946,778호(본 명세서에서 참조에 의해 전체적으로 통합된다); 버드(Bird) 외, (1988) 사이언스 242:423-426; 위트로우(Whitlow) 외, (1991) 효소학의 방법 2:1-9; Whitlow 외, (1991) 효소학의 방법 2:97-105; 및 허스튼(Huston) 외, (1991) 효소학의 방법 분자 설계 및 모델링 : 개념 및 적용 203:46-88. 다중 특정 항체는 특히 다른 항원에 결합하는 최소한 둘 항원-결합 부위를 가지는 항체 분자이다. 이러한 분자는 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: 세갈(Segal), 미국 특허 제 4,676,980호(문헌의 개시는 참조에 의해 전체적으로 본 명세서에 통합되었다); 홀링거(Holliger) 외, (1993) Proc . Natl . Acad . Sci . USA 90:6444-6448; 위트로우(Whitlow) 외, (1994) Protein Eng . 7:1017-1026 및 미국 특허 제 6,121,424호.

인간화된 항체는 하나 또는 그 이상의 비인간 종으로부터의 보완성 결정 영역(CDR) 및 인간 면역 글로불린 분자로부터의 프레임워크 영역을 가지는 비인간 종으로부터의 항체 분자이다. (예를 들어, 참조에 의해 전체적으로 본 명세서에 통합된 미국 특허 제 5,585,089호 참조.) 인간화된 단일 복제 항체는 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: PCT 국제 공개 WO 87/02671; 유럽 특허 출원 제 184,187호; 유럽 특허 출원 제 171,496호; 유럽 특허 출원 제 173,494호; PCT 국제 공개 WO 86/01533; 미국 특허 제 4,816,567호; 유럽 특허 출원 제 125,023호; 베터(Better) 외(1988) 사이언스 240:1041-1043; 리우(Liu)외 (1987) Proc . Natl . Acad . Sci . USA 84:3439-3443; 리우(Liu) 외(1987) J. Immunol . 139:3521- 3526; 선(Sun) 외(1987) Proc . Natl . Acad . Sci . USA 84:214-218; 니시무라(Nishimura) (1987) Cancer Res . 47:999-1005; 우드(Wood) 외 (1985) 네이처 314:446-449; 및 쇼(Shaw) 외(1988) J. Natl . Cancer Inst . 80:1553-1559); 모리슨(Morrison)(1985) 사이언스 229:1202-1207; 오이(Oi) 외 (1986) Bio /Technics 4:214; 미국 특허 제 5,225,539호; 존스(Jones) 외 (1986) 네이처 321:552-525; 베르호이언(Verhoeyan) 외 (1988) 사이언스 239:1534; 및 바이들러(Beidler) 외 (1988) J. Immunol . 141:4053-4060.

보다 특정적으로, 인간화된 항체는, 예를 들어, 내생 면역 글로불린의 무겁고 가벼운 체인 유전자를 발현할 능력을 가지지 않으나 인간의 무겁고 가벼운 체인 유전자를 발현할 수 있는 형질 전환 생쥐를 사용하여 제조할 수 있다. 이러한 형질 전환 생쥐는 정상적 방법으로 선택된 항원, 예를 들어, 본 발명의 표지 인자에 해당하는 전부 또는 일부의 폴리펩티드로 면역화된다. 항원에 대한 단일 복제 항체는 통상의 하이브리도마 기술을 사용하여 획득할 수 있다. 상기 인간 면역 글로불린 트랜스유전자는 B 세포 분화 동안 재정렬되는 상기 형질 전환 생귀에 의해 자리를 잡으며, 이후 종류 변환 및 신체적 변이를 겪는다. 따라서, 이러한 기술을 사용하여, 치료적으로 유용한 IgG, IgA 및 IgE 항체를 제조하는 것이 가능하다. 인간 항체 제조를 위한 이러한 기술에 대한 검토는 론버그(Lonberg)와 허스자르(Huszar) (1995) Int . Rev . Immunol . 13:65-93를 참조할 수 있다. 인간 항체와 인간 단일 복제 항체 및 이러한 항체를 제조하기 위한 프로토콜에 대한 이러한 기술의 상세한 설명은, 예를 들어, 미국 특허 5,625,126; 미국 특허 5,633,425; 미국 특허 5,569,825; 미국 특허 5,661,016; 및 미국 특허 5,545,806을 참조할 수 있다. 또한, 아브제닉스(Abgenix, Inc. (Freemont, CA)) 사와 같은 회사들이, 상기 기술된 것과 유사한 기술을 사용하여 선택된 항원에 대한 인간 항체를 제공하기 위해 협력을 맺을 수 있다.

선택된 항원 결정 부위를 인식하는 완전히 인간적인 항체는 "안내된 선택"으로 불리는 기술을 사용하여 생성될 수 있다. 이러한 접근 방식에서 선택된 비인간 단일 복제 항체, 예를 들어, 쥐과 동물 항체가 동일한 항원 결정 부위를 인식하는 완전히 인간적인 항체의 선택을 안내하기 위해 사용된다(제스퍼스(Jespers) 외, 1994, Bio /Technics 12:899-903).

본 발명의 항체는 생산 이후에 분리될 수 있으며(예를 들어, 대상의 혈액 또는 혈청으로부터) 또는 해당 분야에 잘 알려진 기술에 의해 합성 및 더 정제될 수 있다. 예를 들어, IgG 항체는 단백질 A 크로마토그래피를 사용하여 정제될 수 있다. 본 발명의 단백질에 특정한 항체는 선택되거나(예를 들어, 부분적인 정제), 예를 들어, 친화성 크로마토그래피에 의해 정제될 수 있다. 예를 들어, 재조합적으로 발현되고 정제된(또는 부분적으로 정제된) 본 발명의 단백질은 본 명세서에 설명된 대로, 또한, 예를 들어, 크로마토그래피 기둥과 같은 고체 지지체에 공유 결합적으로 또는 비공유 결합적으로 결합되어 생산된다. 상기 기둥은 많은 수의 서로 다른 항원 결정 부위에 대한 항체를 포함하는 표본으로부터의 본 발명의 단백질들에 특정한 항체를 정제하여 친화성을 가지게 하기 위해 사용될 수 있으며, 이에 의해 실질적으로 정제된 항체 성분, 즉, 실질적으로 오염 항체가 없는 항체 성분을 생성한다. 실질적으로 정제된 항체 성분은, 본 발명의 맥락에서, 항체 표본이 원하는 본 발명의 단백질이 아닌 항원 결정 부위에 대한 오염 항체를 최대 30%(건조 중량 기준) 이하로 포함하며, 바람직하게는 표본의 최대 20%, 보다 바람직하게는 최대 10%, 및 가장 바람직하게는 최대 5%(건조 중량 기준)가 오염 항체인 것을 의미한다. 정제된 항체 성분은 성분 내의 최소한 99%의 항체가 본 발명의 바람직한 단백질에 대한 것임을 의미한다.

바람직한 실시예에서, 본 발명의 상기 실질적으로 정제된 항체는 특히 본 발명의 단백질의 신호 펩티드, 분비된 염기서열, 외부세포 영역, 막 관통이나 세포질막 영역, 또는 세포질막에 결합될 수 있다. 특히 바람직한 실시예에서, 본 발명의 상기 실질적으로 정제된 항체는 특히 본 발명의 단백질의 아미노산 염기서열의 분비된 염기서열 또는 외부 세포 영역에 결합된다. 보다 바람직한 실시예에서, 상기 실질적으로 정제된 본 발명의 항체는 특히 표지 인자 단백질의 아미노산 염기서열의 분비된 염기서열 또는 외부 세포 영역에 결합된다.

본 발명의 단백질에 대항하는 항체는 친화성 크로마토그래피 또는 면역 침강법과 같은 표준 기술에 의해 단백질을 분리하기 위해 사용될 수 있다. 더구나, 이러한 항체는 표지 인자의 발현의 수준 및 패턴을 평가하기 위해, (예를 들어, 세포 용해물 또는 세포 상층액 내의) 표지 인자 단백질 또는 이의 파편을 탐지하는데 사용될 수 있다. 상기 항체는 예를 들어, 주어진 치료 식이 요법의 효능을 결정하기 위한 임상적 절차의 일부로서 조직 또는 체액 내의 단백질 수준(예를 들어 체액과 연관된 질병 상태 또는 독성 상태에서)을 진단적으로 모니터링하기 위해 사용될 수 있다. 탐지는 항표지 인자 항체를 탐지 가능물질에 결합하는 본 발명의 항체를 포함하는 항체 파생체를 사용하여 쉽게 수행될 수 있다. 탐지 가능물질의 예는 여러 효소, 보족기, 형광 물질, 발광성 물질, 생물발광 물질, 및 방사능 물질을 포함한다. 적절한 효소의 예는 호스래디시 퍼옥시다제, 알칼리 포스타파아제, β-갈락토시다제, 또는 아세틸촐린에스테라제를 포함하며; 적절한 보족기 복합체의 예는 스트렙타비딘/비오딘 및 아비딘/비오딘을 포함하며; 적절한 형광 물질의 예는 움벨리페론, 플루오레세인, 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐라민 플루오레세인, 염화단실 또는 피코에리티린을 포함하며; 발광성 물질의 예는 루미놀을 포함하며; 생물 발광 물질의 예는 루시퍼라제, 루시퍼린, 및 아에쿼린을 포함하며; 적절한 방사능 물질의 예는 ¹²⁵I, ¹³¹I, ³⁵S, ¹⁴C, 또는 ³H를 포함한다.

본 발명의 항체는 암을 치료하기 위한 치료용 제제로 사용될 수 있다. 바람직한 실시예에서, 완전하게 인간적인 본 발명의 항체는 특히 암을 가지는 인간의 암 환자의 치료적 치료제로서 사용될 수 있다. 또 다른 바람직한 실시예에서, 항체, 특히 표지 인자 단백질 또는 이의 파편에 결합하는 항체는 치료적 처리를 위해 사용된다. 또한, 이러한 치료적 항체는 세포 독소와 같은 치료적 비결합 성분과 켤레를 이루는 항체를 포함하는 항체 파생체 또는 면역 독소, 치료용 제제 또는 방사성 금속 이온이다. 세포 독소 또는 세포 독성 제제는 세포에 해가 되는 모든 제제를 포함한다. 그 예는 탁솔, 산이토찰라신 B, 그라미시딘 D, 브롬화 에티듐, 에메틴, 미토마이신, 에토포사이드, 테노포시드, 빈크리스틴, 빈블라스틴, 콜치신, 독소루비신, 다우노루비신, 디하이드록시 안트라신 디온, 미톡산트론, 미트란마이신, 악티노마이신 D, 1-디하이드로테스토테론, 글루코코티코이드, 프로카인, 테트라카인, 리도카인, 프로파놀롤, 및 퓨로마이신 및 유사체 또는 이의 상동. 치료용 제제는 항대사 물질(예를 들어, 메토트렉세이트, 6-메르캅토퓨린, 6-티오구아닌, 사이타라빈, 5-불화우라실 데카바자인), 알킬화 제제(예를 들어, 메클로레타민, 티오에파 클로람부실, 메팔란, 카르머스틴(BSNU) 및 로무스틴(CCNU), 사이콘덴세호스파마이드, 부설판, 디브로모마니톨, 스트렙토조토신, 미토마이신 C, 및 시스-디클로로나아민 플라티늄(II) (DDP) 시스플라틴), 안트라사이클린 (예를 들어, 다우노루비신(이전의 다우노마이신) 및 독소루비신), 항생제 (예를 들어, 댁티노마이신(이전의 액티노마이신), 블레오마이신, 미트라마이신, 및 안트라마이신(AMC)), 및 항유사 분열 제제(예를 들어, 빈크리스틴 및 빈블라스틴)를 포함하나 이에 한정되지는 않는다.

본 발명의 켤레 항체는 주어진 생물학적 반응을 변화시키기 위해 사용될 수 있으며, 약제의 비결합 성분은 고전적 화학적 치료용 제제에 한정되지 않는 것으로 추정되어야 한다. 예를 들어, 약제 비결합 성분은 원하는 생물학적 활성을 보유하는 단백질 또는 폴리펩티드일 수 있다. 이러한 단백질은, 예를 들어, 리보좀 억제 단백질(베터(Better) 외, 미국 특허 제 6,146,631호 참조, 상기 문헌의 개시는 본 명세서에 전체적으로 통합된다), 아브린, 리신 A, 수도모나스 엑소독소, 또는 디프테리아 독소와 같은 독소; 종양 괴사 요소, 알파 인터페론, 베타 인터페론, 신경 성장 요소, 혈소판 도출 성장 요소, 조직 플라스미노겐 활성 인자와 같은 단백질; 또는, 예를 들어, 림포킨, 인터루킨-1 ("IL-1"), 인터루킨-2 ("IL-2"), 인터루킨-6 ("IL-6"), 그래뉼로사이트 마크로파제 군체 자극 요소("GM-CSF"), 그래뉼로사이트 군체 자극 요소("G-CSF")와 같은 생물학적 반응 변경 인자, 또는 기타 성장 요소를 포함할 수 있다.

이러한 치료적 비결합 성분을 항체에 켤레로 만드는 기술은 잘 알려져 있으며, 예를 들어, 다음 문헌을 참조할 수 있다: 아르논(Arnon) 외, "암 치료에서 약제의 면역 타게팅을 위한 단일 복제 항체", in 단일 복제 항체 및 암 치료, 라이스필드(Reisfeld) 외(eds.), pp. 243-56 (Alan R. Liss, Inc. 1985); 헬스트롬(Hellstrom) 외, " 약 전달을 위한 항체", 제어된 약 전달(제 2판), 로빈슨(Robinson) 외(eds.), pp. 623-53 (Marcel Dekker, Inc. 1987); 소르페(Thorpe), "암 치료에서 세포 독성 제제의 항체 담체: 리뷰", 단일 복제 항체 '84: 생물학적 및 임상적 적용, 핀체라(Pinchera[ 외(eds.), pp. 475-506 (1985); "암 치료에서 방사성 라벨링된 항체의 치료적 사용의 분석, 결과, 및 향후 전망", 암 탐지 및 치료를 위한 단일 복제 항체, 볼드윈(Baldwin) 외 (eds.), pp. 303-16 (Academic Press 1985), 및 소르페(Thorpe) 외, "항체-독소 켤례의 준비 및 세포 독성 특성", Immunol. Rev., 62:119-58 (1982).

이에 따라, 한 측면에서, 본 발명은 실질적으로 정제된 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질 및 바람직하게는, 표지 인자 단백질에 결합한다. 다양한 실시예에서, 상기 실질적으로 정제된 본 발명의 항체, 또는 파편 또는 이의 파생체는 인간, 비인간, 키메릭 및/또는 인간화된 항체일 수 있다. 또 다른 측면에서, 본 발명은 비인간 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질, 바람직하게는, 표지 인자 단백질에 결합한다. 이러한 비인간 항체는 염소, 생쥐, 양, 말, 닭, 쥐 또는 쥐의 항체일 수 있다. 대체적 방법으로, 본 발명의 상기 비인간 항체는 키메릭 및/또는 인간화된 항체일 수 있다. 또한, 상기 비인간 본 발명의 항체는 다중 복제 항체 또는 단일 복제 항체일 수 있다. 또 다른 부가적인 측면에서, 본 발명은 단일 복제 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질, 바람직하게는, 표지 인자 단백질에 결합한다. 상기 단일 복제 항체는 인간 및 인간화된 항체, 키메릭 및/또는 비인간 항체일 수 있다.

본 발명은 또한 탐지 가능 물질에 짝지어질 수 있는 본 발명의 항체를 포함하는 키트, 및 사용 지침을 포함한다. 본 발명의 또 다른 측면은 본 발명의 항체를 포함하는 약학적 성분을 포함한다. 일 실시예에서, 상기 약학적 성분은 본 발명의 항체 및 약학적으로 허용되는 담체를 포함한다.

E. 예측적 의약품

본 발명은 진단적 분석, 예후의 분석, 약물 유전체학, 및 검사 및 임상적 조사가 예후의(예측적) 목적으로 사용되어 이에 의해 개별적 예방적 활동을 수행하는 예측적 의약품의 분야에 관한 것이다. 이에 따라, 본 발명의 한 측면은 개체가 특정 질병 또는 약제로 유도되는 독성을 진전시킬 위험이 있는 지를 결정하기 위하여 단백질 또는 핵산의 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하기 위한 진단적 분석에 관한 것이다. 이러한 분석은 예후의 또는 예측적 목적으로 사용될 수 있으며, 이에 의해 질환이 시작되기 이전에 개체를 예방적으로 치료할 수 있다.

본 발명의 또 다른 측면은 임상적 시도에서 제제(예를 들어, 질환 또는 약제로 유도되는 독성을 억제, 치료 또는 예방하기 위한 목적 중 하나로 투여되는 약제 또는 기타 화합물{즉 이러한 치료가 가지는 약제로 유도되는 독성 효과를 이해하기 위해})의 본 발명의 표지 인자의 발현 또는 활성에 대한 영향을 모니터링하는 것에 대한 것이다. 이들 및 기타 다른 제제들은 이후의 절에서 보다 상세히 설명된다.

F. 진단적 분석

생물학적 표본 내 표지 인자 단백질 또는 핵산의 존재 또는 부존재를 결정하기 위한 예시적 방법은 검사 대상으로부터 생물학적 표본(예를 들어 독성 관련 체액 또는 조직 표본)을 획득하는 단계 및 생물학적 표본을 폴리펩티드 또는 핵산(예를 들어, mRNA, 게놈 DNA, 또는 cDNA)를 탐지할 수 있는 화합물 또는 제제와 접촉시키는 단계를 포함한다. 따라서 본 발명의 탐지 방법은, 예를 들어, 생체 내 생물학적 표본뿐만 아니로 생체 외 생물학적 표본에 대해서 mRNA, 단백질, cDNA, 또는 게놈 DNA를 탐지하기 위해 사용될 수 있다. 예를 들어, mRNA의 탐지를 위한 생체 외 기술은 북부 잡종 형성 및 부위 내 잡종 형성을 포함한다. 표지 인자 단백질의 탐지를 위한 생체 외 기술은 효소 결합 면역 흡수 분석(ELISA), 서부 블롯, 면역 침강법 및 면역 형광법을 포함한다. 게놈 DNA 탐지를 위한 생체 외 기술은 남부 잡종 형성을 포함한다. mRNA 탐지를 위한 생체 내 기술은 중합효소 연쇄 반응(PCR), 북부 잡종 형성 및 부위 내 잡종 형성을 포함한다. 또한, 표지 인자 단백질의 탐지를 위한 생체 내 기술은 대상으로 단백질 또는 이의 파편에 대한 라벨링된 항체를 도입하는 것을 포함한다. 예를 들어, 상기 항체는 대상 내에서의 존재 및 위치가 표준 영상화 기술로 탐지될 수 있는 방사성 표지 인자로 라벨링될 수 있다.

이러한 진단적 및 예후의 분석의 일반적 원리는 표지 인자를 포함할 수 있는 표본 또는 반응 혼합물을 준비하고, 및 표지 인자 및 탐침이 반응하고 결합하기에 충분한 적절한 조건하에서 적절한 시간 동안 탐색하여, 반응 혼합물 내에서 제거되고, 또한/또는 탐지될 수 있는 복합체를 형성하는 것을 포함한다. 이러한 분석들은 여러 가지 방법으로 수행될 수 있다.

예를 들어, 이러한 분석을 수행하는 한 방법은 표지 인자 또는 탐침을 기질으로도 불리는 고체 상 지지체에 안착시키는 단계, 및 반응의 마지막에 상기 고체 상 지지체에 안착된 타겟 표지 인자/탐침 복합체를 탐지하는 단계를 포함할 수 있을 것이다. 이러한 방법의 일 실시예에서, 표지 인자의 존재 및/또는 농도에 대해 분석될 대상으로부터의 표본은 담체 또는 고체 상 지지체에 안착될 수 있다. 또 다른 실시예에서, 탐침이 고체 상에 안착될 수있고 대상으로부터의 표본이 분석에서 안착되지 않은 성분으로서 반응할 수 있는 반대의 상황도 가능하다.

분석 성분을 고체 상에 안착시키기 위한 많은 방법이 확립되어 있다. 이러한 방법은 한정되지 않으면서, 비오딘 및 스트렙타비딘의 켤레 결합을 통해 고정되는 표지 인자 또는 탐침 분자를 포함한다. 이러한 비오딘화딘 분석 성분은 해당 분야에 알려진 기술(예를 들어, 비오딘화 키트, 피어스(Pierce) 케미컬, 록포드, IL)을 사용하여 비오딘-NHS (N-하이드록시-석시니마이드)으로부터 제조될 수 있으며, 스트렙타비딘-코팅된 96 개의 웰 플레이트(Pierce 케미컬)의 웰에 고정될 수 있다. 특정 실시예에서, 고정된 분석 성분을 가지는 상기 표면은 미리 준비되어 저장될 수 있다.

이러한 분석을 위한 다른 적절한 담체 또는 고체 상태 지지체는 상기 표지 인자 또는 탐침이 속하는 분자의 계열을 결합할 능력이 있는 어떠한 물질도 포함한다. 잘 알려진 지지체 또는 담체는 유리, 폴리스티렌, 나일론, 폴리프로필렌, 나일론, 폴리에틸렌, 덱스트란, 아밀라아제, 자연적 및 수정된 셀룰로오즈, 폴리아크릴아미드, 가브로, 및 마그네타이트를 포함하나 이에 한정되지는 않는다.

상기 언급된 접근 방식으로 분석을 수행하기 위해, 고정되지 않은 성분이 제 2 성분이 그 위에 장착되는 고체 상태에 추가된다. 반응이 완료되고 난 후, 복합되지 않은 성분들은 형성된 모든 복합물이 고체 상태 상에 고정되어 유지된다는 조건 하에 (예를 들어, 세척에 의해) 제거될 수 있다. 고체 상에 안착한 표지 인자/탐침 복합체의 탐지는 본 명세서에 개략적으로 설명된 다수의 방법에 의해 성취될 수 있다.

바람직한 실시예에서, 상기 탐침은, 안착되지 않은 분석 성분인 경우, 본 명세서에서 논의된 탐지 가능 라벨 및 해당 분야의 통상의 기술자에게 잘 알려진 라벨을 사용하여 직접적 또는 간접적으로 분석의 탐지 및 해독의 목적으로 라벨링될 수 있다.

표지 인자/탐침 복합체 형성을, 추가적으로 조작하거나 또는 양 성분(표지 인자 또는 탐침)을 라벨링하지 않고, 예를 들어 형광 에너지 이전(예를 들어, 라코윅즈(Lakowicz) 외, 미국 특허 제 5,631,169호; 스타브리아노포울로스(Stavrianopoulos) 외, 미국 특허 제 4,868,103호 참조) 방법을 활용하여 탐지하는 것도 가능하다. 제 1 '도너' 분자 상의 형광단 라벨은 적절한 파장 길이의 입사광이 여과될 때, 이로부터 방출된 형광 에너지가 제 2 '수용기' 분자의 형광 라벨에 흡수되도록 선택되며, 이는 다시 흡수된 에너지로 인해 형광을 발생시킬 수 있다. 대체적 방법으로, '도너' 단백질 분자는 단순히 트립토판 잔여부의 자연적 형광 에너지를 활용할 수 있다. 라벨은 '수용기' 분자 라벨이 '도너' 분자 라벨로부터 구분될 수 있게 하기 위해 다른 파장 길이의 빛을 방출하도록 선택된다. 라벨들 사이의 에너지 전달 효율이 분자를 분리시키는 거리에 관계되기 때문에, 분자들 사이의 공간적 관계가 평가된다. 결합이 분자들 간에 일어나는 상황에서는, 분석 내의 '수용기' 분자 라벨의 형광 방출이 최대로 되어야 한다. FET 결합 이벤트는 해당 분야에서 잘 알려져 있는 표준 형광 검출 탐지 수단을 통해 간편하게 측정될 수 있다(예를 들어, 형광 검출기를 사용).

또 다른 실시예에서, 표지 인자를 인식할 수 있는 탐침의 능력의 결정은 두 분석 성분(탐침 또는 표지 인자)을 라벨링하지 않고 실시간 바이오분자 상호 반응 분석(BIA)(예를 들어, 스졸랜더(Sjolander, S.) 및 우르바닉스키(Urbaniczky, C.), 1991, Anal . Chem . 63:2338-2345 및 스자보(Szabo) 외, 1995, Curr . Opin . Struct . Biol . 5:699-705 참조)과 같은 기술을 사용하여 수행될 수 있다. 본 명세서에서 사용되는, “BIA” 또는 “표면 플라스몬 공명”은 어떠한 반응물(예를 들어, BIA 코어)도 라벨링하지 않으면서 생물학적 특정 상호 반응을 실시간으로 연구하기 위한 기술이다. 결합 표면 (결합 이벤트를 나타냄)에서의 질량 변화는 결과적으로 표면 근처에서의 빛의 굴절률 변화로 나타나며(표면 플라스몬 공명(SPR)의 광학적 성질), 결과적으로 생물학적 분자 사이의 실시간 반응을 나타내는 것으로 사용될 수 있는 탐지 가능 신호로 나타난다.

대체적 방법으로, 또 다른 실시예에서, 유사한 진단적 및 예후의 분석이 액상에서 표지 인자 및 탐침을 용질로 하여 수행될 수 있다. 이러한 분석에서, 상기 복합화된 표지 인자 및 탐침은 복합화되지 않은 성분으로부터 다수의 표준 기술 중 하나로 분리되며, 이러한 기술은 분별 원심 분리, 크로마토그래피, 전기영동 및 면역 침강법을 포함하나 이에 한정되지는 않는다. 분별 원심 분리에서, 표지 인자/탐침 복합체는 복합되지 않은 분석 성분으로부터 자신들의 서로 다른 크기 및 밀도를 기반으로 침착의 평형이 다른 점을 이용하여 일련의 원심분리 단계를 통해 분리될 수 있다(예를 들어, 리바스(Rivas, G.) 및 민튼(Minton, A.P.), 1993, Trends Biochem Sci . 18(8): 284-7 참조). 복합된 분자를 복합되지 않은 분자로부터 분리하기 위해 표준 크로마토그래피 기술을 사용할 수 있다. 예를 들어, 겔 여과 크로마토그래피는 크기를 기반으로 분자를 분리하며, 예를 들어, 기둥 양식 내에서 적절한 겔 여과 수지를 활용함으로써, 상대적으로 큰 복합 분자가 상대적으로 작은 비복합 성분으로부터 분리될 수 있다. 마찬가지로, 표지 인자/탐침 복합체의 비복합 성분과 비교하여 상대적으로 다른 전하의 성질을 사용하여, 예를 들어, 이온 교환 크로마토그래피 수지의 활용을 통해 복합 성분을 비복합 성분으로부터 구분할 수 있다. 이러한 수지와 크로마토그래피 기술은 해당 분야의 통상의 기술자에게 잘 알려져 있다(예를 들어, 히가드(Heegaard, N.H.), 1998, J. Mol . Recognit . 윈터(Winter) 11(1-6):141-8; 하지(Hage, D.S.), 및 트위드(Tweed, S.A.) J Chromatogr B Biomed Sci Appl 1997 Oct 10;699(1-2):499-525 참조). 겔 전기영동 또한 복합환된 분석 성분을 결합되지 않은 성분과 분리하기 위해 채택될 수 있다(예를 들어, 아우수벨(Ausubel) 외, ed., 분자생물 학에서의 현 재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 1987-1999 참조). 이러한 기술에서, 단백질 또는 핵산 복합제는, 예를 들어, 크기 또는 전하를 기반으로 분리될 수 있다. 전기영동 과정 동안 결합 상호 반응을 유지하기 위해, 일반적으로 환원 제제가 없는 비 변성 겔 매트릭스 물질 및 조건들이 바람직하다. 특정한 분석 및 이의 성분에 적절한 조건들은 해당 분야의 통상의 기술자에게 잘 알려져 있다.

특정한 실시예에서, 상기 표지 인자 mRNA의 수준은 생물학적 표본 내의 부위 상 및 생체 외 양식에 의해 해당 분야에서 알려진 방법을 사용하여 결정할 수 있다. 용어 "생물학적 표본"은 조직, 세포, 생체액 및 대상 내에 존재하는 조직, 세포 및 액체뿐만 아니라 대상으로부터 분리된 이들의 분리물을 포함하도록 의도된 것다. 많은 발현 탐지 방법은 분리된 RNA를 사용한다. 생체 외 방법에 대해, mRNA의 분리와 반대로 선택하지 않는 어떠한 RNA 분리 기술도 세포로부터 RNA를 분리하기 위해 사용될 수 있다(예를 들어, 아우수벨(Ausubel) 외, ed., 분자생물학에서의 현재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), 뉴욕 1987-1999 참조). 또한, 많은 수의 조직 표본들이 해당 분야의 통상의 기술자에게 잘 알려진 기술, 예를 들어, 촘크진스키(Chomczynski)(1989, 미국 특허 제 4,843,155호)의 단일 단계 RNA 분리 과정을 사용하여 쉽게 처리될 수 있다.

상기 분리된 mRNA는 잡종 형성 또는 증폭 분석에서 사용될 수 있으며, 이는 남부(Southern) 또는 북부(Northern) 분석, 중합효소 연쇄 반응 분석 및 탐침 배열을 포함하나 이에 한정되지는 않는다. mRNA 수준의 탐지를 위한 바람직한 한 진단적 방법은 분리된 mRNA를 탐지되고 있는 유전자에 의해 부호화된 mRNA에 잡종을 형성할 수 있는 핵산 분자(탐침)와 접촉시키는 것을 포함한다. 상기 핵산 탐침은, 예를 들어, 엄격한 조건 하에서 본 발명의 표지 인자를 부호화하는 mRNA 또는 게놈적 DNA에 잡종을 형성할 수 있는 최소한 7, 15, 30, 50, 100, 250 또는 500 길이의 뉴클레오타이드의 올리고뉴클레오타이드와 같은 완전한 길이의 cDNA, 또는 이의 부분일 수 있다. 본 발명의 진단적 분석을 위해 사용할 수 있는 다른 적절한 탐침이 본 명세서에 기술되어 있다. 탐침에 의한 mRNA의 잡종 형성은 문제가 되는 표지 인자가 발현되고 있음을 나타낸다.

한 양식에서, 상기 mRNA는 고체 표면 상에 고정되고, 예를 들어, 분리된 mRNA를 아가로스 겔 상에서 작동하게 하고 mRNA를 겔로부터 니트로셀룰로오즈와 같은 막으로 이동시킴으로써 탐침에 접촉된다. 또 다른 양식에서는, 탐침(들)이 고체 표면 상에 고정되고 mRNA가, 예를 들어, 아피메트릭스(Affymetrix) 사의 유전자 칩 배열 내의 탐침(들)에 접촉된다. 해당 분야의 통상의 기술자라면 알려진 mRNA 탐지 방법을 본 발명의 표지 인자에 의해 부호화된 mRNA의 수준을 탐지하기 위해 적응시킬 수 있을 것이다.

표본 내 mRNA 표지 인자의 수준을 결정하기 위한 한 대체적 방법은 핵산 증폭 과정, 예를 들어, RT-PCR(멀리스(Mullis), 1987, 미국 특허 제 4,683,202호에 개시된 실험적 실시예), 리가아제 연쇄 반응(바라니(Barany), 1991, Proc . Natl . Acad . Sci . USA , 88:189-193), 자체 지지 염기서열 복제(구아텔리(Guatelli) 외, 1990, Proc . Natl . Acad . Sci. USA 87:1874-1878), 전사적 증폭 시스템(쿼(Kwoh) 외, 1989, Proc . Natl . Acad . Sci . USA 86:1173-1177), Q-베타 복제 효소(리자디(Lizardi) 외, 1988, Bio /Technics:1197), 구르는 원 복제(리자디(Lizardi) 외, 미국 특허 제 5,854,033호) 또는 기타 다른 핵산 증폭 방법에 의해 수행될 수 있고, 이후 해당 분야의 통상의 기술자에게 잘 알려진 기술을 사용하여 증폭된 분자의 탐지가 이어진다. 이러한 탐지 기술 체계는 핵산 분자가 매우 적은 개수로 존재하는 경우에 핵산 분자의 탐지에 특히 유용하다. 본 명세서에서 사용되는, 증폭 프라이머는 유전자의 5'또는 3'영역(각각 플러스 및 마이너스 가닥, 또는 그 반대)에 아닐링될 수 있으며 사이의 짧은 영역을 포함하는 핵산 분자의 쌍인 것으로 정의된다. 일반적으로, 증폭 프라이머는 약 10 내지 30의 길이를 가지는 뉴클레오타이드이며 영역 약 50 내지 20의 길이를 가지는 뉴클레오타이드로부터의 측면 영역을 포함한다. 적절한 조건 및 적절한 반응 제제 하에서, 이러한 프라이머는 프라이머에 의해 측면 부착된 뉴클레오타이드 염기서열을 포함하는 핵산 분자의 증폭을 가능케 한다.

부위 내(in situ) 방법을 위해, mRNA는 탐지 이전에 분리될 필요가 없다. 이러한 방법에서, 세포 또는 조직 표본이 알려진 조직학적 방법을 사용하여 준비/처리된다. 이 표본은 이후 지지체, 일반적으로 유리 슬라이드 상에 고정되고, 다시 표지 인자를 부호화하는 mRNA로 잡종을 형성할 수 있는 탐침에 접촉된다.

표지 인자의 절대적 발현 수준을 기반으로 결정을 내리는 방법에 대한 대안으로, 이러한 결정은 표지 인자의 정규화된 발현 수준을 기반으로 내릴 수 있다. 발현 수준은 표지 인자의 절대적 발현 수준을 표지 인자가 아닌 유전자, 예를 들어, 구성요소로서 발현되는 항존(housekeeping) 유전자의 발현과 비교하여 교정함으로써 정규화된다. 정규화를 위한 적절한 유전자는 액틴 유전자와 같은 항존 유전자 또는 상피 세포 특정 유전자를 포함한다. 이러한 정규화를 통해 하나의 표본, 예를 들어, 환자 표본에서 다른 표본, 예를 들어, 비 질병 또는 비독성 표본으로, 또는 다른 소스로부터의 표본들 사이에서의 발현 수준의 비교가 가능하다.

대체적인 방법으로, 상기 발현 수준은 상대적 발현 수준을 제공할 수 있다. 표지 인자의 상대적 발현 수준을 결정하기 위해, 문제가 되는 표본의 발현 수준을 결정하기 이전에, 상기 표지 인자의 발현 수준은 정상 대비 분리된 질병 또는 독성 세포의 10개 또는 그 이상의 표본, 바람직하게는 50 또는 그 이상의 표본에 대해 결정된다. 많은 개수의 표본 내에서 분석된 유전자의 평균 발현 수준이 결정되며 이는 표지 인자에 대한 기준치 발현 수준으로 사용된다. 검사 표본에 대해 결정된 표지 인자의 발현 수준(절대적 발현 수준)은 이후 해당 표지 인자로부터 획득한 평균 발현 값으로 나누어진다. 이는 상대적 발현 수준을 제공한다.

바람직하게는, 기준치 결정에 사용된 표본은 비질병 또는 비독성 세포로부터 유래된 것이어야 한다. 세포 소스의 선택은 상대적 발현 수준의 사용에 따라 달라진다. 정상 조직에서 발견되는 발현을 평균 발현 스코어로 사용하는 것은 분석된 표지 인자가 질병 또는 독성에 특정한지(정상 세포 대비)를 증명하는데 도움이 된다. 또한, 보다 많은 데이터가 축적됨에 따라, 평균 발현 값이 개정될 수 있으며, 축적된 데이터를 기반으로 보다 개선된 상대적 발현 값을 제공하게 된다. 질병 세포 또는 독성 세포로부터의 발현 데이터는 질병 또는 독성 상태의 심각성에 대한 단계를 판별하는 수단을 제공한다.

본 발명의 또 다른 실시예에서, 표지 인자 단백질이 탐지된다. 본 발명의 단백질의 표지 인자를 탐지하기 위한 바람직한 제제는 이러한 단백질 또는 이의 파편에 결합할 수 있는 항체, 바람직하게는 탐지 가능 라벨을 가진 항체이다. 항체는 다중 복제될 수 있으며, 또는 보다 바람직하게는, 단일 복제될 수 있다. 순수한 항체, 또는 파편 또는 이의 파생체(예를 들어, Fab 또는 F(ab')₂)가 사용될 수 있다. 용어 탐침 또는 항체에 대해 "라벨링된"은, 직접적으로 라벨링된 반응 제제와 반응시킴으로써 탐침 또는 항체를 간접적으로 라벨링시키는 것뿐만 아니라, 탐지 가능물질을 탐침 또는 항체에 커플링(즉, 물리적 연결)시킴으로써 탐침 또는 항체의 직접적 라벨링을 포괄하도록 의도된 것이다. 간접적 라벨링의 예는 형광적으로 라벨링된 이차 항체를 사용한 일차 항체의 탐지 및 비오딘에 의한 DNA 탐침의 종단 라벨링하여 형광적으로 라벨링된 스트렙타비딘으로 탐지될 수 있도록 하는 것을 포함한다

세포로부터의 단백질은 해당 분야의 통상의 기술자에게 잘 알려진 방법을 사용하여 분리될 수 있다. 채택된 단백질 분리 방법으로는, 예를 들어, 할로우(Harlow)와 레인(Lane)(할로우(Harlow)와 레인(Lane), 1988, 항체: A Laboratory Manual, 콜드 스프링 하버 출판사, 콜드 스프링 하버, 뉴욕)에 기술된 방법이 채택될 수 있다.

다양한 양식들이 표본이 주어진 항체에 결합하는 단백질을 포함하는 지를 결정하기 위해 채택될 수 있다. 이러한 양식의 예는 효소 면역 분석 (EIA), 방사선 면역 분석 (RIA), 서부 블롯 분석 및 효소 연관 면역 흡수체 분석 (ELISA)을 포함하나 이에 한정되지는 않는다. 해당 분야의 통상의 기술자라면 알려진 단백질/항체 탐지 방법을 세포가 본 발명의 표지 인자를 발현하는지를 결정하기 위해 적응시킬 수 있을 것이다.

한 양식에서, 항체, 또는 항체 파편 또는 파생체가 서부 블롯 또는 면역 형광법 기술과 같은 방법에서 발현된 단백질을 탐지하기 위해 사용될 수 있다. 이러한 사용에 있어서, 일반적으로 항체 또는 단백질 중 하나를 고체 지지체 상에 고정시키는 것이 뱌람직하다. 적절한 고체 지지체 또는 담체는 항원 또는 항체를 결합시킬 수 있는 지지체를 포함한다. 잘 알려진 지지체 또는 담체는 유리, 폴리스티렌, 나일론, 폴리프로필렌, 나일론, 폴리에틸렌, 덱스트란, 아밀라아제, 자연적 및 수정된 셀룰로오즈, 폴리아크릴아미드, 가브로, 및 마그네타이트를 포함한다.

해당 분야의 통상의 기술자라면 결합 항체 또는 항원을 위한 적절한 담체를 알고 있을 것이며, 이러한 담체를 본 발명을 위해 사용할 수 있도록 적응시킬 수 있을 것이다. 예를 들어, 질병 또는 독성 세포로부터 분리되 단백질은 폴리아크릴아미드 겔 전기영동 상에서 구동될 수 있으며 니트로셀룰로오즈와 같은 고체 상태 지지체에 고정될 수 있다. 이 지지체는 이후 적절한 버퍼로 세척된 후 탐지 가능하도록 라벨링된 항체로 처리될 수 있다. 상기 고체 상태 지지체는 결합되지 않은 항체를 제거하기 위해 버퍼로 수회 세척될 수 있다. 이 후 고체 지지체 상의 결합 라벨의 양이 통상적인 수단에 의해 탐지될 수 있다.

본 발명은 또한 생물학적 표본 내 표지 인자 단백질 또는 핵산의 존재를 탐지할 수 있는 키트를 포괄한다. 이러한 키트는 대상이 특정한 질병 또는 약제로 유도되는 독성을 겪고 있거나 이를 개발할 위험성에 처해 있는지를 결정하기 위해 사용될 수 있다. 예를 들어, 상기 키트는 생물학적 표본 내의 표지 인자 단백질 또는 핵산을 탐지할 수 있는 라벨링된 화합물 또는 제제, 및 단백질 또는 표본 내 mRNA의 양을 결정하기 위한 수단(예를 들어, 단백질 또는 이의 파편에 결합하는 항체, 또는 단백질을 부호화하는 DNA 또는 mRNA 에 결합하는 올리고뉴클레오타이드 탐침)을 포함할 수 있다. 상기 키트는 또한 상기 키트를 사용하여 획득한 결과를 해석하기 위한 지침을 포함할 수 있다.

항체 기반 키트에 대해, 이러한 키트는, 예를 들어: (1) 표지 인자 단백질에 결합되는 제 1 항체 (예를 들어, 고체 지지체에 부착); 및, 선택적으로, (2) 상기 단백질 또는 제 1 항체에 결합되며 탐지 가능 라벨의 켤레가 되는 제 2의 다른 항체를 포함할 수 있다.

올리고뉴클레오타이드 기반 키트에 대해, 상기 키트는, 예를 들어: (1) 올리고뉴클레오타이드, 예를 들어, 표지 인자 단백질을 부호화하는 핵산 염기서열로 잡종을 형성하는 탐지 가능하게 라벨링된 올리고뉴클레오타이드, 또는 (2) 표지 인자 핵산 분자를 증폭하기에 유용한 프라이머의 쌍을 포함할 수 있다. 상기 키트는 또한, 예를 들어, 버퍼링 제제, 보존제, 또는 단백질 안정 제제를 포함할 수 있다. 상기 키트는 탐지 가능 라벨(예를 들어, 효소 또는 기질)을 탐지하기 위해 필요한 성분을 더 포함할 수 있다. 상기 키트는 또한 분석되어 검사 표본에 비교될 수 있는 제어 표본 또는 일련의 제어 표본들을 포함할 수 있다. 상기 키트의 각 성분은 개별적 컨테이너에 수용될 수 있으며, 다수의 컨테이너 모두가 키트를 사용하여 수행된 분석의 결과를 해석하기 위한 지침과 함께 단일 패키지 내에 있을 수 있다.

G. 약물 유전체학

본 발명의 표지 인자는 또한 약물 유전체학적 표지 인자로서 유용하다. 본 명세서에서 사용되는 “약물 유전체학적 표지 인자”는 그 발현 수준이 환자 내의 특정한 임상적 약 반응 또는 민감도와 상호 관련되는 객관적인 생화학적 표지 인자이다(예를 들어, 맥레오드(McLeod) 외 (1999) Eur . J. Cancer 35(12): 1650-1652 참조). 약물 유전체학적 표지 인자 발현의 존재 또는 양은 환자의 예측된 반응, 보다 특정적으로는 특정한 약제 또는 약제의 종류에 의한 치료에 대한 질병에 걸린 환자 또는 독성 세포의 반응과 관련된다. 환자 내에서 하나 또는 그 이상의 약물 유전체학적 표지 인자의 발현의 존재 또는 그 양을 분석함으로써, 환자에 대해 가장 적절한 약제 치료, 또는 성공의 정도가 가장 클 것으로 예상되는 치료가 선택될 수 있다. 예를 들어, 환자 내에서 특정한 종양 표지 인자에 의해 부호화된 RNA 또는 단백질의 존재 또는 양을 기반으로, 환자 내에 존재할 수 있는 특정한 종양의 치료에 최적화된 약제 또는 치료 과정이 선택될 수 있다. 따라서, 약물 유전체학적 표지 인자의 사용은 다른 약제나 치료 체계를 사용하지 않고도 각 암 환자에 대한 가장 적절한 치료를 선택하거나 설계할 수 있게 해 준다.

약물 유전체학의 또 다른 측면은 신체가 약제에 반응하는 양식을 변경시키는 유전학적 조건을 다루는 것이다. 이러한 약학적, 유전학적 조건은 희귀한 결함 또는 다형성으로서 발생할 수 있다. 예를 들어, 글루코스-6-인산염 디하이드로제나제(G6PD) 결핍은 흔한 유전적 효소 질환으로서 주요 임상적 합병증은 옥시던트 약제(항 말라리아 제, 설폰아마이드, 진통제, 니트로퓨란)의 섭취 또는 잠두(fava bean)의 소모 이후의 혈액 용균이다.

예시적 실시예로서, 대사 활동 효소의 약제 활성은 강도 및 약제의 작용 기간 모두를 결정하는 주요 요소이다. 약제 대사 효소(예를 들어, N-아세틸기 전이효소 2 (NAT 2) 및 시토크롬 P450 효소 CYP2D6 및 CYP2C19)의 유전학적 다형성의 발견은 왜 일부 환자들에게 기대되었던 약의 효과가 나타나지 않는지, 또는 왜 약제를 표준 양으로 안전하게 투여한 이후에 과도한 약제 반응 및 심각한 독성이 나타나는지에 대한 설명을 제공하였다. 이러한 다형성은 군집 내의 두 표현형인 확장된 대사 인자(EM) 및 빈약한 대사 인자(PM)로 표현된다. PM의 우열은 다른 군집들 사이에서 다르게 나타난다. 예를 들어, CYP2D6를 위한 유전자 부호화는 고도의 다형성을 보이며 다양한 변이가 PM에서 식별되었는데, 이는 모두 기능적 CYP2D6의 부재를 초래하였다. CYP2D6 및 CYP2C19의 빈약한 대사 인자는 이들이 표준 투여량을 수용할 때 매우 자주 과도한 약제 반응 및 부작용을 경험한다. 대사 물질이 능동적인 치료적 비결합 성분이라면, PM은 치료적 반응을 보이지 않을 것이며, 이는 이의 CYP2D6 형성 대사 물질 모르핀에 의한 코데인 중재의 진통제 효과에서 보여진다. 다른 극단적 상태는 소위 매우 빠른 대사 인자라 불리는 것으로 표준 투약에 반응하지 않는 것이다. 최근에, 매우 빠른 대사의 분자적 기반이 CYP2D6 유전자 증폭 덕분에 식별되었다.

따라서, 본 발명의 표지 인자의 발현 수준의 결정은 이에 의해 개인의 치료제 또는 예방적 치료제를 위한 적절한 제제(들)을 선택할 수 있도록 개별적으로 결정될 수 있다. 또한, 약제 대사 효소를 부호화하는 다형성 대립 유전자의 유전 형질 분석을 개별적 약제의 반응성 표현형의 식별에 적용하기 위해, 약제 유전학적 연구가 사용될 수 있다. 이러한 지식이 약제의 투여 또는 이의 선택에 적용되는 경우, 부작용이나 또는 치료에서의 실패를 피할 수 있으며, 따라서 대상을 본 발명의 표지 인자의 발현의 조절 인자로 치료할 때 치료제 또는 예방제의 효율을 향상시킬 수 있다.

H. 임상적 시도의 모니터링

제제(예를 들어, 약제 화합물)가 본 발명의 표지 인자의 발현 수준에 미치는 영향을 모니터링하는 것은 기본적인 약제 선별뿐만 아니라, 임상적 시도에도 적용할 수 있다. 예를 들어, 표지 인자 발현에 영향을 미치는 제제의 효율성은 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성, 또는 약제로 유도되는 독성과 같은 특정 질병에 대한 치료를 받는 환자의 임상적 시도에서 모니터링될 수 있다. 바람직한 실시예에서, 본 발명은 제제(예를 들어, 작용 물질, 억제 물질, 펩티도미메트릭, 단백질, 펩티드, 핵산, 소형 분자, 또는 기타 약제 후보)를 사용한 대상의 치료의 효율성을 모니터링하는 방법을 제공하며, 상기 방법은 (i) 제제의 투여 이전에 대상으로부터을 획득하는 단계; (ii) 투여 전 표본 내의 본 발명의 하나 또는 그 이상의 선택된 표지 인자의 발현 수준을 탐지하는 단계; (iii) 대상으로부터 하나 또는 그 이상의 투여 후 표본을 획득하는 단계; (iv) 투여 후 표본 내의 표지 인자의 발현 수준(들)을 탐지하는 단계; (v) 상기 투여 전 표본 내의 표지 인자의 발현 수준(들)을 투여 후 표본 또는 표본 내의 표지 인자의 발현 수준(들)과 비교하는 단계; 및 (vi) 상기 결과에 따라 투여 대상에 대한 제제의 투여를 변경하는 단계를 포함한다. 예를 들어, 치료 과정 중의 표지 인자 유전자(들)의 증가된 발현은 효과적인 투여를 나타낼 수 있으며 투여량을 늘리는 것이 바람직함을 보일 수 있다. 반대로, 표지 인자 유전자(들)의 감소된 발현은 효과적인 치료를 나타낼 수 있으며 투여량을 변화시킬 필요가 없음을 보일 수 있다.

H. 배열

본 발명은 또한 본 발명의 표지 인자로 이루어진 배열을 포함한다. 상기 배열은 배열 내에서 하나 또는 그 이상의 유전자의 발현을 평가하기 위해 사용될 수 있다. 일 실시예에서, 상기 배열은 배열 내의 유전자의 조직 특정성을 확인하기 위해 조직 내의 유전자 발현을 분석하는데 사용될 수 있다. 이러한 방식에서, 약 760개까지의 유전자가 발현에 대해 동시에 분석될 수 있다. 이는 특히 하나 또는 그 이상의 조직들에서 발현된 유전자의 배터리를 보여 주는 프로필을 개발하게 해 준다.

이러한 정성적 결정과 더불어, 본 발명은 유전자 발현의 정량 측정을 가능케 한다. 따라서, 조직 특정성뿐만 아니라, 조직 내 유전자의 배터리의 발현 수준 또한 확인이 가능하다. 따라서, 유전자는 이들의 조직 발현 자체 및 해당 조직 내 발현 수준을 기반으로 군을 형성할 수 있다. 이는, 예를 들어, 조직 사이 또는 이들 중의 유전자 발현의 관계를 확인하는데 유용하다. 따라서, 하나의 조직이 교란되고 다른 조직에서의 유전자 발현에 대한 효과가 결정될 수 있다. 이러한 맥락에서, 생물학적 자극에 대한 반응으로서, 한 세포 유형의 또 다른 세포 유형에 대한 효과가 결정된다. 이러한 결정은, 예를 들어, 유전자 발현 수준에서 세포-세포 상호 반응을 알아 내는데 유용하다. 제제가 하나의 세포 유형을 치료하기 위해 치료적으로 투여되었으나 다른 세포 유형에서는 바람직하지 못한 효과를 보이는 경우, 본 발명은 상기 바람직하지 못한 효과에 대한 분자 기반의 분석을 제공하며, 따라서 이에 대처할 수 있는 제제를 보조적으로 투여하거나 상기 바람직하지 못한 효과를 다른 방법으로 치료할 수 있는 기회를 제공한다. 마찬가지로, 단일 세포 유형 내에서도, 바람직하지 않은 생물학적 효과가 분자 수준에서 결정될 수 있다. 따라서, 타겟 유전자 이외의 발현에 대한 제제의 효과가 확인되고 이에 대한 대책이 마련될 수 있다.

또 다른 실시예에서, 상기 배열은 배열 내 하나 또는 그 이상의 유전자의 발현의 시간적 전개를 모니터링하기 위해 사용될 수 있다. 이는 본 명세서에서 개시된 여러 생물학적 맥락에서 발생할 수 있으며, 예를 들어 약제로 유도되는 독성의 전개, 약제로 유도되는 독성의 진전 및 약제로 유도되는 독성과 관련된 세포 변형과 같은 과정을 포함한다.

상기 배열은 동일한 세포 내의 다른 유전자 또는 서로 다른 세포 내에서의 발현에 대한 유전자의 발현 효과를 확인하는데도 유용하다. 이는, 예를 들어, 최종적 또는 하향 타겟이 조절될 수 없는 경우에 치료적 시술을 위한 대안적 분자의 타겟의 식별을 제공한다.

상기 배열은 또한 정상 및 비정상 세포 내의 하나 또는 그 이상의 유전자의발현 패턴을 확인하는데 유용하다. 이는 진단 또는 치료적 시술을 위한 분자의 타겟으로 작용할 수 있는 유전자의 배터리를 제공한다.

VII . 표본 획득을 위한 방법

본 발명의 방법에서 유용한 표본은 본 발명의 표지 인자를 표현하는 조직, 세포, 생체 검사, 또는 신체의 액체 표본을 포함한다. 일 실시예에서, 상기 표본은 조직, 세포, 전체 혈액, 혈청, 플라스마, 구강 내 표본, 침, 뇌척수액, 오줌, 기관, 또는 기관지 폐포 세척액이다. 바람직한 실시예에서, 상기 조직 표본은 질병 상태 또는 독성 상태 표본이다. 보다 바람직한 실시예에서, 상기 조직 표본은 암 표본, 당뇨 표본, 비만 표본, 심장혈관 표본 또는 약제로 유도되는 독성 표본이다.

신체 표본은 해당 분야에서 알려진 다양한 기술, 예를 들어, 생체 검사에 의해, 또는 부위를 긁거나 문지름으로써, 또는 바늘을 사용하여 체액을 추출하는 등의 기술을 사용하여 대상으로부터 획득할 수 있다. 여러 신체 표본을 수집하는 방법은 해당 분야에서 잘 알려져 있다.

본 발명의 표지 인자를 탐지하고 정량 측정하기에 적절한 조직 표본은 신선하거나, 냉동되거나, 해당 분야의 통상의 기술자에게 알려져 있는 방법에 따라 고정될 수 있다. 적절한 조직 표본은 바람직하게는 절개되고 추가 분석을 위해 현미경 슬라이드 상에 놓여진다. 대체적 방법으로, 고체 표본, 즉, 조직 표본이 용액화되고, 또한/또는 균일화되고 이후 용해성 추출물로서 분석된다.

일 실시예에서, 신선하게 획득되는 생체 검사 표본은, 예를 들어, 액체 질소 또는 디플로로디클로로메탄을 사용하여 냉동된다. 상기 냉동된 표본은, 예를 들어, OCT를 사용하여 구획하기 위해 장착되며, 저온 유지 장치 내에 일련 구획을 제공한다. 상기 일련의 구획들은 유리 현미경 슬라이드 상에 수집된다. 면역 조직화학 검사 염색을 위해 상기 슬라이드들은 구?牡? 슬라이드 상에 고정되어 유지되도록 하기 위해, 예를 들어, 크롬-알룸, 겔라틴 또는 폴리-L-라이신으로 코팅될 수 있다. 또 다른 실시예에서, 표본들은 고정되고 구획 전에 삽입된다. 예를 들어, 조직 표본은, 탈수되어, 예를 들어, 파라핀에 삽입된, 예를 들어, 포르말린으로 고정될 수 있다.

일단 표본이 획득되면 본 발명의 표지 인자를 탐지하고 정량 측정하기에 적절한 해당 분야에서 알려진 방법이 사용될 수 있다(핵산 또는 단백질 수준 중 하나에서). 이러한 방법은 해당 분야에서 잘 알려져 있으며, 서부 블롯, 북부 블롯, 남부 블롯, 면역조직화학, ELISA, 예를 들어, 증폭된 ELISA, 면역 침강법, 면역 형광법, 유동 세포 계수법, 면역세포화학, 질량 분광계 분석, 예를 들어, MALDI-TOF 및 SELDI-TOF, 핵산 잡종 형성 기술, 핵산 역 전사 방법, 및 핵산 증폭 방법을 포함하나 이에 한정되지는 않는다. 특정 실시예에서, 본 발명의 표지 인자의 발현은, 예를 들어, 특히 이들 단백질에 결합하는 항체를 사용하여 단백질 수준에서 탐지된다.

표본은 항체 결합에 접근할 수 있는 본 발명의 표지 인자를 만들기 위해 수정될 수 있다. 면역세포화학 또는 면역조직화학 방법의 특정한 측면에서, 슬라이드들은 치료 전 버퍼로 옮겨 지고, 항원 접근성을 높이기 위해 선택적으로 가열될 수 있다. 치료 전 버퍼 내에서의 표본의 가열은 세포의 지질 이중 레이어를 빠르게 교란시키며, 항원(신선한 표본의 경우에 해당할 수 있으나, 고정된 표본에서는 일반적으로 발생하지 않음)에 항체 결합을 위해 보다 쉽게 접근되도록 한다. 용어 "치료 전 버퍼" 및 "준비 버퍼"는 특히 항체 결합에 대한 본 발명의 표지 인자의 접근성을 증가시킴으로써 면역 염색을 위한 세포학 또는 조직학 표본을 준비하기 위해 본 명세서에서 사용되는 버퍼를 말하기 위해 교차적으로 사용되었다. 치료 전 버퍼는 pH-특정 염 용액, 중합체, 세제, 또는 비이온성 또는 음이온성 계면활성제, 예를 들어, 알카노염 또는 알콕시염 또는 이들 계면활성제들의 혼합물까지를 포함하는 에틸록시화 음이온 또는 비이온 계면활성제, 또는 담즙염의 사용까지도 포함할 수 있다. 치료 전 버퍼는, 예를 들어, 0.1% 내지 1%의 데옥시콜릭 산 용액, 나트륨 염, 또는 나트륨 라우레스-13-카르복실염(예를 들어, 산도판(Sandopan) LS) 용액 또는 및 에톡시화 음이온 복합체일 수 있다. 일부 실시예에서, 상기 사전 치료 버퍼는 슬라이드 저장 버퍼로도 사용될 수 있다.

표지 인자 본 발명의 단백질들을 항체 결합을 위해 보다 접근하기 쉽게 만드는 어떠한 방법도 발명을 실시하기 위해 사용될 수 있으며, 여기에는 항원 확보를 위해 해당 분야에서 알려진 방법들이 포함된다. 예를 들어, 비보(Bibbo) 외 (2002) Acta . Cytol. 46:25-29; Saqi, 외 (2003) Diagn . Cytopathol. 27:365-370; 비보(Bibbo) 외 (2003) Anal. Quant . Cytol . Histol. 25:8-11을 참조할 수 있으며, 그 전체 내용은 참조에 의해 본 명세서에 통합된다.

표지 인자 단백질 접근성을 증가시키기 위한 사전 치료에 뒤이어, 표본들을 적절한 차단 제제, 예를 들어, 수소 퍼옥사이드와 같은 퍼옥시다제 반응 차단 제제를 사용하여 차단할 수 있다. 일부 실시예에서, 상기 표본은 항체의 비특정 결합을 방지하기 위한 반응 제제를 차단하는 단백질을 사용하여 차단할 수 있다. 상기 단백질 차단 반응 제제는, 예를 들어, 정제된 카세인을 포함할 수 있다. 항체, 특히 본 발명의 표지 인자에 결합하는 단일 복제 또는 다중 복제 항체는 표본과 함께 배양된다. 해당 분야의 통상의 기술자는 일부 경우에 보다 정확한 예단 또는 진단이 환자 표본 내의 표지 인자 본 발명의 단백질 상의 다중 항원 결정 부위를 탐지함으로써 획득될 수 있다는 것을 인식할 것이다. 따라서, 특정 실시예에서, 본 발명의 표지 인자의 서로 다른 항원 결정 부위에 작용하는 최소한 두 항체가 사용된다. 하나를 초과하는 항체가 사용되는 경우, 이들 항체는 단일 표본에 개별적 항체 반응 제제로서 연속적으로, 또는 항체 칵테일로서 동시에 추가될 수 있다. 대체적 방법으로, 각각의 개별적 항체가 동일한 환자로부터 분리된 표본에 추가될 수 있으며, 그 결과가 데이터 풀 내에 보관된다.

항체 결합을 탐지하는 기술은 해당 분야에서 잘 알려져 있다. 본 발명의 표지 인자에 대한 항체 결합은 항체 결합의 수준에 해당하는 탐지 가능 신호를 생성하는 화학적 반응 제제의 사용을 통해 탐지될 수 있으며, 이에 따라, 표지 인자 단백질 발현의 수준을 탐지할 수 있다. 본 발명의 면역조직화학 또는 면역세포화학 방법 중 하나에서, 항체 결합은 라벨링된 중합체의 켤레가 되는 이차 항체의 사용을 통해 탐지된다. 라벨링된 중합체의 예는 중합체-효소 켤레를 포함하나 이에 한정되지는 않는다. 이러한 복합체 내의 상기 효소는 일반적으로 항원-항체 결합 부위에서의 발색체의 침착을 촉진시키기 위해 사용되며, 이에 의해 결과적으로 관심 대상 생물학적 표지 인자결과의 발현 수준에 해당하는 세포 염색을 가져 온다. 특별한 관심 대상 효소는 호스래디시 퍼옥시다제 (HRP) 및 알칼리 포스타파아제(AP)를 포함하나 이에 한정되지는 않는다.

본 발명의 특정한 면역조직화학 또는 면역세포화학 방법에서, 본 발명의 표지 인자에 대한 항체 결합은 제 2 항체의 켤레가 되는 HRP-라벨링된 중합체의 사용을 통해 탐지된다. 항체 결합은 또한 종에 특정한 탐침 반응 제제를 사용하여 탐지될 수 있으며, 이때 이 제제는 종에 특정한 탐침 반응 제제에 결합하는 HRP의 켤레인 단일 복제 또는 다중 복제 항체, 및 중합체에 결합한다. 슬라이드는 항체 결합을 위해 임의의 발색제, 예를 들어, 발색제 3,3-디아미노벤지딘(DAB)을 사용하여 착색되고, 이후 헤마톡실린으로 대응 착색되며, 선택적으로, 암모늄 하이드록사이드 또는 TBS/Tween-20과 같은 청색화 제제로 착색된다. 다른 적절한 발색체는, 예를 들어, 3-아미노-9-에틸카바졸(AEC)을 포함한다. 본 발명의 일부 측면에서, 슬라이드는 세포 염색 분석을 위해 세포화학자 및/또는 병리학자에 의해 현미경을 이용한 방법, 예를 들어, 형광 염색(즉, 표지 인자 발현)으로 검토된다. 대체적 방법으로는, 표본은 자동화된 현미경 관찰법을 통해 또는 긍정적 염색 세포의 식별을 빠르게 해 주는 컴퓨터 소프트웨어의 도움을 받는 요원에 의해 검토될 수 있다.

항체 결합의 탐지는 항표지 인자 항체를 탐지 가능물질에 결합함으로써 보다 쉽게 수행될 수 있다. 탐지 가능물질의 예는 여러 효소, 보족기, 형광 물질, 발광성 물질, 생물발광 물질, 및 방사능 물질을 포함한다. 적절한 효소의 예는 호스래디시 퍼옥시다제, 알칼리 포스타파아제, β-갈락토시다제, 또는 아세틸촐린에스테라제를 포함하며; 적절한 보족기 복합체의 예는 스트렙타비딘/비오딘 및 아비딘/비오딘을 포함하며; 적절한 형광 물질의 예는 움벨리페론, 플루오레세인, 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐라민 플루오레세인, 염화단실 또는 피코에리티린을 포함하며; 발광성 물질의 예는 루미놀을 포함하며; 생물 발광 물질의 예는 루시퍼라제, 루시퍼린, 및 아에쿼린을 포함하며; 적절한 방사능 물질의 예는 ¹²⁵I, ¹³¹I, ³⁵S, ¹⁴C, 또는 ³H를 포함한다.

본 발명의 일 실시예에서, 냉동된 표본은 상기 기술된 방법으로 준비되어, 이후, 예를 들어, 삼중-버퍼링된 염분(TBS)를 사용하여 적절한 농도로 희석된 본 발명의 표지 인자에 대한 항체로 착색된다. 일차 항체는 슬라이드를 비오딘화 항면역 글로불린 내에서 배양함으로써 탐지될 수 있다. 이 신호는 선택적으로 증폭되고 항원의 디아미노벤지딘 침착을 사용하여 시각화될 수 있다. 또한, 슬라이드는 세포를 시각화하기 위해 선택적으로, 예를 들어 헤마톡실린으로 대응 착색될 수 있다.

또 다른 실시예에서, 고정되고 삽입된 표본이 본 발명의 표지 인자에 대한 항체로 착색되고 냉동 부분에서 상기 기술된대로 대응 착색된다. 또한, 표본은 항체 염색을 시각화를 위해 신호를 증폭하기 위해 선택적으로 제제로 처리될 수 있다. 예를 들어, 비오디닐(biotinyl)-티라미드의 퍼옥시다제-촉매 침착을 수행하고, 이후 퍼옥시다제-켤레 스트렙타비딘(효소화된 신호 증폭(CSA) 시스템, DAKO, 카핀테리아, CA)을 사용할 수 있다.

조직-기반 분석(즉, 면역조직화학)은 본 발명의 표지 인자를 탐지하고 정량화하기 위한 바람직한 방법이다. 일 실시예에서, 본 발명의 표지 인자의 존재 또는 부재는 면역조직화학에 의해 결정될 수 있다. 일 실시예에서, 상기 면역 조직화학 검사 분석은 표지 인자가 결여된 세포가 착색되지 않도록 저 농도의 항표지 인자 항체를 사용한다. 또 다른 실시예에서, 본 발명의 표지 인자의 존재 또는 부재가 표지 인자 단백질 착색이 심하게 결여된 세포와 같은 고농도의 항표지 인자 항체를 사용하는 면역 조직화학 검사 방법을 사용하여 결정된다. 착색하지 않는 세포는 변이된 표지 인자 및 항원적으로 인식 가능한 표지 인자 단백질을 생산할 수 없는 세포이거나, 또는 표지 인자 수준을 조절하는 경로에 조절 장애가 일어나, 결과적으로 무시할 수 있는 표지 인자 단백질의 안정 상태 발현이 발생하는 세포이다.

해당 분야의 통상의 기술자라면 본 발명의 방법을 실시하기 위해 사용되는 특정한 항체의 농도가 결합의 시간, 본 발명의 표지 인자에 대한 항체의 특정성의 수준, 및 표본의 준비 방법과 같은 요소에 따라 변화할 수 있다는 것을 인식할 것이다. 또한, 다중 항체가 사용될 때, 요구되는 농도는 항체가 표본에 적용되는 순서, 예를 들어, 칵테일로서 동시에 적용되는지 또는 개별적 항체 반응 제제로서 연속적으로 적용되는지에 따라 영향을 받을 수 있다. 또한, 본 발명의 표지 인자의 항체 결합을 시각화하기 위해 사용된 탐지 화학 방법은 또한 노이즈 비율에 대해 원하는 신호를 생성하기 위해 최적화되어야 한다.

본 발명의 일 실시예에서, 단백질체의 방법, 예를 들어, 질량 분광학이 표지 인자 본 발명의 단백질들을 탐지하고 정량화하기 위해 사용된다. 예를 들어, 단백질-결합 칩에 대해, 혈청과 같은 생물학적 표본의 적용을 포함하는 매트릭스-연관 레이저 탈착/이온화 비행 시간(time-of-flight) 질량 분광학 (MALDI-TOF MS) 또는 표면-개선 레이저 탈착/이온화 비행 시간(time-of-flight) 질량 분광학 (SELDI-TOF MS)(라이트 주니어(Wright, G.L., Jr.) 외(2002) Expert Rev Mol Diagn 2:549; 리(Li, J.), 외 (2002) Clin Chem 48:1296; 라롱가(Laronga, C.) 외(2003) Dis markers 19:229; 페트리코인(Petricoin, E.F.) 외(2002) 359:572; 아담(Adam, B.L.) 외(2002) 암 Res 62:3609; 톨슨(Tolson, J.) 외(2004) Lab Invest 84:845; 지아오(Xiao, Z.) 외(2001) Cancer Res 61:6029)을 사용하여 PY-Shc 및/또는 p66-여성 단백질을 탐지하고 정량화할 수 있다. 질량 분광학적 방법은, 예를 들어, 미국 특허 제 5,622,824호, 제5,605,798호 및 제 5,547,835호에 기술되어 있으며, 그 전체 내용은 참조에 의해 본 명세서에 각각 통합된다.

다른 실시예에서, 본 발명의 표지 인자의 발현은 핵산 수준에서 탐지된다. 발현을 분석하기 위한 핵산-기반 기술은 해당 분야에서 잘 알려져 있으며, 예를 들어, 대상으로부터의 표본 내의 표지 인자 mRNA의 수준을 결정하는 방법을 포함한다. 많은 발현 탐지 방법이 분리된 RNA를 사용한다. mRNA의 분리에 반해 선택을 하지 않는 모든 RNA 분리 기술이 본 발명의 표지 인자를 발현하는 세포로부터의 RNA 정제를 위해 사용할 수 있다(예를 들어, 오수벨(Ausubel) 외, ed., (1987-1999) 분자생물학에서의 현재 프로토콜(존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 참조). 또한, 많은 수의 조직 표본들이, 예를 들어, 촘크진스키(Chomczynski) (1989, 미국 특허 제 4,843,155호)의 단일 단계 RNA 분리 과정과 같은 해당 기술 분야의 통상의 기술자에게 잘 알려진 기술을 사용하여 쉽게 처리될 수 있다.

용어 "탐침"은 본 발명의 표지 인자에 선택적으로 결합할 수 있는 모든 분자, 예를 들어, 뉴클레오타이드 전사체 및/또는 단백질을 말한다. 탐침은 해당 분야에서 알려진 방법 중 하나, 또는 적절한 생물학적 준비로부터 도출된 방법을 사용하여 합성될 수 있다. 탐침은 특히 라벨링되도록 설계될 수 있다. 탐침으로 사용될 수 있는 분자의 예는 RNA, DNA, 단백질, 항체, 및 기관계 분자를 포함하나 이에 한정되지는 않는다.

분리된 mRNA는 잡종 형성 또는 증폭 분석에서 사용될 수 있으며, 남부 또는 북부 분석, 중합효소 연쇄 반응 분석 및 탐침 배열을 포함하나 이에 한정되지는 않는다. mRNA 수준의 탐지를 위한 한 방법은 분리된 mRNA를 표지 인자 mRNA로 잡종을 형성할 수 있는 핵산 분자(탐침)와 접촉시키는 것을 포함한다. 상기 핵산 탐침은, 예를 들어 최소한 7, 15, 30, 50, 100, 250 또는 500의 길이를 가지는 뉴클레오타이드로서 특히 표지 인자 게놈적 DNA에 엄격한 조건에서 잡종을 형성하기에 충분한 올리고뉴클레오타이드와 같은 완전한 길이의 cDNA, 또는 이의 부분일 수 있다.

일 실시예에서, 상기 mRNA는 고체 표면 상에 고정되고, 예를 들어, 분리된 mRNA를 아가로세 겔 상에서 구동시켜 mRNA를 겔로부터 니트로셀룰로오즈와 같은 막으로 이전시킴으로써 탐침과 접촉되게 한다. 대체적인 실시예에서, 상기 탐침(들)은 고체 표면 상에 고정되고, 예를 들어, 아피메트릭스(Affymetrix) 유전자 칩 배열 내의 탐침(들)과 접촉되게 한다. 통상의 기술자라면 알려진 mRNA 탐지 방법을 표지 인자 mRNA의 수준을 탐지하기 위해 사용할 수 있도록 쉽게 적응시킬 수 있을 것이다.

표본 내의 표지 인자 mRNA의 수준을 결정하는 대체적 방법은, 예를 들어, RT-PCR(실험 실시예는 Mullis, 1987, 미국 특허 제 4,683,202호에 개시되어 있음), 리가아제 연쇄 반응(바라니(Barany)(1991) Proc . Natl . Acad . Sci . USA 88:189-193), 자체 지지 염기서열 복제(구아텔리(Guatelli) 외(1990) Proc . Natl . Acad . Sci . USA 87:1874-1878), 전사적 증폭 시스템(쿼(Kwoh) 외(1989) Proc . Natl . Acad . Sci . USA 86:1173-1177), Q-베타 복제 효소(리자디(Lizardi) 외 (1988) Bio /Technics 6:1197), 구르는 원(rolling circle) 복제(Lizardi 외, 미국 특허 제 5,854,033호) 또는 기타 핵산 증폭 방법에 의한 핵산 증폭의 과정, 및 여기에 이어지는 해당 분야의 통상의 기술자에게 잘 알려진 기술을 사용한 증폭된 분자의 탐지를 포함한다. 이러한 탐지 방법은 이들 분자가 매우 작은 수로 존재하는 경우 핵산 분자의 탐지에 특히 유용하다. 본 발명의 특별한 측면에 따르면, 표지 인자 발현은 정량적 형광 RT-PCR (즉, TaqMan^TM 시스템)에 의해 분석된다. 이러한 방법은 일반적으로 본 발명의 표지 인자에 특정한 올리고뉴클레오타이드 프라이머의 쌍을 활용한다. 알려진 염기서열에 특정한 올리고뉴클레오타이드 프라이머를 설계하는 방법은 기술 분야에서 잘 알려져 있다.

본 발명의 표지 인자의 발현 수준은 (북부, 남부, 도트 등에 사용된 것과 같은 및 잡종 형성 분석과 같은)막 블롯, 또는 마이크로웰, 표본 튜브, 겔, 구슬 또는 섬유질(또는 결합 핵산을 포함하는 기타 고체 지지체)을 사용하여 모니터링될 수 있다. 참조에 의해 본 명세서에 통합된 미국 특허 제 5,770,722, 5,874,219, 5,744,305, 5,677,195 및 5,445,934호 참조. 표지 인자 발현의 탐지는 용액 내에서 핵산 탐침을 사용하는 것을 포함할 수 있다.

본 발명의 일 실시예에서, 미세 배열은 본 발명의 표지 인자의 발현을 탐지하기 위해 사용된다. 미세 배열은 서로 다른 실험에서의 재생성 때문에 특히 이러한 목적에 적합하다. DNA 미세 배열은 많은 수의 유전자의 발현 수준을 동시에 측정하는 하나의 방법을 제공한다. 각 배열은 고체 지지체에 부착된 포획 탐침의 재생 가능 패턴으로 구성된다. 라벨링된 RNA 또는 DNA는 배열 상에서 보완 탐침에 대해 잡종을 형성하고 레이저 스캐닝에 의해 탐지된다. 배열 상의 각 탐침의 잡종 형성 강도가 결정되어 상대적 유전자 발현 수준을 나타내는 정량적 값으로 변환된다. 이에 대해서는, 참조에 의해 본 명세서에 통합된 미국 특허 제 6,040,138호, 제 5,800,992호와 제 6,020,135호, 제 6,033,860호, 및 제 6,344,316호를 참조한다. 고밀도 올리고뉴클레오타이드 배열은 표본 내 많은 개수의 RNA에 대한 유전자 발현 프로필을 결정하는데 특히 유용하다.

표지 인자의 양, 및/또는 본 발명의 표지 인자의 양의 수학적 관계는 질병 상태 또는 독성 상태에 대해 치료되고 있는 대상에서의 질병 상태, 예를 들어 암, 당뇨, 비만, 심장병, 또는 독성 상태, 예를 들어, 약제로 유도되는 독성 또는 심장 독성의 재발의 위험, 질병 상태 또는 독성 상태에 대해 치료되고 있는 대상의 생존 가능성, 질병 상태 또는 독성 상태가 악성인지의 여부, 질병 상태 또는 독성 상태를 치료하기 위한 치료 식이 요법의 효능 등을 해당 분야의 통상의 기술자에게 알려진 회귀 분석 방법을 포함하는 본 발명의 방법을 사용하여 계산하는데 사용될 수 있다. 예를 들어, 적절한 회귀 모델은 CART(예를 들어, 힐(Hill, T), 및 루위키(Lewicki, P.) (2006) “STATISTICS 방법 및 적용” StatSoft, Tulsa, OK), 콕스(Cox)(예를 들어, www.evidence-based-medicine.co.uk), 지수, 정규 및 로그 정규 (예를 들어, www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html), 병참적(예를 들어, www.en.wikipedia.org/wiki/Logistic_regression), 매개 변수적, 비매개변수적, 반매개변수적(예를 들어, www.socserv.mcmaster.ca/jfox/Books/Companion), 선형(예를 들어, www.en.wikipedia.org/wiki/Linear_regression), 또는 첨가적(예를 들어, www.en.wikipedia.org/wiki/generalized_additive_model) 모델을 포함하나 이에 한정되지는 않는다.

일 실시예에서, 회귀 분석은 표지 인자의 양을 포함한다. 또 다른 실시예에서, 회귀 분석은 표지 인자의 수학적 관계를 포함한다. 또 다른 실시예에서, 표지 인자의 양 및/또는 표지 인자의 수학적 관계의 회귀 분석은 추가적인 임상적 및/또는 분자의 보조 변량을 포함할 수 있다. 이러한 임상적 보조 변량은 노드의 상태, 종양 단계, 종양 등급, 종양의 크기, 예를 들어, 화학 치료 및/또는 방사선 치료와 같은 치료 방법 체계, 임상적 결과(예를 들어, 재발, 질병에 특정한 생존, 치료 실패) 및/또는 진단 이후 시간, 초기 치료 이후의 시간 및/또는 치료의 완료 이후의 시간의 함수로서의 임상적 결과를 포함하나 이에 한정되지는 않는다.

VIII . 키트

본 발명은 또한 질병 상태 또는 독성 상태에 대한 치료를 받는 대상의 질병 상태, 예를 들어 암, 당뇨, 비만, 심장병, 또는 독성 상태, 예를 들어, 약제로 유도되는 독성 또는 심장 독성, 질병 상태의 재발 또는 독성 상태, 또는 생존을 예단하기 위한 구성 요소 및 키트를 제공한다. 이들 키트들은 다음 중 하나 또는 그 이상을 포함한다: 특히 본 발명의 표지 인자에 결합하는 탐지 가능항체, 특히 염색에 사용하기 위한 대상의 조직 표본의 획득 및/또는 준비를 위한 본 발명의 표지 인자, 반응 제제에 결합하는 탐지 가능항체, 및 이의 사용을 위한 지침.

본 발명의 키트는 선택적으로 본 발명의 방법을 수행하기에 유용한 추가적 성분을 포함할 수 있다. 예로써 설명하면, 상기 키트는 보완 핵산을 아닐링하기에 적합하거나 항체를 상기 항체가 특히 결합되는 단백질에 결합하기에 적합한액체(예를 들어, SSC 버퍼), 하나 또는 그 이상의 표본 구획, 본 발 명의 방법 및 조직 특정한 제어/표준수행을 설명하는 지침 문서를 포함할 수 있다.

IX . 선별 분석

본 발명의 타겟은 본 명세서에 열거된 유전자 및/또는 단백질을 포함하나 이에 한정되지는 않는다. 본 출원인들이 본 명세서에 기술한 실험의 결과를 기반으로, 질병 상태 또는 독성 상태에서 조절되는 핵심 단백질은 세포 골격 성분, 전사 요소, 세포 사멸제 반응, 오탄당 인산염 경로, 생체 합성 경로, 산소 첨가 스트레스(친 옥시던트), 막 변경, 및 산소 첨가 인산화 대사를 포함하는 서로 다른 경로 또는 분자의 군에 연관되거나 이들로 분류될 수 있다. 이에 따라, 본 발명의 일 실시예에서, 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, CANX, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나 또는 그 이상의 유전자(또는 단백질)를 포함한다. 일 실시예에서, 상기 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된 하나 또는 그 이상의 유전자(또는 단백질)을 포함할 수 있다. 일부 실시예에서, 상기 표지 인자는 상기 기술한 유전자(또는 단백질)들 중 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물, 스물-다섯, 서른, 또는 그 이상의 조합이다.

식별된 표지 인자의 조절 인자를 식별하기에 유용한 선별 분석은 아래에서 설명된다.

본 발명은 또한 조절 인자, 즉, 후보 또는 검사 화합물 또는 제제(예를 들어, 단백질, 펩티드, 펩티도미메트릭, 펩토이드, 소형 분자 또는 기타 약제)를 식별하는 방법(본 명세서에서 "선별 분석"으로도 불림)을 제공하며, 상기 방법은 본 발명의 표지 인자의 발현 및/또는 활성을 조절함으로써 질병 상태 또는 독성 상태를 치료하고 예방하는데 유용하다. 이러한 분석은 일반적으로 본 발명의 표지 인자 및 하나 또는 그 이상의 분석 성분 간의 반응을 포함한다. 상기 기타 성분은 검사 화합물 자체, 또는 검사 화합물의 조합 및 본 발명의 표지 인자의 자연적 결합 파트너 중 하나일 수 있다. 본 명세서에서 기술된 것과 같은 분석을 통해 식별된 화합물은, 예를 들어, 질병 상태 또는 독성 상태의 공격성을 억제, 완화, 치료 또는 예방하는데 유용할 수 있다.

본 발명의 선별 분석에서 사용된 상기 검사 화합물은 자연적 및/또는 합성 화합물의 체계적 라이브러리를 포함하는 어떠한 가용한 소스로부터도 획득할 수 있다. 검사 화합물 또한 다음을 포함하는 해당 분야에서 알려진 조합적 라이브러리방법 내의 다수의 접근 방식 중 어느 하나에 의해 획득될 수 있다: 생물학적 라이브러리; 펩토이드 라이브러리(펩티드의 기능성을 가지나, 효소 퇴화에 대해 저항성이 있으나 그럼에도 생체 활성을 유지하는 신규의 비 펩티드 백본을 가지는 분자들의 라이브러리; 예를 들어, 주커만(Zuckermann) 외, 1994, J. Med. Chem. 37:2678-85 참조); 공간적으로 배치될 수 있는 병렬 고체 상 또는 용액 상 라이브러리; 디콘볼루션(deconvolution)을 요하는 합성 라이브러리 방법; '일-구슬 일-화합물' 라이브러리 방법; 및 친화성 크로마토그래피 선택을 사용한 합성 라이브러리 방법. 상기 생물학적 라이브러리 및 펩토이드 라이브러리 접근 방식은 펩티드 라이브러리에 제한되며, 반면에 다른 네 개의 접근 방식은 펩티드, 비 펩티드 올리고머 또는 소형 분자 화합물의 라이브러리에 적용할 수 있다(램(Lam), 1997, AntiCancer Drug Des. 12:145).

분자 라이브러리의 합성을 위한 방법들의 예는, 예를 들어, 다음과 같은 해당 분야의 기술에서 찾아 볼 수 있다: 드위트(DeWitt) 외(1993) Proc. Natl. Acad. Sci. 미국. 90:6909; 어브(Erb) 외(1994) Proc. Natl. Acad. Sci. 미국 91:11422; 주커만(Zuckermann) 외(1994). J. Med. Chem. 37:2678; 조(Cho) 외(1993) 사이언스 261:1303; 카렐(Carrell) 외(1994) Angew. Chem. Int. Ed. Engl. 33:2059; 카렐(Carrell) 외(1994) Angew. Chem. Int. Ed. Engl. 33:2061; 및 갤럽(Gallop) 외(1994) J. Med. Chem. 37:1233.

화합물의 라이브러리는 용액으로 제공되거나(예를 들어, 후텐(Houghten), 1992, Biotechniques 13:412-421), 또는 구슬(램(Lam), 1991, 네이처 354:82-84), 칩(포더(Fodor), 1993, 네이처 364:555-556), 박테리아 및/또는 포자(라드너(Ladner), USP 5,223,409), 플라스미드(컬(Cull) 외, 1992, Proc Natl Acad Sci USA 89:1865-1869) 또는 파지(스코트(Scott) 및 스미스(Smith), 1990, 사이언스 249:386-390; 데블린(Devlin), 1990, 사이언스 249:404-406; 스월라(Cwirla) 외, 1990, Proc. Natl. Acad. Sci. 87:6378-6382; 펠리치(Felici), 1991, J. Mol. Biol. 222:301-310; 라드너(Ladner), 상기와 동일)로 제공된다.

본 발명의 선별 방법은 질병 상태 세포 또는 독성 상태 세포를 검사 화합물과 접촉시키는 단계, 및 검사 화합물이 세포 내 본 발명의 표지 인자의 발현 및/또는 활성을 조절할 수 있는 능력을 결정하는 단계를 포함한다. 본 발명의 표지 인자의 발현 및/또는 활성은 본 명세서에 기술된 바에 따라 결정될 수 있다.

또 다른 실시예에서, 본 발명은 본 발명의 표지 인자 또는 이의 생물학적으로 활성화된 부분의 기질인 후보 또는 검사 화합물의 선별을 위한 분석을 제공한다. 또 다른 실시예에서, 본 발명은 본 발명의 표지 인자 또는 이의 생물학적으로 활성화된 부분에 결합하는 후보 또는 검사 화합물의 선별을 위한 분석을 제공한다. 표지 인자에 직접 결합할 수 있는 검사 화합물의 능력을 결정하는 것은, 예를 들어, 화합물의 표지 인자로의 결합이 복합체 내 라벨링된 표지 인자 화합물을 탐지함으로써 결정될 수 있도록 화합물을 방사성 동위원소 또는 효소 라벨에 결합 시킴으로써 성취될 수 있다. 예를 들어, 화합물(예를 들어, 표지 인자 기질)은 ¹³¹I, ¹²⁵I, ³⁵S, ¹⁴C, 또는 ³H로, 직접적 또는 간접적으로 라벨링될 수 있으며, 상기 방사성 동위원소는 방사성 방출의 직접적 계수 또는 섬광을 계수함으로써 탐지될 수 있다. 대체적 방법으로, 분석 성분은, 예를 들어, 호스래디시 퍼옥시다제, 알칼리 포스타파아제, 또는 루시퍼라제, 및 적절한 기질에서 생산물로의 변환에 대한 결정에 의해 탐지된 효소 라벨로서 효소적으로 라벨링될 수 있다.

본 발명은 또한 상기 기술된 선별 분석에 의해 식별된 신규의 제제에 관한 것이다. 이에 따라, 상기 기술된 바에 따라 식별된 제제를 적절한 동물 모델에 대해 추가적으로 이용하는 것 또한 본 발명의 범위 내에 있는 것이다. 예를 들어, 본 명세서에서 기술된 바에 의해 식별된 본 발명의 표지 인자의 발현 및/또는 활성을 조절할 수 있는 제제는 동물 모델에서 이러한 제제를 통한 치료의 의 효능, 독성, 또는 부작용을 결정하기 위해 사용될 수 있다. 대체적 방법으로, 본 명세서에서 기술된 대로 식별된 제제는 동물 모델에서 이러한 제제의 활동의 메커니즘을 결정하기 위해 사용될 수 있다. 또한, 본 발명은 상기 기술된 대로의 치료를 위한 상기 기술된 선별 분석에 의해 식별된 신규의 제제의 사용에 관한 것이다.

예를 통한 발명의 설명

예 1: 암 합치 및 시뮬레이션 네트워크 구축을 위한 플랫폼 기술 채택

본 예에서는, 필요에 따라 구축된 생체 외 암 모델로부터 얻어진 데이터를 통합하고, 이에 의해 암의 발병을 추진시키는 신규의 단백질/경로를 식별하기 위해 위에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 암과 관련된 진단적/예후의 표지 인자와 더불어 암 치료 타겟을 제공하였다.

연구 설계는 도 18에서 묘사된다. 간단히 설명하면, 두 개의 암 세포 라인(PaCa2, HepG2) 및 하나의 정상 세포 라인(THLE2)이 생체 내 암 세포가 경험하는 환경을 모의하는 일곱 조건 중 하나의 조건을 겪도록 하였다. 특히, 세포들은 고혈당 조건, 저산소 상태 조건, 젖산 조건, 고혈당 + 저산소 상태 조합 조건, 고혈당 + 젖산 조합 조건, 저산소 상태 + 젖산 조합 조건, 또는 고혈당 + 저산소 상태 + 젖산 조합 조건에 노출되었다. 이들 서로 다른 조건들은 다음과 같이 생성되었다:

--고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 생성되었다.

--저산소 상태 조건은 세포를 모듈라 인큐베이터 챔버(MIC-101, 빌럽-로덴버그 사(Billups-Rothenberg Inc). 델 마, 캘리포니아) 내에 위치시킴으로써 유도되었으며, 이때 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업용 기체 혼합물로 넘치게 했다.

--젖산 조건은 세포를 12.5 mM 젖산을 함유하는 매체에서 배양함으로써 생성되었다.

--고혈당 + 저산소 상태 조합 조건은 세포를 22 mM 글루코스를 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.

--고혈당 + 젖산 조합 조건이 세포를 22 mM 글루코스 및 12.5 mM 젖산을 함유하는 매체에서 배양함으로써 생성되었다.

--저산소 상태 + 젖산 조합 조건은 세포를 12.5 mM 젖산을 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.

--고혈당 + 저산소 상태 + 젖산 조합 조건은 세포를 22 mM 글루코스 및 12.5 mM 젖산을 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.

상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 코엔자임 Q10로 처리하여 환경적 교란에 노출시킴으로써 추가적으로 조사된다. 특히, 세포들은 0, 50μM, 또는 100μM에서 코엔자임 Q10로 처리된다.

각각의 조건을 가지며 각각의 코엔자임 Q10 로 처리된 세포 라인에 대해 매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간을 포함하여 처리 이후에 수 회 수집되었다.

또한, 두 개의 다른 암 세포인 PaCa2 및 HepG2 세포 사이의 상호 대화 실험이 수행되었으며, 이때 PaCa2 및 HepG2 세포는 공생 배양되었다. 이러?h 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(PaCa2)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(HepG2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입 트레이가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템을 포함하는 삽입기는 제 2 세포 시스템을 포함하는 주 트레이 내에 위치하였다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 2D 분석을 위한 충분한 물질들이 생산되도록 하였다. 상기 매체(1 ml 부분 표본)와 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 삼회 반복 수행되었다.

상호 대화(cross talk) 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰” 이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.

정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 세포 라인에 각 조건에서, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수집된 세포 및 매체 표본에 대해 수행되었다. 정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링은 마찬가지로 각 조건 및 치료에서 각각의 공생 배양된 세포 라인에 대하여 수집된 세포 및 매체 표본에 대해 수행되었다.

또한, 암, 정상 세포 및 상호 대화 실험 내에서 코엔자임 Q10 교란의 존재 또는 부존재 하에서 각 조건에 노출된 세포들의 생명 에너지론적 프로파일링이 Seahorse 분석기를 본질적으로 제조사가 권장한 대로 채택하여 생성되었다. OCR (산소 소모율) 및 ECAR(세포외 공간 산화율)이 상기 시호스(seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지로서 생성된 7 μl 챔버 내의 전극에 의해 기록되었다.

각 세포 라인(상호 대화 실험 내의 세포를 포함)에 대해 각 조건(들) 및 각 교란의 존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. Paca2, HepG2, THLE2 및 상호 대화 실험에 대한 미가공 데이터가 다시 표준화된 명명법을 사용하여 조합되었다. 15% 이상의 단백질체학 데이터가 결여된 유전자는 필터링하여 제거되었다. 데이터 산입 적략이 개발되었다. 예를 들어, 복제 오류 내에서 모델이 복제를 가지는 실험적 조건으로부터의 데이터를 산입하기 위해 사용되었다. 10 개의 이웃에 기반한 K-NN 알고리즘이 복제를 가지지 않는 데이터를 산입하기 위해 사용되었다. 세 개의 생물학적 시스템 모두에 대해, Paca2 시스템에 대해서만, 또는 표현형 데이터에 링크된 HepG2 시스템만에 대해 서로 다른 REFS™ 모델들이 구축되었다.

곡선 아래의 넓이 및 시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화가 R 프로그램밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되며, 이때 상기 R 프로그램밍 언어는 통계적 컴퓨팅 및 그래픽을 위한 오픈 소스 소프트웨어 환경이다.

R 프로그램으로부터의 출력은 합치된 네트워크의 시각적 표현을 생성하기 위한 오픈 소스 프로그램인 사이토스케이프(Cytoscape)로 입력된다.

구축된 모든 모델 중에서, 70% 파편 빈도에서 예시적 단백질 상호 반응의 REFS 합치된 네트워크가 도 21에 도시된다.

도 21에 도시된 합치된 네트워크 내의 각 노드는 상기 상세한 설명에서 상세히 설명한 대로 REFS™을 사용하여 시뮬레이션 네트워크를 생성하기 위해 LDHA의 발현을 4배 증가 또는 감소시킴으로써 모의된다.

도 21에 도시된 예시적 합치된 네트워크 내의 고 수준에서의 PARK7과 연관되어, PARK7 및 단백질에 대한 모의된 LDHA 발현 변화의 효과가 조사되었다. 두 개의 암 세포 라인, 즉, Paca2 및 HepG2에서 LDHA 시뮬레이션에 반응하는 단백질이 REFS™을 사용하여 식별되었다(도 22 참조). 이들 수들은 특정한 단백질 발현 수준의 배수 변화를 나타낸다.

상기 방법을 사용하여 식별된 단백질 연결을 증명하기 위해, 시뮬레이션 네트워크 내의 LDHA에 직접적 근접성을 가지는 식별될 표지 인자가 이전에 출간된 문헌들에 기반한 네트워크들 사이의 실험적 출력들 사이의 분자의 연관을 결정하기 위해 신경망 네트워크를 활용하는 소프트웨어 프로그램인 IPA에 입력되었다. IPA 프로그램의 출력은 도 23에 도시되었으며, 이때 회생 모양의 표지 인자는 플랫폼에 의해 생성된 시뮬레이션 네트워크 내 LDHA에 직접적 근접성을 가지는 것으로 식별되었으며 채워지지 않은 형태의 표지 인자는 이전에 출간된 문헌 내의 알려진 지식에 기반한 IPA에 의해 식별된 연결이다.

조사적 생물학 플랫폼 기술로부터의 출력에서 식별된 표지 인자들(도 21에 도시), 즉 DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1 및 CANX는 IPA로 생성된 네트워크 내에서 TP53 및 PARK7와 같은 잘 알려진 암 표지 인자와 연결되어 있는 것으로 관찰되었다(도 23에 도시). 본 발명의 조사적 생물학 플랫폼에 의해 식별된 요소들이 과학 문헌들에 발표된 알려진 요소들과 연결성을 공유한다는 사실은 본 발명의 조사적 생물학 플랫폼을 사용하여 생성된 네트워크의 정확성을 증명하는 것이다. 또한, 본 발명의 조사적 생물학 플랫폼 출력을 사용하여 생성된 LDHA 하위 네트워크 내의 이러한 네트워크 연관은, 분자 개체들 사이의 연결이 반응하는 노드들 사이의 기능적인 방향성을 제공하지 않는 IPA 네트워크와는 반대로, 각 요소에 대한 방향적 영향이 존재함을 입증한다. 따라서, 데이터 생성, 통합 및 역 엔지니어링에 대해 편향되지 않은 접근 방식을 채택하여 계산 모델을 생성하고, 이어서 시뮬레이션 및 분별 네트워크 분석을 수행함으로써, 상기 조사적 생물학의 발견 플랫폼은 아직까지 알려지지 않은 암 생리병리학에서의 메커니즘을 질병 생리병리학의 잘 확립된 과학적 이해와 조화를 이루어 이해할 수 있게 해 준다.

도 19는 아이프로파일링으로부터의 단백질 발현 데이터에 기반한 하향 노드(퍼브메드(pubmed) 단백질 접근 번호는 도 19에 열거된다)에 대한 CoQ10 치료의 효과를 도시한다. 단백질 접근 번호 P00338은 LDHA이다. 수중 실험에 의한 단백질체 데이터의 증명은 LDHA 발현에 대해 HepG2 세포 내에서 수행되었다(도 20 참조). 도 20에서 보인 바와 같이, LDHA 발현 수준은 HepG2 가 50 uM CoQ10 또는 100 uM CoQ10으로 24 또는 48 시간 동안 처리하였을 때 감소한다.

잘 알려진 암 표지 인자인 TP53, Bcl-2, Bax 및 카스파제3에 대해, SKMEL 28 세포 내의 이들 표지 인자의 발현 수준에 대한 CoQ10 치료 효과의 증명이 수중 실험을 통해 수행되었다 (도 24 및 도 25 참조).

예 2: 암 델타-델타 네트워크를 구축하기 위한 플랫폼 기술의 채택

간단히 설명하면, 네 개의 암 라인(PaCa2, HepG2, PC3 및 MCF7) 및 두 개의 정상 세포 라인(THLE2 및 HDFa)이 생체 내 암 세포가 경험하는 환경을 모의하는 여러 조건들을 겪도록 하였다. 특히, 세포들은 고혈당 조건, 혈중 산소 감소 조건 및 젖산에 의한 처리 각각에 별도로 노출되었다. 예를 들어, 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 생성되었다. 혈중 산소 감소 조건은 세포를 모듈라 인큐베이터 챔버(MIC-101, 빌럽-로덴버그 사(Billups-Rothenberg Inc). 델 마, 캘리포니아) 내에 위치시킴으로써 유도되었으며, 이때 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업용 기체 혼합물로 넘치게 했다. 젖산 처리를 위해, 각 세포 라인은 0 또는 12.5 mM 젖산에서 처리되었다. 세포들을 위의 셋 조건에 별도로 노출시키는 것과 더불어, 세포들은 또한 상기 조건들의 둘의 조합 또는 세 조건 모두(즉, 고혈당 및 혈중 산소 감소 조건; 고혈당 조건 및 젖산; 혈중 산소 감소 조건 및 젖산; 및 고혈당 및 혈중 산소 감소 조건 및 젖산)에 노출되었다.

각각의 조건(또는 조건들의 조합)에 노출되고 코엔자임 Q10 로 처리되거나 처리되지 않은 세포 라인에 대해 세포로부터의 세크리톰을 함유하는 세포매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간를 포함하여 처리 이후에 수 회 수집되었다.

또한, 두 개의 다른 암 세포인 PaCa2 및 HepG2 세포 사이의 상호 대화 실험이 수행되었으며, 이때 PaCa2 및 HepG2 세포는 공생 배양되었다. 이러한 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(PaCa2)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기 에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(HepG2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입기를 포함하는 6개의 웰 플레이드가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템 및 제 1 세포 시스템의 각 매체를 포함하는 삽입기는 제 2 세포 시스템 및 제 2 세포 시스템의 각 매체를 포함하는 주 트레이 내에 위치하였다. 그러나, 모든 경우의 공생 배양에서 공생 배양된 세포는 공생 배양 전의 제 1일 중에 별도로이긴 하지만 동일한 “암 조건”(예를 들어, 고혈당증, 저산소 상태, 젖산, 또는 이들의 조합)에 노출된 바 있다. 다시 말해, 삽입부 내의 제 1 세포 시스템 및 트레이 내의 제 2 세포 시스템은 “공생배양” 설정으로 옮겨지기 전에 동일한 조건에 노출되었다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 이후의 단백질체의 분석을 위한 충분한 물질들이 생산되도록 하였다. 세크리톰(1 ml 부분 표본)을 함유하는 상기 매체, 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 3회 반복 수행되었다.

상호 대화 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰”이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.

상기 세포 시스템을 상기 기술된 “암 조건”과 공생 배양 실험으로부터의 쌍을 이루는 세포의 세크리톰 내에서 생산된 교란(즉, 코엔자임 Q10 치료), 및/또는 조건에 노출시키고 나서, 세포의 반응이 세포 시스템으로부터의 여러 해독의 분석에 의해 분석되었다. 상기 해독은 세포 배양 매체로 분비된 단백질 및 특히 세포 생명 에너지론의 기능적 데이터뿐만 아니라, 단백질체의 데이터, 특히 세포 내 단백질 발현을 포함하였다.

정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 조건(또는 조건들의 조합)에 노출되고, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료가 존재하거나 존재하지 않는 각 세포 라인(정상 및 암 세포 라인)에 대하여 수집된 세포 및 매체 표본에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수행되었다.

또한, 암, 정상 세포 및 상호 대화 실험 내에서 “환경적 교란”, 즉, 코엔자임 Q10 치료의 존재 또는 부존재 하에서 각 조건(또는 조건들의 조합)이 노출된 각세포 라인들(정상 및 암 세포 라인들)의 생명 에너지론적 프로파일링이 시호스(seahorse) 분석기를 본질적으로 제조사가 권장한 대로 채택하여 생성되었다. OCR (산소 소모율) 및 ECAR(세포외 공간 산화율)이 상기 시호스(Seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지로서 생성된 7 μl 챔버 내의 전극에 의해 기록되었다.

각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재/부존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재/부존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. “복합체 암 교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출된 후, 교란(CoQ10)에 더 노출된 데이터의 결합으로부터 생성되었다. “복합체 암 비교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 교란(CoQ10)에는 노출되지 않은 데이터의 결합으로부터 생성되었다. 마찬가지로, “복합체 정상 교란 네트워크” 가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 추가적으로 교란(CoQ10)에 더 노출된 데이터의 결합으로부터 생성되었다. “복합체 정상 비교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 교란(CoQ10)에는 노출되지 않은 데이터의 결합으로부터 생성되었다.

이후, “시뮬레이션 합성 네트워크”(본 명세서에서 “시뮬레이션 네트워크”로도 불림)가 상기 설명된 네 개의 복합체 네트워크 각각에 대해 REFS™을 사용하여 생성되었다. 이를 성취하기 위해, 상기 상세한 설명에서 상세히 설명한 대로, 주어진 합치된 복합체 네트워크 내의 각 노드가 시뮬레이션 네트워크를 생성하기 위해 REFS™을 사용하여 모의(10배 증가 또는 감소시킴으로써) 되었다.

최종적으로, 델타 네트워크가 생성되며, 이때 상기 델타 네트워크는 둘 시뮬레이션 합성 네트워크 사이의 분별을 나타낸다. 상기 델타 네트워크는 시뮬레이션 합성 네트워크로부터 생성된다. 코엔자임 Q10 에 반응하는 암 대 정상 분별 네트워크(델타-델타 네트워크)를 생성하기 위해, 도 26에 도시된 것과 같은 연속적인 비교 단계가 PERL 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 수행되었다.

먼저, 처리되지 않은 암 네트워크(T0)와 처리된 암 네트워크(T1)가 R 프로그램을 사용하여 비교되고, 고유의 처리된 암 T1 네트워크가 분리되었다(도 26의 진한 회색 부분의 초승달 모양 참조). 이는 암 T1 ∩ (교집합) 암 T0 “델타” 네트워크를 나타낸다. 이 델타 네트워크 내에서의 단백질 상호 반응 / 연관은 코엔자임 Q10 치료에 대한 고유한 암 반응을 나타내는 것으로 볼 수 있다.

마찬가지로, 처리되지 않은 정상 네트워크(T0)와 처리된 정상 네트워크(T1)가 R 프로그램을 사용하여 비교되었으며, 고유한 정상의 처리된 T1 네트워크가 분리되었다(도 26의 밝은 회색 부분의 초승달 모양 참조). 이는 정상 T1 ∩ 정상 T0 “델타” 네트워크를 나타낸다. 이 델타 네트워크 내에서의 단백질 상호 반응 / 연관은 코엔자임 Q10 치료에 대한 고유한 정상 세포 반응을 나타내는 것으로 볼 수 있다.

최종적으로, 고유한 암 T1 네트워크(도 26에서 진한 회색의 초승달 형 모양 참조) 및 고유한 정상 T1 네트워크(도 26에서 밝은 회색의 초승달 형 모양 참조)가 R 프로그램을 사용하여 비교되고, 코엔자임 Q10에 대한 반응으로 오직 암에만 고유하고 정상 세포에는 존재하지 않는 네트워크가 생성된다(도 26 참조). 이러한 단백질 상호 반응 / 연관의 수집은 코엔자임 Q10 치료에 대해 정상 세포에는 존재하지 않는 암 세포 내의 고유한 경로를 나타낸다. 이러한 단백질 상호 반응 / 연관의 수집은 암 세포로부터의 분별 맵과 정상 제어 세포로부터의 분별 맵 사이의 비교로부터 생성된 분별 맵이기 때문에 “델타-델타 네트워크”라 불린다.

PERL 및 R 프로그램으로부터의 출력은 델타-델타 네트워크의 시각적 표현을 위한 오픈 소스 프로그램인 사이토스케이프(Cytoscape)로 입력된다.

본 명세서에서 기술된 방법을 사용하여 식별된 이러한 델타-델타 네트워크는 암 치료를 위한 타겟을 식별하는데 매우 유용하다. 예를 들어, 도 27에 제시된 델타-델타 네트워크에 따르면, 단백질 A는 OCR3(산화적 인산화의 측정)을 억제하고 ECAR3(해당 과정에 대한 측정)을 향상시킨다. 이러한 상호 반응은 암 세포 내에서 고유하기 때문에(델타-델타 네트워크는 코엔자임 Q10 치료에서 정상 세포에 통상적으로 존재하는 상호 반응을 뺀 것이므로), 단백질 A 발현의 억제가 암 대사 경로의 전형적 특징인 해당 과정-기반의 에너지 대사를 감소시키고 세포를 정상 세포에 보다 밀접히 연관된 표현형인 산소 첨가 인산화-기반의 에너지 대사 쪽으로 이동시킬 것으로 기대된다. 따라서, 코엔자임 Q10 및 단백질 A 금지 인자를 사용하는 조합 치료가 암 세포의 에너지 대사 프로필을 정상 세포에 유사한 프로필로 이동시킴으로써, 암을 치료하는데 최소한 부분적으로는 효과적일 것으로 기대된다.

본 발명의 조사적 생물학 플랫폼 기술의 이점은 실제적 예를 사용하여 더 예시되며, 이 예에서는 인과 네트워크로 도출된 하위 네트워크가 이전에 발표된 문헌에 기반한 네트워크로의 실험적 출력들 사이의 분자의 연결을 결정하기 위해 신경 네트워크를 활용하는 소프트웨어 프로그램을 사용하여 IPA를 사용하는 분자의 네트워크와 비교된다. 조사적 생물학 플랫폼을 사용하여 생성된 PARK7을 포함하는 상기 인과적 하위 네트워크(도 29에 도시)가 실제적 예에서 사용된다. 조사적 생물학 플랫폼로부터의 PARK7 네트워크의 모든 분자 서명은 알려진/기존의 문헌 증거에 기반한 네트워크를 생성하기 위해 IPA로 통합된다. 이후 상기 조사적 생물학 출력과 IPA를 사용하여 생성된 출력 사이의 네트워크 출력이 비교된다.

조사적 생물학 플랫폼 기술의 출력으로부터 식별된 여섯 개의 표지 인자(도 29에 도시), 즉 도 27-29의 A, B, C, X, Y 및 Z는, IPA 생성 네트워크 내의 TP53에 연결된 것으로 관측되었다(도 28). 여섯 개의 표지 인자 가운데, A, B 및 C는 문헌에서 HSPA1A/HSPA1B뿐만 아니라 암과 연관된 것으로 보고되었다. X, Y 및 Z는 “허브” 또는 암 상태의 핵심 추진 인자로서 식별되며, 따라서 신규의 암 표지 인자로서 식별된다. 또한, MIF1 및 KARS 역시 “허브” 또는 암 상태의 핵심 추진 인자로서 식별되며, 따라서 신규의 암 표지 인자로서 식별된다. 조사적 생물학 플랫폼의 사용에 의해 식별된 요소가 과학 문헌에 발표된 알려진 요소와 연결성을 공유한다는 사실은 조사적 생물학 플랫폼에 의해 생성된 네트워크의 정확성을 증명하는 것이다. 추가적으로, 조사적 생물학 플랫폼 출력의 사용을 통해 생성된 PARK7 하위-네트워크 내에서의 상기 네트워크 연관(도 29에 도시)은, 분자 개체들 사이의 연결이 반응하는 노드들 사이의 기능적 방향성을 제공하지 않는 IPA 네트워크(도 28에 도시)와는 반대로, 각 요소의 방향적 영향을 예시한다. 또한, 조사적 생물학 플랫폼로부터의 출력(도 29에 점선으로 도시)은 이러한 성분들의 연관이 PARK7을 통한 잠재적 메카니즘으로 이어진다는 것을 예시한다. 단백질 C, 단백질 A 및 PARK7의 기타 노드들은 암 대사의 핵심 추진 인자인 것으로 관측되었다(도 27).

본 예에 의해 증명되는 것처럼, 데이터 생성, 통합 및 역 엔지니어링에 대해 편향되지 않은 접근 방식을 채택하여 계산 모델을 생성하고 뒤이어 시뮬레이션과 분별 네트워크 분석을 수행함으로써, 상기 조사적 생물학의 발견 플랫폼은 아직까지 알려지지 않은 암 생리병리학에서의 메커니즘을 질병 생리병리학의 잘 확립된 과학적 이해와 조화를 이루어 이해할 수 있게 해 준다.

예 3: 당뇨/비만/ 심장병 델타-델타 네트워크를 구축하기 위한 플랫폼 기술의 채택

본 예에서는, 필요에 따라 구축된 당뇨/비만/심장병 (CVD) 모델로부터 얻어진 데이터를 통합하고, 당뇨/비만/CVD의 발병을 추진시키는 신규의 단백질/경로를 식별하기 위해 상세한 설명에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 당뇨/비만/CVD과 관련된 진단적/예후의 표지 인자와 더불어 당뇨/비만/CVD 치료 타겟을 제공하였다.

다섯 개의 인간 세포 라인, 즉 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC), 및 기부 관상 세포(HK2)들이 이들 생체 내 질병 관련 세포가 경험하는 환경을 모의하는 다섯 조건 중 한 조건을 겪도록 하였다. 특히, 다섯 세포 라인이 다음과 갈은 조건들에 각각 별도로 노출되었다: 고혈당 조건, 고지질증 조건, 고인슐린증 조건, 혈중 산소 감소 조건 및 젖산에 대한 노출. 상기 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 유도되었다. 상기 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 함유하는 매체에서 배양함으로써 유도되었다. 상기 고인슐린 증 조건은 세포를 1000 nM 인슐린을 함유하는 매체에서 배양함으로써 유도되었다. 상기 혈중 산소 감소 조건은 세포를 5% CO₂, 2% O₂ 및 93% 질소를 함유하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA) 상에 위치시킴으로써 유도되었다. 각 세포 라인은 또한 0 또는 12.5 mM 젖산으로 처리되었다.

또한, 두 개의 다른 암 세포인 HASMC(세포 시스템 1) 및 HK2 세포(세포 시스템 2) 또는 간 세포(세포 시스템 1) 및 지방 세포(세포시스템 2)사이의 상호 대화 실험이 수행되었으며, 이때 상기 쌍의 세포들은 공생 배양되었다. 이러한 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(예를 들어, HASMC)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기 에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(예를 들어, HK2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입기가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템을 포함하는 삽입기는 제 2 세포 시스템을 포함하는 주 트레이 내에 위치하였다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 2D 분석을 위한 충분한 물질들이 생산되도록 하였다. 상기 매체(1 ml 부분 표본), 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 3회 반복 수행되었다.

상호 대화 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰” 이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.

상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 코엔자임 Q10로 처리하여 “환경적 교란”에 노출시킴으로써 추가적으로 “조사”된다. 특히, 세포들은 0, 50μM, 또는 100μM에서 코엔자임 Q10로 처리된다.

각각의 조건을 가지며 각각의 코엔자임 Q10 로 처리된 세포 라인에 대해 매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간를 포함하여 처리 이후에 수 회 수집되었다. 특정한 세포 및 특정 조건하에서, 매체 표본이 또한 수집되고 분석되었다.

정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 조건, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료에 대해 각 세포 라인에 대하여 수집된 세포 및 매체 표본에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수행되었다.

상기 열거된 각 세포 라인에 대해 각 조건 및 각 교란의 존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건 및 각 교란의 존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. Paca2, HepG2, THLE2 및 상호 대화 실험에 대한 미가공 데이터가 다시 표준화된 명명법을 사용하여 조합되었다. 교란된 합성 네트워크가 교란 (CoQ10)에 노출된 하나의 특정한 조건(예를 들어, 고혈당증)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 합성 네트워크가 교란에 노출되지 않은(CoQ10가 없는) 동일한 하나의 특정한 조건(예를 들어, 고혈당증)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 마찬가지로, 교란된 합성 네트워크가 교란 (CoQ10)에 노출된 제 2 제어 조건(예를 들어, 정상 혈당 상태)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 합성 네트워크가 교란에 노출되지 않은(CoQ10가 없는) 제 2 제어 조건(예를 들어, 정상 혈당 상태)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다.

시뮬레이션 네트워크를 생성하기 위해 상기 기술된 합치된 합성 네트워크에서의 각 노드들이 상기 상세한 설명에서 상세하게 설명된 REFS™를 사용하여 (10 배 증가시키거나 감소시킴으로써) 모의되었다.

델타 네트워크가 모의된 합성 네트워크로부터 생성되었다. 코엔자임 Q10 에 반응하는 당뇨/비만/심장병 조건 대 정상 조건의 분별 네트워크(델타-델타 네트워크)를 생성하기 위해, 비교의 단계들이 도 30에 도시된 대로, PERL 프로그램에 의해 작성된 필요에 따라 구축된 프로그램에 의해 수행되었다.

특히, 도 30에서 보인 바와 같이, 치료 T1 은 코엔자임 Q10 치료를 말하며 NG와 HG는 조건으로서 정상 및 고혈당증을 말한다. NG in the NG∩HG 델타 네트워크로부터의 고유한 간선들은 HG∩HGT1 델타 네트워크 내의 HGT1의 고유한 간선들과 비교되었다. NG와 HGT1의 교집합 내의 간선들은 T1에 의해 NG로 회복된 HG이다. T1에 의해 NG로 회복된 HG의 간선들은 NG∩HG 델타 네트워크 상에 중첩되었다(도 31에서 진한 색의 원으로 도시됨)

특히, 시뮬레이션된 정상 혈당(NG) 조건의 복합 맵과 시뮬레이션된 고혈당(HG) 조건의 복합 맵이 정상 혈당 조건의 고유한 간선들을 생성하기 위해 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 코엔자임 Q10 치료(HG)가 없는 시뮬레이션된 고혈당(HG) 조건의 복합 맵과 코엔자임 Q10 치료(HG)가 있는 시뮬레이션된 고혈당 조건의 복합 맵이 코엔자임 Q10 치료(HGT1)에 의한 고혈당 조건의 고유한 간선들을 생성하기 위해 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 정상 혈당 조건(NG)으로부터의 고유한 간선들과 코엔자임 Q10 치료가 행해진 고혈당증 조건으로부터의 고유한 간선들의 교집합 내의 간선들이 Perl 프로그램에 의해 식별되었다. 이 간선들은 코엔자임 Q10 치료에 의해 고혈당증 조건으로부터 정상 혈당 조건으로 회복된 요소/네트워크를 나타낸다. 코엔자임 Q10 치료에 의해 정상 혈당 조건으로 회복된 고혈당 간선들의 델타-델타 네트워크가 정상 혈당 ∩ 고혈당 델타 네트워크 상에 중첩되었다. 중첩된 네트워크의 표본이 도 31에 도시된다. 도 31은 코엔자임 Q10(델타-델타 네트워크)에 반응하는 예시적인 당뇨/비만/심장병 조건 대 정상 조건의 분별 네트워크이다. 도 31에서 진한 색의 원은 코엔자임 Q10 치료에 의해 고혈당증 조건으로부터 정상 혈당 조건으로 회복된 것으로 식별된 간선들이다. 도 31에서 옅은 색의 원은 고유한 정상 혈당으로 식별된 간선이다.

고혈당증 대 정상 혈당 조건에 대해 상기 설명한 실험과 마찬가지로, 코엔자임 Q10에 의한 치료가 없는 치료고지혈증 조건의 시뮬레이션된 복합 네트워크(상기 기술된 당뇨/비만/심장혈관 관계 세포로부터의 데이터를 결합)와 코엔자임 Q10에 의한 치료가 행해진 고지혈증 조건의 시뮬레이션된 복합 네트워크(상기 기술된 당뇨/비만/심장혈관 관계 세포로부터의 데이터를 결합)가 코엔자임 Q10 치료에 의한 고지혈증 조건의 고유한 간선들을 생성하기 위해 Perl 프로그램을 사용하여 비교되었다. 정상 지질 조건으로부터의 고유한 간선들과 코엔자임 Q10 치료가 행해진 고지질 조건으로부터의 고유한 간선들의 교집합 내의 간선들이 Perl 프로그램에 의해 식별되었다. 이 간선들은 코엔자임 Q10 치료에 의해 고지혈증 조건으로부터 정상 지질 조건으로 회복된 요소/네트워크를 나타낸다. 코엔자임 Q10 치료에 의해 정상 지질 조건으로 회복된 고지혈증 간선들의 델타-델타 네트워크가 정상 지질 ∩ 고지혈증 델타 네트워크 상에 중첩되었다. 중첩된 네트워크의 표본이 도 32에 도시된다. 도 32에서 진한 색의 원은 코엔자임 Q10 치료에 의해 고지혈증 조건으로부터 정상 지질 조건으로 회복된 것으로 식별된 간선들이다. 도 32에서 옅은 색의 원은 고유한 정상 지질 로 식별된 간선이다. FASN이 고지혈증에서 정상 지질 조건으로의 회복에 대한 코엔자임 Q10의 효과를 조절하는 신호 전달 경로의 중요한 요소로서 식별되었다.

FASN과 같은 지방산 합성 효소는 비만, 인슐린 저항성 또는 지질 대사 장애와 같은 인간의 대사적 변이의 거의 모든 측면에 관계되어 왔다. FASN 금지 인자는 분자의 메커니즘은 알려져 있지 않지만, 비만의 치료를 위한 주요 분자로 제안되었다(몹스(Mobbs) 외, 2002). 세룰레닌 및 합성 화합물 C75- FASN 금지 인자가 음식 섭취를 줄이는 효과가 있고 체중 감소를 일으키는 것으로 밝혀 졌다(로퍼스(Loftus) 외, 2000).

도 32에서 보인 바와 같이, FASN이 본 명세서에서 기술된 플랫폼 기술에 의해 코엔자임 Q10의 당뇨 상태에서 정상적 상태로 회복시키는 효과를 조절하는 신호 경로 상에서의 중요한 요소로서 식별된다는 사실은 본 델타-델타 네트워크의 정확성을 증명하는 것이다. 따라서, 본 델타-델타 네트워크에서 식별된 다른 신규의 요소들이 잠재적 치료적 요소 또는 추가적인 조사를 위한 약제 타겟이 될 수 있을 것이다.

예 4: 약제로 유도되는 심장 독성의 모델을 구축하기 위한 플랫폼 기술의 채택

본 예에서는, 필요에 따라 구축된 심장 독성 모델로부터 얻어진 데이터를 통합하고, 약의 발병/ 독성을 추진시키는 신규의 단백질/경로를 식별하기 위해 상세한 설명에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 독성 생물학적 표지 인자를 제공하였다.

건강한 심장에서 수축 기능은 지방산 및 탄수화물 산화의 균형에 따라 달라진다. 만성 섭취 불균형, 사용, 기관의 생물 발생 및 비지방질 조직(심장 및 간)에서의 분비가 미토콘드리아의 손상 및 기능 장애의 핵심에 있으며, 약제로 유도되는 심장 독성에 주요 역할을 하는 것으로 생각된다. 여기서 출원인들은 특히 세포 생명 에너지론 및 미토콘드리아의 막 기능을 살펴 보기 위해 단백질 및 지질 서명을 기능적 종단점 분석과 결합하는 시스템적 접근 방식을 기술한다. 과도 지방산 및 고혈당증에 의해 보완되는 당뇨성 및 정상 심장근 세포를 포함하는 생체 외 모델이 독성의 서명 및 잠재적 메커니즘을 생성하기 위해 일단의 약제들로 처리되었다. 출원인들은 다음 열거된 단계를 포함하여 여러 수준에서 에너지 대사 성분을 교란시킴으로써 미토콘드리아를 불안정하게 하는 약제의 다양한 효과를 예증하였다: (i) 미토콘드리아의 에너지 대사 유전자의 발현을 제어하는 전사적 네트워크의 조절의 장애; (ii) 당뇨성 심장근 세포 내 GPAT1 와 타파진의 유도 및 이에 의한 데노보 인산지질 합성 의 개시와 미토콘드리아 막에서의 리모델링; 및 (iii) 섭취, 지방산 산화 및 ATP 합성에 영향을 미치는 당뇨성 심장근 세포 내 지방산 운명의 변화. 또한, 출원인들은 수중 실험실 생물학 및 AI 기반 데이터 마이닝 플랫폼의 파워를 결합하여 베이지안(Bayesian) 모델에 기반한 인과 네트워크를 생성하였다. 정상 세포 기능의 손실과 인과적 관계를 가지는 단백질 및 지질의 네트워크가 세포보호 메커니즘으로부터 약제 유도 독성의 메커니즘을 알아내기 위해 사용되었다. 이러한 신규의 접근 방식은 변경된 표현형을 교정하는 보다 안전한 치료제의 개발을 가능케 하는 한편으로, 독성의 메커니즘을 이해하기 위한 강력한 새로운 도구로 작용할 것이다

인간 심장근 세포를 생체 내 질병 관련 세포가 경험하는 당뇨성 환경을 모의하는 조건을 겪게 하였다. 특히, 상기 세포는 고혈당 조건 및 고지혈증 조건에 노출되었다. 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 유도되었다. 고지혈증 조건은 세포를 1mM L-카르니틴, 0.7mM 올레산 및 0.7mM 리놀레산을 함유하는 매체에서 배양함으로써 유도되었다.

상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 심장 독성을 야기하는 것으로 알려진 당뇨 치료제(T)와 구조 분자 (R). 또는 당뇨 치료제와 구조 분자 모두(T+R)로 처리하여 환경적 교란에 노출시킴으로써 추가적으로 “조사”된다. 특히, 상기 세포는 당뇨 치료제로 처리되거나; 구조 분자 코엔자임 Q10으로 0, 50μM 또는 100μM에서 처리되거나; 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리되었다.

각각의 조건에서 각각 교란 처리된 세포 라인에 대해 세포 표본이 처리 후 6시간를 포함하여 처리 이후에 수 회 수집되었다. 특정 조건을 위해 매체 표본이 또한 수집되고 분석되었다.

정량적 단백질체학에 의한 전체 세포 단백질 발현 에서의 변화에 대한 아이프로파일링이 각 조건에 대해 각 “환경적 교란”, 즉, 당뇨 치료제 치료, 코엔자임 Q10 치료 또는 두 치료 모두를 가하여 수집된 세포 및 매체 표본에 대해 상세한 설명에서 기술된 기술을 사용하여 수행된다. 전사적 프로파일링 실험이 바이오래드(Biorad) cfx-384 증폭 시스템을 사용하여 수행되었다. 데이터 수집(Ct)에 이어, 제어 표본에 대한 최종 배수 변화가 δCt 방법을 사용하여 제조사의 프로토콜에서 제시된 대로 수행되었다. 리피도믹스 실험이 질량 분광학을 사용하여 수행되었다. 산소 소모율(OCR)과 같은 기능적 분석이 시호스(Seahorse) 분석기를 ??택하여 기본적으로 제조사가 권장하는 방식으로 수행되었다. OCR은 전극에 의해 시호스(Seahorse) 배양 플레이트에 밀어 넣어지는 카트리지로 생성된 7 μl 챔버에 기록되었다.

도 35에서 보인 바와 같이, 당뇨성 심장근 세포(고혈당 및 고지혈증 조건을 겪은 심장근 세포) 내에서 인간 미토콘드리아의 에너지 대사 유전자의 전사 네트워크 및 발현이 교란된 치료와 교란되지 않은 치료 사이에서 비교되었다. 특히, 전사적 네트워크 및 인간 미토콘드리아의 에너지 대사 유전자의 발현 데이터가 당뇨 치료제로 처리된 당뇨성 심장근 세포(T) 및 처리되지 않은 당뇨성 심장근 세포 표본(UT) 사이에서 비교되었다. 전사적 네트워크 및 인간 미토콘드리아의 에너지 대사 유전자 발현 데이터가 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리된 당뇨성 심장근 세포(T+R)와 처리되지 않은 당뇨성 심장근 세포 표본(UT) 사이에서 비교되었다. 처리되지 않은 당뇨성 심장근 세포로부터의 데이터를 비교한 결과, 당뇨성 심장근 세포가 당뇨 치료제로 처리되었을 때 특정한 유전자 발현 및 전사가 변화되었다. 구조 분자 코엔자임 Q10은 당뇨 치료제의 독성 효과를 역전시키고 유전자 발현 및 전사를 정규화하는 것으로 예시되었다.

도 36A에서 보인 바와 같이, 심장근 세포가 정상 혈당(NG) 또는 고 혈당(HG) 조건 중 하나에서 배양되고 당뇨 치료제 단독으로(T) 또는 당뇨 치료제와 구조 분자 코엔자임 Q10 모두(T+R)로 처리되었다. 각 조건 및 각 치료에 대한 GPAT1과 TAZ의 단백질 발현 수준이 서부 블로팅으로 검사되었다. GPAT1 과 TAZ 모두 고혈당증 조건을 겪고 당뇨 치료제로 처리된 심장근 세포에서 상향 조절되었다. 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리되었을 때, GPAT1 과 TAZ의 상향 조절된 단백질 발현 수준이 정규화되었다.

도 37A에서 보인 바와 같이, 미토콘드리아의 산소 소모율(%) 실험이 고혈당증 조건을 겪은 심장근 세포 표본에 대해 수행되었다. 고혈당증 조건을 겪은 심장근 세포는 처리되지 않거나(UT), 심장 독성을 야기하는 것으로 알려진 당뇨 치료제 T1으로 처리되거나, 심장 독성을 야기하는 것으로 알려진 당뇨 치료제 T2로 처리되거나, 당뇨 치료제 T1 및 구조 분자 코엔자임 Q10 모두(T1+R)로 처리되거나, 당뇨 치료제 T2와 구조 분자 코엔자임 Q10 모두(T2+R)로 처리되었다. 처리되지 않은 제어 표본와 비교한 결과, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제 T1 또는 T2로 처리되었을 때 미토콘드리아의 OCR이 감소하였다. 그러나, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제 및 구조 분자 코엔자임 Q10 모두(T1 + R, 또는 T2 + R)로 처리되었을 때는 미토콘드리아의 OCR이 정상화되었다.

도 37B에서 보인 바와 같이, 미토콘드리아 ATP 합성 실험이 고혈당증 조건을 겪은 심장근 세포 표본에 대해 수행되었다. 고혈당증 조건을 겪은 심장근 세포가 처리되지 않거나(UT), 당뇨 치료제로 처리되거나(T), 또는 당뇨 치료제 및 구조 분자 코엔자임 Q10 모두(T+R)로 처리되었다. 처리되지 않은 제어 표본와 비교한 결과, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제(T)로 처리되었을 때 미토콘드리아의 ATP 합성이 억제되었다.

도 38에서 보인 바와 같이, 수집된 단백질체 데이터를 기반으로, 약제 치료에 의해 하향 조절된 단백질이 GO 항으로 주석되었다. 고혈당증 조건을 겪은 심장근 세포가 심장 독성을 야기하는 것으로 알려진 당뇨 치료제로 처리되었을 때, 미토콘드리아의 에너지 대사에 관련된 단백질이 하향 조절되었다.

각 조건에서 각 교란을 가하여 수집된 단백질체학, 리피도믹스, 전사적 프로파일링, 기능적 분석, 및 서부 블로팅 데이터가 REFS™ 시스템에 의해 처리되었다. 복합 교란 네트워크가 각 교란 (예를 들어, 당뇨 치료제, CoQ10, 또는 둘 모두)에 노출된 특정한 조건 (예를 들어, 고혈당증, 또는 고지혈증)으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 복합 네트워크가 동일한 하나의 특정 조건(예를 들어, 고혈당증, 또는 고지혈증)에서 교란없이(비교란) 획득된 데이터의 결합으로부터 생성되었다. 마찬가지로, 교란된 복합 네트워크가 제 2 제어 조건(예를 들어, 정상 혈당 상태)에서 각 교란(예를 들어, 당뇨 치료제, CoQ10, 또는 둘 모두)에 노출되어 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 복합 네트워크가 동일한 제 2 제어 조건(예를 들어, 정상 혈당 상태)에서 교란없이(비교란) 획득된 데이터의 결합으로부터 생성되었다.

시뮬레이션 네트워크를 생성하기 위해 상기 기술된 합치된 합성 네트워크 내의 각 노드가 (10 배 증가 또는 감소시킴으로써) 상기 상세한 설명에서 상세히 설명된 대로 REFS™을 사용하여 모의되었다.

시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 곡선 아래 면적과 배수 변화가 R 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되었으며, 이때 상기 R 프로그래밍 언어는 통계적 계산과 그래픽을 위한 오픈 소스 소프트웨어 환경이다.

모의된 합성 네트워크로부터 델타 네트워크가 생성되었다. 당뇨 치료제에 대한 반응으로 약제 유도 독성 조건 대 정상 조건 분별 네트워크(델타 네트워크)를 생성하기 위해, 비교 단계들이 R 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 도 39에 도시된 대로 수행되었다.

특히, 도 39에서 보인 바와 같이, UT는 고혈당증 조건에서 처리되지 않은 제어 심장근 세포의 단백질 발현 네트워크를 말한다. 치료 T는 고혈당증 조건에서 처리된 심장근 세포의 당뇨 치료제의 단백질 발현 네트워크를 말한다. UT∩T 델타 네트워크에서 T로부터의 고유한 간선이 도 40에 제시된다.

특히, 고혈당증 조건 내 당뇨 치료제로 치료된 심장근 세포의 고유한 간선을 생성하기 위해, 고혈당증 조건 내 처리되지 않은 심장근 세포의 모의된 복합 맵과 고혈당증 조건 내 당뇨 치료제로 처리된 심장근 세포의 모의된 복합 맵이 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 델타 네트워크의 시각적 표현을 생성하기 위해 PERL 및 R 프로그램으로부터의 출력이 오픈 소스 프로그램인 사이토스코프(Cytoscape)로 입력되었다. 도 40에서 보인 바와 같이, 상기 네트워크는 고혈당증 조건에서의 당뇨 치료제 대 처리되지 않은 심장근 세포/ 심장 독성 모델에 의해 추진된 델타 네트워크를 나타낸다.

도 40에 도시된 약제 유도 독성 조건 대. 정상 조건 분별 네트워크로부터, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1와 같은 약제로 유도되는 심장 독성의 생리병리학을 추진하는 단백질이 식별되었다. 이러한 단백질들은 다른 심장 독성 유도 약제를 식별하기 위한 생물학적 표지 인자로서 작용할 수 있다. 이러한 단백질들은 또한 심장 독성을 완화시킬 수 있는 제제를 식별하기 위한 생물학적 표지 인자로서 작용할 수 있다.

본 예에서 설명한 실험은 교란된 막 생물학 및 약제 치료에 노출된 당뇨성 심장근 세포 내 자유 지방산의 운명의 변화가 약제 유도 독성의 핵심을 나타냄을 보여 준다. 데이터 통합 및 네트워크 생물학을 통해 심장 독성에 대한 이해를 증진할 수 있었으며, 심장 독성의 예후를 나타내는 신규의 생물학적 표지 인자를 식별할 수 있었다.

예 5: 효소 활성을 밝히기 위한 다중 단백질체학 모델의 구현을 위한 플랫폼 기술의 채택.

일반적으로, 위의 예 1-4에서 설명된 플랫폼 기술은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 더 구현하기 위해 적응될 수 있다. 상기 방법은 생물학적 시스템의 특징적 측면을 나타내기 위해생물학적 시스템과 연관된 세포를 사용하여 생물학적 시스템에 대한 모델을 채택한다. 상기 모델은 최소한 세 개의 수준의 데이터, 즉 (i) 생물학적 시스템과 연관된 세포에서의 효소의 전역적 활성을 나타내는 제 1 데이터 집합, (ii) 생물학적 시스템과 연관된 세포에서의 효소 대사 물질 또는 기질 상의 효소의 전역적 활성을 나타내는 제 2 데이터 집합, 및 (iii) 생물학적 시스템과 연관된 세포에서의 단백질체의 전역적 변화를 나타내는 제 3 데이터 집합을 획득하기 위해 사용된다. 상기 데이터는 효소의 전역적 활성, 효소의 전역적 활성의 영향, 및 단백질체의 전역적 변화 사이의 합치 인과 관계 네트워크를 생성하기 위해 사용된다. 상기 합치 인과 관계 네트워크는 프로그래밍된 컴퓨터 장치를 사용하여(즉, 알려진 어떠한 생물학적 관계에도 기반하지 않고) 제 1, 제 2 및 제 3 데이터 집합에만 기반한다. 상기 합치 인과 관계 네트워크는 다시 생물학적 시스템에 고유한 인과 관계를 식별하기 위해 사용되며, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 유전자 또는 단백질이 생물학적 시스템 또는 질병 과정의 조절 인자로서 식별된다.

본 예에서, 상기 플랫폼 기술은 효소 활성 및 단백질체에 대한 이 활성의 직접적 효과를 측정하기 위한 다중 단백질체학 기술을 구현하기 위해 적응되었으며, 이에 의해, 세포 단백질체 내에서의 전역 변화의 맥락에서, 효소들과 이들의 대사 물질/기질 사이의 인과 관계를 이해하기 위해 사용될 수 있는 시스템을 제공한다. 본 예에서 예증되었듯이, 효소 활성이 효소 발현과 직교할 수 있기 때문에(예를 들어, 하향 조절된 활성과 조절되지 않은 발현), 이러한 기술은 귀중한 통찰을 제공할 수 있다. 이러한 분석의 결과로 얻어지는 관계적 맵은 질병과 연관된 진단적/예후의 표지 인자뿐만 아니라 질병 치료 타겟을 제공할 수 있다. 이러한 타겟 및 표지 인자는 치료적 성분 및 이를 위한 방법을 제공할 수 있다. 모델을 수립하고, 데이터 집합을 획득하며, 합치 인과 관계 네트워크를 생성하고, 생물학적 시스템에 고유한 인과 관계를 식별하기 위한 기술들이 발명의 요약, 상세한 설명, 및 상기 예에서 기술된다. 모델을 수립하고 효소의 전역적 활성 및 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 효과를 나타내는 데이터 집합을 획득하기 위한 추가적인 기술들이 이하에서 제공된다.

도 41A는 효소(예를 들어, 키나아제) 활성을 밝히기 위한 다중 단백질체 기술을 채택하는 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 도시한다. 먼저, 본 플랫폼 기술에 따라 세포 라인이 질병을 모의하는 조건을 겪게 되는 모델이 수립되고 환경적 교란(예를 들어, 하기 제공된 간세포 암종들의 특정한 예에서 넥사바(Sorafenib)에 대한 노출)에 노출시킴으로써 조사된다. 제어 표본이 비교를 위해 제공된다. 두 번째로, 효소 활성 및 그 하향 효과가 (i) 효소의 전역적 활성, (ii) 단백질체(예를 들어, 효소 활성의 대사 물질/기질)에 대한 효소 활성의 특정 효과, 및 (iii) 세포 단백질체에 대한 전역 효과를 분석함으로써, 전역 단백질체 변화의 맥락에서 추적된다. 세 번째로, 관심있는 조절 인자를 식별하기 위해 상기 데이터 집합이 본 플랫폼 기술에 따라 분석된다. 예를 들어, 암 모델은 알려진 항암 약제 키나아제 금지 인자에 의해 조사될 수 있으며, 시스템에 대한 이러한 교란 전역 키나아제 활성에 미치는 효과가 인산 단백질체 및 전체 단백질체에 대한 결과적인 효과와 함께 분석될 수 있고, 데이터 집합이 AI 기반 REFS™ 시스템에 의해 분석될 수 있다.

본 예에서, 에파토세포 암종 (HCC)이 본 플랫폼 기술의 예시적 구현을 제공하기 위해 선택되었다. HCC는 전 세계적으로 암 관련 사망의 주요 원인 중 하나이며, 폐 및 위의 암종에 이어 세 번째로 가장 치명적인 암의 위치를 차지하고 있다. 다양한 원인론, 높은 질병률/사망률, 초기 진단을 위한 진단적 표지 인자의 부족 및 HCC의 변동성 높은 임상 과정으로 인해 이의 진단 및 치료가 부진하였다. HCC를 연구한 후 몇 년 뒤에도, HCC 내에서의 분자의 메카니즘 작동에 대한 이해는 불완전하였다. 게놈, 전사체, 및 비교적 단백질체의 프로필이 HCC 재탐구를 위한 어느 정도 중요한 통찰을 제공하였다. 그러나, 많은 연구들이 HCC와 연관된 세포 변화의 단일 측면에만 초점을 맞추고 있어서 생물학적 시스템의 진정한 복잡성과 동적 특성에 대한 이해가 완전히 이루어지지 못했다.

이러한 예시적 예는 (i) 세포 생물학, 및 (ii) 인과적 단백질 네트워크를 생성하는 통합된 단백질체학 플랫폼과 정보학 플랫폼의 파워를 결합하여, 예를 들어, 인산화, 및, 예를 들어, 키나아제와 같이 이러한 메커니즘에 참여하는 효소와 같은 HCC의 생리병리학에서 번역 후 수정의 역할을 구분한다. 특히, 이 접근 방식은 ATP 결합 도메인 농축 탐침 및 HCC 세포 모델 내 전체 단백질의 인산-단백질체 매핑을 채택하는 활성 기반 단백질체학을 통합한다.

병이 진전된 HCC 환자에 대한 첫 번째 라인의 화학 치료용 제제인 다중 키나아제 금지 인자 넥사바(Sorafenib)가 이 치료와 연관된 전역 키나아제 활성 및 단백질 인산화 변화의 역할을 탐침하기 위해 사용되었다. HepG2 (ATCC 접근 번호 HB-8065) 세포 라인이 HCC 세포를 모델링하기 위해 선택되었으며 THLE2 (ATCC 접근 번호 CRL-10149)세포 라인이 모델 정상 간 세포를 모델링하기 위해 선택되었다.

도 41B은 전역 효소(예를 들어, 키나아제) 농축 프로파일링을 위한 방법을 도시한다. 먼저, 타겟이된 효소(예를 들어, 키나아제)를 포함하는 세포 용해물이 준비된다. 제 2 단계는 탐침 결합(예를 들어, 키나아제의 경우에는 ATP 탐침)이다. 이후, 상기 효소는 소화되고 탐침에 결합된 파편들이 포획된다. 이들 파편들은 (예를 들어, LC-MS/MS에 의해) 분석될 수 있으며 이에 따라 해당하는 단백질이 (예를 들어, LC-Ms/MS 데이터의 데이터베이스 탐색을 통해) 식별된다.

THERMO SCIENTIFICⓒ PIERCE® 키나아제 농축 키트 및 ACTIVXⓒ 탐침(사용 지침은 다음 웹 사이트의 THERMO SCIENTIFICⓒ 및 PIERCE® Bio기술에서 볼 수 있다: www.thermoscientific.com/pierce)이 효소의 전역적 활성 분석을 위해 사용되었다. 간단히 말해, 이들 키트들 및 유사한 키트들은 키나아제, 셰프론 및 대사적 효소를 포함하는 ATP 분해 효소의 선택적 라벨링 및 농축을 가능하게 한다. ATP 및 ADP 탐침은 일반적으로 뉴클레오타이드 파생체이며, 이들은 효소의 활성 부위를 뉴클레오타이드-결합 부위 내의 보존된 라이신 잔여부로서 공유 결합적으로 수정한다. 예를 들어, 데스티오비오틴-ATP 및 ?ADP의 구조는 라빌 아크릴-인산염 결합에 의해 뉴클레오타이드에 부착된 수정된 바이오틴으로 구성된다. 효소 활성 부위 내 라이신의 위치에 따라, 데스티오비오틴-ATP 또는 -ADP 중 하나가 라벨링 특유의 ATP 분해 효소로서 뱌람직하다.

데스티오비오틴-ATP 및 -ADP 모두 표본 내 타겟 효소 클라스들을 선택적으로 농축, 식별 또는 프로파일링하거나, 효소 금지 인자의 특정성 및 친화성을 분석할 수있다. 많은 ATP 분해 효소 및 기타 뉴클레오타이드-결합 단백질은 이들이 효소적으로 비활성인 상태에서도 뉴클레오타이드 또는 금지 인자를 결합시킨다; 이러한 반응 제제들은 복잡한 표본 내에서 비활성 및 활성 효소들을 결합시킨다. 표본을 활성 부위 탐침을 위해 경쟁하는 작은 분자 금지 인자로 사전 배양함으로써 결합 친화성 및 타겟 특정성에 대한 금지 인자 결합의 결정에 사용할 수있다.

활성 부위 라벨링에 대한 평가는 서부 블롯 또는 질량 분광학(MS) 중 하나에 의해 성취될 수 있다. 서부 블롯 작업 흐름에 대해 설명하면, 데스티오비오틴으로 라벨링된 단백질이 SDS-PAGE 분석을 위해 농축되고 이어서 특정한 항체로 탐지된다. MS 작업 흐름에 대해 설명하면, 데스티오비오틴으로 라벨링된 단백질이 환원, 알킬화 및 효소전으로 펩티드로 소화된다. 데스티오비오틴으로 라벨링된 활성 부위 펩티드만이 LC-MS/MS에 의한 분석을 위해 농축된다. 두 작업 흐름 모두가 금지 인자 타겟 결합을 결정하기 위해 사용될 수 있으나, MS 작업 흐름만이 전역 금지 인자 타겟 및 비타겟을 식별할 수 있다.

인산 단백질체 분석을 위해 THERMO SCIENTIFICⓒ PIERCE® TiO₂ 인산펩티드 농축 및 정리키트(지침은THERMO SCIENTIFICⓒ 및 PIERCE® Bio기술 웹사이트에서 볼 수 있다. www.thermoscientific.com/pierce)가 사용되었다. 간단히 말해서, 이들 키트 및 이와 유사한 키트들은 질량 분광학(MS)에 의한 분석에 의해 복합체 및 분할된 단백질 소화물로부터 인산화된 펩티드를 효율적으로 분리할 수 있게 해 준다. 최적화된 버퍼와 결합된 구 형상의 다공성 이산화티타늄(TiO2)은 최소한의 비특정적 결합을 가지는 인산펩티드의 농축과 식별에 대한 개선을 제공한다. 스핀 기둥 양식은 빠르고 쉽게 사용할 수 있으며 300-1000μg의 소화된 단백질 표본으로부터 100μg까지의 인산펩티드를 농축할 수 있다. 상기 키트의 최적화된 프로토콜, 버퍼 성분 및 흑연 스핀 기둥은 결과적으로 MS 분석에 사용할 수 있는 고수율의 깨끗한 인산펩티드 표본을 생산한다.

인산화는 세포 신호 전달, 성장, 분화와 분리, 및 예정된 세포 사멸과 같은 생물학적 기능에 필수적인 단백질 수정 과정이다. 그러나, 인산펩티드는 높은 친수성을 가지고 있고 적은 양으로 존재하며, 결과적으로 크로마토그래피, 이온화 및 파편화가 빈약하다. 따라서, 인산펩티드 농축은 성공적인 MS 분석을 위해 필수적이다. 인산펩티드 농축 및 정리 키트는 인산펩티드 농축 및 식별을 위한 완전한 작업 흐름을 제공하기 위한 용균, 환원, 알킬화, 소화 및 흑연 스핀 기둥에 호환될 수 있다.

비교(comparative) 단백질체학, 인산 단백질체 및 효소 활성 데이터가 AI 기반 REFS™ 정보학 플랫폼으로 통합된다. 특히 기능적 관점에서의 단백질 상호 반응의 인과 네트워크, 즉 키나아제/효소 활성 및 이 키나아제의 잠재적 타겟이 인산화되고 생성될 수 있다. 또한, 세포의 기능적 판독을 사용하여, 타겟의 인산화를 조절하고 병리생리학적 세포 거동을 기계적으로 추진하는 효소/ 키나아제가 결정된다. 본 명세서에서 개략적으로 설명된 예시적 구현을 통해 세포 반응의 전역적 특성화, 화학적 반응도의 메커니즘에 대한 이해, 및 HCC의 임상적 운영을 위한 잠재적 타겟/생물학적 표지 인자를 쉽게 성취할 수 있다.

물질 및 방법

세포들은 다음 프로토콜에 따라 배양되었다. 제 1일: HepG2/Hep3B -3.2x10⁶개의 세포를 T-75 배양 플라스크 내에; 7.4x10⁶개의 세포를 T-175 배양 플라스크 내에; 또는 9.5x10⁶개의 세포를 T-225 배양 플라스크 내에 뿌린다. THLE-2 - 1.3x10⁶개의 세포를 T-75 배양플라스크 내에 뿌린다. 제 2일: 16-24시간 후에, 50-70% 융합에서 - 치료를 가한다. 제어: 0.01%의 최종 농도에서 DMSO. EGF: 10 mM 아세트 산 내 500 ng/mL. 넥사바(Sorafenib): DMSO 내 0.1% 부피에서 1 μM. 제 3일: 치료 후 24시간 이후, 세포들을 트립신화에 의해 수확한다. 펠릿을 동결 이전에 PBS로 2회 세척한다.

전반적 효소 활성 분석은 다음 프로토콜에 따라 수행되었다.

세포 용균:

신선하게 준비된 용균 버퍼 -5 M 요소, 50 mM 트리-HCL pH 8.4, 0.1% SDS, 1% 프로테아제 금지 인자 칵테일, 1% 포스타파아제 금지 인자 칵테일

1) 2000 g에서 5 분간 원심분리하고 상층액을 제거한 1.5-2 mL 에펜도르프 마이크로 튜브 내의 펠릿 세포.

2) 세포를 PBS 내의 재현탁 펠릿으로 세척한다. 세척을 한 번 더 반복한다.

3) 적절한 양의 용균 버퍼를 각 표본 및 보텍스에 첨가한다.

4) 주기적으로 혼합하면서 얼음 위에서 10분간 배양한다.

5) 용균이 완전해 질 때까지 각 표본을 초음파 처리한다.

6) 최고 속도로 15분 간 원심 분리한다

7) 용해물(상층액)을 새로운 튜브로 옮긴다.

용균 버퍼-교환:

피어스(Pierce) 사의 사전에 제작된 반응 버퍼를 사용.

반응 버퍼 - 20 mM HEPES pH 7.4, 150 mM NaCl, 0.1% TritonX-100

1) 제바(Zeba) 스핀 제염 기둥의 바닥 마감부를 비틀어 뚜껑을 느슨하게 한다.

2) 15 mL 콘 모양 튜브 내에 넣는다.

3) 기둥을 실온의 1000 g에서 2분 간 원심분리하여 저장 용액을 제거한다.

4) 3 mL의 반응 버퍼를 기둥에 추가한다. 1000 g에서 2분 간 원심분리하여 버퍼를 제거한다. 이 과정을 2회 더 반복하고, 버퍼를 제거한다.

a. 최종 세척 후에 과잉 버퍼가 있는 경우, 추가적으로 1000 g에서 2-3분간 원심분리한다.

5) 기둥을 새로운 콘 모양 튜브로 옮긴다.

6) 전체 표본을 수지 베드의 중앙에 천천히 가한다.

7) 1000 g에서 2분 간 원심분리하여 표본을 수집한다. 기둥을 제거한다.

8) 1:100 프로테아제/포스타파아제 금지 인자 칵테일을 표본에 추가하고 얼음 상에 위치시킨다.

a. 표본은 냉동고에서 -80 ℃로 냉동될 수 있다.

중단 포인트

탐침을 사용한 표본 라벨링:

사전 제작된 피어스(Pierce) 제 1 M MgCl₂을 사용하였음.

신선한 1 M MnCl₂를 제조.

1) 브래드포드(Bradford) 분석을 사용하여 단백질 농도를 결정한다.

2) 용해물을 물을 사용하여 가능하면 2 mg/mL(2 μg/μL)로 희석한다.

3) 2 mg을 새로운 마이크로 원심분리 튜브로 옮긴다.

4) 20 μL의 1 M MgCl₂을 각 표본에 추가하고, 혼합한 후, 실온에서 1분 간 배양한다.

주: 최종 농도는 0.02 M MgCl₂이다.

5) 10 μL의 1 M MgCl₂을 각 표본에 추가하고, 혼합한 후, 실온에서 1분 간 배양한다.

주: 최종 농도는 10 mM MgCl₂ 이다.

6) ATP/ADP 반응 제제를 실온에서 건조제로 평형을 맞춘다. 나머지를 -80℃에서 보관한다.

7) 20 μM 반응에 대해 -10 μL의 초순수 물을 반응 제제에 추가하여 1 mM 재고 용액을 제조한다.

8) 20 μL의 ATP/ADP 스톡을 각 표본에 추가하고, 혼합한 후, 실온에서 1시간 동안 배양한다.

라벨링된 단백질 환원 및 알킬화:

신선한 10 M 요소/50 mM 트리-HCL pH 8.4를 준비한다.

1) 1 mL의 10 M 요소/50 mM 트리-HCL을 각 반응에 첨가한다.

2) 100 μL of 200 mM TCEP 을 각 반응에 첨가한다. 55 ℃에서 1시간 동안 배양한다.

3) 100 μL의 375 mM 이오도 아세타마이드를 각 표본에 첨가한다. 실온에서 30분 간 어둠 속에서 배양한다.

버퍼 교환:

신선한 소화 버퍼를 준비한다 - 2 M 요소, 200 mM 트리-HCL pH 8.4

1) 제바(Zeba) 스핀 제염 기둥의 바닥 밀폐부를 비틀어 뚜껑을 느슨하게 한다.

2) 15 mL 콘 모양 튜브를 삽입한다.

3) 기둥을 실온의 1000 g에서 2분간 원심분리하여 저장 용액을 제거한다.

4) 3 mL의 소화 버퍼를 기둥에 추가한다. 1000 g에서 2분간 원심분리하여 버퍼를 제거한다. 이 과정을 2회 더 반복하고, 버퍼를 제거한다.

a. 마지막 세척 후 과잉 버퍼가 있는 경우 추가적으로 1000 g에서 2-3분간 원심분리한다.

5) 기둥을 새로운 콘 형 튜브로 옮긴다.

6) 전체 표본을 수지 베드의 중앙에 천천히 가한다.

7) 1000 g에서 2분간 원심분리하여 표본을 수집한다. 기둥을 제거한다.

라벨링된 단백질 소화:

1) 트립신을 1:50 비율(트립신: 단백질)로 첨가한다.

2) 37℃에서 흔들면서 하루밤 배양한다.

라벨링된 펩티드 포획 및 용출:

신선한 용출 버퍼(50% ACN; 0.1% 포름산)를 준비한다.

1) 50 μL의 슬러리를 소화된 각 표본에 첨가한다. 실온에서 1.5시간 동안 일정한 혼합으로 배양한다.

2) 표본을 피어스(Pierce) 스핀 기둥으로 옮긴다. 1000 g에서 1분간 원심분리한다. 통과된 유량을 수집하고 저장한다.

3) 각 세척에 대해 1000 g에서 1분 간:

a. 수지를 500 μL의 4 M 요소/50 mM 트리-HCl pH 8.4로 3회 세척한다.

b. 수지를 500 μL의 PBS로 4회 세척한다.

c. 수지를 500 μL의 물로 4회 세척한다.

4) 펩티드를 75 μL의 용출 버퍼로 녹여 분리하고 3 분 간 배양한다. 이 과정을 2회 더 반복하여, 분리된 부분을 결합한다.

5) 표본을 진공 농축기 내에서 감압 하에 동결 건조한다.

LCMSMS 분석을 위한 무 라벨, 1-D 분리

1) 표본이 감압 동결 건조에 의해 건조되면, 각 표본을 25 μL의 0.1% 포름산에서 재현탁한다.

2) LCMSMS 을 위해 10 μL을 유리병으로 옮긴다.

iTRAQ 라벨링

1) 남아 있는 15 μL 표본이 완전히 건조되었다.

2) 표본을 30 μL의 200 mM TEAB 내에서 재현탁한다.

3) 15 μL의 표본이 30 μL의 iTRAQ 반응 제제로 라벨링되었고 실온에서 2시간 동안 배양되었다.

a. 표본 당 6 μL이 QCP를 위해 풀로 보관되었다.

4) 라벨링 이후, 8 μL의 5% 히드록사민이 냉각을 위해 4℃에서 15분 간 추가되었다.

5) 모든 MP가 풀에 함께 저장된 후, 건조, 제염되고20 μL의 0.1% 포름산 내에서 재현탁되었다.

엑시겐트(Eksigent)/LTQ 오비트랩(오비트랩) 기구가 문제를 일으켜서 MP가 건조되고 18 μL의 20 mM 암모늄 포름산염 내에서 재현탁되었다.

표본 당 왼쪽(leftvovers):

200 mM TEAB 내 9 μL의 분리물 -80℃

기구 상 20 mM암모늄 포름산염 내 MP

인산 단백질 분석이 다음 프로토콜에 따라 수행되었다.

표본 준비 프로토콜:

1. 세포 용균

a. 용균 버퍼 - 5 M 요소, 50 mM 트리-HCL, 0.1% SDS, 1% 프로테아제 금지 인자 칵테일, 1% 포스타파아제 금지 인자 칵테일

b. 펠릿을 적절한 양의 용균 버퍼에 현탁시킨다.

c. 얼음 상에서 와류시켜 10 분간 배양한다. 반복한다.

d. 얼음 상에서 초음파를 쪼이고 10 분간 배양한다.

e. 최고 속도로 15분간 원심분리한다.

f. 용해물이 여전히 점성이 있고 끈적거릴 때는 초음파를 다시 쪼여 준다.

g. 용해물을 새로운 튜브로 옮긴다.

2. 단백질 농도를 결정하기 위한 브래드포드(Bradford) 분석을 수행한다.

3. 700 μg의 단백질(THLE-2에 대한 400 μg)을 45 μL의 200 mM TEAB로 새로운 마이크로튜브로 옮긴다.

4. 5 μL TCEP 에서 200 mM TCEP로 환원되었다: 55℃ 에서 1시간, 100 μL 부피.

5. 5 μL 요오드에서 375 mM 요오드 아세타마이드로 알킬화한다: 실온에서 100 μL 부피, 어둠에서 30 분간.

6. 7배 부피 에서 아세톤 침착 -20℃에서 하루밤 동안.

7. 단백질을 50 μg/μL의 200 mM TEAB내에서 재현탁. 1:40 (트립신:단백질) 비율로 37℃에서 하루밤 동안 트립신으로 소화

기둥을 준비하는 동안, 펩티드 표본을 150 μL의 버퍼 B에 재현탁시킨다.

기둥 준비:

1. 원심분리 기둥 어댑터를 수집 튜브 내에 위치시키고 TiO₂ 스핀 팁을 어댑터에 삽입한다.

2. 20 μL의 버퍼 A를 추가한다. 3000 g에서 2분간 원심분리한다. FT를 제거한다.

3. 20 μL의 버퍼 B를 추가한다. 3000 g에서 2분간 원심분리한다. FT를 제거한다.

인산펩티드 결합:

1. 스핀 팁을 깨끗한 마이크로튜브로 옮긴다.

2. 현탁된 표본을 스핀 팁에 가한다. 1000 g에서 10분간 원심분리한다.

3. 표본을 스핀 팁에 다시 가하고 1000 g에서 10분간 원심분리한다. FT를 저장한다.

4. 스핀 팁을 새로운 마이크로튜브로 옮긴다.

5. 20 μL의 버퍼 B를 추가하여 기둥을 세척한다. 3000 g에서 2분간 원심분리한다.

6. 20 μL의 버퍼 A를 추가하여 기둥을 세척한다. 3000 g에서 2분간 원심분리한다. 이 과정을 한번 더 반복한다.

용출:

1. 스핀 팁을 새로운 수집 튜브에 위치시킨다. 50 μL의 용출 버퍼 1을 추가한다. 1000 g에서 5분간 원심분리한다.

2. 동일한 수집 튜브를 사용하여, 50 μL의 용출 버퍼 2를 스핀 팁에 추가한다. 1000 g에서 5분간 원심분리한다.

3. 100 μL의 2.5% 포름산을 첨가하여 용출 부분을 산화시킨다.

인산펩티드의 흑연에 의한 정리

**이는 LC/MS/MS 분석 이전의 최종 정리이므로 TFA를 포름산과 교체한다.

기둥 준비:

1. 흑연 스핀 기둥의 상단 및 하단 덮개를 제거한다. 기둥을 1.5 mL의 마이크로튜브 내에 놓는다. 2000 g에서 1분간 원심분리하여 저장 버퍼를 제거한다.

2. 100 μL의 1 M NH₄OH를 첨가한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한번 더 반복한다.

3. 100 μL의 아세토니트릴을 첨가하여 흑연을 활성화시킨다. 2000 g에서 1분간 원심분리한다. FT를 제거한다.

4. 100 μL의 1% 포름산을 첨가한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한번 더 반복한다.

표본 결합 및 용출:

용출 = 0.1% FA + 50% ACN

1. 기둥을 새로운 수집 튜브에 넣는다. 표본 수지 베드의 상단에 가한다. 10분간 주기적으로 휘저어 혼합시키면서 결합이 되도록 한다.

2. 1000 g에서 3분간 원심분리한다. FT를 제거한다.

3. 기둥을 새로운 수집 튜브에 위치시킨다. 200 μL의 1% FA를 가하여 기둥을 세척한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한 번 더 반복한다.

4. 기둥을 새로운 수집 튜브에 위치시킨다. 100 μL의 0.1% FA/50% CAN을 가하여 표본을 녹여 분리한다. 2000 g에서 1분간 원심분리한다. 400 μL의 완전한 용출을 위해 이 과정을 3회 더 반복한다.

5. 표본을 진공 증발기(SpeedVac) 내에서 건조시킨다.

HepG2 및 Hep3B:

700 μg의 단백질로 시작한다

TiO₂ 농축 및 흑연 정리 후, 인산펩티드가 400 μL의 0.1% 포름산/50% CAN에서 용해되어 분리된다.

(400/700)* 비율의 400 μL 부분 표본이 용해 분리물로부터 취해져서 완전히 건조된다. 이는 20 μL의 200 mM TEAB에서 iTRAQ 라벨링을 위해 재현탁된다.

라벨링 이후, 표본은 제염, 건조, 및 20 μL의 0.1% 포름산에서 재현탁된다.

남아 있는 부분 표본은 완전히 건조되고 20 μL의 0.1% 포름산 내에서 재현탁된다.

10 μL가 라벨 없는 LCMSMS 분석을 위한 유리병으로 이송된다.

THLE-2:

400 μg의 단백질만이 수확된다.

모든 단백질이 TiO₂ 기둥으로 농축되며 흑연 기둥으로 세척된다.

용해 분리물이 건조되고, 20 μL의 200 mM TEAB에서 iTRAQ 라벨링을 위해 재현탁된다.

표본 상에서의 왼쪽:

iTRAQ 표본 - 20 mM 암모늄 포름산염 내 기구 상

라벨링 없는 HepG2/Hep3B - 0.1% 포름산 내 10 μL, -80℃; 기구 상의 0.1% 포름산 내 10 μL

결과

도 42는 ENO1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 ENO1 발현에 대해서는 그렇지 않다. 도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않다. 도 44는 넥사바(Sorafenib)로 처리한 HepG2에서 LDHA 활성의 상당한 감소를 도시한다. 각 경우에 있어서, ENO1 발현은 QC 표본에 대해 상대적인 단위로 측정되며 ENO1 활성 변화는 제어된 비처리 표본에 대해 상대적인 단위로 측정된다.

도 42-44에서의 데이터는 HCC 질병 모델 내의 ENO1, LDHA, 및 PGK1에 대해 넥사바(Sorafenib)를 사용한 세포의 치료 결과, 단백질의 효소 활성의 하향 조절을 수반하면서 단백질 발현의 상향 조절이 일어남을 보여 준다. 따라서, 상기 인산 단백질체는 키나아제 활성 및 전체 세포 단백질에 대한 세포외 신호(예를 들어, 약 분자) 사이의 복잡한 관계를 밝히기 위해 사용될 수 있는 추가적인 레이어의 정보를 부여하며, 이를 통해 질병과 연관된 진단적/예후의 표지 인자뿐만 아니라 질병 치료 타겟의 식별을 용이하게 할 수 있다.

도 45는 AI 기반 REFS™ 시스템을 사용하여 결과적인 데이터 집합을 분석함으로써 생산될 수 있는 인과적 분자의 상호 반응 네트워크를 예시한다(왼쪽 프레임 참조). 상기 네트워크는, 예를 들어, 정상 및 암 세포(각각 중앙 및 오른 쪽 프레임 참조)에서 분별적으로 조절된 관심 대상 네트워크를 식별하기 위해 사용될 수 있다. 이러한 정보는 HCC와 연관된 진단적/예후의 표지 인자뿐만 아니라 HCC 치료 타겟을 제공하기 위해 사용될 수 있다.

도 46-51은 종양 형성 시스템의 이차원 화학적 조사 및 서명의 다중-체학적 통합이 어떻게 암의 생리병리학에 관련된 신규의 신호 전달 경로를 밝혀 주며, 이에 의해 어떻게 치료적 타겟, 관련된 생물학적 표지 인자, 및/또는 치료제를 식별하는지를 도시한다. 특히, 도 46-51은 도 41 및 본 명세서에서 기술된 여러 방법에 따라 보여진 일반적인 방법론의 구현을 예시한다. 도 41에서 보인 바와 같이, 상기 접근 방식은 생체 외 암 및 제어 모델이 일차원에서 키나아제 금지 인자 (넥사바(Sorafenib))에 의해 조사되는 “이차원적 화학적 조사”에 의해 보강된다. 키나아제 활성에서의 전체적 변화는 활성 기반 키나아제 농축 탐침을 채택하는 이차원 화학적 조사에 의해 포획되었다. 키나아제는 LC-MS에 의해 식별되었다. 또한, 키나아제 금지 인자에 대한 반응으로서의 인산 단백질체에서의 변화는 인산 단백질 농축 방법 및 뒤이은 단백질의 식별을 위한 LC-MS를 사용하여 식별되었다. 최종적으로, 전체 단백질 발현에서의 정량적 변화가 획득되었다. 결과적으로 얻어진 다중-체학 데이터는 AI 기반 정보학을 사용하여 통합되었으며, 데이터에 의해 추진되며 “정상” 모델에서는 작동하지 않으나 암 모델에서는 작동하는 단백질의 인산화를 추진하는 분별 키나아제 활성을 나타내는 인과 네트워크의 생성으로 귀결되었다. 이러한 보완 분석의 통합은 도 46 및 47의 추정된 경로에서 도시되었다. 상기 기술은 결과적으로 신규의 키나아제 및 암의 생리병리학에 기계적으로 관련된 관계에 대한 발견을 가져 온다(예를 들어, 도 48-50).

도 46은 베이지안(Bayesian) 네트워크 추정 알고리즘을 채택하는 다중체적 데이터의 통합이 어떻게 간세포 암종에서의 신호 전달 경로의 이해로 귀결되는지를 예시한다. 노란색 사각형은 전사후 수정(인산) 데이터를 나타내며, 파란색 삼각형은 활성 기반(키나아제) 데이터를, 녹색 원은 단백질체학 데이터를 나타낸다. 도 47은 간세포 암종에서의 신호 전달 경로에서의 자동 조절과 역 피드백 조절이 어떻게 플랫폼에 의해 추정될 수 있는지를 예시한다. 사각형은 PMT(인산) 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타내며, 사각형은 활성 기반(키나아제) + 단백질체학 데이터 (회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타낸다. 이러한 분석들은 상기 설명되고 도 41에 예시된 세 개의 레이어된 다중-단백질체학 방법론을 사용하여 수행되었다. 이러한 분석들의 결과는 도 48-51에 도시되며 이하에서 자세히 설명된다.

도 48-50은 플랫폼에 의해 추정된 신호 전달 경로에서의 도출된 인과적 연관의 예를 예시한다. 키나아제 이름은 대표적인 사각형과 원으로 나타내어 졌으며, 연결기에 의해 나타나는 인과적 연관을 보여 준다. 도 48은 CLTCL1, MAPK1, NME1, HIST1H2BA, RPS5, TMED4, 및 MAP4 키나아제 동형 단백질의 식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 도 49은 HNRPDL, HNRNPK, RAB7A, RPL28, HSPA9, MAP2K2, RPS6, FBL, TCOF1, PGK1, SLTM, TUBB, PGK2, CDK1, MARCKS, HDLBP, 및 GSK3B 키나아제 동형 단백질의식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 도 50은 RPS5, TNRCBA, CLTCL1, NME1, MAPK1, RPL17, CAMK2A, NME2, UBE21, CLTCL1, HMGB2, 및 NME2 키나아제 동형 단백질의식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 이들 키나아제 동형 단백질은 잠재적 치료적 타겟, 표지 인자, 및 치료제를 제시한다.

도 51은 플랫폼에 의해 도출된 인과적 연관의 예시도이다. 특히, 도 51은 EIF4G1, MAPK1, 및 TOP2A 키나아제 동형 단백질의 식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 이 관계는 EIF, MAPK, 및 TOP 키나아제 사이의 공개된 관계에 부합하기 때문에 모델 및 방법에 대한 증명을 제공한다.

결론적으로, 효소(예를 들어, 키나아제)활성 다중체학 기반 분석은 세포 활동의 함수로서 대사 물질과 기질 사이의 하향 인과 관계를 결정하는데 있어 유용한 방법으로 나타난다. 마찬가지로, 치료적 치료에 대한 반응으로서 효소의 전역적 활성에서의 변화를 모니터링하는 활성 기반 단백질체는 단백질(예를 들어, 효소)의 전반적 세포 발현만을 모니터링하는 방법에 비해 세포 신호 전달의 동적 작용에 대한 핵심 통찰력을 제공할 수 있다. 또한, 상기 플랫폼은 신호 전달 경로를 견고하게 추정할 수 있고 종양 형성 대 정상 환경에서의 피드백 조절을 역전시킬 수 있으며, 따라서, 종양 형성 신호 전달 경로에서의 신규의 인과적 연관을 식별할 수 있음이 밝혀 졌다. 이에 따라, 본 기술은 신규의 키나아제 식별과 키나아제 금지 인자의 활동에 대한 메커니즘의 판독을 제공한다.

예 6: CoQ10 에 의한 신생 혈관 생성 및 조절의 생체 외 모델

서론: 종양 크기가 2-5mm으로 진전되기 위해서는 종양에 산소 및 영양분을 공급하기 위한 신생 혈관 생성의 유도를 필요로 한다. 신생 혈관 생성은 저산소 상태 또는 유전학적 변이에 대한 반응으로 내피의 미토겐 요소의 종양 내 세포 분비로 인해 발생하며, 현재, 예를 들어 VEGF 및 PlGF와 같은 몇 개의 단백질이 치료적 항신생 혈관 생성 타겟으로서 임상적 개발 단계에 있다. 본 명세서에서, 우리는 현재 암 전개의 인간 연구에서 조사되고 있는생체 외 코엔자임 Q10(CoQ10)을 조사하였다.

방법: 혈관 형성 표현형을 조절하는 인간 배꼽의 정맥 내피의 세포(HUVEC) 운명 결정이 100 또는 1500μM CoQ10 또는 부형제의 존재 하에 조사되었으며 처리되지 않은 제어 세포와 비교되었다. 마트리겔(MATRIGEL®) 내의 세포 자살, 증식, 이주 및 3-D 관 형성에 대한 내피의 세포 운명 분석이 수행되었다.

결과: 아넥신 V/요오드화프로피디움 양성 세포에 대한 형태학적 혈구 흐름 계산 분석 결과 부형제 또는 제어 세포와 비교하여 1500μM CoQ10의 존재 하에 HUVEC 세포 자살이 증가함이 밝혀 졌다. CoQ10C로 인한 세포 사멸에 수반하여, HUVEC 세포의 개수가 1500μM CoQ10의 존재 하에서 상당히 감소하였다. 내피의 이주에 대한 CoQ10의 잠재적 효과를 분석하기 위해, HUVEC 이주가 세포 정리 후 5시간 후에 내피의 스크래치 분석에서 조사되었다. CoQ10와 부형제 모두 100 및 1500μM 농도에서 HUVEC 이주를 상당히 저해하였으며, 이는 부형제와 CoQ10 모두에서의 항 이주 활성을 보여 주는 것이다. CoQ10 항종양 활성이 내피의 분출 신생 혈관 생성에 대한 효과로 인한 것인지를 결정하기 위해, 우리는 3-D 마트리겔(MATRIGEL®) 배양에서 시간에 따른 내피의 관 형성을 조사하였다. 겔 및 그 위의 매체 모두에 부형제를 첨가하면 제어 표본에 비해 관 형성이 저해되었다. 또한, 1500μM CoQ10을 첨가하면 부형제 및 제어 표본의 처리되지 않은 세포 모두에 비해 HUVEC 관 형성이 더 저해되었다. 이러한 효과는 산포 후 24 시간 만에 관측되어 배양에서 96 시간까지 지속되었다. 종합적으로 말하면, 이들 연구를 통해 CoQ10의 효과는, 최소한 부분적으로는, 신생 혈관 형성을 위한 국지적 혈액 공급의 종양 모집이 금지된 때문일 가능성이 있다는 것이 밝혀 졌다.

내피의 형태에 대한 CoQ10 의 효과: 인간 배꼽의 정맥 내피 세포(HUVEC 세포)가 CoQ10 농도의 범위에서 24시간 동안 처리되었다. '정상' 세포에 매우 닮은 융합성 세포와 또한 증식 세포의 혈관 형성 표현형을 매우 유사하게 나타내는 하위-융합성 세포에 약제를 가하였다. 융합성 배양에서는, 점점 증가하는 첨가된 CoQ10의 농도로 인해 EC들에 대한 보다 가까운 연관, 길이 증가 및 정렬이 발생하였다. 5000μM의 첨가가 둘러싸는 세포들에 대한 미묘한 증가를 가져 왔다(도 52A). 하위-융합성 내피의 세포의 CoQ10에 대한 반응은 융합성 세포 반응에 대해 다양하게 나타났다(도 52B). 1000μM CoQ10 및 그 이상에서 내피는 외견 상 건강하지 않아 보였다. 증가한 세포 사멸은 CoQ10의 농도가 증가함에 따라 보다 가시화되었다.

CoQ10은 내피의 세포 생존에 분기(divergent) 효과가 있다: HUVEC 세포의 융합성 및 하위 융합성 배양이 100 또는 1500μM CoQ10으로 24시간 동안 처리되고 요오드화프로피디엄 양성 세포 사멸제 세포에 대해 분석되었다. 그 결과는 도 53A 및 53B에 각각 도시되었다. CoQ10 융합에서 처리된 EC를 보호하는 경향이 있으며, 반면에 하위 융합성 세포는 CoQ10에 민감하고 1500μM CoQ10에서 증가하는 세포 자살을 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 자살 수준이 높아지는 것을 보여 주는 하위 융합성 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)의 대표적인 히스토그램이 도 53C에서 도시된다.

CoQ10 이 내피의 세포의 개수 및 증식을 감소시킨다: HUVEC 세포의 하위 융합성 배양이 100 또는 1500μM CoQ10으로 72시간 동안 처리되고 요오드화프로피디엄 통합 분석(G2/M 위상 DNA를 탐지)을 사용하여 세포의 개수(도 54A) 및 증식(도 54B) 모두에 대해 분석되었다. 높은 농도의 CoQ10는 세포의 개수에서 상당한 감소를 가져 왔으며 EC 증식에 대한 투여량에 의존하는 효과를 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 증식이 낮아지는 것을 보여 주는 세포 사이클의 G2/M 위상 내의 세포에 대한 대표적인 세포 증식 게이팅의 히스토그램이 도시되었다[도 54C, 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)].

CoQ10 이 내피의 세포 이주를 감소시킴: HUVEC 세포가 "스크래치" 분석을 사용하여 이주에 대해 검사될 수 있도록 융합되어 성장하였다. 100 또는 1500μM CoQ10이 스크래치 시 가해졌으며 정리된 부분의 폐쇄가 48 시간에 걸쳐 모니터링되었다. 100μM CoQ10는 제어 표본에 비해 내피의 폐쇄를 지연시켰다. 0, 12, 24, 및 36 시간에서의 대표적인 영상들이 도 55에 제공된다. 1500μM CoQ10을 48시간까지도 폐쇄가 방지되었다(데이터 미도시).

CoQ10 이 내피의 관 형성을 저해함: 3-D 마트리겔에서 성장하는 내피 세포는 시간이 지남에 따라 관을 형성한다. 100μM 및 1500 μM CoQ10의 관 형성에 대한 분별 효과가 관찰되었다. 저해된 세포에서 세포로의 연관 및 초기 관 구조의 붕괴는 1500 μM CoQ10에서 상당 규모로 일어난다. 흥미롭게도, 1500μM CoQ10의 존재 하에서는 관 형성이 시작되지 않았으나, 이 과정은 48 시간에서 관 성장 및 형성을 저해하였다. 도 56에 도시된 영상은 72시간에 획득되었다.

결과 및 결론:

우리는 CoQ10의 잠재적 신생 혈관 생성 조절 효과를 조사하였다. CoQ10은 인간 고형 종양 연구에서 조사되고 있는 세포 에너지 대사를 조절하는 항암 제제이다.

CoQ10은 적은 양을 투여하면 융합성 내피의 세포를 보호하지만, 반면에 CoQ10를 하위-융합성 세포에 투여하면 세포 자살이 증가하고, 세포의 개수가 감소하며 내피의 증식에 대한 강력한 금지 인자가 된다. 우리는 '정상' 맥관 구조를 보호할 수 있는 융합성 및 하위융합성 세포에 대한 다변적 효과를 증명하였다.

2-D 스크래치 분석에서의 내피의 이주 능력에 대한 기능적 평가를 통해 내피의 이주에 대한 강력한 금지 인자가 밝혀졌다. 시간을 두고 촬영한 사진을 통해 2일의 배양/치료에 걸쳐 정리된 영역을 폐쇄하는데 실패하는 동적인 내피의 '전면'이 밝혀졌다.

내피의 세포를 3-D 마트리겔에서 현탁시킨 결과 시간에 지남에 따른 관 형성이 관찰되었다. 종양 신생 혈관 생성에서 역할을 하는 많은 요소들을 재확인해주는 이러한 양호하게 특성화된 분석을 사용함으로써, 우리는 내피의 관 형성에 대한 CoQ10의 효과를 조사하였다. 100μM CoQ10의 추가는 관 형성에 다소의 효과를 주었으나, 1500μM CoQ10의 추가는 내피의 관 형성이 극적으로 파괴되는 결과를 가져 왔다.

요약하면, 이들 결과들은 내피의 분출, 이주 및 증식에 대한 CoQ10의 영향을 보여 주며, 혈관 형성 내피의 세포 내 세포의 선택적 사멸을 유도하는 것을 나타낸다.

예 7: 융합성 및 하위융합성 HUVEC 세포에서 코엔자임 Q10의 분별적으로 조절된 기능적 반응

융합성 및 하위융합성 조건에서 성장한 HUVEC 세포 내의 세포 증식 및 이주에 대한 CoQ10의 분별적 효과를 예증한 후, HUVEC 세포 상의 생화학적 경로에 대한 CoQ10의 효과가 조사되었다.

CoQ10의 존재 또는 부재 하에서 정상 산소 상태 및 저산소 상태에 대한 HUVEC 세포의 반응이 분석되었다. 특히, HUVEC 세포가 본 명세서에서 기술된 노목식 또는 혈중 산소 감소 조건 하의 융합성 및 융합성 배양에서 성장되었다. 상기 세포는 또한 0, 100, 또는 1500 μM CoQ10에 노출되었다. 산화질소(NO) 및 반응성 산소 종(ROS) 수준이 본 명세서에서 제공된 방법을 사용하여 결정되었다. 도 57에서 보인 바와 같이, HUVEC 세포는 CoQ10 및 저산소 상태에 대한 반응으로서 산화질소(NO) 및 반응성 산소 종(ROS)의 생성에 따라 구분된 투여량을 예시한다.

HUVEC 세포의 생명 에너지론이 여러 농도의 CoQ10의 존재 하에 분석되었다. 특히, HUVEC 세포가 융합성 또는 융합성 조건에서 CoQ10(10, 100, 1500 μM)의 부재 또는 존재 하에 성장되었다. 산소 소모율(OCR), 전체 및 미토콘드리아 모두에서의 ATP 생산, 및 세포외 산화 비율(ECAR)이 시호스(Seahorse) 분석을 사용하여 분석되었다. 하위-융합성 배양에서 성장하는 HUVEC 세포는 도 58A-D에서 보인 바와 같이, 융합성 배양과 비교하여 미토콘드리아의 산소 소모를 제한한다((A) 전체 OCR; (B) 미토콘드리아의 OCR; (C) ATP; (D) ECAR_. 하위-융합성 배양에 CoQ10를 추가하면 융합성 수준 OCR 에 대한 미토콘드리아의 OCR을 역전시킨다(도 58B).

예 8: 항 CoQ10 의 혈관 형성 메커니즘을 밝히기 위한 기능적 단백질체학 및 리피도믹스의 적용

신생 혈관 생성은 종양 세포 성장에 필요한 산소 및 영양분을 제공하여 종양 발전을 가능케 하는 핵심 특징이다. 우리는 현재 조사되고 있는 인간에서의 암 전개에 대한 항종양 약제인 CoQ10의 항혈관 형성 특성을 조사하였다. CoQ10은 '스크래치' 분석에서의 내피의 이주 및 3-D 마트리겔(MATRIGEL®) 관 형성 분석에서의 관 형성을 저해하였다. CoQ10의 추가는 또한 내피의 증식을 저해하며, 이는 G2/M 상 세포 및 증식 세포 핵 항원 (pCNA) 단백질로서 알 수 있다. CoQ10은 카스파제 3의 활성을 유도하고 혈관 형성/증식 내피 세포의 세포 자살을 증가시키며, 반면에 비 증식 융합성 내피의 세포 배양의 세포 사멸은 제어에 비해 감소하였다.

I혈관 형성 증식 내피 세포 및 비증식 내피 세포의 세포 내 단백질체의 프로필을 결정하기 위해, 우리는 단백질체, 지질체, 및 기능적 단백질체의 접근 방식을 사용하였다. 단백질체 및 단발(shotgun) 지질체 분석이 LTQ-오비트랩-벨로스(Velos) 및 Vantage-QqQ 상에서 각각 수행되었다. 채택된 기능적 단백질체학 접근 방식은 비교적 단백질체학에 의한 조합 내의 활성-기반 탐침이다. 키나아제 및 기타 ATP 분해 요소가 특히 효소의 활성 부위와 이들의 자연적 형태에서 반응하는 ATP-결합 도메인 농축 탐침으로 라벨링되었다. 농축은 스트렙타비딘 수지를 사용하여 면역 침강법으로 수행되었다.

인과적 지질/ 단백질/ 기능적 단백질체학 네트워크를 생성하는 통합된 리피도믹스 및 단백질체의 플랫폼 및 AI 기반 베이지안(Bayesian) 정보학 플랫폼을 사용하여, 신생 혈관 생성을 조절하는 신규의 단백질, 지질 및 효소가 식별되었다. CoQ10로 처리된 세포와 정상 및 혈관 형성 내피의 세포와의 비교가 전역 키나아제 활성을 탐구하기 위해 사용되었다. 신생 혈관 생성의 복잡함과 동적 특성을 밝혀 내기 위해 비교학적 단백질체학 및 효소 활성 데이터가 AI 기반 베이지안(Bayesian) 정보학 플랫폼으로 통합되어 기능적 단백질-단백질 상호 반응의 인과 네트워크를 조사하였다. 인과적 상호 반응성 네트워크는 도 59A-C에 도시된다. 특히, 도 59A는 지질, 단백질 및 키나아제의 완전한 다중 체학적 인과적 상호 반응 네트워크이다. 도 59B 단백질 농축 네트워크의 허브를 도시하며, 도 59C는 키나아제, 지질체 및 기능적 종단점 네트워크의 허브를 도시한다. 네트워크 내의 단백질은 원으로 표시되며, 키나아제는 사각형으로, 지질은 다이아몬드로, 기능적 활성 또는 세포 반응은 8각형으로 표시된다. 일부 단백질 및 키나아제 이름이 제공된다. 이러한 플랫폼으로부터의 출력이 알려진 단백질 상호 반응을 확인하였다.

요약하면, 본 발명의 플랫폼 기술을 사용하여, CoQ10의 항혈관 형성 메카니즘 및 증식적 내피 세포의 고유한 특성이 통합된 기능적 단백질체의 분석을 적용하여 효소 활성에서의 전역 변화를 결정함으로써 조사되었다. 조사적 “체학(omic)” 기반 플랫폼은 세포적 지능을 견고히 추정한다. 인과성을 추정하기 위한 데이터 마이닝에 대한 이러한 AI 기반 네트워크 엔지니어링 접근 방식은 결과적으로 작용 가능한 생물학적 지능을 가져 온다. 또한, 상기 발견 플랫폼을 통해 환경적 도전, 대사적 상태의 변화, 및 병리학적 교란을 완화하기 위한 적응적 분자의 생산에 대한 반응으로서의 내피 세포의 생리병리학에 대한 이해를 향상시킬 수 있다.

예 9: 신생 혈관 생성의 모델을 구축하기위한 플랫폼 기술의 채택

본 예에서, 신생 혈관 생성 모델로부터 획득한 데이터를 통합하고, 신생 혈관 생성을 추진하는 신규의 단백질/경로를 식별하기 위해 상기 상세한 설명에서 상세히 설명된 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 생성되는 관계적 맵은 신생 혈관 생성 생물학적 표지 인자를 제공한다.

신생 혈관 생성은 완전히 이해되지 않는 복잡한 일련의 신호 전달 경로들의 결과이다. 신생 혈관 생성은 다수의 병리학적 조건에서 역할을 하며, 이러한 조건은 암을 포함하나 이에 한정되지는 않는다. 특히 세포 생명 에너지론 및 미토콘드리아의 막 기능을 알아 보기 위해, 단백질 및 지질 신호를 기능적 종단점 분석과 결합하는 시스템 접근 방식이 본 명세서에서 제시되었다. 상기 예시한 바와 같이, 하위-융합성 HUVEC 세포가 신생 혈관 생성 상태를 모방하기 위해 사용될 수 있으며, 반면에 융합성 HUVEC 세포는 비혈관 형성, 즉, 정상 상태를 모방하기 위해 사용될 수 있다.

생체 외 모델에서, HUVEC 세포는 신생 혈관 생성의 잠재적 메커니즘의 신호를 창출하고 또 이를 밝히기 위해, 신생 혈관 생성 금지 인자, 예를 들어, CoQ10와 같은 환경적 영향 인자의 존재 또는 부재 하에서, 접촉 금지 조건(예를 들어, 융합성 배양) 또는 접촉 금지가 없는 조건(예를 들어, 하위-융합성 배양, 예를 들어, 약 60% 미만의 융합성, 약 70% 미만의 융합성, 약 80% 미만의 융합성, 약 90% 미만의 융합성; 삼차원적 배양; 또는 세포의 패치가 배양물을 “스크래치”하는 배양)을 겪도록 하였다. 단백질체 및 지질체의 신호는 본 명세서에서 제공된 플랫폼 방법을 사용하여 분석되었다. 신생 혈관 생성의 생물학적 표지 인자가 수중 실험실 방법을 사용하여 추가로 확인되었다. 이러한 접근 방식은 신생 혈관 생성의 메커니즘을 이해하기 위한 강력한 도구를 제공하며, 새로운 혈관 형성 생물학적 표지 인자를 식별하고 신생 혈관 생성을 조절하는 제제를 개발, 검사할 수 있게 해 준다.

인간 배꼽의 정맥 내피의 세포는 생체 내 질병 관련 세포가 경험하는 혈관 형성 환경을 모의하는 조건을 겪게 된다. 특히, 상기 세포는 접촉 금지로 인해 성장이 억제는 조건이나(즉, 정상 세포), 접촉 금지로 인해 배양, 성장이 최소한 부분적으로 억제되지 않는 조건(즉, 혈관 형성 세포) 하에서 성장한다. 설명을 간단하게 하기 위해, 배양, 성장이 최소한 부분적으로 억제되지 않는 조건하에서 성장한 세포를 비융합성 배양이라 부르기로 한다.

상기 언급된 세포를 포함하며 세포가 융합성 또는 비융합성 배양에서 성장하는 상기 세포 모델은 상기 세포를 “환경적 교란”에 노출시키고 신생 혈관 생성을 조절하는 제제, 예를 들어, 신생 혈관 생성을 억제하는 제제로 처리함으로써 추가적으로 “조사”된다. 예를 들어, 상기 세포는 여러 농도, 예를 들어, 하나 또는 그 이상의 0, 50μM, 100μM, 250μM, 500μM, 750μM, 1000μM, 1250μM, 또는 1500μM의 농도에서 코엔자임 Q10으로 처리된다. 본 명세서에서 제공되는 교란은, 예를 들어, 배양을 “스크래칭”하거나 세포를 낮은 밀도에서 하위 배양하는 등의 세포의 기계적 교란을 포함한다.

각각의 교란 치료를 겪은 조건으로부터의 세포 표본이 치료 후, 예를 들어, 치료 이후 6, 12, 18, 24, 36, 48, 60, 72, 84, 96, 108, 또는 120 시간 이후에, 또는 이들 사이의 시간에 수 회 수집되었다. 특정 조건에 대해서, 매체 표본이 수집되어 분석되었다. 표본은 이후 단백질 발현 또는 활성, 유전자 발현, 및 지질 수준의 하나 또는 그 이상의 수준에 대해 분석될 수 있다.

정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링이 각 조건 및 각 “환경적 교란”, 즉, 코엔자임 Q10 치료에 대해 수집된 세포 및 매체 표본을 대상으로 상기 상세한 설명에서 설명된 기술을 사용하여 수행되었다. 전사 프로파일링 실험이, 예를 들어, Biorad® CFX-384 증폭 시스템을 사용하여 수행되었다. 데이터 수집(Ct)에 이어, 제어에 대한 최종 배수 변화가, 예를 들어, 제조사의 프로토콜에서 제시되는 δCt 방법을 사용하여 결정되었다. 리피도믹스 실험이 질량 분광학을 사용하여 수행되었다. 산소 소모율(OCR)과 같은 기능적 분석이, 예를 들어, 시호스(Seahorse) 분석기를 채택하여 기본적으로 제조사가 권장하는 방법에 따라 측정되었다. OCR은 시호스(seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지에 의해 생성된 7 μl 챔버 내의 전극에 의해 기록될 수 있다.

요약하면, 형태학적, 효소 관련, 및 흐름 혈구 계산 분석을 통해 세포 자살, 이주, 산화질소 및 ROS 생성 및 CoQ10 치료에 대한 반응에서의 생체 에너지 용량에서의 극적인 변화가 밝혀 졌다. 지질체적 분석을 통해 미토콘드리아의 기능 및 세포 밀도를 변화시킴으로써 완화될 수 있는 지질 경로에서의 신규의 변화가 밝혀 졌다. 본 플랫폼 방법을 활용한 단백질체의 통합을 통해 미토콘드리아의 조절을 위한 특성화되지 않은 세포 내 적응 및 신호 전달이 밝혀 졌다. 모두 종합하면, 이들 연구들을 통해 CoQ10가 내피의 이주, 증식, 세포 자살, 산화질소, ROS, 및 단백질/지질 구조를 변화시킨다는 사실이 밝혀 졌다. 신규의 메커니즘이 본 명세서에서 제시되었으며, 여기에서 신생 혈관 형성을 위한 국지적 혈액 공급의 종양 발생을 억제하기 위해 CoQ10의 항종양 활성은 혈관 형성 및 세포 사멸제 요소의 대사적 상호 대화로 인한 것이다. 추가적으로, 단백질체 및 지질체적 적응은 환경적 자극에 반응하는 내피 세포의 생리학적 요건을 지지하는 상호 반응적 네트워크와 연관되었다. 이들 데이터는 조절 장애를 겪은 미토콘드리아의 대사적 제어 요소로 인한 종양 신생 혈관 생성의 선택적 적응에 대한 특징적 통찰을 제공한다.

예 10: 플랫폼 기술을 채택하여 효소 활성을 설명하기 위한 다중 단백질체학 모델의 구현.

일반적으로, 상기 예 5에서 설명된 효소 플랫폼 기술은 신생 혈관 생성과 같은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 더 구현하기 위해 적응시킬 수 있다. 상기 방법은 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 포함하는 신생 혈관 생성을 위한 모델을 채택한다. 상기 모델은 다음과 같은 최소한 세 수준의 데이터를 획득하기 위해 사용된다: 즉 (i) 신생 혈관 생성과 연관된 세포 내에서의 효소의 전역적 활성을 나타내는 제 1 데이터 집합, (ii) 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 영향을 나타내는 제 2 데이터 집합, 및 (iii) 신생 혈관 생성과 연관된 세포 내에서의 단백질체의 전역적 변화를 나타내는 제 3 데이터 집합. 지질체, 전사체, 대사체, 및 SNP 데이터와 같은 부가적 데이터 집합. 상기 데이터는 효소의 전역적 활성, 효소의 전역적 활성의 효과, 및 단백질체의 전역적 변화 중에서 합치 인과 관계 네트워크를 생성하기 위해 사용된다. 상기 합치 인과 관계 네트워크는 프로그램된 컴퓨터 장치를 사용하여 제 1, 제 2, 및 제 3 데이터 집합에만 기반한다(즉, 알려진 다른 생물학적 관계에는 기반하지 않는다). 상기 합치 인과 관계 네트워크는 이후 고유한 인과 관계에 연관된 최소한 하나의 유전자 또는 단백질이 신생 혈관 생성의 조절 인자로서 식별되는 신생 혈관 생성에 고유한 인과 관계를 식별하기 위해 사용된다.

본 예에서, 상기 플랫폼 기술은 신생 혈관생성과 관련된 효소 활성 및 단백질체에 대한 이 활성의 직접적 영향을 측정하기 위한 다중 단백질체학 기술을 구현하기 위해 적응되며; 이에 의해, 효소들(예를 들어, 키나아제 및/또는 프로테아제) 및 이들의 대사 물질/기질 사이의 인과 관계를 신생 혈관 생성 중의 세포 단백질체의 전역 변화의 문맥에서 이해하기 위해 사용될 수 있는 시스템을 제공한다. 효소 활성이 효소 발현과 직교하기 때문에(예를 들어, 하향 조절된 활성 및 조절되지 않은 발현), 이러한 기술들은 귀중한 통찰을 제공할 수 있다. 이러한 분석의 결과로 만들어지는 관계적 맵은 신생 혈관 생성과 관련된 진단적/예후의 표지 인자뿐만 아니라 신생 혈관 생성을 조절함으로써 질병 치료 타겟을 제공할 수 있다. 이러한 타겟 및 표지 인자는 치료적 성분 및 방법을 제공할 수 있다. 모델을 수립하고, 데이터 집합을 획득하며, 합치 인과 관계 네트워크를 생성하고, 신생 혈관 생성에 고유한 인과 관계를 식별하기 위한 기술은 상기 발명의 요약, 상세한 설명 및 예에서 설명된다. 모델을 수립하고, 효소의 전역적 활성 및 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 효과를 나타내는 데이터 집합을 획득하기 위한 추가적인 기술들은 이하에서 기술된다.

먼저, 본 플랫폼 기술에 따라 모델이 수립되며, 이때, 예를 들어, 세포 라인들이 질병을 모의하는 조건을 겪게 되며 환경적 교란(예를 들어, 신생 혈관 생성의 조절 인자, 예를 들어, CoQ10, 아바스틴, VEGF 금지 인자, 안지오스타틴, 베바씨주마브, HUVEC 세포의 융합도의 변화에 대한 노출)에 대한 노출에 이해 조사된다. 비교를 위한 제어가 제공된다. 두 번 째로, (i) 효소의 전역적 활성, (ii) 단백질체 (예를 들어, 효소 활성의 대사 물질/기질)에 대한 효소의 특별한 효과, 및 (iii) 세포 단백질체의 전역 효과를 분석함으로써 효소 활성 및 그의 하향적 효과가 단백질체의 전역적 변화의 문맥에서 추적된다. 세 번째로, 상기 데이터 집합이 관심 있는 조절 인자를 식별하기 위해 본 플랫폼 기술에 따라 분석된다. 예를 들어, 혈관 형성 모델 신생 혈관 생성의 알려진 조절 인자에 의해 조사되고; 시스템에서 전역 키나아제 활성에 대한 이 교란의 효과가 인산 단백질체 및 전체 단백질체에 대한 결과적인 효과와 더불어 분석되며; 또한 상기 데이터 집합이 AI 기반 REFS™ 시스템에 의해 분석될 수 있다.

예를 들어, 여러 조건 하에서 성장한 HUVEC 세포는 혈관 형성 및 정상(예를 들어, 신생 혈관 비생성) 상태를 모의하기 위해 사용될 수 있다. 신생 혈관 생성은 예를 들어, 임신, 부상 회복 등과 같은 특별한 환경을 제외하고는 성체에서 발생하지 않기 때문에, 이러한 접근 방식으로 식별한 혈관 형성 표지 인자의 존재는 질병 상태, 예를 들어, 암, 류머티스 관절염, 노화 관련 황반 변성, 또는 당뇨성 망막증을 나타내는 표지 인자로서 유용할 수 있다.

본 예시적 예는 (i) 세포 생물학, (ii) 예를 들어, 신생 혈관 생성에서 이러한 메커니즘에 참여하는 인산화 및 효소, 예를 들어, 키나아제와 같이 번역 이후 수정의 역할을 구분하기 위해 인과적 단백질 네트워크를 생성하는 통합된 단백질체학 플랫폼 및 정보학 플랫폼의 능력들을 결합한다. 특히, 이 접근 방식은 신생 혈관 생성 모델 내 ATP 결합 도메인 농축 탐침 및 전체 단백질의 인산-단백질체 매핑을 통합하는 활성 기반 단백질체학을 채택한다.

비교적 단백질체학, 인산 단백질체 및 효소 활성 데이터가 AI 기반 REFS™ 정보학 플랫폼에 통합된다. 기능적 지점 즉 키나아제가 인산화할 수 있는 키나아제/효소 활성 및 잠재적 타겟으로부터의 단백질 상호 반응의 인과 네트워크가 이후 생성된다. 추가적으로, 타겟의 인산화를 조절하고 병리생리학적 세포 거동을 기계적으로 구동하는 세포의 기능적 판독을 이용하여, 효소/ 키나아제가 결정된다. 본 명세서에 개략적으로 설명된 예시적 구현은 신생 혈관 생성의 임상적 관리를 위한 세포 반응, 신생 혈관 생성 메커니즘 및 잠재적 타겟/생물학적 표지 인자에 대한 통찰을 용이하게 한다.

예시적 예로서, 정상 세포 및 혈관 형성 세포를 나타내는 세포가 비교를 위해 선택된다. 본 명세서에서 예시된 바와 같이, HUVEC 세포가 하위-융합성 배양에서 성장하면 신생 혈관 생성의 특성을 보이며, 반면에 융합성 HUVEC 세포는 이를 보이지 않는다. 하위-융합성 배양에서 HUVEC 세포를 CoQ10로 처리하면 본 명세서에서 예시된 바와 같이 HUVEC 세포가 비-신생 혈관 생성 상태로 이동한다. 상기 단백질체학 방법이 제공하는 바와 같이, 효소 활성의 분석 방법은 임의의 조건에서 성장한 HUVEC 세포에 대한 쌍의 분석을 포함할 수 있으며, 선택적으로 제 3 데이터 집합으로부터의 결과를 쌍으로 비교한 결과에 대한 분석을 더 포함할 수 있다.

예시적 실시예로서, 동등한 개수의 HUVEC 세포들이 융합성으로 배양되고 비융합성 배양이 수확되며, 세포들이 예를 들어, 인산펩티드와 같은 관심있는 펩티드의 존재 하에서 농축된다. 신생 혈관 생성과 관련된 효소 활성을 탐지하기 위해 비교적 분석이 예 5와 같이 수행된다.

참조에 의한 통합

본 출원 전체에 걸쳐 인용될 수 있는 모든 인용 참조 문헌(문헌에 의한 참조, 특허, 특허 출원, 본 출원의 출원일에 사용할 수 있는 버전의 젠뱅크(GenBank) 번호, 및 웹사이트를 포함)의 내용은 본 명세서에서 그 전체로서 참조에 의해 그 안에 인용된 참조 문헌을 포함하여 명시적으로 통합된다. 본 발명의 실시는 다르게 기술되지 않는 한, 해당 분야에 잘 알려져 있는 통상적인 단백질 형성 기술을 채택한다.

균등 사항

본 발명은 본 발명의 사상 또는 본질적 특성을 벗어나지 않고 다른 특정 형태로 구현될 수 있다. 따라서 상기 실시예들은 모든 측면에서 본 명세서에서 기술된 발명을 제한하기보다는 예시하는 것으로 간주 되어야 한다. 따라서 본 발명의 범위는 상기 상세한 설명보다는 첨부된 청구항에 의해 이해되어야 하며, 이에 따라 청구항의 의미와 범위 내에서의 모든 변화는 본 명세서에 포함되어 있는 것으로 이해되어야 한다.

부록 A: 관련된 단백질에 대한 아미노산 및 cDNA 염기서열

SEQUENCE LISTING <110> BERG PHARMA LLC <120> INTERROGATORY CELL-BASED ASSAYS AND USES THEREOF <130> 119992-06120 <140> PCT/US2012/054321 <141> 2012-09-07 <150> 61/678,590 <151> 2012-08-01 <150> 61/678,596 <151> 2012-08-01 <150> 61/668,617 <151> 2012-07-06 <150> 61/665,631 <151> 2012-06-28 <150> 61/620,305 <151> 2012-04-04 <150> 61/619,326 <151> 2012-04-02 <160> 156 <170> PatentIn version 3.5 <210> 1 <211> 1411 <212> PRT <213> Homo sapiens <400> 1 Met Ala Glu Ala Arg Lys Arg Arg Glu Leu Leu Pro Leu Ile Tyr His 1 5 10 15 His Leu Leu Arg Ala Gly Tyr Val Arg Ala Ala Arg Glu Val Lys Glu 20 25 30 Gln Ser Gly Gln Lys Cys Phe Leu Ala Gln Pro Val Thr Leu Leu Asp 35 40 45 Ile Tyr Thr His Trp Gln Gln Thr Ser Glu Leu Gly Arg Lys Arg Lys 50 55 60 Ala Glu Glu Asp Ala Ala Leu Gln Ala Lys Lys Thr Arg Val Ser Asp 65 70 75 80 Pro Ile Ser Thr Ser Glu Ser Ser Glu Glu Glu Glu Glu Ala Glu Ala 85 90 95 Glu Thr Ala Lys Ala Thr Pro Arg Leu Ala Ser Thr Asn Ser Ser Val 100 105 110 Leu Gly Ala Asp Leu Pro Ser Ser Met Lys Glu Lys Ala Lys Ala Glu 115 120 125 Thr Glu Lys Ala Gly Lys Thr Gly Asn Ser Met Pro His Pro Ala Thr 130 135 140 Gly Lys Thr Val Ala Asn Leu Leu Ser Gly Lys Ser Pro Arg Lys Ser 145 150 155 160 Ala Glu Pro Ser Ala Asn Thr Thr Leu Val Ser Glu Thr Glu Glu Glu 165 170 175 Gly Ser Val Pro Ala Phe Gly Ala Ala Ala Lys Pro Gly Met Val Ser 180 185 190 Ala Gly Gln Ala Asp Ser Ser Ser Glu Asp Thr Ser Ser Ser Ser Asp 195 200 205 Glu Thr Asp Val Glu Val Lys Ala Ser Glu Lys Ile Leu Gln Val Arg 210 215 220 Ala Ala Ser Ala Pro Ala Lys Gly Thr Pro Gly Lys Gly Ala Thr Pro 225 230 235 240 Ala Pro Pro Gly Lys Ala Gly Ala Val Ala Ser Gln Thr Lys Ala Gly 245 250 255 Lys Pro Glu Glu Asp Ser Glu Ser Ser Ser Glu Glu Ser Ser Asp Ser 260 265 270 Glu Glu Glu Thr Pro Ala Ala Lys Ala Leu Leu Gln Ala Lys Ala Ser 275 280 285 Gly Lys Thr Ser Gln Val Gly Ala Ala Ser Ala Pro Ala Lys Glu Ser 290 295 300 Pro Arg Lys Gly Ala Ala Pro Ala Pro Pro Gly Lys Thr Gly Pro Ala 305 310 315 320 Val Ala Lys Ala Gln Ala Gly Lys Arg Glu Glu Asp Ser Gln Ser Ser 325 330 335 Ser Glu Glu Ser Asp Ser Glu Glu Glu Ala Pro Ala Gln Ala Lys Pro 340 345 350 Ser Gly Lys Ala Pro Gln Val Arg Ala Ala Ser Ala Pro Ala Lys Glu 355 360 365 Ser Pro Arg Lys Gly Ala Ala Pro Ala Pro Pro Arg Lys Thr Gly Pro 370 375 380 Ala Ala Ala Gln Val Gln Val Gly Lys Gln Glu Glu Asp Ser Arg Ser 385 390 395 400 Ser Ser Glu Glu Ser Asp Ser Asp Arg Glu Ala Leu Ala Ala Met Asn 405 410 415 Ala Ala Gln Val Lys Pro Leu Gly Lys Ser Pro Gln Val Lys Pro Ala 420 425 430 Ser Thr Met Gly Met Gly Pro Leu Gly Lys Gly Ala Gly Pro Val Pro 435 440 445 Pro Gly Lys Val Gly Pro Ala Thr Pro Ser Ala Gln Val Gly Lys Trp 450 455 460 Glu Glu Asp Ser Glu Ser Ser Ser Glu Glu Ser Ser Asp Ser Ser Asp 465 470 475 480 Gly Glu Val Pro Thr Ala Val Ala Pro Ala Gln Glu Lys Ser Leu Gly 485 490 495 Asn Ile Leu Gln Ala Lys Pro Thr Ser Ser Pro Ala Lys Gly Pro Pro 500 505 510 Gln Lys Ala Gly Pro Val Ala Val Gln Val Lys Ala Glu Lys Pro Met 515 520 525 Asp Asn Ser Glu Ser Ser Glu Glu Ser Ser Asp Ser Ala Asp Ser Glu 530 535 540 Glu Ala Pro Ala Ala Met Thr Ala Ala Gln Ala Lys Pro Ala Leu Lys 545 550 555 560 Ile Pro Gln Thr Lys Ala Cys Pro Lys Lys Thr Asn Thr Thr Ala Ser 565 570 575 Ala Lys Val Ala Pro Val Arg Val Gly Thr Gln Ala Pro Arg Lys Ala 580 585 590 Gly Thr Ala Thr Ser Pro Ala Gly Ser Ser Pro Ala Val Ala Gly Gly 595 600 605 Thr Gln Arg Pro Ala Glu Asp Ser Ser Ser Ser Glu Glu Ser Asp Ser 610 615 620 Glu Glu Glu Lys Thr Gly Leu Ala Val Thr Val Gly Gln Ala Lys Ser 625 630 635 640 Val Gly Lys Gly Leu Gln Val Lys Ala Ala Ser Val Pro Val Lys Gly 645 650 655 Ser Leu Gly Gln Gly Thr Ala Pro Val Leu Pro Gly Lys Thr Gly Pro 660 665 670 Thr Val Thr Gln Val Lys Ala Glu Lys Gln Glu Asp Ser Glu Ser Ser 675 680 685 Glu Glu Glu Ser Asp Ser Glu Glu Ala Ala Ala Ser Pro Ala Gln Val 690 695 700 Lys Thr Ser Val Lys Lys Thr Gln Ala Lys Ala Asn Pro Ala Ala Ala 705 710 715 720 Arg Ala Pro Ser Ala Lys Gly Thr Ile Ser Ala Pro Gly Lys Val Val 725 730 735 Thr Ala Ala Ala Gln Ala Lys Gln Arg Ser Pro Ser Lys Val Lys Pro 740 745 750 Pro Val Arg Asn Pro Gln Asn Ser Thr Val Leu Ala Arg Gly Pro Ala 755 760 765 Ser Val Pro Ser Val Gly Lys Ala Val Ala Thr Ala Ala Gln Ala Gln 770 775 780 Thr Gly Pro Glu Glu Asp Ser Gly Ser Ser Glu Glu Glu Ser Asp Ser 785 790 795 800 Glu Glu Glu Ala Glu Thr Leu Ala Gln Val Lys Pro Ser Gly Lys Thr 805 810 815 His Gln Ile Arg Ala Ala Leu Ala Pro Ala Lys Glu Ser Pro Arg Lys 820 825 830 Gly Ala Ala Pro Thr Pro Pro Gly Lys Thr Gly Pro Ser Ala Ala Gln 835 840 845 Ala Gly Lys Gln Asp Asp Ser Gly Ser Ser Ser Glu Glu Ser Asp Ser 850 855 860 Asp Gly Glu Ala Pro Ala Ala Val Thr Ser Ala Gln Val Ile Lys Pro 865 870 875 880 Pro Leu Ile Phe Val Asp Pro Asn Arg Ser Pro Ala Gly Pro Ala Ala 885 890 895 Thr Pro Ala Gln Ala Gln Ala Ala Ser Thr Pro Arg Lys Ala Arg Ala 900 905 910 Ser Glu Ser Thr Ala Arg Ser Ser Ser Ser Glu Ser Glu Asp Glu Asp 915 920 925 Val Ile Pro Ala Thr Gln Cys Leu Thr Pro Gly Ile Arg Thr Asn Val 930 935 940 Val Thr Met Pro Thr Ala His Pro Arg Ile Ala Pro Lys Ala Ser Met 945 950 955 960 Ala Gly Ala Ser Ser Ser Lys Glu Ser Ser Arg Ile Ser Asp Gly Lys 965 970 975 Lys Gln Glu Gly Pro Ala Thr Gln Val Ser Lys Lys Asn Pro Ala Ser 980 985 990 Leu Pro Leu Thr Gln Ala Ala Leu Lys Val Leu Ala Gln Lys Ala Ser 995 1000 1005 Glu Ala Gln Pro Pro Val Ala Arg Thr Gln Pro Ser Ser Gly Val 1010 1015 1020 Asp Ser Ala Val Gly Thr Leu Pro Ala Thr Ser Pro Gln Ser Thr 1025 1030 1035 Ser Val Gln Ala Lys Gly Thr Asn Lys Leu Arg Lys Pro Lys Leu 1040 1045 1050 Pro Glu Val Gln Gln Ala Thr Lys Ala Pro Glu Ser Ser Asp Asp 1055 1060 1065 Ser Glu Asp Ser Ser Asp Ser Ser Ser Gly Ser Glu Glu Asp Gly 1070 1075 1080 Glu Gly Pro Gln Gly Ala Lys Ser Ala His Thr Leu Gly Pro Thr 1085 1090 1095 Pro Ser Arg Thr Glu Thr Leu Val Glu Glu Thr Ala Ala Glu Ser 1100 1105 1110 Ser Glu Asp Asp Val Val Ala Pro Ser Gln Ser Leu Leu Ser Gly 1115 1120 1125 Tyr Met Thr Pro Gly Leu Thr Pro Ala Asn Ser Gln Ala Ser Lys 1130 1135 1140 Ala Thr Pro Lys Leu Asp Ser Ser Pro Ser Val Ser Ser Thr Leu 1145 1150 1155 Ala Ala Lys Asp Asp Pro Asp Gly Lys Gln Glu Ala Lys Pro Gln 1160 1165 1170 Gln Ala Ala Gly Met Leu Ser Pro Lys Thr Gly Gly Lys Glu Ala 1175 1180 1185 Ala Ser Gly Thr Thr Pro Gln Lys Ser Arg Lys Pro Lys Lys Gly 1190 1195 1200 Ala Gly Asn Pro Gln Ala Ser Thr Leu Ala Leu Gln Ser Asn Ile 1205 1210 1215 Thr Gln Cys Leu Leu Gly Gln Pro Trp Pro Leu Asn Glu Ala Gln 1220 1225 1230 Val Gln Ala Ser Val Val Lys Val Leu Thr Glu Leu Leu Glu Gln 1235 1240 1245 Glu Arg Lys Lys Val Val Asp Thr Thr Lys Glu Ser Ser Arg Lys 1250 1255 1260 Gly Trp Glu Ser Arg Lys Arg Lys Leu Ser Gly Asp Gln Pro Ala 1265 1270 1275 Ala Arg Thr Pro Arg Ser Lys Lys Lys Lys Lys Leu Gly Ala Gly 1280 1285 1290 Glu Gly Gly Glu Ala Ser Val Ser Pro Glu Lys Thr Ser Thr Thr 1295 1300 1305 Ser Lys Gly Lys Ala Lys Arg Asp Lys Ala Ser Gly Asp Val Lys 1310 1315 1320 Glu Lys Lys Gly Lys Gly Ser Leu Gly Ser Gln Gly Ala Lys Asp 1325 1330 1335 Glu Pro Glu Glu Glu Leu Gln Lys Gly Met Gly Thr Val Glu Gly 1340 1345 1350 Gly Asp Gln Ser Asn Pro Lys Ser Lys Lys Glu Lys Lys Lys Ser 1355 1360 1365 Asp Lys Arg Lys Lys Asp Lys Glu Lys Lys Glu Lys Lys Lys Lys 1370 1375 1380 Ala Lys Lys Ala Ser Thr Lys Asp Ser Glu Ser Pro Ser Gln Lys 1385 1390 1395 Lys Lys Lys Lys Lys Lys Lys Thr Ala Glu Gln Thr Val 1400 1405 1410 <210> 2 <211> 4882 <212> DNA <213> Homo sapiens <400> 2 gaaagaggag ccggaagtgt ggcgcgcgag gtctaagggc gcgagggaag tggcgggcgg 60 ggactaaggc ggggcgtgca ggtagccggc cggccggggg tcgcgggtat ggccgaggcc 120 aggaagcggc gggagctact tcccctgatc taccaccatc tgctgcgggc tggctatgtg 180 cgtgcggcgc gggaagtgaa ggagcagagc ggccagaagt gtttcctggc tcagcccgta 240 acccttctgg acatctatac acactggcaa caaacctcag agcttggtcg gaagcggaag 300 gcagaggaag atgcggcact gcaagctaag aaaacccgtg tgtcagaccc catcagcacc 360 tcggagagct cggaagagga ggaagaagca gaagccgaaa ccgccaaagc caccccaaga 420 ctagcatcta ccaactcctc agtcctgggg gcggacttgc catcaagcat gaaagaaaaa 480 gccaaggcag agacagagaa agctggcaag actgggaatt ccatgccaca ccctgccact 540 gggaagacgg tggccaacct tctttctggg aagtctccca ggaagtcagc agagccctca 600 gcaaatacta cgttggtctc agaaactgag gaggagggca gcgtcccggc ctttggagct 660 gctgccaagc ctgggatggt gtcagcgggc caggccgaca gctccagcga ggacacctcc 720 agctccagtg atgagacaga cgtggaggta aaggcctctg aaaaaattct ccaggtcaga 780 gctgcctcag cccctgccaa ggggacccct gggaaagggg ctaccccagc accccctggg 840 aaggcagggg ctgtagcctc ccagaccaag gcagggaagc cagaggagga ctcagagagc 900 agcagcgagg agtcatctga cagtgaggag gagacgccag ctgccaaggc cctgcttcag 960 gcgaaggcct caggaaaaac ctctcaggtc ggagctgcct cagcccctgc caaggagtcc 1020 cccaggaaag gagctgcccc agcgccccct gggaagacag ggcctgcagt tgccaaggcc 1080 caggcgggga agcgggagga ggactcgcag agcagcagcg aggaatcgga cagtgaggag 1140 gaggcgcctg ctcaggcgaa gccttcaggg aaggcccccc aggtcagagc cgcctcggcc 1200 cctgccaagg agtcccccag gaaaggggct gccccagcac ctcctaggaa aacagggcct 1260 gcagccgccc aggtccaggt ggggaagcag gaggaggact caagaagcag cagcgaggag 1320 tcagacagtg acagagaggc actggcagcc atgaatgcag ctcaggtgaa gcccttgggg 1380 aaaagccccc aggtgaaacc tgcctctacc atgggcatgg ggcccttggg gaaaggcgcc 1440 ggcccagtgc cacccgggaa ggtggggcct gcaaccccct cagcccaggt ggggaagtgg 1500 gaggaggact cagagagcag tagtgaggag tcatcagaca gcagtgatgg agaggtgccc 1560 acagctgtgg ccccggctca ggaaaagtcc ttggggaaca tcctccaggc caaacccacc 1620 tccagtcctg ccaaggggcc ccctcagaag gcagggcctg tagccgtcca ggtcaaggct 1680 gaaaagccca tggacaactc ggagagcagc gaggagtcat cggacagtgc ggacagtgag 1740 gaggcaccag cagccatgac tgcagctcag gcaaaaccag ctctgaaaat tcctcagacc 1800 aaggcctgcc caaagaaaac caataccact gcatctgcca aggtcgcccc tgtgcgagtg 1860 ggcacccaag ccccccggaa agcaggaact gcgacttctc cagcaggctc atccccagct 1920 gtggctgggg gcacccagag accagcagag gattcttcaa gcagtgagga atcagatagt 1980 gaggaagaga agacaggtct tgcagtaacc gtgggacagg caaagtctgt ggggaaaggc 2040 ctccaggtga aagcagcctc agtgcctgtc aaggggtcct tggggcaagg gactgctcca 2100 gtactccctg ggaagacggg gcctacagtc acccaggtga aagctgaaaa gcaggaagac 2160 tctgagagca gtgaggagga atcagacagt gaggaagcag ctgcatctcc agcacaggtg 2220 aaaacctcag taaagaaaac ccaggccaaa gccaacccag ctgccgccag agcaccttca 2280 gcaaaaggga caatttcagc ccctggaaaa gttgtcactg cagctgctca agccaagcag 2340 aggtctccat ccaaggtgaa gccaccagtg agaaaccccc agaacagtac cgtcttggcg 2400 aggggcccag catctgtgcc atctgtgggg aaggccgtgg ctacagcagc tcaggcccag 2460 acagggccag aggaggactc agggagcagt gaggaggagt cagacagtga ggaggaggcg 2520 gagacgctgg ctcaggtgaa gccttcaggg aagacccacc agatcagagc tgccttggct 2580 cctgccaagg agtcccccag gaaaggggct gccccaacac ctcctgggaa gacagggcct 2640 tcggctgccc aggcagggaa gcaggatgac tcagggagca gcagcgagga atcagacagt 2700 gatggggagg caccggcagc tgtgacctct gcccaggtga ttaaaccccc tctgattttt 2760 gtcgacccta atcgtagtcc agctggccca gctgctacac ccgcacaagc ccaggctgca 2820 agcaccccga ggaaggcccg agcctcggag agcacagcca ggagctcctc ctccgagagc 2880 gaggatgagg acgtgatccc cgctacacag tgcttgactc ctggcatcag aaccaatgtg 2940 gtgaccatgc ccactgccca cccaagaata gcccccaaag ccagcatggc tggggccagc 3000 agcagcaagg agtccagtcg gatatcagat ggcaagaaac aggagggacc agccactcag 3060 gtgtcaaaga agaacccagc ttccctccca ctgacccagg ctgccctgaa ggtcctcgcc 3120 cagaaagcca gtgaggctca gcctcctgtt gccaggaccc agccttcaag tggggttgac 3180 agtgctgtgg gaacactccc tgcaacaagt ccccagagca cctccgtcca ggccaaaggg 3240 accaacaagc tcagaaaacc taagcttcct gaggtccagc aggccaccaa agcccctgag 3300 agctcagatg acagtgagga cagcagcgac agttcttcag ggagtgagga agatggtgaa 3360 gggccccagg gggccaagtc agcccacacg ctgggtccca ccccctccag gacagagacc 3420 ctggtggagg agaccgcagc agagtccagc gaggatgatg tggtggcgcc atcccagtct 3480 ctcctctcag gttatatgac ccctggacta accccagcca attcccaggc ctcaaaagcc 3540 actcccaagc tagactccag cccctcagtt tcctctactc tggccgccaa agatgaccca 3600 gatggcaagc aggaggcaaa gccccaacag gcagcaggca tgttgtcccc taaaacaggt 3660 ggaaaagagg ctgcttcagg caccacacct cagaagtccc ggaagcccaa gaaaggggct 3720 gggaaccccc aagcctcaac cctggcgctg caaagcaaca tcacccagtg cctcctgggc 3780 caaccctggc ccctgaatga ggcccaggtg caggcctcag tggtgaaggt cctgactgag 3840 ctgctggaac aggaaagaaa gaaggtggtg gacaccacca aggagagcag caggaagggc 3900 tgggagagcc gcaagcggaa gctatcggga gaccagccag ctgccaggac ccccaggagc 3960 aagaagaaga agaagctggg ggccggggaa ggtggggagg cctctgtttc cccagaaaag 4020 acctccacga cttccaaggg gaaagcaaag agagacaaag caagtggtga tgtcaaggag 4080 aagaaaggga aggggtctct tggctcccaa ggggccaagg acgagccaga agaggagctt 4140 cagaagggga tggggacggt tgaaggtgga gatcaaagca acccaaagag caagaaggag 4200 aagaagaaat ccgacaagag aaaaaaagac aaagaaaaaa aagaaaagaa gaagaaagca 4260 aaaaaggcct caaccaaaga ttctgagtca ccgtcccaga agaaaaagaa gaaaaagaag 4320 aagacagcag agcagactgt atgacgagca ccagcaccag gcacagggat ttcctagccg 4380 agcagtggcc atccccatgc ctctgacctc caccgacctc tgcccaccat gggttggaac 4440 taaactgtta ccttccctcg ctccacagaa gaagacagcc agcttcaggg gtccctgtgc 4500 tggccaagcc agtgagcctg cggggaggct ggtccaagga gaaagtggac cagctcccat 4560 gacctcaccc cactccccca acacaggacg cttcatatag atgtgtacag tatatgtatt 4620 tttttaagtg acctcctctc cttccacaga ccccacatgc ccaaaggcct cgggacttcc 4680 caccaccttg ctccacagat ccagctaggc ctgacctgtg cctcatcccg tgccgctcgg 4740 tctctggctg atcccgaggc tttgtcttcc tctcgtcagt tcttttggtt gtgttttttg 4800 tttttttttt aataactcaa aaaaaaaata aaagacttgg aggaagggtg caagctccca 4860 gtgcaaaaaa aaaaaaaaaa aa 4882 <210> 3 <211> 1531 <212> PRT <213> Homo sapiens <400> 3 Met Glu Val Ser Pro Leu Gln Pro Val Asn Glu Asn Met Gln Val Asn 1 5 10 15 Lys Ile Lys Lys Asn Glu Asp Ala Lys Lys Arg Leu Ser Val Glu Arg 20 25 30 Ile Tyr Gln Lys Lys Thr Gln Leu Glu His Ile Leu Leu Arg Pro Asp 35 40 45 Thr Tyr Ile Gly Ser Val Glu Leu Val Thr Gln Gln Met Trp Val Tyr 50 55 60 Asp Glu Asp Val Gly Ile Asn Tyr Arg Glu Val Thr Phe Val Pro Gly 65 70 75 80 Leu Tyr Lys Ile Phe Asp Glu Ile Leu Val Asn Ala Ala Asp Asn Lys 85 90 95 Gln Arg Asp Pro Lys Met Ser Cys Ile Arg Val Thr Ile Asp Pro Glu 100 105 110 Asn Asn Leu Ile Ser Ile Trp Asn Asn Gly Lys Gly Ile Pro Val Val 115 120 125 Glu His Lys Val Glu Lys Met Tyr Val Pro Ala Leu Ile Phe Gly Gln 130 135 140 Leu Leu Thr Ser Ser Asn Tyr Asp Asp Asp Glu Lys Lys Val Thr Gly 145 150 155 160 Gly Arg Asn Gly Tyr Gly Ala Lys Leu Cys Asn Ile Phe Ser Thr Lys 165 170 175 Phe Thr Val Glu Thr Ala Ser Arg Glu Tyr Lys Lys Met Phe Lys Gln 180 185 190 Thr Trp Met Asp Asn Met Gly Arg Ala Gly Glu Met Glu Leu Lys Pro 195 200 205 Phe Asn Gly Glu Asp Tyr Thr Cys Ile Thr Phe Gln Pro Asp Leu Ser 210 215 220 Lys Phe Lys Met Gln Ser Leu Asp Lys Asp Ile Val Ala Leu Met Val 225 230 235 240 Arg Arg Ala Tyr Asp Ile Ala Gly Ser Thr Lys Asp Val Lys Val Phe 245 250 255 Leu Asn Gly Asn Lys Leu Pro Val Lys Gly Phe Arg Ser Tyr Val Asp 260 265 270 Met Tyr Leu Lys Asp Lys Leu Asp Glu Thr Gly Asn Ser Leu Lys Val 275 280 285 Ile His Glu Gln Val Asn His Arg Trp Glu Val Cys Leu Thr Met Ser 290 295 300 Glu Lys Gly Phe Gln Gln Ile Ser Phe Val Asn Ser Ile Ala Thr Ser 305 310 315 320 Lys Gly Gly Arg His Val Asp Tyr Val Ala Asp Gln Ile Val Thr Lys 325 330 335 Leu Val Asp Val Val Lys Lys Lys Asn Lys Gly Gly Val Ala Val Lys 340 345 350 Ala His Gln Val Lys Asn His Met Trp Ile Phe Val Asn Ala Leu Ile 355 360 365 Glu Asn Pro Thr Phe Asp Ser Gln Thr Lys Glu Asn Met Thr Leu Gln 370 375 380 Pro Lys Ser Phe Gly Ser Thr Cys Gln Leu Ser Glu Lys Phe Ile Lys 385 390 395 400 Ala Ala Ile Gly Cys Gly Ile Val Glu Ser Ile Leu Asn Trp Val Lys 405 410 415 Phe Lys Ala Gln Val Gln Leu Asn Lys Lys Cys Ser Ala Val Lys His 420 425 430 Asn Arg Ile Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly 435 440 445 Gly Arg Asn Ser Thr Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser 450 455 460 Ala Lys Thr Leu Ala Val Ser Gly Leu Gly Val Val Gly Arg Asp Lys 465 470 475 480 Tyr Gly Val Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala 485 490 495 Ser His Lys Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys 500 505 510 Ile Val Gly Leu Gln Tyr Lys Lys Asn Tyr Glu Asp Glu Asp Ser Leu 515 520 525 Lys Thr Leu Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln 530 535 540 Asp Gly Ser His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn 545 550 555 560 Trp Pro Ser Leu Leu Arg His Arg Phe Leu Glu Glu Phe Ile Thr Pro 565 570 575 Ile Val Lys Val Ser Lys Asn Lys Gln Glu Met Ala Phe Tyr Ser Leu 580 585 590 Pro Glu Phe Glu Glu Trp Lys Ser Ser Thr Pro Asn His Lys Lys Trp 595 600 605 Lys Val Lys Tyr Tyr Lys Gly Leu Gly Thr Ser Thr Ser Lys Glu Ala 610 615 620 Lys Glu Tyr Phe Ala Asp Met Lys Arg His Arg Ile Gln Phe Lys Tyr 625 630 635 640 Ser Gly Pro Glu Asp Asp Ala Ala Ile Ser Leu Ala Phe Ser Lys Lys 645 650 655 Gln Ile Asp Asp Arg Lys Glu Trp Leu Thr Asn Phe Met Glu Asp Arg 660 665 670 Arg Gln Arg Lys Leu Leu Gly Leu Pro Glu Asp Tyr Leu Tyr Gly Gln 675 680 685 Thr Thr Thr Tyr Leu Thr Tyr Asn Asp Phe Ile Asn Lys Glu Leu Ile 690 695 700 Leu Phe Ser Asn Ser Asp Asn Glu Arg Ser Ile Pro Ser Met Val Asp 705 710 715 720 Gly Leu Lys Pro Gly Gln Arg Lys Val Leu Phe Thr Cys Phe Lys Arg 725 730 735 Asn Asp Lys Arg Glu Val Lys Val Ala Gln Leu Ala Gly Ser Val Ala 740 745 750 Glu Met Ser Ser Tyr His His Gly Glu Met Ser Leu Met Met Thr Ile 755 760 765 Ile Asn Leu Ala Gln Asn Phe Val Gly Ser Asn Asn Leu Asn Leu Leu 770 775 780 Gln Pro Ile Gly Gln Phe Gly Thr Arg Leu His Gly Gly Lys Asp Ser 785 790 795 800 Ala Ser Pro Arg Tyr Ile Phe Thr Met Leu Ser Ser Leu Ala Arg Leu 805 810 815 Leu Phe Pro Pro Lys Asp Asp His Thr Leu Lys Phe Leu Tyr Asp Asp 820 825 830 Asn Gln Arg Val Glu Pro Glu Trp Tyr Ile Pro Ile Ile Pro Met Val 835 840 845 Leu Ile Asn Gly Ala Glu Gly Ile Gly Thr Gly Trp Ser Cys Lys Ile 850 855 860 Pro Asn Phe Asp Val Arg Glu Ile Val Asn Asn Ile Arg Arg Leu Met 865 870 875 880 Asp Gly Glu Glu Pro Leu Pro Met Leu Pro Ser Tyr Lys Asn Phe Lys 885 890 895 Gly Thr Ile Glu Glu Leu Ala Pro Asn Gln Tyr Val Ile Ser Gly Glu 900 905 910 Val Ala Ile Leu Asn Ser Thr Thr Ile Glu Ile Ser Glu Leu Pro Val 915 920 925 Arg Thr Trp Thr Gln Thr Tyr Lys Glu Gln Val Leu Glu Pro Met Leu 930 935 940 Asn Gly Thr Glu Lys Thr Pro Pro Leu Ile Thr Asp Tyr Arg Glu Tyr 945 950 955 960 His Thr Asp Thr Thr Val Lys Phe Val Val Lys Met Thr Glu Glu Lys 965 970 975 Leu Ala Glu Ala Glu Arg Val Gly Leu His Lys Val Phe Lys Leu Gln 980 985 990 Thr Ser Leu Thr Cys Asn Ser Met Val Leu Phe Asp His Val Gly Cys 995 1000 1005 Leu Lys Lys Tyr Asp Thr Val Leu Asp Ile Leu Arg Asp Phe Phe 1010 1015 1020 Glu Leu Arg Leu Lys Tyr Tyr Gly Leu Arg Lys Glu Trp Leu Leu 1025 1030 1035 Gly Met Leu Gly Ala Glu Ser Ala Lys Leu Asn Asn Gln Ala Arg 1040 1045 1050 Phe Ile Leu Glu Lys Ile Asp Gly Lys Ile Ile Ile Glu Asn Lys 1055 1060 1065 Pro Lys Lys Glu Leu Ile Lys Val Leu Ile Gln Arg Gly Tyr Asp 1070 1075 1080 Ser Asp Pro Val Lys Ala Trp Lys Glu Ala Gln Gln Lys Val Pro 1085 1090 1095 Asp Glu Glu Glu Asn Glu Glu Ser Asp Asn Glu Lys Glu Thr Glu 1100 1105 1110 Lys Ser Asp Ser Val Thr Asp Ser Gly Pro Thr Phe Asn Tyr Leu 1115 1120 1125 Leu Asp Met Pro Leu Trp Tyr Leu Thr Lys Glu Lys Lys Asp Glu 1130 1135 1140 Leu Cys Arg Leu Arg Asn Glu Lys Glu Gln Glu Leu Asp Thr Leu 1145 1150 1155 Lys Arg Lys Ser Pro Ser Asp Leu Trp Lys Glu Asp Leu Ala Thr 1160 1165 1170 Phe Ile Glu Glu Leu Glu Ala Val Glu Ala Lys Glu Lys Gln Asp 1175 1180 1185 Glu Gln Val Gly Leu Pro Gly Lys Gly Gly Lys Ala Lys Gly Lys 1190 1195 1200 Lys Thr Gln Met Ala Glu Val Leu Pro Ser Pro Arg Gly Gln Arg 1205 1210 1215 Val Ile Pro Arg Ile Thr Ile Glu Met Lys Ala Glu Ala Glu Lys 1220 1225 1230 Lys Asn Lys Lys Lys Ile Lys Asn Glu Asn Thr Glu Gly Ser Pro 1235 1240 1245 Gln Glu Asp Gly Val Glu Leu Glu Gly Leu Lys Gln Arg Leu Glu 1250 1255 1260 Lys Lys Gln Lys Arg Glu Pro Gly Thr Lys Thr Lys Lys Gln Thr 1265 1270 1275 Thr Leu Ala Phe Lys Pro Ile Lys Lys Gly Lys Lys Arg Asn Pro 1280 1285 1290 Trp Ser Asp Ser Glu Ser Asp Arg Ser Ser Asp Glu Ser Asn Phe 1295 1300 1305 Asp Val Pro Pro Arg Glu Thr Glu Pro Arg Arg Ala Ala Thr Lys 1310 1315 1320 Thr Lys Phe Thr Met Asp Leu Asp Ser Asp Glu Asp Phe Ser Asp 1325 1330 1335 Phe Asp Glu Lys Thr Asp Asp Glu Asp Phe Val Pro Ser Asp Ala 1340 1345 1350 Ser Pro Pro Lys Thr Lys Thr Ser Pro Lys Leu Ser Asn Lys Glu 1355 1360 1365 Leu Lys Pro Gln Lys Ser Val Val Ser Asp Leu Glu Ala Asp Asp 1370 1375 1380 Val Lys Gly Ser Val Pro Leu Ser Ser Ser Pro Pro Ala Thr His 1385 1390 1395 Phe Pro Asp Glu Thr Glu Ile Thr Asn Pro Val Pro Lys Lys Asn 1400 1405 1410 Val Thr Val Lys Lys Thr Ala Ala Lys Ser Gln Ser Ser Thr Ser 1415 1420 1425 Thr Thr Gly Ala Lys Lys Arg Ala Ala Pro Lys Gly Thr Lys Arg 1430 1435 1440 Asp Pro Ala Leu Asn Ser Gly Val Ser Gln Lys Pro Asp Pro Ala 1445 1450 1455 Lys Thr Lys Asn Arg Arg Lys Arg Lys Pro Ser Thr Ser Asp Asp 1460 1465 1470 Ser Asp Ser Asn Phe Glu Lys Ile Val Ser Lys Ala Val Thr Ser 1475 1480 1485 Lys Lys Ser Lys Gly Glu Ser Asp Asp Phe His Met Asp Phe Asp 1490 1495 1500 Ser Ala Val Ala Pro Arg Ala Lys Ser Val Arg Ala Lys Lys Pro 1505 1510 1515 Ile Lys Tyr Leu Glu Glu Ser Asp Glu Asp Asp Leu Phe 1520 1525 1530 <210> 4 <211> 5753 <212> DNA <213> Homo sapiens <400> 4 gattggctgg tctgcttcgg gcgggctaaa ggaaggttca agtggagctc tcctaaccga 60 cgcgcgtctg tggagaagcg gcttggtcgg gggtggtctc gtggggtcct gcctgtttag 120 tcgctttcag ggttcttgag ccccttcacg accgtcacca tggaagtgtc accattgcag 180 cctgtaaatg aaaatatgca agtcaacaaa ataaagaaaa atgaagatgc taagaaaaga 240 ctgtctgttg aaagaatcta tcaaaagaaa acacaattgg aacatatttt gctccgccca 300 gacacctaca ttggttctgt ggaattagtg acccagcaaa tgtgggttta cgatgaagat 360 gttggcatta actataggga agtcactttt gttcctggtt tgtacaaaat ctttgatgag 420 attctagtta atgctgcgga caacaaacaa agggacccaa aaatgtcttg tattagagtc 480 acaattgatc cggaaaacaa tttaattagt atatggaata atggaaaagg tattcctgtt 540 gttgaacaca aagttgaaaa gatgtatgtc ccagctctca tatttggaca gctcctaact 600 tctagtaact atgatgatga tgaaaagaaa gtgacaggtg gtcgaaatgg ctatggagcc 660 aaattgtgta acatattcag taccaaattt actgtggaaa cagccagtag agaatacaag 720 aaaatgttca aacagacatg gatggataat atgggaagag ctggtgagat ggaactcaag 780 cccttcaatg gagaagatta tacatgtatc acctttcagc ctgatttgtc taagtttaaa 840 atgcaaagcc tggacaaaga tattgttgca ctaatggtca gaagagcata tgatattgct 900 ggatccacca aagatgtcaa agtctttctt aatggaaata aactgccagt aaaaggattt 960 cgtagttatg tggacatgta tttgaaggac aagttggatg aaactggtaa ctccttgaaa 1020 gtaatacatg aacaagtaaa ccacaggtgg gaagtgtgtt taactatgag tgaaaaaggc 1080 tttcagcaaa ttagctttgt caacagcatt gctacatcca agggtggcag acatgttgat 1140 tatgtagctg atcagattgt gactaaactt gttgatgttg tgaagaagaa gaacaagggt 1200 ggtgttgcag taaaagcaca tcaggtgaaa aatcacatgt ggatttttgt aaatgcctta 1260 attgaaaacc caacctttga ctctcagaca aaagaaaaca tgactttaca acccaagagc 1320 tttggatcaa catgccaatt gagtgaaaaa tttatcaaag ctgccattgg ctgtggtatt 1380 gtagaaagca tactaaactg ggtgaagttt aaggcccaag tccagttaaa caagaagtgt 1440 tcagctgtaa aacataatag aatcaaggga attcccaaac tcgatgatgc caatgatgca 1500 gggggccgaa actccactga gtgtacgctt atcctgactg agggagattc agccaaaact 1560 ttggctgttt caggccttgg tgtggttggg agagacaaat atggggtttt ccctcttaga 1620 ggaaaaatac tcaatgttcg agaagcttct cataagcaga tcatggaaaa tgctgagatt 1680 aacaatatca tcaagattgt gggtcttcag tacaagaaaa actatgaaga tgaagattca 1740 ttgaagacgc ttcgttatgg gaagataatg attatgacag atcaggacca agatggttcc 1800 cacatcaaag gcttgctgat taattttatc catcacaact ggccctctct tctgcgacat 1860 cgttttctgg aggaatttat cactcccatt gtaaaggtat ctaaaaacaa gcaagaaatg 1920 gcattttaca gccttcctga atttgaagag tggaagagtt ctactccaaa tcataaaaaa 1980 tggaaagtca aatattacaa aggtttgggc accagcacat caaaggaagc taaagaatac 2040 tttgcagata tgaaaagaca tcgtatccag ttcaaatatt ctggtcctga agatgatgct 2100 gctatcagcc tggcctttag caaaaaacag atagatgatc gaaaggaatg gttaactaat 2160 ttcatggagg atagaagaca acgaaagtta cttgggcttc ctgaggatta cttgtatgga 2220 caaactacca catatctgac atataatgac ttcatcaaca aggaacttat cttgttctca 2280 aattctgata acgagagatc tatcccttct atggtggatg gtttgaaacc aggtcagaga 2340 aaggttttgt ttacttgctt caaacggaat gacaagcgag aagtaaaggt tgcccaatta 2400 gctggatcag tggctgaaat gtcttcttat catcatggtg agatgtcact aatgatgacc 2460 attatcaatt tggctcagaa ttttgtgggt agcaataatc taaacctctt gcagcccatt 2520 ggtcagtttg gtaccaggct acatggtggc aaggattctg ctagtccacg atacatcttt 2580 acaatgctca gctctttggc tcgattgtta tttccaccaa aagatgatca cacgttgaag 2640 tttttatatg atgacaacca gcgtgttgag cctgaatggt acattcctat tattcccatg 2700 gtgctgataa atggtgctga aggaatcggt actgggtggt cctgcaaaat ccccaacttt 2760 gatgtgcgtg aaattgtaaa taacatcagg cgtttgatgg atggagaaga acctttgcca 2820 atgcttccaa gttacaagaa cttcaagggt actattgaag aactggctcc aaatcaatat 2880 gtgattagtg gtgaagtagc tattcttaat tctacaacca ttgaaatctc agagcttccc 2940 gtcagaacat ggacccagac atacaaagaa caagttctag aacccatgtt gaatggcacc 3000 gagaagacac ctcctctcat aacagactat agggaatacc atacagatac cactgtgaaa 3060 tttgttgtga agatgactga agaaaaactg gcagaggcag agagagttgg actacacaaa 3120 gtcttcaaac tccaaactag tctcacatgc aactctatgg tgctttttga ccacgtaggc 3180 tgtttaaaga aatatgacac ggtgttggat attctaagag acttttttga actcagactt 3240 aaatattatg gattaagaaa agaatggctc ctaggaatgc ttggtgctga atctgctaaa 3300 ctgaataatc aggctcgctt tatcttagag aaaatagatg gcaaaataat cattgaaaat 3360 aagcctaaga aagaattaat taaagttctg attcagaggg gatatgattc ggatcctgtg 3420 aaggcctgga aagaagccca gcaaaaggtt ccagatgaag aagaaaatga agagagtgac 3480 aacgaaaagg aaactgaaaa gagtgactcc gtaacagatt ctggaccaac cttcaactat 3540 cttcttgata tgcccctttg gtatttaacc aaggaaaaga aagatgaact ctgcaggcta 3600 agaaatgaaa aagaacaaga gctggacaca ttaaaaagaa agagtccatc agatttgtgg 3660 aaagaagact tggctacatt tattgaagaa ttggaggctg ttgaagccaa ggaaaaacaa 3720 gatgaacaag tcggacttcc tgggaaaggg gggaaggcca aggggaaaaa aacacaaatg 3780 gctgaagttt tgccttctcc gcgtggtcaa agagtcattc cacgaataac catagaaatg 3840 aaagcagagg cagaaaagaa aaataaaaag aaaattaaga atgaaaatac tgaaggaagc 3900 cctcaagaag atggtgtgga actagaaggc ctaaaacaaa gattagaaaa gaaacagaaa 3960 agagaaccag gtacaaagac aaagaaacaa actacattgg catttaagcc aatcaaaaaa 4020 ggaaagaaga gaaatccctg gtctgattca gaatcagata ggagcagtga cgaaagtaat 4080 tttgatgtcc ctccacgaga aacagagcca cggagagcag caacaaaaac aaaattcaca 4140 atggatttgg attcagatga agatttctca gattttgatg aaaaaactga tgatgaagat 4200 tttgtcccat cagatgctag tccacctaag accaaaactt ccccaaaact tagtaacaaa 4260 gaactgaaac cacagaaaag tgtcgtgtca gaccttgaag ctgatgatgt taagggcagt 4320 gtaccactgt cttcaagccc tcctgctaca catttcccag atgaaactga aattacaaac 4380 ccagttccta aaaagaatgt gacagtgaag aagacagcag caaaaagtca gtcttccacc 4440 tccactaccg gtgccaaaaa aagggctgcc ccaaaaggaa ctaaaaggga tccagctttg 4500 aattctggtg tctctcaaaa gcctgatcct gccaaaacca agaatcgccg caaaaggaag 4560 ccatccactt ctgatgattc tgactctaat tttgagaaaa ttgtttcgaa agcagtcaca 4620 agcaagaaat ccaaggggga gagtgatgac ttccatatgg actttgactc agctgtggct 4680 cctcgggcaa aatctgtacg ggcaaagaaa cctataaagt acctggaaga gtcagatgaa 4740 gatgatctgt tttaaaatgt gaggcgatta ttttaagtaa ttatcttacc aagcccaaga 4800 ctggttttaa agttacctga agctcttaac ttcctcccct ctgaatttag tttggggaag 4860 gtgtttttag tacaagacat caaagtgaag taaagcccaa gtgttcttta gctttttata 4920 atactgtcta aatagtgacc atctcatggg cattgttttc ttctctgctt tgtctgtgtt 4980 ttgagtctgc tttcttttgt ctttaaaacc tgatttttaa gttcttctga actgtagaaa 5040 tagctatctg atcacttcag cgtaaagcag tgtgtttatt aaccatccac taagctaaaa 5100 ctagagcagt ttgatttaaa agtgtcactc ttcctccttt tctactttca gtagatatga 5160 gatagagcat aattatctgt tttatcttag ttttatacat aatttaccat cagatagaac 5220 tttatggttc tagtacagat actctactac actcagcctc ttatgtgcca agtttttctt 5280 taagcaatga gaaattgctc atgttcttca tcttctcaaa tcatcagagg ccgaagaaaa 5340 acactttggc tgtgtctata acttgacaca gtcaatagaa tgaagaaaat tagagtagtt 5400 atgtgattat ttcagctctt gacctgtccc ctctggctgc ctctgagtct gaatctccca 5460 aagagagaaa ccaatttcta agaggactgg attgcagaag actcggggac aacatttgat 5520 ccaagatctt aaatgttata ttgataacca tgctcagcaa tgagctatta gattcatttt 5580 gggaaatctc cataatttca atttgtaaac tttgttaaga cctgtctaca ttgttatatg 5640 tgtgtgactt gagtaatgtt atcaacgttt ttgtaaatat ttactatgtt tttctattag 5700 ctaaattcca acaattttgt actttaataa aatgttctaa acattgcaac cca 5753 <210> 5 <211> 489 <212> PRT <213> Homo sapiens <400> 5 Met Ala Thr Ile Thr Cys Thr Arg Phe Thr Glu Glu Tyr Gln Leu Phe 1 5 10 15 Glu Glu Leu Gly Lys Gly Ala Phe Ser Val Val Arg Arg Cys Val Lys 20 25 30 Val Leu Ala Gly Gln Glu Tyr Ala Ala Lys Ile Ile Asn Thr Lys Lys 35 40 45 Leu Ser Ala Arg Asp His Gln Lys Leu Glu Arg Glu Ala Arg Ile Cys 50 55 60 Arg Leu Leu Lys His Pro Asn Ile Val Arg Leu His Asp Ser Ile Ser 65 70 75 80 Glu Glu Gly His His Tyr Leu Ile Phe Asp Leu Val Thr Gly Gly Glu 85 90 95 Leu Phe Glu Asp Ile Val Ala Arg Glu Tyr Tyr Ser Glu Ala Asp Ala 100 105 110 Ser His Cys Ile Gln Gln Ile Leu Glu Ala Val Leu His Cys His Gln 115 120 125 Met Gly Val Val His Arg Asp Leu Lys Pro Glu Asn Leu Leu Leu Ala 130 135 140 Ser Lys Leu Lys Gly Ala Ala Val Lys Leu Ala Asp Phe Gly Leu Ala 145 150 155 160 Ile Glu Val Glu Gly Glu Gln Gln Ala Trp Phe Gly Phe Ala Gly Thr 165 170 175 Pro Gly Tyr Leu Ser Pro Glu Val Leu Arg Lys Asp Pro Tyr Gly Lys 180 185 190 Pro Val Asp Leu Trp Ala Cys Gly Val Ile Leu Tyr Ile Leu Leu Val 195 200 205 Gly Tyr Pro Pro Phe Trp Asp Glu Asp Gln His Arg Leu Tyr Gln Gln 210 215 220 Ile Lys Ala Gly Ala Tyr Asp Phe Pro Ser Pro Glu Trp Asp Thr Val 225 230 235 240 Thr Pro Glu Ala Lys Asp Leu Ile Asn Lys Met Leu Thr Ile Asn Pro 245 250 255 Ser Lys Arg Ile Thr Ala Ala Glu Ala Leu Lys His Pro Trp Ile Ser 260 265 270 His Arg Ser Thr Val Ala Ser Cys Met His Arg Gln Glu Thr Val Asp 275 280 285 Cys Leu Lys Lys Phe Asn Ala Arg Arg Lys Leu Lys Gly Ala Ile Leu 290 295 300 Thr Thr Met Leu Ala Thr Arg Asn Phe Ser Gly Gly Lys Ser Gly Gly 305 310 315 320 Asn Lys Lys Ser Asp Gly Val Lys Lys Arg Lys Ser Ser Ser Ser Val 325 330 335 Gln Leu Met Glu Ser Ser Glu Ser Thr Asn Thr Thr Ile Glu Asp Glu 340 345 350 Asp Thr Lys Val Arg Lys Gln Glu Ile Ile Lys Val Thr Glu Gln Leu 355 360 365 Ile Glu Ala Ile Ser Asn Gly Asp Phe Glu Ser Tyr Thr Lys Met Cys 370 375 380 Asp Pro Gly Met Thr Ala Phe Glu Pro Glu Ala Leu Gly Asn Leu Val 385 390 395 400 Glu Gly Leu Asp Phe His Arg Phe Tyr Phe Glu Asn Leu Trp Ser Arg 405 410 415 Asn Ser Lys Pro Val His Thr Thr Ile Leu Asn Pro His Ile His Leu 420 425 430 Met Gly Asp Glu Ser Ala Cys Ile Ala Tyr Ile Arg Ile Thr Gln Tyr 435 440 445 Leu Asp Ala Gly Gly Ile Pro Arg Thr Ala Gln Ser Glu Glu Thr Arg 450 455 460 Val Trp His Arg Arg Asp Gly Lys Trp Gln Ile Val His Phe His Arg 465 470 475 480 Ser Gly Ala Pro Ser Val Leu Pro His 485 <210> 6 <211> 4918 <212> DNA <213> Homo sapiens <400> 6 ggttgccatg gggacctgga tgctgacgaa ggctcgcgag gctgtgagca gccacagtgc 60 cctgctcaga agccccgggc tcgtcagtca aaccggttct ctgtttgcac tcggcagcac 120 gggcaggcaa gtggtcccta ggttcgggag cagagcagca gcgcctcagt cctggtcccc 180 cagtcccaag cctcacctgc ctgcccagcg ccaggatggc caccatcacc tgcacccgct 240 tcacggaaga gtaccagctc ttcgaggaat tgggcaaggg agccttctcg gtggtgcgaa 300 ggtgtgtgaa ggtgctggct ggccaggagt atgctgccaa gatcatcaac acaaagaagc 360 tgtcagccag agaccatcag aagctggagc gtgaagcccg catctgccgc ctgctgaagc 420 accccaacat cgtccgacta catgacagca tctcagagga gggacaccac tacctgatct 480 tcgacctggt cactggtggg gaactgtttg aagatatcgt ggcccgggag tattacagtg 540 aggcggatgc cagtcactgt atccagcaga tcctggaggc tgtgctgcac tgccaccaga 600 tgggggtggt gcaccgggac ctgaagcctg agaatctgtt gctggcctcc aagctcaagg 660 gtgccgcagt gaagctggca gactttggcc tggccataga ggtggagggg gagcagcagg 720 catggtttgg gtttgcaggg actcctggat atctctcccc agaagtgctg cggaaggacc 780 cgtacgggaa gcctgtggac ctgtgggctt gtggggtcat cctgtacatc ctgctggttg 840 ggtacccccc gttctgggat gaggaccagc accgcctgta ccagcagatc aaagccggcg 900 cctatgattt cccatcgccg gaatgggaca ctgtcacccc ggaagccaag gatctgatca 960 ataagatgct gaccattaac ccatccaaac gcatcacagc tgccgaagcc cttaagcacc 1020 cctggatctc gcaccgctcc accgtggcat cctgcatgca cagacaggag accgtggact 1080 gcctgaagaa gttcaatgcc aggaggaaac tgaagggagc cattctcacc acgatgctgg 1140 ccaccaggaa cttctccgga gggaagagtg ggggaaacaa gaagagcgat ggtgtgaaga 1200 aaagaaagtc cagttccagc gttcagttaa tggaatcctc agagagcacc aacaccacca 1260 tcgaggatga agacaccaaa gtgcggaaac aggaaattat aaaagtgaca gagcagctga 1320 ttgaagccat aagcaatgga gattttgagt cctacacgaa gatgtgcgac cctggcatga 1380 cagccttcga acctgaggcc ctggggaacc tggttgaggg cctggacttc catcgattct 1440 attttgaaaa cctgtggtcc cggaacagca agcccgtgca caccaccatc ctgaatcccc 1500 acatccacct gatgggcgac gagtcagcct gcatcgccta catccgcatc acgcagtacc 1560 tggacgctgg cggcatccca cgcaccgccc agtcggagga gacccgtgtc tggcaccgcc 1620 gggatggcaa atggcagatc gtccacttcc acagatctgg ggcgccctcc gtcctgcccc 1680 actgagggac caggctgggg tcgctgcgtt gctgtgccgc agagatccac tctgtccgtg 1740 gagtggagct gctggttctc ccaggtggat tttgctggaa ttctcccatg tcatcacccc 1800 accaccgtca cttctgtacc tgcatcaaga aaacctgctt gttcacaaaa gtcatcgcaa 1860 cttcagagcg aacggccaca tctccccacc tctcaccccc accctctccc ctgccaggct 1920 ggggcttcct caggcatggg tgtccacagc actggccccc tctccccagc ctcagctgct 1980 gtccgcctga tctgtcttgg gctgtaggct agaatgcccg ggctggtgcc caccaggggc 2040 tggggagaag gaggggtggc atgatgagga aggcagcatc cgtccgtccc tctcccagac 2100 ctctcctctt ccagtgtccc cggggaaggg cagatgacac tcccttcccc ctaagccaac 2160 cgcactgaag gagtggggag aagagcatac gccaggagcc tcctgcctca aagtgctccc 2220 ctaagtcttc ttcctcctgt gctgacctca gggtggtctg acccttccct cggtgtgggg 2280 gatgtggccc tctcaggtgc ccctacttgc tttctgcttc cttctggtga agtccacctc 2340 caacattaac ctgcccaccc cacccccgtc atccctggag aattccagct ttgtcgtatc 2400 tcagagaggg aatctaattg tttttggggg gcaaaagaaa gcaacgttta ggtatcactt 2460 ctacttggac cgcatgcctt tttatagcca aatttctgtg tatttcgtaa atggatttcg 2520 cgttaatgga tatttatgta ataactagac ttctcagatt attgtgagaa gggtcaggtt 2580 ggaaggggtg taggaagagg ggtgaggggt agtttttttc tgttctagtt tttttttttt 2640 tttttgtcat ctctgaggtg gaccttgtca cctgtggtta ttggggccaa ggtggactca 2700 gctccgggga gaagggcctc tctgccattt cggtcccaag gtgagctgac acaggcgttc 2760 cttttgggac tgtggaagca tcagatgcca gcactgactc aggaacagca agtcagggca 2820 gagaggagga gggaggctgt caggatggaa atacctggac ttttctttgc ttccctcgca 2880 aactggggtc ttctctaccg aacttcccag gatttcatct caccatatct gtgtgccgcc 2940 cccagcaccc cccacccacc tctggggggc ccgtgagcgt gtgtcttcat tgcctctctc 3000 cccttggcgt ctgatgacca cagcaaagca ctgggaattt ctactcttca tgcctcatcc 3060 tgcagcctcg ggttcgcatt ctctctttct tttcctcttt ccctctttcc ctgggattga 3120 ctctgagtgg aataccttgg cacatccact aggatctact gtctgcactg ttttctttgc 3180 atgactttat acgcagtaag tatgttgaaa acaaacaaaa agaagaaaac actcaacaaa 3240 accaatctac atgttttgga ctaaaaaaaa aaatagaggt tgtattctca gtgtccgact 3300 cggaattatg ttgctgcctc tctgtgcttt tggcctctgt gtggccgtgt tttgccagca 3360 tgagatactg tcccctctgg aggattttag gggaggaaga gccacgtccc cagggattgg 3420 aggaggctcc ggtaccctcg accctcctgg gtgttggttg gagcagaact ggtgaggatg 3480 tttgatccga gattttctga gctctcccca atcaccagct gtctgctggg ttcttttctc 3540 aagtcctgct gcccaggccc aggtgagaca ggcaacgcca ggtctgcagg ccaggagaga 3600 tgctgcccag gcctcctggt ttccaagctg gtccatcact ggcctctgtc cttggcagag 3660 accttgctgc ccaggcccag gggcaggctc ttggcctgcc ccaggcccag agggcttccc 3720 agtaaggccc agtgatccca ttatcccagg ggcaaaacca cctgtcccct tttgagctgc 3780 cagttcccta cagccatccc cagtcaaggg tgagggtgtg gccttcacca ggggctgctg 3840 taattaccga gcaaggtctg agctcttctt cagcctcagt tccctcattg gttaaaaggg 3900 ttctttgttc ccatccagcc gatgaaggag caaacgtctg gctatgtgaa gcctaattta 3960 cctgcaggaa ctggcaggga tagtcactgg ctggactcct gtttacttct agacctggtc 4020 aggctccatc ccctccccca cctgcccctg attcccctcg tcggtgcctg tcaactgctt 4080 ttcagcagtg gactgcaggg gaaagagcag tgatttgggg tgagtaggct tcaattccca 4140 gctctgacca gacttgctgt gtgaccttgg gcaagttcct ttccctcttt ggagcttggt 4200 ttccctgcca gaggaaactg agctggagga gcctgaggtc ctgcctttca ttggctgaca 4260 cacctcctgt ccactgtgtc actctccaag tgccagagaa gtggaggcag atcgctaccc 4320 caggctgaga tggcccccac tgtgaaggcc acgcctgtgg gtgggcagcc acctggtgcc 4380 accacagggc accagggatg atcctgatgt ggcaggcagg ggagactcac agaaaaatct 4440 gcccagagcc taccctcacc agacaaactc tgtgctcctc caaaacatcc tttagatgca 4500 aaataataat aataataata ataaataaat aaataaaaat ccaaacccaa gtcaaaacct 4560 tggctccagc atgaaaacac gtttacagga aagtgttctc ctgggtttgt gcccaccatg 4620 gtgcgaatcc tgacccaagg cctcctgtct cccttcaaag ggagaccctt ttgggggatg 4680 agtttgccag actccccgtg ctggtttctt tgttactatt tgtttggggt tttgttttag 4740 ttcttttttt ttttcttttc ttttttaaaa atatgtggct gtgaacttga atgaacactg 4800 ctcaaacttt ctgctattgg ggggggcggg tgggatggga agaaggggcg tttgttttat 4860 tcttggtgtt ttcagtgcaa taaatagcta caaacttctg tgcaaaaaaa aaaaaaaa 4918 <210> 7 <211> 478 <212> PRT <213> Homo sapiens <400> 7 Met Ala Thr Ile Thr Cys Thr Arg Phe Thr Glu Glu Tyr Gln Leu Phe 1 5 10 15 Glu Glu Leu Gly Lys Gly Ala Phe Ser Val Val Arg Arg Cys Val Lys 20 25 30 Val Leu Ala Gly Gln Glu Tyr Ala Ala Lys Ile Ile Asn Thr Lys Lys 35 40 45 Leu Ser Ala Arg Asp His Gln Lys Leu Glu Arg Glu Ala Arg Ile Cys 50 55 60 Arg Leu Leu Lys His Pro Asn Ile Val Arg Leu His Asp Ser Ile Ser 65 70 75 80 Glu Glu Gly His His Tyr Leu Ile Phe Asp Leu Val Thr Gly Gly Glu 85 90 95 Leu Phe Glu Asp Ile Val Ala Arg Glu Tyr Tyr Ser Glu Ala Asp Ala 100 105 110 Ser His Cys Ile Gln Gln Ile Leu Glu Ala Val Leu His Cys His Gln 115 120 125 Met Gly Val Val His Arg Asp Leu Lys Pro Glu Asn Leu Leu Leu Ala 130 135 140 Ser Lys Leu Lys Gly Ala Ala Val Lys Leu Ala Asp Phe Gly Leu Ala 145 150 155 160 Ile Glu Val Glu Gly Glu Gln Gln Ala Trp Phe Gly Phe Ala Gly Thr 165 170 175 Pro Gly Tyr Leu Ser Pro Glu Val Leu Arg Lys Asp Pro Tyr Gly Lys 180 185 190 Pro Val Asp Leu Trp Ala Cys Gly Val Ile Leu Tyr Ile Leu Leu Val 195 200 205 Gly Tyr Pro Pro Phe Trp Asp Glu Asp Gln His Arg Leu Tyr Gln Gln 210 215 220 Ile Lys Ala Gly Ala Tyr Asp Phe Pro Ser Pro Glu Trp Asp Thr Val 225 230 235 240 Thr Pro Glu Ala Lys Asp Leu Ile Asn Lys Met Leu Thr Ile Asn Pro 245 250 255 Ser Lys Arg Ile Thr Ala Ala Glu Ala Leu Lys His Pro Trp Ile Ser 260 265 270 His Arg Ser Thr Val Ala Ser Cys Met His Arg Gln Glu Thr Val Asp 275 280 285 Cys Leu Lys Lys Phe Asn Ala Arg Arg Lys Leu Lys Gly Ala Ile Leu 290 295 300 Thr Thr Met Leu Ala Thr Arg Asn Phe Ser Gly Gly Lys Ser Gly Gly 305 310 315 320 Asn Lys Lys Ser Asp Gly Val Lys Glu Ser Ser Glu Ser Thr Asn Thr 325 330 335 Thr Ile Glu Asp Glu Asp Thr Lys Val Arg Lys Gln Glu Ile Ile Lys 340 345 350 Val Thr Glu Gln Leu Ile Glu Ala Ile Ser Asn Gly Asp Phe Glu Ser 355 360 365 Tyr Thr Lys Met Cys Asp Pro Gly Met Thr Ala Phe Glu Pro Glu Ala 370 375 380 Leu Gly Asn Leu Val Glu Gly Leu Asp Phe His Arg Phe Tyr Phe Glu 385 390 395 400 Asn Leu Trp Ser Arg Asn Ser Lys Pro Val His Thr Thr Ile Leu Asn 405 410 415 Pro His Ile His Leu Met Gly Asp Glu Ser Ala Cys Ile Ala Tyr Ile 420 425 430 Arg Ile Thr Gln Tyr Leu Asp Ala Gly Gly Ile Pro Arg Thr Ala Gln 435 440 445 Ser Glu Glu Thr Arg Val Trp His Arg Arg Asp Gly Lys Trp Gln Ile 450 455 460 Val His Phe His Arg Ser Gly Ala Pro Ser Val Leu Pro His 465 470 475 <210> 8 <211> 4885 <212> DNA <213> Homo sapiens <400> 8 ggttgccatg gggacctgga tgctgacgaa ggctcgcgag gctgtgagca gccacagtgc 60 cctgctcaga agccccgggc tcgtcagtca aaccggttct ctgtttgcac tcggcagcac 120 gggcaggcaa gtggtcccta ggttcgggag cagagcagca gcgcctcagt cctggtcccc 180 cagtcccaag cctcacctgc ctgcccagcg ccaggatggc caccatcacc tgcacccgct 240 tcacggaaga gtaccagctc ttcgaggaat tgggcaaggg agccttctcg gtggtgcgaa 300 ggtgtgtgaa ggtgctggct ggccaggagt atgctgccaa gatcatcaac acaaagaagc 360 tgtcagccag agaccatcag aagctggagc gtgaagcccg catctgccgc ctgctgaagc 420 accccaacat cgtccgacta catgacagca tctcagagga gggacaccac tacctgatct 480 tcgacctggt cactggtggg gaactgtttg aagatatcgt ggcccgggag tattacagtg 540 aggcggatgc cagtcactgt atccagcaga tcctggaggc tgtgctgcac tgccaccaga 600 tgggggtggt gcaccgggac ctgaagcctg agaatctgtt gctggcctcc aagctcaagg 660 gtgccgcagt gaagctggca gactttggcc tggccataga ggtggagggg gagcagcagg 720 catggtttgg gtttgcaggg actcctggat atctctcccc agaagtgctg cggaaggacc 780 cgtacgggaa gcctgtggac ctgtgggctt gtggggtcat cctgtacatc ctgctggttg 840 ggtacccccc gttctgggat gaggaccagc accgcctgta ccagcagatc aaagccggcg 900 cctatgattt cccatcgccg gaatgggaca ctgtcacccc ggaagccaag gatctgatca 960 ataagatgct gaccattaac ccatccaaac gcatcacagc tgccgaagcc cttaagcacc 1020 cctggatctc gcaccgctcc accgtggcat cctgcatgca cagacaggag accgtggact 1080 gcctgaagaa gttcaatgcc aggaggaaac tgaagggagc cattctcacc acgatgctgg 1140 ccaccaggaa cttctccgga gggaagagtg ggggaaacaa gaagagcgat ggtgtgaagg 1200 aatcctcaga gagcaccaac accaccatcg aggatgaaga caccaaagtg cggaaacagg 1260 aaattataaa agtgacagag cagctgattg aagccataag caatggagat tttgagtcct 1320 acacgaagat gtgcgaccct ggcatgacag ccttcgaacc tgaggccctg gggaacctgg 1380 ttgagggcct ggacttccat cgattctatt ttgaaaacct gtggtcccgg aacagcaagc 1440 ccgtgcacac caccatcctg aatccccaca tccacctgat gggcgacgag tcagcctgca 1500 tcgcctacat ccgcatcacg cagtacctgg acgctggcgg catcccacgc accgcccagt 1560 cggaggagac ccgtgtctgg caccgccggg atggcaaatg gcagatcgtc cacttccaca 1620 gatctggggc gccctccgtc ctgccccact gagggaccag gctggggtcg ctgcgttgct 1680 gtgccgcaga gatccactct gtccgtggag tggagctgct ggttctccca ggtggatttt 1740 gctggaattc tcccatgtca tcaccccacc accgtcactt ctgtacctgc atcaagaaaa 1800 cctgcttgtt cacaaaagtc atcgcaactt cagagcgaac ggccacatct ccccacctct 1860 cacccccacc ctctcccctg ccaggctggg gcttcctcag gcatgggtgt ccacagcact 1920 ggccccctct ccccagcctc agctgctgtc cgcctgatct gtcttgggct gtaggctaga 1980 atgcccgggc tggtgcccac caggggctgg ggagaaggag gggtggcatg atgaggaagg 2040 cagcatccgt ccgtccctct cccagacctc tcctcttcca gtgtccccgg ggaagggcag 2100 atgacactcc cttcccccta agccaaccgc actgaaggag tggggagaag agcatacgcc 2160 aggagcctcc tgcctcaaag tgctccccta agtcttcttc ctcctgtgct gacctcaggg 2220 tggtctgacc cttccctcgg tgtgggggat gtggccctct caggtgcccc tacttgcttt 2280 ctgcttcctt ctggtgaagt ccacctccaa cattaacctg cccaccccac ccccgtcatc 2340 cctggagaat tccagctttg tcgtatctca gagagggaat ctaattgttt ttggggggca 2400 aaagaaagca acgtttaggt atcacttcta cttggaccgc atgccttttt atagccaaat 2460 ttctgtgtat ttcgtaaatg gatttcgcgt taatggatat ttatgtaata actagacttc 2520 tcagattatt gtgagaaggg tcaggttgga aggggtgtag gaagaggggt gaggggtagt 2580 ttttttctgt tctagttttt tttttttttt ttgtcatctc tgaggtggac cttgtcacct 2640 gtggttattg gggccaaggt ggactcagct ccggggagaa gggcctctct gccatttcgg 2700 tcccaaggtg agctgacaca ggcgttcctt ttgggactgt ggaagcatca gatgccagca 2760 ctgactcagg aacagcaagt cagggcagag aggaggaggg aggctgtcag gatggaaata 2820 cctggacttt tctttgcttc cctcgcaaac tggggtcttc tctaccgaac ttcccaggat 2880 ttcatctcac catatctgtg tgccgccccc agcacccccc acccacctct ggggggcccg 2940 tgagcgtgtg tcttcattgc ctctctcccc ttggcgtctg atgaccacag caaagcactg 3000 ggaatttcta ctcttcatgc ctcatcctgc agcctcgggt tcgcattctc tctttctttt 3060 cctctttccc tctttccctg ggattgactc tgagtggaat accttggcac atccactagg 3120 atctactgtc tgcactgttt tctttgcatg actttatacg cagtaagtat gttgaaaaca 3180 aacaaaaaga agaaaacact caacaaaacc aatctacatg ttttggacta aaaaaaaaaa 3240 tagaggttgt attctcagtg tccgactcgg aattatgttg ctgcctctct gtgcttttgg 3300 cctctgtgtg gccgtgtttt gccagcatga gatactgtcc cctctggagg attttagggg 3360 aggaagagcc acgtccccag ggattggagg aggctccggt accctcgacc ctcctgggtg 3420 ttggttggag cagaactggt gaggatgttt gatccgagat tttctgagct ctccccaatc 3480 accagctgtc tgctgggttc ttttctcaag tcctgctgcc caggcccagg tgagacaggc 3540 aacgccaggt ctgcaggcca ggagagatgc tgcccaggcc tcctggtttc caagctggtc 3600 catcactggc ctctgtcctt ggcagagacc ttgctgccca ggcccagggg caggctcttg 3660 gcctgcccca ggcccagagg gcttcccagt aaggcccagt gatcccatta tcccaggggc 3720 aaaaccacct gtcccctttt gagctgccag ttccctacag ccatccccag tcaagggtga 3780 gggtgtggcc ttcaccaggg gctgctgtaa ttaccgagca aggtctgagc tcttcttcag 3840 cctcagttcc ctcattggtt aaaagggttc tttgttccca tccagccgat gaaggagcaa 3900 acgtctggct atgtgaagcc taatttacct gcaggaactg gcagggatag tcactggctg 3960 gactcctgtt tacttctaga cctggtcagg ctccatcccc tcccccacct gcccctgatt 4020 cccctcgtcg gtgcctgtca actgcttttc agcagtggac tgcaggggaa agagcagtga 4080 tttggggtga gtaggcttca attcccagct ctgaccagac ttgctgtgtg accttgggca 4140 agttcctttc cctctttgga gcttggtttc cctgccagag gaaactgagc tggaggagcc 4200 tgaggtcctg cctttcattg gctgacacac ctcctgtcca ctgtgtcact ctccaagtgc 4260 cagagaagtg gaggcagatc gctaccccag gctgagatgg cccccactgt gaaggccacg 4320 cctgtgggtg ggcagccacc tggtgccacc acagggcacc agggatgatc ctgatgtggc 4380 aggcagggga gactcacaga aaaatctgcc cagagcctac cctcaccaga caaactctgt 4440 gctcctccaa aacatccttt agatgcaaaa taataataat aataataata aataaataaa 4500 taaaaatcca aacccaagtc aaaaccttgg ctccagcatg aaaacacgtt tacaggaaag 4560 tgttctcctg ggtttgtgcc caccatggtg cgaatcctga cccaaggcct cctgtctccc 4620 ttcaaaggga gacccttttg ggggatgagt ttgccagact ccccgtgctg gtttctttgt 4680 tactatttgt ttggggtttt gttttagttc tttttttttt tcttttcttt tttaaaaata 4740 tgtggctgtg aacttgaatg aacactgctc aaactttctg ctattggggg gggcgggtgg 4800 gatgggaaga aggggcgttt gttttattct tggtgttttc agtgcaataa atagctacaa 4860 acttctgtgc aaaaaaaaaa aaaaa 4885 <210> 9 <211> 109 <212> PRT <213> Homo sapiens <400> 9 Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met 20 25 30 Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val 50 55 60 Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe 65 70 75 80 Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro 85 90 95 Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Val Lys Ala 100 105 <210> 10 <211> 1754 <212> DNA <213> Homo sapiens <400> 10 agccgccctt tcctctttct ttcgcgctct agccacccgg gaaggcctgc ccagcgtagc 60 tgggctctga ttggctgctt tgaaagtcta cgggctaccc gattggtgaa tccggggccc 120 tttagcgcgg atctaccata cccattgact aactatggaa gattatacca aaatagagaa 180 aattggagaa ggtacctatg gagttgtgta taagggtaga cacaaaacta caggtcaagt 240 ggtagccatg aaaaaaatca gactagaaag tgaagaggaa ggggttccta gtactgcaat 300 tcgggaaatt tctctattaa aggaacttcg tcatccaaat atagtcagtc ttcaggatgt 360 gcttatgcag gattccaggt tatatctcat ctttgagttt ctttccatgg atctgaagaa 420 atacttggat tctatccctc ctggtcagta catggattct tcacttgtta aggtaaaagc 480 ttaactaatt ttattaatat ttatgcactg tggatataaa gggactatat atagaagtcc 540 ctgcattttg tgggaatatg cttggaaaaa gtgttagaat aagaaaaagt atttcatttt 600 tctccctcat ggttagttta tacaggttag agatacccat gttattacca gatagtgttt 660 ctagtaagta aaaattagtg cctgagataa catagaactg gtaggtattg ttggaagcta 720 gggtagtctg gtctttcttt ggctgtcaga tacatgtaaa acaaagtaat gaaagcctag 780 ggcagagtgg tggttgtagg tgttttattc cagttttgaa catgttttgg tcaatttatt 840 gtagacattt attatatttc aggtaaatta taaaattgta tagttttaag tactgaagta 900 tataaaagtg tcttattctt gcaccagttc taccaaacca ctctgcagag gtagcgctgt 960 tagttttatt tgtaatctta cacttgtatg tatgttcact ttgtatgtat ataaagattt 1020 ttttttttac acaaggtgga cttatttgca tatgtatata tacatatttt cccttttttg 1080 tgtaaaacat tatcaagacg tagatctacc tatgtctatt tacatttttg atataattaa 1140 accacttcca tattgatgaa catttaaatt attttccaac ttggttattg ttgctcttat 1200 taacagtact gcactgaatg tccttataga tatttatctt cgtatgcaac tttataggat 1260 aaatttttag aatgggaatg atggattgaa gatgtttatt tacattttga tagatattgc 1320 cggttgcccc ctaaaaaact tgtagcaatt tactcttaaa tactcatggt gtgtaatact 1380 tattgtttta gtacatcatt gccaaaactt ggttttatca atctgttaac tatgtgaaaa 1440 aggcatatta agattgtttt aattttatat ttcatgacaa tttaacactt catatttagc 1500 tattataaac cgcctatatt ttcgttagga tacgttcttt aacaatcttg catgactttt 1560 ggactttctg cttttatgtc ttgcttaagt cttcctcact caaagatcga atgtattaga 1620 ataatacatg tcagtatttt tctggtagtt ttagtaagtc ctgtcttcca cacatacttt 1680 ttttgtctta aattctgtat taagatttat tttgacttaa aaactgggat acagattctg 1740 ctttatcttt ttcc 1754 <210> 11 <211> 297 <212> PRT <213> Homo sapiens <400> 11 Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met 20 25 30 Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val 50 55 60 Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe 65 70 75 80 Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro 85 90 95 Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Ser Tyr Leu Tyr Gln Ile 100 105 110 Leu Gln Gly Ile Val Phe Cys His Ser Arg Arg Val Leu His Arg Asp 115 120 125 Leu Lys Pro Gln Asn Leu Leu Ile Asp Asp Lys Gly Thr Ile Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Ile Arg Val Tyr 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ser Pro Glu Val Leu Leu 165 170 175 Gly Ser Ala Arg Tyr Ser Thr Pro Val Asp Ile Trp Ser Ile Gly Thr 180 185 190 Ile Phe Ala Glu Leu Ala Thr Lys Lys Pro Leu Phe His Gly Asp Ser 195 200 205 Glu Ile Asp Gln Leu Phe Arg Ile Phe Arg Ala Leu Gly Thr Pro Asn 210 215 220 Asn Glu Val Trp Pro Glu Val Glu Ser Leu Gln Asp Tyr Lys Asn Thr 225 230 235 240 Phe Pro Lys Trp Lys Pro Gly Ser Leu Ala Ser His Val Lys Asn Leu 245 250 255 Asp Glu Asn Gly Leu Asp Leu Leu Ser Lys Met Leu Ile Tyr Asp Pro 260 265 270 Ala Lys Arg Ile Ser Gly Lys Met Ala Leu Asn His Pro Tyr Phe Asn 275 280 285 Asp Leu Asp Asn Gln Ile Lys Lys Met 290 295 <210> 12 <211> 1923 <212> DNA <213> Homo sapiens <400> 12 agcgcggtga gtttgaaact gctcgcactt ggcttcaaag ctggctcttg gaaattgagc 60 ggagagcgac gcggttgttg tagctgccgc tgcggccgcc gcggaataat aagccgggat 120 ctaccatacc cattgactaa ctatggaaga ttataccaaa atagagaaaa ttggagaagg 180 tacctatgga gttgtgtata agggtagaca caaaactaca ggtcaagtgg tagccatgaa 240 aaaaatcaga ctagaaagtg aagaggaagg ggttcctagt actgcaattc gggaaatttc 300 tctattaaag gaacttcgtc atccaaatat agtcagtctt caggatgtgc ttatgcagga 360 ttccaggtta tatctcatct ttgagtttct ttccatggat ctgaagaaat acttggattc 420 tatccctcct ggtcagtaca tggattcttc acttgttaag agttatttat accaaatcct 480 acaggggatt gtgttttgtc actctagaag agttcttcac agagacttaa aacctcaaaa 540 tctcttgatt gatgacaaag gaacaattaa actggctgat tttggccttg ccagagcttt 600 tggaatacct atcagagtat atacacatga ggtagtaaca ctctggtaca gatctccaga 660 agtattgctg gggtcagctc gttactcaac tccagttgac atttggagta taggcaccat 720 atttgctgaa ctagcaacta agaaaccact tttccatggg gattcagaaa ttgatcaact 780 cttcaggatt ttcagagctt tgggcactcc caataatgaa gtgtggccag aagtggaatc 840 tttacaggac tataagaata catttcccaa atggaaacca ggaagcctag catcccatgt 900 caaaaacttg gatgaaaatg gcttggattt gctctcgaaa atgttaatct atgatccagc 960 caaacgaatt tctggcaaaa tggcactgaa tcatccatat tttaatgatt tggacaatca 1020 gattaagaag atgtagcttt ctgacaaaaa gtttccatat gttatatcaa cagatagttg 1080 tgtttttatt gttaactctt gtctattttt gtcttatata tatttctttg ttatcaaact 1140 tcagctgtac ttcgtcttct aatttcaaaa atataactta aaaatgtaaa tattctatat 1200 gaatttaaat ataattctgt aaatgtgtgt aggtctcact gtaacaacta tttgttacta 1260 taataaaact ataatattga tgtcaggaat caggaaaaaa tttgagttgg cttaaatcat 1320 ctcagtcctt atggcagttt tattttcctg tagttggaac tactaaaatt taggaaaatg 1380 ctaagttcaa gtttcgtaat gctttgaagt atttttatgc tctgaatgtt taaatgttct 1440 catcagtttc ttgccatgtt gttaactata caacctggct aaagatgaat atttttctac 1500 tggtatttta atttttgacc taaatgttta agcattcgga atgagaaaac tatacagatt 1560 tgagaaatga tgctaaattt ataggagttt tcagtaactt aaaaagctaa catgagagca 1620 tgccaaaatt tgctaagtct tacaaagatc aagggctgtc cgcaacaggg aagaacagtt 1680 ttgaaaattt atgaactatc ttatttttag gtaggttttg aaagcttttt gtctaagtga 1740 attcttatgc cttggtcaga gtaataactg aaggagttgc ttatcttggc tttcgagtct 1800 gagtttaaaa ctacacattt tgacatagtg tttattagca gccatctaaa aaggctctaa 1860 tgtatattta actaaaatta ctagctttgg gaattaaact gtttaacaaa taaaaaaaaa 1920 aaa 1923 <210> 13 <211> 240 <212> PRT <213> Homo sapiens <400> 13 Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met 20 25 30 Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val 50 55 60 Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe 65 70 75 80 Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro 85 90 95 Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Val Val Thr Leu Trp Tyr 100 105 110 Arg Ser Pro Glu Val Leu Leu Gly Ser Ala Arg Tyr Ser Thr Pro Val 115 120 125 Asp Ile Trp Ser Ile Gly Thr Ile Phe Ala Glu Leu Ala Thr Lys Lys 130 135 140 Pro Leu Phe His Gly Asp Ser Glu Ile Asp Gln Leu Phe Arg Ile Phe 145 150 155 160 Arg Ala Leu Gly Thr Pro Asn Asn Glu Val Trp Pro Glu Val Glu Ser 165 170 175 Leu Gln Asp Tyr Lys Asn Thr Phe Pro Lys Trp Lys Pro Gly Ser Leu 180 185 190 Ala Ser His Val Lys Asn Leu Asp Glu Asn Gly Leu Asp Leu Leu Ser 195 200 205 Lys Met Leu Ile Tyr Asp Pro Ala Lys Arg Ile Ser Gly Lys Met Ala 210 215 220 Leu Asn His Pro Tyr Phe Asn Asp Leu Asp Asn Gln Ile Lys Lys Met 225 230 235 240 <210> 14 <211> 1752 <212> DNA <213> Homo sapiens <400> 14 agcgcggtga gtttgaaact gctcgcactt ggcttcaaag ctggctcttg gaaattgagc 60 ggagagcgac gcggttgttg tagctgccgc tgcggccgcc gcggaataat aagccgggat 120 ctaccatacc cattgactaa ctatggaaga ttataccaaa atagagaaaa ttggagaagg 180 tacctatgga gttgtgtata agggtagaca caaaactaca ggtcaagtgg tagccatgaa 240 aaaaatcaga ctagaaagtg aagaggaagg ggttcctagt actgcaattc gggaaatttc 300 tctattaaag gaacttcgtc atccaaatat agtcagtctt caggatgtgc ttatgcagga 360 ttccaggtta tatctcatct ttgagtttct ttccatggat ctgaagaaat acttggattc 420 tatccctcct ggtcagtaca tggattcttc acttgttaag gtagtaacac tctggtacag 480 atctccagaa gtattgctgg ggtcagctcg ttactcaact ccagttgaca tttggagtat 540 aggcaccata tttgctgaac tagcaactaa gaaaccactt ttccatgggg attcagaaat 600 tgatcaactc ttcaggattt tcagagcttt gggcactccc aataatgaag tgtggccaga 660 agtggaatct ttacaggact ataagaatac atttcccaaa tggaaaccag gaagcctagc 720 atcccatgtc aaaaacttgg atgaaaatgg cttggatttg ctctcgaaaa tgttaatcta 780 tgatccagcc aaacgaattt ctggcaaaat ggcactgaat catccatatt ttaatgattt 840 ggacaatcag attaagaaga tgtagctttc tgacaaaaag tttccatatg ttatatcaac 900 agatagttgt gtttttattg ttaactcttg tctatttttg tcttatatat atttctttgt 960 tatcaaactt cagctgtact tcgtcttcta atttcaaaaa tataacttaa aaatgtaaat 1020 attctatatg aatttaaata taattctgta aatgtgtgta ggtctcactg taacaactat 1080 ttgttactat aataaaacta taatattgat gtcaggaatc aggaaaaaat ttgagttggc 1140 ttaaatcatc tcagtcctta tggcagtttt attttcctgt agttggaact actaaaattt 1200 aggaaaatgc taagttcaag tttcgtaatg ctttgaagta tttttatgct ctgaatgttt 1260 aaatgttctc atcagtttct tgccatgttg ttaactatac aacctggcta aagatgaata 1320 tttttctact ggtattttaa tttttgacct aaatgtttaa gcattcggaa tgagaaaact 1380 atacagattt gagaaatgat gctaaattta taggagtttt cagtaactta aaaagctaac 1440 atgagagcat gccaaaattt gctaagtctt acaaagatca agggctgtcc gcaacaggga 1500 agaacagttt tgaaaattta tgaactatct tatttttagg taggttttga aagctttttg 1560 tctaagtgaa ttcttatgcc ttggtcagag taataactga aggagttgct tatcttggct 1620 ttcgagtctg agtttaaaac tacacatttt gacatagtgt ttattagcag ccatctaaaa 1680 aggctctaat gtatatttaa ctaaaattac tagctttggg aattaaactg tttaacaaat 1740 aaaaaaaaaa aa 1752 <210> 15 <211> 1583 <212> PRT <213> Homo sapiens <400> 15 Met Ala Gln Ile Leu Pro Val Arg Phe Gln Glu His Phe Gln Leu Gln 1 5 10 15 Asn Leu Gly Ile Asn Pro Ala Asn Ile Gly Phe Ser Thr Leu Thr Met 20 25 30 Glu Ser Asp Lys Phe Ile Cys Ile Arg Glu Lys Val Gly Glu Gln Ala 35 40 45 Gln Val Thr Ile Ile Asp Met Ser Asp Pro Met Ala Pro Ile Arg Arg 50 55 60 Pro Ile Ser Ala Glu Ser Ala Ile Met Asn Pro Ala Ser Lys Val Ile 65 70 75 80 Ala Leu Lys Ala Gly Lys Thr Leu Gln Ile Phe Asn Ile Glu Met Lys 85 90 95 Ser Lys Met Lys Ala His Thr Met Ala Glu Glu Val Ile Phe Trp Lys 100 105 110 Trp Val Ser Val Asn Thr Val Ala Leu Val Thr Glu Thr Ala Val Tyr 115 120 125 His Trp Ser Met Glu Gly Asp Ser Gln Pro Met Lys Met Phe Asp Arg 130 135 140 His Thr Ser Leu Val Gly Cys Gln Val Ile His Tyr Arg Thr Asp Glu 145 150 155 160 Tyr Gln Lys Trp Leu Leu Leu Val Gly Ile Ser Ala Gln Gln Asn Arg 165 170 175 Val Val Gly Ala Met Gln Leu Tyr Ser Val Asp Arg Lys Val Ser Gln 180 185 190 Pro Ile Glu Gly His Ala Ala Ala Phe Ala Glu Phe Lys Met Glu Gly 195 200 205 Asn Ala Lys Pro Ala Thr Leu Phe Cys Phe Ala Val Arg Asn Pro Thr 210 215 220 Gly Gly Lys Leu His Ile Ile Glu Val Gly Gln Pro Ala Ala Gly Asn 225 230 235 240 Gln Pro Phe Val Lys Lys Ala Val Asp Val Phe Phe Pro Pro Glu Ala 245 250 255 Gln Asn Asp Phe Pro Val Ala Met Gln Ile Gly Ala Lys His Gly Val 260 265 270 Ile Tyr Leu Ile Thr Lys Tyr Gly Tyr Leu His Leu Tyr Asp Leu Glu 275 280 285 Ser Gly Val Cys Ile Cys Met Asn Arg Ile Ser Ala Asp Thr Ile Phe 290 295 300 Val Thr Ala Pro His Lys Pro Thr Ser Gly Ile Ile Gly Val Asn Lys 305 310 315 320 Lys Gly Gln Val Leu Ser Val Cys Val Glu Glu Asp Asn Ile Val Asn 325 330 335 Tyr Ala Thr Asn Val Leu Gln Asn Pro Asp Leu Gly Leu Arg Leu Ala 340 345 350 Val Arg Ser Asn Leu Ala Gly Ala Glu Lys Leu Phe Val Arg Lys Phe 355 360 365 Asn Thr Leu Phe Ala Gln Gly Ser Tyr Ala Glu Ala Ala Lys Val Ala 370 375 380 Ala Ser Ala Pro Lys Gly Ile Leu Arg Thr Arg Glu Thr Val Gln Lys 385 390 395 400 Phe Gln Ser Ile Pro Ala Gln Ser Gly Gln Ala Ser Pro Leu Leu Gln 405 410 415 Tyr Phe Gly Ile Leu Leu Asp Gln Gly Gln Leu Asn Lys Leu Glu Ser 420 425 430 Leu Glu Leu Cys His Leu Val Leu Gln Gln Gly Arg Lys Gln Leu Leu 435 440 445 Glu Lys Trp Leu Lys Glu Asp Lys Leu Glu Cys Ser Glu Glu Leu Gly 450 455 460 Asp Leu Val Lys Thr Thr Asp Pro Met Leu Ala Leu Ser Val Tyr Leu 465 470 475 480 Arg Ala Asn Val Pro Ser Lys Val Ile Gln Cys Phe Ala Glu Thr Gly 485 490 495 Gln Phe Gln Lys Ile Val Leu Tyr Ala Lys Lys Val Gly Tyr Thr Pro 500 505 510 Asp Trp Ile Phe Leu Leu Arg Gly Val Met Lys Ile Ser Pro Glu Gln 515 520 525 Gly Leu Gln Phe Ser Arg Met Leu Val Gln Asp Glu Glu Pro Leu Ala 530 535 540 Asn Ile Ser Gln Ile Val Asp Ile Phe Met Glu Asn Ser Leu Ile Gln 545 550 555 560 Gln Cys Thr Ser Phe Leu Leu Asp Ala Leu Lys Asn Asn Arg Pro Ala 565 570 575 Glu Gly Leu Leu Gln Thr Trp Leu Leu Glu Met Asn Leu Val His Ala 580 585 590 Pro Gln Val Ala Asp Ala Ile Leu Gly Asn Lys Met Phe Thr His Tyr 595 600 605 Asp Arg Ala His Ile Ala Gln Leu Cys Glu Lys Ala Gly Leu Leu Gln 610 615 620 Gln Ala Leu Glu His Tyr Thr Asp Leu Tyr Asp Ile Lys Arg Ala Val 625 630 635 640 Val His Thr His Leu Leu Asn Pro Glu Trp Leu Val Asn Phe Phe Gly 645 650 655 Ser Leu Ser Val Glu Asp Ser Val Glu Cys Leu His Ala Met Leu Ser 660 665 670 Ala Asn Ile Arg Gln Asn Leu Gln Leu Cys Val Gln Val Ala Ser Lys 675 680 685 Tyr His Glu Gln Leu Gly Thr Gln Ala Leu Val Glu Leu Phe Glu Ser 690 695 700 Phe Lys Ser Tyr Lys Gly Leu Phe Tyr Phe Leu Gly Ser Ile Val Asn 705 710 715 720 Phe Ser Gln Asp Pro Asp Val His Leu Lys Tyr Ile Gln Ala Ala Cys 725 730 735 Lys Thr Gly Gln Ile Lys Glu Val Glu Arg Ile Cys Arg Glu Ser Ser 740 745 750 Cys Tyr Asn Pro Glu Arg Val Lys Asn Phe Leu Lys Glu Ala Lys Leu 755 760 765 Thr Asp Gln Leu Pro Leu Ile Ile Val Cys Asp Arg Phe Gly Phe Val 770 775 780 His Asp Leu Val Leu Tyr Leu Tyr Arg Asn Asn Leu Gln Arg Tyr Ile 785 790 795 800 Glu Ile Tyr Val Gln Lys Val Asn Pro Ser Arg Thr Pro Ala Val Ile 805 810 815 Gly Gly Leu Leu Asp Val Asp Cys Ser Glu Glu Val Ile Lys His Leu 820 825 830 Ile Met Ala Val Arg Gly Gln Phe Ser Thr Asp Glu Leu Val Ala Glu 835 840 845 Val Glu Lys Arg Asn Arg Leu Lys Leu Leu Leu Pro Trp Leu Glu Ser 850 855 860 Gln Ile Gln Glu Gly Cys Glu Glu Pro Ala Thr His Asn Ala Leu Ala 865 870 875 880 Lys Ile Tyr Ile Asp Ser Asn Asn Ser Pro Glu Cys Phe Leu Arg Glu 885 890 895 Asn Ala Tyr Tyr Asp Ser Ser Val Val Gly Arg Tyr Cys Glu Lys Arg 900 905 910 Asp Pro His Leu Ala Cys Val Ala Tyr Glu Arg Gly Gln Cys Asp Leu 915 920 925 Glu Leu Ile Lys Val Cys Asn Glu Asn Ser Leu Phe Lys Ser Glu Ala 930 935 940 Arg Tyr Leu Val Cys Arg Lys Asp Pro Glu Leu Trp Ala His Val Leu 945 950 955 960 Glu Glu Thr Asn Pro Ser Arg Arg Gln Leu Ile Asp Gln Val Val Gln 965 970 975 Thr Ala Leu Ser Glu Thr Arg Asp Pro Glu Glu Ile Ser Val Thr Val 980 985 990 Lys Ala Phe Met Thr Ala Asp Leu Pro Asn Glu Leu Ile Glu Leu Leu 995 1000 1005 Glu Lys Ile Val Leu Asp Asn Ser Val Phe Ser Glu His Arg Asn 1010 1015 1020 Leu Gln Asn Leu Leu Ile Leu Thr Ala Ile Lys Ala Asp Arg Thr 1025 1030 1035 Arg Val Met Glu Tyr Ile Ser Arg Leu Asp Asn Tyr Asp Ala Leu 1040 1045 1050 Asp Ile Ala Ser Ile Ala Val Ser Ser Ala Leu Tyr Glu Glu Ala 1055 1060 1065 Phe Thr Val Phe His Lys Phe Asp Met Asn Ala Ser Ala Ile Gln 1070 1075 1080 Val Leu Ile Glu His Ile Gly Asn Leu Asp Arg Ala Tyr Glu Phe 1085 1090 1095 Ala Glu Arg Cys Asn Glu Pro Ala Val Trp Ser Gln Leu Ala Gln 1100 1105 1110 Ala Gln Leu Gln Lys Asp Leu Val Lys Glu Ala Ile Asn Ser Tyr 1115 1120 1125 Ile Arg Gly Asp Asp Pro Ser Ser Tyr Leu Glu Val Val Gln Ser 1130 1135 1140 Ala Ser Arg Ser Asn Asn Trp Glu Asp Leu Val Lys Phe Leu Gln 1145 1150 1155 Met Ala Arg Lys Lys Gly Arg Glu Ser Tyr Ile Glu Thr Glu Leu 1160 1165 1170 Ile Phe Ala Leu Ala Lys Thr Ser Arg Val Ser Glu Leu Glu Asp 1175 1180 1185 Phe Ile Asn Gly Pro Asn Asn Ala His Ile Gln Gln Val Gly Asp 1190 1195 1200 Arg Cys Tyr Glu Glu Gly Met Tyr Glu Ala Ala Lys Leu Leu Tyr 1205 1210 1215 Ser Asn Val Ser Asn Phe Ala Arg Leu Ala Ser Thr Leu Val His 1220 1225 1230 Leu Gly Glu Tyr Gln Ala Ala Val Asp Asn Ser Arg Lys Ala Ser 1235 1240 1245 Ser Thr Arg Thr Trp Lys Glu Val Cys Phe Ala Cys Met Asp Gly 1250 1255 1260 Gln Glu Phe Arg Phe Ala Gln Leu Cys Gly Leu His Ile Val Ile 1265 1270 1275 His Ala Asp Glu Leu Glu Glu Leu Met Cys Tyr Tyr Gln Asp Arg 1280 1285 1290 Gly Tyr Phe Glu Glu Leu Ile Leu Leu Leu Glu Ala Ala Leu Gly 1295 1300 1305 Leu Glu Arg Ala His Met Gly Met Phe Thr Glu Leu Ala Ile Leu 1310 1315 1320 Tyr Ser Lys Phe Lys Pro Gln Lys Met Leu Glu His Leu Glu Leu 1325 1330 1335 Phe Trp Ser Arg Val Asn Ile Pro Lys Val Leu Arg Ala Ala Glu 1340 1345 1350 Gln Ala His Leu Trp Ala Glu Leu Val Phe Leu Tyr Asp Lys Tyr 1355 1360 1365 Glu Glu Tyr Asp Asn Ala Val Leu Thr Met Met Ser His Pro Thr 1370 1375 1380 Glu Ala Trp Lys Glu Gly Gln Phe Lys Asp Ile Ile Thr Lys Val 1385 1390 1395 Ala Asn Val Glu Leu Cys Tyr Arg Ala Leu Gln Phe Tyr Leu Asp 1400 1405 1410 Tyr Lys Pro Leu Leu Ile Asn Asp Leu Leu Leu Val Leu Ser Pro 1415 1420 1425 Arg Leu Asp His Thr Trp Thr Val Ser Phe Phe Ser Lys Ala Gly 1430 1435 1440 Gln Leu Pro Leu Val Lys Pro Tyr Leu Arg Ser Val Gln Ser His 1445 1450 1455 Asn Asn Lys Ser Val Asn Glu Ala Leu Asn His Leu Leu Thr Glu 1460 1465 1470 Glu Glu Asp Tyr Gln Asp Ala Met Gln His Ala Ala Glu Ser Arg 1475 1480 1485 Asp Ala Glu Leu Ala Gln Lys Leu Leu Gln Trp Phe Leu Glu Glu 1490 1495 1500 Gly Lys Arg Glu Cys Phe Ala Ala Cys Leu Phe Thr Cys Tyr Asp 1505 1510 1515 Leu Leu Arg Pro Asp Met Val Leu Glu Leu Ala Trp Arg His Asn 1520 1525 1530 Leu Val Asp Leu Ala Met Pro Tyr Phe Ile Gln Val Met Arg Glu 1535 1540 1545 Tyr Leu Ser Lys Val Asp Lys Leu Asp Ala Leu Glu Ser Leu Arg 1550 1555 1560 Lys Gln Glu Glu His Val Thr Glu Pro Ala Pro Leu Val Phe Asp 1565 1570 1575 Phe Asp Gly His Glu 1580 <210> 16 <211> 5371 <212> DNA <213> Homo sapiens <400> 16 accggtcagc ccgcgcgagg ggtcggcgtt cattcctgcc gctgccgccg ccgccgccga 60 ggtcccgcac cagccatggc gcagatcctc cctgttcgct ttcaggagca cttccagctc 120 caaaaccttg gaattaatcc agctaacatt ggattcagca cactgaccat ggaatctgac 180 aagttcatat gtatccgaga gaaagttggt gagcaggcac aggtcacgat cattgacatg 240 agtgacccaa tggctccgat ccgacggcct atctctgcag agagtgccat catgaatcca 300 gcctctaagg tgatagctct gaaagctggg aagacacttc agatctttaa tattgagatg 360 aagagtaaaa tgaaggctca tactatggca gaagaagtga ttttctggaa atgggtttct 420 gtgaacactg ttgccttggt gaccgagacc gcggtctacc actggagcat ggaaggtgac 480 tcccagccca tgaagatgtt tgatagacat accagtctgg tgggctgcca ggtgattcac 540 taccggactg atgagtacca gaagtggctg ctgctcgtag gcatctcggc tcagcaaaac 600 cgtgtggttg gagcaatgca gctctactct gtggatagga aggtttcaca acccatagaa 660 ggccatgctg cggcttttgc agagttcaag atggagggga atgccaagcc tgccaccctt 720 ttctgctttg ctgtacgtaa tcccacagga ggcaagttgc acatcattga agttggacag 780 cctgcagcgg gaaaccaacc ttttgtaaag aaagcagtag atgtgttttt tcctccagag 840 gcacagaatg attttccagt ggctatgcag attggagcta aacatggtgt tatttacttg 900 atcacaaagt atggctatct tcatctgtac gacctagagt ctggcgtgtg catctgcatg 960 aaccgtatta gtgctgacac aatatttgtc actgctccac acaaaccaac ctctggaatt 1020 attggtgtca acaaaaaggg acaggtactg tcagtttgtg ttgaggaaga taacattgtg 1080 aattatgcaa ccaacgtgct tcagaatcca gaccttggtc tgcgtttggc cgttcgtagt 1140 aacctggctg gggcagagaa gttgtttgtg agaaaattca ataccctctt tgcacagggc 1200 agctatgctg aagccgccaa agttgcagcg tctgcaccaa agggaatcct gcgtaccaga 1260 gagacggtcc agaaattcca gagtataccc gctcagtctg gccaggcttc tccattgctg 1320 cagtacttcg gaatcctgct cgaccagggt cagctcaata aacttgaatc cttagaactt 1380 tgccatctgg ttcttcagca ggggcgtaag caactcctag agaagtggct gaaagaagat 1440 aagctggagt gctcagagga gctcggagac ttggtcaaaa ccactgaccc catgctcgct 1500 ctgagtgtgt accttcgggc aaatgtgcca agcaaagtga tccagtgttt tgcagaaaca 1560 ggccaattcc agaaaattgt gctctatgcc aaaaaggttg ggtacacccc agactggatc 1620 tttctgctga ggggtgtaat gaagatcagt ccggaacagg gcctgcagtt ttctcgaatg 1680 ctagtgcagg acgaggagcc gctggccaac attagccaga ttgtggacat tttcatggaa 1740 aacagtttaa ttcagcagtg tacttccttc ttattggatg ccttgaagaa taatcgccca 1800 gctgagggac tcctgcagac atggctgttg gagatgaacc ttgttcatgc accccaggtt 1860 gcagatgcca tccttggaaa taaaatgttt actcattacg accgggccca cattgcccag 1920 ctctgtgaga aggcaggcct cctgcagcaa gcactggagc actacaccga cctctatgac 1980 atcaagaggg ctgtggtcca cactcacctc ctcaatcccg agtggcttgt caatttcttt 2040 ggctccttat cggtggagga ttctgtggag tgtctgcatg ccatgctgtc tgctaacatc 2100 agacagaacc ttcagctgtg tgtgcaggtg gcctctaagt accacgagca gctgggcacg 2160 caggccctgg tggagctctt tgaatccttc aagagttaca aaggcctctt ctacttcctg 2220 ggctcaatcg tgaacttcag ccaagaccca gatgtgcatc tgaaatacat tcaggctgcc 2280 tgtaagacag ggcagatcaa ggaggtggag aggatatgcc gagagagcag ctgctacaac 2340 ccagagcgtg tgaagaactt cctgaaggag gccaagctca cagaccagct tcccctcatc 2400 atcgtgtgtg atcgttttgg ctttgtccat gaccttgtcc tatatttata ccgcaacaac 2460 ctgcagaggt acattgagat ctacgtgcag aaggtcaacc ctagccggac cccagctgtg 2520 attggagggc tgcttgatgt ggattgttct gaggaagtga ttaaacactt aatcatggca 2580 gtgagaggac agttctctac tgatgagttg gtggctgaag tagaaaaaag aaataggctc 2640 aagctgctgc ttccctggct ggagtcccag attcaggaag gctgtgagga gcctgccact 2700 cacaatgcac tggctaaaat ctacatcgac agcaacaaca gccccgagtg cttcctgaga 2760 gagaatgcct actatgacag cagcgtggtg ggccgctact gtgagaagcg agacccccat 2820 ctggcctgtg ttgcctatga gcgggggcag tgtgaccttg agctcatcaa ggtgtgcaat 2880 gagaattctc tgttcaaaag cgaggcccgc tacctggtat gcagaaagga tccggagctc 2940 tgggctcacg tccttgagga gaccaaccca tccaggagac agctaattga ccaggtggta 3000 cagacagcat tgtcagaaac acgggatcct gaagagattt cggtcactgt caaagccttt 3060 atgacagccg acctgcctaa tgaactgatt gaactgctgg agaagatagt tctggataac 3120 tctgtcttca gcgagcacag gaatctacag aatctgttga tcctgactgc catcaaggca 3180 gaccgcacac gggtcatgga gtacatcagc cgcctggaca actatgacgc actggacatc 3240 gcgagcatcg ctgtcagcag cgcactgtat gaggaggcct tcaccgtttt ccacaagttt 3300 gatatgaatg cctcagcaat ccaggtcctg atcgagcaca ttggaaacct ggaccgggca 3360 tatgagtttg cggagagatg caatgagcct gctgtgtgga gtcagctggc ccaagcccag 3420 ctccagaaag atttggtgaa ggaagccatc aactcctata tcagagggga cgacccttcc 3480 tcttacctgg aagttgttca gtcagccagc aggagcaaca actgggagga tctagttaaa 3540 tttctgcaga tggccaggaa aaagggccgt gagtcctata tagagactga acttattttt 3600 gccttggcta aaaccagccg tgtttctgag ctagaagatt ttattaatgg acccaacaat 3660 gcccacatcc agcaggttgg agaccgctgt tacgaggagg gaatgtacga ggctgccaag 3720 ctgctctata gcaatgtttc taactttgcc cgcctggctt ccaccttggt tcacctcggt 3780 gagtatcagg cagcagtgga caacagccgc aaggccagca gcacccggac gtggaaggag 3840 gtgtgctttg cctgcatgga tggacaagag ttccgcttcg cacagctgtg tggtcttcac 3900 atcgtcattc atgcagatga gctggaggag ctgatgtgct attaccagga tcgtggctac 3960 tttgaggagc tgatcttgct gttggaagcg gccctgggcc tggagcgggc ccacatgggc 4020 atgttcactg agctggccat cctctactcc aaattcaagc cacagaagat gctggagcat 4080 ctggagcttt tctggtcccg tgtcaacatc ccaaaggtgc tgagggctgc agagcaggca 4140 cacctgtggg ctgagctggt gttcctctat gacaagtacg aggagtatga caatgctgtg 4200 ctcaccatga tgagccaccc cactgaggcc tggaaggagg gtcagttcaa ggacatcatt 4260 accaaggttg ccaacgtcga gctctgttac agagccctgc agttctattt ggattacaaa 4320 ccactgctca tcaatgacct gctgctggtg ctttcacccc ggctggacca cacctggaca 4380 gtcagtttct tttcaaaggc aggtcagctg cccctggtga agccttacct gcggtcagtc 4440 cagagccaca acaacaagag tgtgaatgag gcactcaacc acctgctgac agaggaggag 4500 gactatcagg atgccatgca gcatgctgca gagtcgcggg atgctgagct ggcccagaag 4560 ttgctgcagt ggttcctgga ggaaggcaag agggagtgct tcgcagcttg tctcttcacc 4620 tgctatgacc tgcttcgccc agacatggtg cttgagctgg cctggaggca caacctcgtg 4680 gacttggcca tgccctactt catccaggtg atgagggagt acctgagcaa ggtggacaaa 4740 ctggatgcct tggagagtct gcgcaagcaa gaggagcatg tgacagagcc tgcccctctc 4800 gtgtttgatt ttgatgggca tgaatgagac ccagctgatt gcactaagcc ctgccgtggg 4860 cccagcccct gccagcttcc cctatggata tgcctctgct cccaacttcg ccagcctcca 4920 atgtacaact tccgcgtgta gtgggcgttg tcaccaccca ccctacctgc agagttacta 4980 acttctccaa ggagcatgtc actccagcag cacaggggac gcaatgggag gcagggacac 5040 ctggacaata tttatttttg ctgaaaccca atgacggcaa cctctgagcc atcccagagc 5100 ctggggaggc cagggtagag gctgacggcg caagaccagc tttagccgac aacagagact 5160 ggactgtggg ccctcctgct ggagccaggc cttcctcctg ggcgcctccg actggctgga 5220 gctgccccct ccaggccagt ttgaagacta catgaacacg tcttgtttgg aggtaccgga 5280 cctcataaaa ggactctcag cctcttggca atcataaata ttaaagtcgg tttatccagg 5340 caaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 5371 <210> 17 <211> 1640 <212> PRT <213> Homo sapiens <400> 17 Met Ala Gln Ile Leu Pro Val Arg Phe Gln Glu His Phe Gln Leu Gln 1 5 10 15 Asn Leu Gly Ile Asn Pro Ala Asn Ile Gly Phe Ser Thr Leu Thr Met 20 25 30 Glu Ser Asp Lys Phe Ile Cys Ile Arg Glu Lys Val Gly Glu Gln Ala 35 40 45 Gln Val Thr Ile Ile Asp Met Ser Asp Pro Met Ala Pro Ile Arg Arg 50 55 60 Pro Ile Ser Ala Glu Ser Ala Ile Met Asn Pro Ala Ser Lys Val Ile 65 70 75 80 Ala Leu Lys Ala Gly Lys Thr Leu Gln Ile Phe Asn Ile Glu Met Lys 85 90 95 Ser Lys Met Lys Ala His Thr Met Ala Glu Glu Val Ile Phe Trp Lys 100 105 110 Trp Val Ser Val Asn Thr Val Ala Leu Val Thr Glu Thr Ala Val Tyr 115 120 125 His Trp Ser Met Glu Gly Asp Ser Gln Pro Met Lys Met Phe Asp Arg 130 135 140 His Thr Ser Leu Val Gly Cys Gln Val Ile His Tyr Arg Thr Asp Glu 145 150 155 160 Tyr Gln Lys Trp Leu Leu Leu Val Gly Ile Ser Ala Gln Gln Asn Arg 165 170 175 Val Val Gly Ala Met Gln Leu Tyr Ser Val Asp Arg Lys Val Ser Gln 180 185 190 Pro Ile Glu Gly His Ala Ala Ala Phe Ala Glu Phe Lys Met Glu Gly 195 200 205 Asn Ala Lys Pro Ala Thr Leu Phe Cys Phe Ala Val Arg Asn Pro Thr 210 215 220 Gly Gly Lys Leu His Ile Ile Glu Val Gly Gln Pro Ala Ala Gly Asn 225 230 235 240 Gln Pro Phe Val Lys Lys Ala Val Asp Val Phe Phe Pro Pro Glu Ala 245 250 255 Gln Asn Asp Phe Pro Val Ala Met Gln Ile Gly Ala Lys His Gly Val 260 265 270 Ile Tyr Leu Ile Thr Lys Tyr Gly Tyr Leu His Leu Tyr Asp Leu Glu 275 280 285 Ser Gly Val Cys Ile Cys Met Asn Arg Ile Ser Ala Asp Thr Ile Phe 290 295 300 Val Thr Ala Pro His Lys Pro Thr Ser Gly Ile Ile Gly Val Asn Lys 305 310 315 320 Lys Gly Gln Val Leu Ser Val Cys Val Glu Glu Asp Asn Ile Val Asn 325 330 335 Tyr Ala Thr Asn Val Leu Gln Asn Pro Asp Leu Gly Leu Arg Leu Ala 340 345 350 Val Arg Ser Asn Leu Ala Gly Ala Glu Lys Leu Phe Val Arg Lys Phe 355 360 365 Asn Thr Leu Phe Ala Gln Gly Ser Tyr Ala Glu Ala Ala Lys Val Ala 370 375 380 Ala Ser Ala Pro Lys Gly Ile Leu Arg Thr Arg Glu Thr Val Gln Lys 385 390 395 400 Phe Gln Ser Ile Pro Ala Gln Ser Gly Gln Ala Ser Pro Leu Leu Gln 405 410 415 Tyr Phe Gly Ile Leu Leu Asp Gln Gly Gln Leu Asn Lys Leu Glu Ser 420 425 430 Leu Glu Leu Cys His Leu Val Leu Gln Gln Gly Arg Lys Gln Leu Leu 435 440 445 Glu Lys Trp Leu Lys Glu Asp Lys Leu Glu Cys Ser Glu Glu Leu Gly 450 455 460 Asp Leu Val Lys Thr Thr Asp Pro Met Leu Ala Leu Ser Val Tyr Leu 465 470 475 480 Arg Ala Asn Val Pro Ser Lys Val Ile Gln Cys Phe Ala Glu Thr Gly 485 490 495 Gln Phe Gln Lys Ile Val Leu Tyr Ala Lys Lys Val Gly Tyr Thr Pro 500 505 510 Asp Trp Ile Phe Leu Leu Arg Gly Val Met Lys Ile Ser Pro Glu Gln 515 520 525 Gly Leu Gln Phe Ser Arg Met Leu Val Gln Asp Glu Glu Pro Leu Ala 530 535 540 Asn Ile Ser Gln Ile Val Asp Ile Phe Met Glu Asn Ser Leu Ile Gln 545 550 555 560 Gln Cys Thr Ser Phe Leu Leu Asp Ala Leu Lys Asn Asn Arg Pro Ala 565 570 575 Glu Gly Leu Leu Gln Thr Trp Leu Leu Glu Met Asn Leu Val His Ala 580 585 590 Pro Gln Val Ala Asp Ala Ile Leu Gly Asn Lys Met Phe Thr His Tyr 595 600 605 Asp Arg Ala His Ile Ala Gln Leu Cys Glu Lys Ala Gly Leu Leu Gln 610 615 620 Gln Ala Leu Glu His Tyr Thr Asp Leu Tyr Asp Ile Lys Arg Ala Val 625 630 635 640 Val His Thr His Leu Leu Asn Pro Glu Trp Leu Val Asn Phe Phe Gly 645 650 655 Ser Leu Ser Val Glu Asp Ser Val Glu Cys Leu His Ala Met Leu Ser 660 665 670 Ala Asn Ile Arg Gln Asn Leu Gln Leu Cys Val Gln Val Ala Ser Lys 675 680 685 Tyr His Glu Gln Leu Gly Thr Gln Ala Leu Val Glu Leu Phe Glu Ser 690 695 700 Phe Lys Ser Tyr Lys Gly Leu Phe Tyr Phe Leu Gly Ser Ile Val Asn 705 710 715 720 Phe Ser Gln Asp Pro Asp Val His Leu Lys Tyr Ile Gln Ala Ala Cys 725 730 735 Lys Thr Gly Gln Ile Lys Glu Val Glu Arg Ile Cys Arg Glu Ser Ser 740 745 750 Cys Tyr Asn Pro Glu Arg Val Lys Asn Phe Leu Lys Glu Ala Lys Leu 755 760 765 Thr Asp Gln Leu Pro Leu Ile Ile Val Cys Asp Arg Phe Gly Phe Val 770 775 780 His Asp Leu Val Leu Tyr Leu Tyr Arg Asn Asn Leu Gln Arg Tyr Ile 785 790 795 800 Glu Ile Tyr Val Gln Lys Val Asn Pro Ser Arg Thr Pro Ala Val Ile 805 810 815 Gly Gly Leu Leu Asp Val Asp Cys Ser Glu Glu Val Ile Lys His Leu 820 825 830 Ile Met Ala Val Arg Gly Gln Phe Ser Thr Asp Glu Leu Val Ala Glu 835 840 845 Val Glu Lys Arg Asn Arg Leu Lys Leu Leu Leu Pro Trp Leu Glu Ser 850 855 860 Gln Ile Gln Glu Gly Cys Glu Glu Pro Ala Thr His Asn Ala Leu Ala 865 870 875 880 Lys Ile Tyr Ile Asp Ser Asn Asn Ser Pro Glu Cys Phe Leu Arg Glu 885 890 895 Asn Ala Tyr Tyr Asp Ser Ser Val Val Gly Arg Tyr Cys Glu Lys Arg 900 905 910 Asp Pro His Leu Ala Cys Val Ala Tyr Glu Arg Gly Gln Cys Asp Leu 915 920 925 Glu Leu Ile Lys Val Cys Asn Glu Asn Ser Leu Phe Lys Ser Glu Ala 930 935 940 Arg Tyr Leu Val Cys Arg Lys Asp Pro Glu Leu Trp Ala His Val Leu 945 950 955 960 Glu Glu Thr Asn Pro Ser Arg Arg Gln Leu Ile Asp Gln Val Val Gln 965 970 975 Thr Ala Leu Ser Glu Thr Arg Asp Pro Glu Glu Ile Ser Val Thr Val 980 985 990 Lys Ala Phe Met Thr Ala Asp Leu Pro Asn Glu Leu Ile Glu Leu Leu 995 1000 1005 Glu Lys Ile Val Leu Asp Asn Ser Val Phe Ser Glu His Arg Asn 1010 1015 1020 Leu Gln Asn Leu Leu Ile Leu Thr Ala Ile Lys Ala Asp Arg Thr 1025 1030 1035 Arg Val Met Glu Tyr Ile Ser Arg Leu Asp Asn Tyr Asp Ala Leu 1040 1045 1050 Asp Ile Ala Ser Ile Ala Val Ser Ser Ala Leu Tyr Glu Glu Ala 1055 1060 1065 Phe Thr Val Phe His Lys Phe Asp Met Asn Ala Ser Ala Ile Gln 1070 1075 1080 Val Leu Ile Glu His Ile Gly Asn Leu Asp Arg Ala Tyr Glu Phe 1085 1090 1095 Ala Glu Arg Cys Asn Glu Pro Ala Val Trp Ser Gln Leu Ala Gln 1100 1105 1110 Ala Gln Leu Gln Lys Asp Leu Val Lys Glu Ala Ile Asn Ser Tyr 1115 1120 1125 Ile Arg Gly Asp Asp Pro Ser Ser Tyr Leu Glu Val Val Gln Ser 1130 1135 1140 Ala Ser Arg Ser Asn Asn Trp Glu Asp Leu Val Lys Phe Leu Gln 1145 1150 1155 Met Ala Arg Lys Lys Gly Arg Glu Ser Tyr Ile Glu Thr Glu Leu 1160 1165 1170 Ile Phe Ala Leu Ala Lys Thr Ser Arg Val Ser Glu Leu Glu Asp 1175 1180 1185 Phe Ile Asn Gly Pro Asn Asn Ala His Ile Gln Gln Val Gly Asp 1190 1195 1200 Arg Cys Tyr Glu Glu Gly Met Tyr Glu Ala Ala Lys Leu Leu Tyr 1205 1210 1215 Ser Asn Val Ser Asn Phe Ala Arg Leu Ala Ser Thr Leu Val His 1220 1225 1230 Leu Gly Glu Tyr Gln Ala Ala Val Asp Asn Ser Arg Lys Ala Ser 1235 1240 1245 Ser Thr Arg Thr Trp Lys Glu Val Cys Phe Ala Cys Met Asp Gly 1250 1255 1260 Gln Glu Phe Arg Phe Ala Gln Leu Cys Gly Leu His Ile Val Ile 1265 1270 1275 His Ala Asp Glu Leu Glu Glu Leu Met Cys Tyr Tyr Gln Asp Arg 1280 1285 1290 Gly Tyr Phe Glu Glu Leu Ile Leu Leu Leu Glu Ala Ala Leu Gly 1295 1300 1305 Leu Glu Arg Ala His Met Gly Met Phe Thr Glu Leu Ala Ile Leu 1310 1315 1320 Tyr Ser Lys Phe Lys Pro Gln Lys Met Leu Glu His Leu Glu Leu 1325 1330 1335 Phe Trp Ser Arg Val Asn Ile Pro Lys Val Leu Arg Ala Ala Glu 1340 1345 1350 Gln Ala His Leu Trp Ala Glu Leu Val Phe Leu Tyr Asp Lys Tyr 1355 1360 1365 Glu Glu Tyr Asp Asn Ala Val Leu Thr Met Met Ser His Pro Thr 1370 1375 1380 Glu Ala Trp Lys Glu Gly Gln Phe Lys Asp Ile Ile Thr Lys Val 1385 1390 1395 Ala Asn Val Glu Leu Cys Tyr Arg Ala Leu Gln Phe Tyr Leu Asp 1400 1405 1410 Tyr Lys Pro Leu Leu Ile Asn Asp Leu Leu Leu Val Leu Ser Pro 1415 1420 1425 Arg Leu Asp His Thr Trp Thr Val Ser Phe Phe Ser Lys Ala Gly 1430 1435 1440 Gln Leu Pro Leu Val Lys Pro Tyr Leu Arg Ser Val Gln Ser His 1445 1450 1455 Asn Asn Lys Ser Val Asn Glu Ala Leu Asn His Leu Leu Thr Glu 1460 1465 1470 Glu Glu Asp Tyr Gln Gly Leu Arg Ala Ser Ile Asp Ala Tyr Asp 1475 1480 1485 Asn Phe Asp Asn Ile Ser Leu Ala Gln Gln Leu Glu Lys His Gln 1490 1495 1500 Leu Met Glu Phe Arg Cys Ile Ala Ala Tyr Leu Tyr Lys Gly Asn 1505 1510 1515 Asn Trp Trp Ala Gln Ser Val Glu Leu Cys Lys Lys Asp His Leu 1520 1525 1530 Tyr Lys Asp Ala Met Gln His Ala Ala Glu Ser Arg Asp Ala Glu 1535 1540 1545 Leu Ala Gln Lys Leu Leu Gln Trp Phe Leu Glu Glu Gly Lys Arg 1550 1555 1560 Glu Cys Phe Ala Ala Cys Leu Phe Thr Cys Tyr Asp Leu Leu Arg 1565 1570 1575 Pro Asp Met Val Leu Glu Leu Ala Trp Arg His Asn Leu Val Asp 1580 1585 1590 Leu Ala Met Pro Tyr Phe Ile Gln Val Met Arg Glu Tyr Leu Ser 1595 1600 1605 Lys Val Asp Lys Leu Asp Ala Leu Glu Ser Leu Arg Lys Gln Glu 1610 1615 1620 Glu His Val Thr Glu Pro Ala Pro Leu Val Phe Asp Phe Asp Gly 1625 1630 1635 His Glu 1640 <210> 18 <211> 5542 <212> DNA <213> Homo sapiens <400> 18 accggtcagc ccgcgcgagg ggtcggcgtt cattcctgcc gctgccgccg ccgccgccga 60 ggtcccgcac cagccatggc gcagatcctc cctgttcgct ttcaggagca cttccagctc 120 caaaaccttg gaattaatcc agctaacatt ggattcagca cactgaccat ggaatctgac 180 aagttcatat gtatccgaga gaaagttggt gagcaggcac aggtcacgat cattgacatg 240 agtgacccaa tggctccgat ccgacggcct atctctgcag agagtgccat catgaatcca 300 gcctctaagg tgatagctct gaaagctggg aagacacttc agatctttaa tattgagatg 360 aagagtaaaa tgaaggctca tactatggca gaagaagtga ttttctggaa atgggtttct 420 gtgaacactg ttgccttggt gaccgagacc gcggtctacc actggagcat ggaaggtgac 480 tcccagccca tgaagatgtt tgatagacat accagtctgg tgggctgcca ggtgattcac 540 taccggactg atgagtacca gaagtggctg ctgctcgtag gcatctcggc tcagcaaaac 600 cgtgtggttg gagcaatgca gctctactct gtggatagga aggtttcaca acccatagaa 660 ggccatgctg cggcttttgc agagttcaag atggagggga atgccaagcc tgccaccctt 720 ttctgctttg ctgtacgtaa tcccacagga ggcaagttgc acatcattga agttggacag 780 cctgcagcgg gaaaccaacc ttttgtaaag aaagcagtag atgtgttttt tcctccagag 840 gcacagaatg attttccagt ggctatgcag attggagcta aacatggtgt tatttacttg 900 atcacaaagt atggctatct tcatctgtac gacctagagt ctggcgtgtg catctgcatg 960 aaccgtatta gtgctgacac aatatttgtc actgctccac acaaaccaac ctctggaatt 1020 attggtgtca acaaaaaggg acaggtactg tcagtttgtg ttgaggaaga taacattgtg 1080 aattatgcaa ccaacgtgct tcagaatcca gaccttggtc tgcgtttggc cgttcgtagt 1140 aacctggctg gggcagagaa gttgtttgtg agaaaattca ataccctctt tgcacagggc 1200 agctatgctg aagccgccaa agttgcagcg tctgcaccaa agggaatcct gcgtaccaga 1260 gagacggtcc agaaattcca gagtataccc gctcagtctg gccaggcttc tccattgctg 1320 cagtacttcg gaatcctgct cgaccagggt cagctcaata aacttgaatc cttagaactt 1380 tgccatctgg ttcttcagca ggggcgtaag caactcctag agaagtggct gaaagaagat 1440 aagctggagt gctcagagga gctcggagac ttggtcaaaa ccactgaccc catgctcgct 1500 ctgagtgtgt accttcgggc aaatgtgcca agcaaagtga tccagtgttt tgcagaaaca 1560 ggccaattcc agaaaattgt gctctatgcc aaaaaggttg ggtacacccc agactggatc 1620 tttctgctga ggggtgtaat gaagatcagt ccggaacagg gcctgcagtt ttctcgaatg 1680 ctagtgcagg acgaggagcc gctggccaac attagccaga ttgtggacat tttcatggaa 1740 aacagtttaa ttcagcagtg tacttccttc ttattggatg ccttgaagaa taatcgccca 1800 gctgagggac tcctgcagac atggctgttg gagatgaacc ttgttcatgc accccaggtt 1860 gcagatgcca tccttggaaa taaaatgttt actcattacg accgggccca cattgcccag 1920 ctctgtgaga aggcaggcct cctgcagcaa gcactggagc actacaccga cctctatgac 1980 atcaagaggg ctgtggtcca cactcacctc ctcaatcccg agtggcttgt caatttcttt 2040 ggctccttat cggtggagga ttctgtggag tgtctgcatg ccatgctgtc tgctaacatc 2100 agacagaacc ttcagctgtg tgtgcaggtg gcctctaagt accacgagca gctgggcacg 2160 caggccctgg tggagctctt tgaatccttc aagagttaca aaggcctctt ctacttcctg 2220 ggctcaatcg tgaacttcag ccaagaccca gatgtgcatc tgaaatacat tcaggctgcc 2280 tgtaagacag ggcagatcaa ggaggtggag aggatatgcc gagagagcag ctgctacaac 2340 ccagagcgtg tgaagaactt cctgaaggag gccaagctca cagaccagct tcccctcatc 2400 atcgtgtgtg atcgttttgg ctttgtccat gaccttgtcc tatatttata ccgcaacaac 2460 ctgcagaggt acattgagat ctacgtgcag aaggtcaacc ctagccggac cccagctgtg 2520 attggagggc tgcttgatgt ggattgttct gaggaagtga ttaaacactt aatcatggca 2580 gtgagaggac agttctctac tgatgagttg gtggctgaag tagaaaaaag aaataggctc 2640 aagctgctgc ttccctggct ggagtcccag attcaggaag gctgtgagga gcctgccact 2700 cacaatgcac tggctaaaat ctacatcgac agcaacaaca gccccgagtg cttcctgaga 2760 gagaatgcct actatgacag cagcgtggtg ggccgctact gtgagaagcg agacccccat 2820 ctggcctgtg ttgcctatga gcgggggcag tgtgaccttg agctcatcaa ggtgtgcaat 2880 gagaattctc tgttcaaaag cgaggcccgc tacctggtat gcagaaagga tccggagctc 2940 tgggctcacg tccttgagga gaccaaccca tccaggagac agctaattga ccaggtggta 3000 cagacagcat tgtcagaaac acgggatcct gaagagattt cggtcactgt caaagccttt 3060 atgacagccg acctgcctaa tgaactgatt gaactgctgg agaagatagt tctggataac 3120 tctgtcttca gcgagcacag gaatctacag aatctgttga tcctgactgc catcaaggca 3180 gaccgcacac gggtcatgga gtacatcagc cgcctggaca actatgacgc actggacatc 3240 gcgagcatcg ctgtcagcag cgcactgtat gaggaggcct tcaccgtttt ccacaagttt 3300 gatatgaatg cctcagcaat ccaggtcctg atcgagcaca ttggaaacct ggaccgggca 3360 tatgagtttg cggagagatg caatgagcct gctgtgtgga gtcagctggc ccaagcccag 3420 ctccagaaag atttggtgaa ggaagccatc aactcctata tcagagggga cgacccttcc 3480 tcttacctgg aagttgttca gtcagccagc aggagcaaca actgggagga tctagttaaa 3540 tttctgcaga tggccaggaa aaagggccgt gagtcctata tagagactga acttattttt 3600 gccttggcta aaaccagccg tgtttctgag ctagaagatt ttattaatgg acccaacaat 3660 gcccacatcc agcaggttgg agaccgctgt tacgaggagg gaatgtacga ggctgccaag 3720 ctgctctata gcaatgtttc taactttgcc cgcctggctt ccaccttggt tcacctcggt 3780 gagtatcagg cagcagtgga caacagccgc aaggccagca gcacccggac gtggaaggag 3840 gtgtgctttg cctgcatgga tggacaagag ttccgcttcg cacagctgtg tggtcttcac 3900 atcgtcattc atgcagatga gctggaggag ctgatgtgct attaccagga tcgtggctac 3960 tttgaggagc tgatcttgct gttggaagcg gccctgggcc tggagcgggc ccacatgggc 4020 atgttcactg agctggccat cctctactcc aaattcaagc cacagaagat gctggagcat 4080 ctggagcttt tctggtcccg tgtcaacatc ccaaaggtgc tgagggctgc agagcaggca 4140 cacctgtggg ctgagctggt gttcctctat gacaagtacg aggagtatga caatgctgtg 4200 ctcaccatga tgagccaccc cactgaggcc tggaaggagg gtcagttcaa ggacatcatt 4260 accaaggttg ccaacgtcga gctctgttac agagccctgc agttctattt ggattacaaa 4320 ccactgctca tcaatgacct gctgctggtg ctttcacccc ggctggacca cacctggaca 4380 gtcagtttct tttcaaaggc aggtcagctg cccctggtga agccttacct gcggtcagtc 4440 cagagccaca acaacaagag tgtgaatgag gcactcaacc acctgctgac agaggaggag 4500 gactatcagg gcttaagggc atctatcgat gcctatgaca actttgacaa catcagcctg 4560 gctcagcagc tggagaagca tcagctgatg gagttcaggt gcattgcggc ctatctgtac 4620 aagggcaata actggtgggc ccagagcgtg gagctctgca agaaggatca tctctacaag 4680 gatgccatgc agcatgctgc agagtcgcgg gatgctgagc tggcccagaa gttgctgcag 4740 tggttcctgg aggaaggcaa gagggagtgc ttcgcagctt gtctcttcac ctgctatgac 4800 ctgcttcgcc cagacatggt gcttgagctg gcctggaggc acaacctcgt ggacttggcc 4860 atgccctact tcatccaggt gatgagggag tacctgagca aggtggacaa actggatgcc 4920 ttggagagtc tgcgcaagca agaggagcat gtgacagagc ctgcccctct cgtgtttgat 4980 tttgatgggc atgaatgaga cccagctgat tgcactaagc cctgccgtgg gcccagcccc 5040 tgccagcttc ccctatggat atgcctctgc tcccaacttc gccagcctcc aatgtacaac 5100 ttccgcgtgt agtgggcgtt gtcaccaccc accctacctg cagagttact aacttctcca 5160 aggagcatgt cactccagca gcacagggga cgcaatggga ggcagggaca cctggacaat 5220 atttattttt gctgaaaccc aatgacggca acctctgagc catcccagag cctggggagg 5280 ccagggtaga ggctgacggc gcaagaccag ctttagccga caacagagac tggactgtgg 5340 gccctcctgc tggagccagg ccttcctcct gggcgcctcc gactggctgg agctgccccc 5400 tccaggccag tttgaagact acatgaacac gtcttgtttg gaggtaccgg acctcataaa 5460 aggactctca gcctcttggc aatcataaat attaaagtcg gtttatccag gcaaaaaaaa 5520 aaaaaaaaaa aaaaaaaaaa aa 5542 <210> 19 <211> 1606 <212> PRT <213> Homo sapiens <400> 19 Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro 1 5 10 15 Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val 20 25 30 Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg 35 40 45 Gln Gly Gly Phe Arg Ser Leu Gln His Phe Tyr Pro Ser Arg Ala Gln 50 55 60 Pro Pro Ser Ser Ala Ala Ser Arg Val Gln Ser Ala Ala Pro Ala Arg 65 70 75 80 Pro Gly Pro Ala Ala His Val Tyr Pro Ala Gly Ser Gln Val Met Met 85 90 95 Ile Pro Ser Gln Ile Ser Tyr Pro Ala Ser Gln Gly Ala Tyr Tyr Ile 100 105 110 Pro Gly Gln Gly Arg Ser Thr Tyr Val Val Pro Thr Gln Gln Tyr Pro 115 120 125 Val Gln Pro Gly Ala Pro Gly Phe Tyr Pro Gly Ala Ser Pro Thr Glu 130 135 140 Phe Gly Thr Tyr Ala Gly Ala Tyr Tyr Pro Ala Gln Gly Val Gln Gln 145 150 155 160 Phe Pro Thr Gly Val Ala Pro Ala Pro Val Leu Met Asn Gln Pro Pro 165 170 175 Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile Arg Ile Arg Asp Pro 180 185 190 Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile Met Ser Gly Ala Arg 195 200 205 Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly Gly Gly Leu Glu Pro 210 215 220 Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val Ile Val Arg Pro Asp 225 230 235 240 Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg Pro Gly Leu Pro Gly 245 250 255 Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser Ser Pro Ser Pro Thr 260 265 270 Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser Glu Pro Asn Leu Ala 275 280 285 Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr Ile Gln Met Ser Val 290 295 300 Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly Glu Pro Tyr Arg Leu 305 310 315 320 Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile Leu Glu Val Glu Val 325 330 335 Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe Ser Ser Ser Pro Leu 340 345 350 Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val Glu Ile His Glu Pro 355 360 365 Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro Glu Val Glu Ser Ser 370 375 380 Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser Glu Ser Pro Val Pro 385 390 395 400 Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu Asn Gly Ala Pro Ser 405 410 415 Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu Pro Glu Glu Gln Ala 420 425 430 Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr Ile Pro Ser Ala Thr 435 440 445 Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala Gln Glu Glu Glu Met 450 455 460 Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala Gly Glu Ala Gly Glu 465 470 475 480 Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu Pro Pro Glu Ser Thr 485 490 495 Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu Ala Ala Ala Ala Thr 500 505 510 Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg Lys Ile Lys Glu Leu 515 520 525 Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp Ala Phe Lys Glu Ala 530 535 540 Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro Pro Ala Gly Ser Asn 545 550 555 560 Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro Pro Arg Pro Glu Glu 565 570 575 Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys Ile His Asn Ala Glu 580 585 590 Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr Lys Ser Asp Gln Trp 595 600 605 Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr Asp Arg Glu Phe Leu 610 615 620 Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln Lys Pro Glu Gly Leu 625 630 635 640 Pro His Ile Ser Asp Val Val Leu Asp Lys Ala Asn Lys Thr Pro Leu 645 650 655 Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile Asn Cys Gly Pro Asp 660 665 670 Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr Thr Leu Ser Thr Arg 675 680 685 Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu Pro Arg Gly Pro Ala 690 695 700 Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro Arg Lys Glu Pro Arg 705 710 715 720 Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp Ile Lys Leu Asn Lys 725 730 735 Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg Thr Ala Ala Asp Lys 740 745 750 Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys Thr Gln Asp Leu Phe 755 760 765 Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met Phe Gln 770 775 780 Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile Asp Thr Glu Glu Arg 785 790 795 800 Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys Ala Ile Ser Glu Pro 805 810 815 Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Met Ala Leu 820 825 830 Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr Val Asn Phe Arg Lys 835 840 845 Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys Asp Asp 850 855 860 Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met Asp Glu Ala Ala Thr 865 870 875 880 Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu Glu Glu Ala Arg Asp 885 890 895 Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys Phe Ile Gly Glu Leu 900 905 910 Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp Cys Val Val 915 920 925 Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg 930 935 940 Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro 945 950 955 960 Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Ile Lys Glu Lys 965 970 975 Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Leu Asp Leu 980 985 990 Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp Gln Gly Pro Lys Thr 995 1000 1005 Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu Glu His Arg Glu 1010 1015 1020 His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser Asp Lys Arg 1025 1030 1035 Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu Pro Leu 1040 1045 1050 Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly Ser 1055 1060 1065 Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly 1070 1075 1080 Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu 1085 1090 1095 Ser Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser 1100 1105 1110 Asp Ala Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn 1115 1120 1125 Arg Phe Ser Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp 1130 1135 1140 Asn Arg Arg Val Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly 1145 1150 1155 Glu Lys Ala Gly Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg 1160 1165 1170 Gly Gly Asp Arg Gly Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala 1175 1180 1185 Thr Lys Arg Ser Phe Ser Lys Glu Val Glu Glu Arg Ser Arg Glu 1190 1195 1200 Arg Pro Ser Gln Pro Glu Gly Leu Arg Lys Ala Ala Ser Leu Thr 1205 1210 1215 Glu Asp Arg Asp Arg Gly Arg Asp Ala Val Lys Arg Glu Ala Ala 1220 1225 1230 Leu Pro Pro Val Ser Pro Leu Lys Ala Ala Leu Ser Glu Glu Glu 1235 1240 1245 Leu Glu Lys Lys Ser Lys Ala Ile Ile Glu Glu Tyr Leu His Leu 1250 1255 1260 Asn Asp Met Lys Glu Ala Val Gln Cys Val Gln Glu Leu Ala Ser 1265 1270 1275 Pro Ser Leu Leu Phe Ile Phe Val Arg His Gly Val Glu Ser Thr 1280 1285 1290 Leu Glu Arg Ser Ala Ile Ala Arg Glu His Met Gly Gln Leu Leu 1295 1300 1305 His Gln Leu Leu Cys Ala Gly His Leu Ser Thr Ala Gln Tyr Tyr 1310 1315 1320 Gln Gly Leu Tyr Glu Ile Leu Glu Leu Ala Glu Asp Met Glu Ile 1325 1330 1335 Asp Ile Pro His Val Trp Leu Tyr Leu Ala Glu Leu Val Thr Pro 1340 1345 1350 Ile Leu Gln Glu Gly Gly Val Pro Met Gly Glu Leu Phe Arg Glu 1355 1360 1365 Ile Thr Lys Pro Leu Arg Pro Leu Gly Lys Ala Ala Ser Leu Leu 1370 1375 1380 Leu Glu Ile Leu Gly Leu Leu Cys Lys Ser Met Gly Pro Lys Lys 1385 1390 1395 Val Gly Thr Leu Trp Arg Glu Ala Gly Leu Ser Trp Lys Glu Phe 1400 1405 1410 Leu Pro Glu Gly Gln Asp Ile Gly Ala Phe Val Ala Glu Gln Lys 1415 1420 1425 Val Glu Tyr Thr Leu Gly Glu Glu Ser Glu Ala Pro Gly Gln Arg 1430 1435 1440 Ala Leu Pro Ser Glu Glu Leu Asn Arg Gln Leu Glu Lys Leu Leu 1445 1450 1455 Lys Glu Gly Ser Ser Asn Gln Arg Val Phe Asp Trp Ile Glu Ala 1460 1465 1470 Asn Leu Ser Glu Gln Gln Ile Val Ser Asn Thr Leu Val Arg Ala 1475 1480 1485 Leu Met Thr Ala Val Cys Tyr Ser Ala Ile Ile Phe Glu Thr Pro 1490 1495 1500 Leu Arg Val Asp Val Ala Val Leu Lys Ala Arg Ala Lys Leu Leu 1505 1510 1515 Gln Lys Tyr Leu Cys Asp Glu Gln Lys Glu Leu Gln Ala Leu Tyr 1520 1525 1530 Ala Leu Gln Ala Leu Val Val Thr Leu Glu Gln Pro Pro Asn Leu 1535 1540 1545 Leu Arg Met Phe Phe Asp Ala Leu Tyr Asp Glu Asp Val Val Lys 1550 1555 1560 Glu Asp Ala Phe Tyr Ser Trp Glu Ser Ser Lys Asp Pro Ala Glu 1565 1570 1575 Gln Gln Gly Lys Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe 1580 1585 1590 Lys Trp Leu Arg Glu Ala Glu Glu Glu Ser Asp His Asn 1595 1600 1605 <210> 20 <211> 5559 <212> DNA <213> Homo sapiens <400> 20 cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60 ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120 tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180 gccctcggat gcccagaacc tgtaggccgc accgtggact tgttcttaat cgagggggtg 240 ctggggggac cctgatgtgg caccaaatga aatgaacaaa gctccacagt ccacaggccc 300 cccacccgcc ccatcccccg gactcccaca gccagcgttt cccccggggc agacagcgcc 360 ggtggtgttc agtacgccac aagcgacaca aatgaacacg ccttctcagc cccgccaggg 420 aggattcagg tctctgcagc acttctaccc tagccgggcc cagcccccga gcagtgcagc 480 ctcccgagtg cagagtgcag cccctgcccg ccctggccca gctgcccatg tctaccctgc 540 tggatcccaa gtaatgatga tcccttccca gatctcctac ccagcctccc agggggccta 600 ctacatccct ggacaggggc gttccacata cgttgtcccg acacagcagt accctgtgca 660 gccaggagcc ccaggcttct atccaggtgc aagccctaca gaatttggga cctacgctgg 720 cgcctactat ccagcccaag gggtgcagca gtttcccact ggcgtggccc ccgccccagt 780 tttgatgaac cagccacccc agattgctcc caagagggag cgtaagacga tccgaattcg 840 agatccaaac caaggaggaa aggatatcac agaggagatc atgtctgggg cccgcactgc 900 ctccacaccc acccctcccc agacgggagg cggtctggag cctcaagcta atggggagac 960 gccccaggtt gctgtcattg tccggccaga tgaccggtca cagggagcaa tcattgctga 1020 ccggccaggg ctgcctggcc cagagcatag cccttcagaa tcccagcctt cgtcgccttc 1080 tccgacccca tcaccatccc cagtcttgga accggggtct gagcctaatc tcgcagtcct 1140 ctctattcct ggggacacta tgacaactat acaaatgtct gtagaagaat caacccccat 1200 ctcccgtgaa actggggagc catatcgcct ctctccagaa cccactcctc tcgccgaacc 1260 catactggaa gtagaagtga cacttagcaa accggttcca gaatctgagt tttcttccag 1320 tcctctccag gctcccaccc ctttggcatc tcacacagtg gaaattcatg agcctaatgg 1380 catggtccca tctgaagatc tggaaccaga ggtggagtca agcccagagc ttgctcctcc 1440 cccagcttgc ccctccgaat cccctgtgcc cattgctcca actgcccaac ctgaggaact 1500 gctcaacgga gccccctcgc caccagctgt ggacttaagc ccagtcagtg agccagagga 1560 gcaggccaag gaggtgacag catcaatggc gccccccacc atcccctctg ctactccagc 1620 tacggctcct tcagctactt ccccagctca ggaggaggaa atggaagaag aagaagaaga 1680 ggaagaagga gaagcaggag aagcaggaga agctgagagt gagaaaggag gagaggaact 1740 gctcccccca gagagtaccc ctattccagc caacttgtct cagaatttgg aggcagcagc 1800 agccactcaa gtggcagtat ctgtgccaaa gaggagacgg aaaattaagg agctaaataa 1860 gaaggaggct gttggagacc ttctggatgc cttcaaggag gcgaacccgg cagtaccaga 1920 ggtggaaaat cagcctcctg caggcagcaa tccaggccca gagtctgagg gcagtggtgt 1980 gcccccacgt cctgaggaag cagatgagac ctgggactca aaggaagaca aaattcacaa 2040 tgctgagaac atccagcccg gggaacagaa gtatgaatat aagtcagatc agtggaagcc 2100 tctaaaccta gaggagaaaa aacgttacga ccgtgagttc ctgcttggtt ttcagttcat 2160 ctttgccagt atgcagaagc cagagggatt gccacatatc agtgacgtgg tgctggacaa 2220 ggccaataaa acaccactgc ggccactgga tcccactaga ctacaaggca taaattgtgg 2280 cccagacttc actccatcct ttgccaacct tggccggaca acccttagca cccgtgggcc 2340 cccaaggggt gggccaggtg gggagctgcc ccgtgggccg gctggcctgg gaccccggcg 2400 ctctcagcag ggaccccgaa aagaaccacg caagatcatt gccacagtgt taatgaccga 2460 agatataaaa ctgaacaaag cagagaaagc ctggaaaccc agcagcaagc ggacggcggc 2520 tgataaggat cgaggggaag aagatgctga tggcagcaaa acccaggacc tattccgcag 2580 ggtgcgctcc atcctgaata aactgacacc ccagatgttc cagcagctga tgaagcaagt 2640 gacgcagctg gccatcgaca ccgaggaacg cctcaaaggg gtcattgacc tcatttttga 2700 gaaggccatt tcagagccca acttctctgt ggcctatgcc aacatgtgcc gctgcctcat 2760 ggcgctgaaa gtgcccacta cggaaaagcc aacagtgact gtgaacttcc gaaagctgtt 2820 gttgaatcga tgtcagaagg agtttgagaa agacaaagat gatgatgagg tttttgagaa 2880 gaagcaaaaa gagatggatg aagctgctac ggcagaggaa cgaggacgcc tgaaggaaga 2940 gctggaagag gctcgggaca tagcccggcg gcgctcttta gggaatatca agtttattgg 3000 agagttgttc aaactgaaga tgttaacaga ggcaataatg catgactgtg tggtcaaact 3060 gcttaagaac catgatgaag agtcccttga gtgcctttgt cgtctgctca ccaccattgg 3120 caaagacctg gactttgaaa aagccaagcc ccgaatggat cagtatttca accagatgga 3180 aaaaatcatt aaagaaaaga agacgtcatc ccgcatccgc tttatgctgc aggacgtgct 3240 ggatctgcga gggagcaatt gggtgccacg ccgaggggat cagggtccca agaccattga 3300 ccagatccat aaggaggctg agatggaaga acatcgagag cacatcaaag tgcagcagct 3360 catggccaag ggcagtgaca agcgtcgggg cggtcctcca ggccctccca tcagccgtgg 3420 acttcccctt gtggatgatg gtggctggaa cacagttccc atcagcaaag gtagccgccc 3480 cattgacacc tcacgactca ccaagatcac caagcctggc tccatcgatt ctaacaacca 3540 gctctttgca cctggagggc gactgagctg gggcaagggc agcagcggag gctcaggagc 3600 caagccctca gacgcagcat cagaagctgc tcgcccagct actagtactt tgaatcgctt 3660 ctcagccctt caacaagcgg tacccacaga aagcacagat aatagacgtg tggtgcagag 3720 gagtagcttg agccgagaac gaggcgagaa agctggagac cgaggagacc gcctagagcg 3780 gagtgaacgg ggaggggacc gtggggaccg gcttgatcgt gcgcggacac ctgctaccaa 3840 gcggagcttc agcaaggaag tggaggagcg gagtagagaa cggccctccc agcctgaggg 3900 gctgcgcaag gcagctagcc tcacggagga tcgggaccgt gggcgggatg ccgtgaagcg 3960 agaagctgcc ctacccccag tgagccccct gaaggcggct ctctctgagg aggagttaga 4020 gaagaaatcc aaggctatca ttgaggaata tctccatctc aatgacatga aagaggcagt 4080 ccagtgcgtg caggagctgg cctcaccctc cttgctcttc atctttgtac ggcatggtgt 4140 cgagtctacg ctggagcgca gtgccattgc tcgtgagcat atggggcagc tgctgcacca 4200 gctgctctgt gctgggcatc tgtctactgc tcagtactac caagggttgt atgaaatctt 4260 ggaattggct gaggacatgg aaattgacat cccccacgtg tggctctacc tagcggaact 4320 ggtaacaccc attctgcagg aaggtggggt gcccatgggg gagctgttca gggagattac 4380 aaagcctctg agaccgttgg gcaaagctgc ttccctgttg ctggagatcc tgggcctcct 4440 gtgcaaaagc atgggtccta aaaaggtggg gacgctgtgg cgagaagccg ggcttagctg 4500 gaaggaattt ctacctgaag gccaggacat tggtgcattc gtcgctgaac agaaggtgga 4560 gtataccctg ggagaggagt cggaagcccc tggccagagg gcactcccct ccgaggagct 4620 gaacaggcag ctggagaagc tgctgaagga gggcagcagt aaccagcggg tgttcgactg 4680 gatagaggcc aacctgagtg agcagcagat agtatccaac acgttagttc gagccctcat 4740 gacggctgtc tgctattctg caattatttt tgagactccc ctccgagtgg acgttgcagt 4800 gctgaaagcg cgagcgaagc tgctgcagaa atacctgtgt gacgagcaga aggagctaca 4860 ggcgctctac gccctccagg cccttgtagt gaccttagaa cagcctccca acctgctgcg 4920 gatgttcttt gacgcactgt atgacgagga cgtggtgaag gaggatgcct tctacagttg 4980 ggagagtagc aaggaccccg ctgagcagca gggcaagggt gtggccctta aatctgtcac 5040 agccttcttc aagtggctcc gtgaagcaga ggaggagtct gaccacaact gagggctggt 5100 ggggccgggg acctggagcc ccatggacac acagatggcc cggctagccg cctggactgc 5160 aggggggcgg cagcagcggc ggtggcagtg ggtgcctgta gtgtgatgtg tctgaactaa 5220 taaagtggct gaagaggcag gatggcttgg ggctgcctgg gcccccctcc aggatgccgc 5280 caggtgtccc tctcctcccc ctggggcaca gagatatatt atatataaag tcttgaaatt 5340 tggtgtgtct tggggtgggg aggggcacca acgcctgccc ctggggtcct tttttttatt 5400 ttctgaaaat cactctcggg actgccgtcc tcgctgctgg gggcatatgc cccagcccct 5460 gtaccacccc tgctgttgcc tgggcagggg gaaggggggg cacggtgcct gtaattatta 5520 aacatgaatt caattaagct caaaaaaaaa aaaaaaaaa 5559 <210> 21 <211> 1404 <212> PRT <213> Homo sapiens <400> 21 Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly 1 5 10 15 Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val 20 25 30 Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg 35 40 45 Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser 50 55 60 Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser 65 70 75 80 Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr 85 90 95 Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly 100 105 110 Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile 115 120 125 Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe 130 135 140 Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val 145 150 155 160 Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro 165 170 175 Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser 180 185 190 Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu 195 200 205 Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu 210 215 220 Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr 225 230 235 240 Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala 245 250 255 Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala 260 265 270 Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu 275 280 285 Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu 290 295 300 Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg 305 310 315 320 Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp 325 330 335 Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro 340 345 350 Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro 355 360 365 Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys 370 375 380 Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr 385 390 395 400 Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr 405 410 415 Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln 420 425 430 Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala 435 440 445 Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile 450 455 460 Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr 465 470 475 480 Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu 485 490 495 Pro Arg Gly Pro Gln Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly 500 505 510 Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu 515 520 525 Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys 530 535 540 Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser 545 550 555 560 Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu 565 570 575 Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala 580 585 590 Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu 595 600 605 Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys 610 615 620 Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val 625 630 635 640 Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe 645 650 655 Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu 660 665 670 Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu 675 680 685 Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile 690 695 700 Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile 705 710 715 720 Met His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser 725 730 735 Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp 740 745 750 Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu 755 760 765 Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu 770 775 780 Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly 785 790 795 800 Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met 805 810 815 Glu Glu His Arg Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly 820 825 830 Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly 835 840 845 Leu Pro Leu Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys 850 855 860 Gly Ser Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro 865 870 875 880 Gly Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu 885 890 895 Ser Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp 900 905 910 Ala Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe 915 920 925 Ser Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg 930 935 940 Val Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly 945 950 955 960 Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly 965 970 975 Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser 980 985 990 Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu Gly 995 1000 1005 Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly Arg 1010 1015 1020 Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro Leu 1025 1030 1035 Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys Ala 1040 1045 1050 Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala Val 1055 1060 1065 Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile Phe 1070 1075 1080 Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile Ala 1085 1090 1095 Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala Gly 1100 1105 1110 His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile Leu 1115 1120 1125 Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp Leu 1130 1135 1140 Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly Val 1145 1150 1155 Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg Pro 1160 1165 1170 Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu Leu 1175 1180 1185 Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg Glu 1190 1195 1200 Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp Ile 1205 1210 1215 Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly Glu 1220 1225 1230 Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu Leu 1235 1240 1245 Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn Gln 1250 1255 1260 Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln Ile 1265 1270 1275 Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys Tyr 1280 1285 1290 Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala Val 1295 1300 1305 Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp Glu 1310 1315 1320 Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val Val 1325 1330 1335 Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp Ala 1340 1345 1350 Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser Trp 1355 1360 1365 Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val Ala 1370 1375 1380 Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala Glu 1385 1390 1395 Glu Glu Ser Asp His Asn 1400 <210> 22 <211> 5050 <212> DNA <213> Homo sapiens <400> 22 tctagatggg ggtcctgggc cccagggtgt gcagccactg acttggggac tgctggtggg 60 gtagggatga gggagggagg ggcattgtga tgtacagggc tgctctgtga gatcaagggt 120 ctcttaaggg tgggagctgg ggcagggact acgagagcag ccagatgggc tgaaagtgga 180 actcaagggg tttctggcac ctacctacct gcttcccgct ggggggtggg gagttggccc 240 agagtcttaa gattggggca gggtggagag gtgggctctt cctgcttccc actcatctta 300 tagctttctt tccccagatc cgaattcgag atccaaacca aggaggaaag gatatcacag 360 aggagatcat gtctggggcc cgcactgcct ccacacccac ccctccccag acgggaggcg 420 gtctggagcc tcaagctaat ggggagacgc cccaggttgc tgtcattgtc cggccagatg 480 accggtcaca gggagcaatc attgctgacc ggccagggct gcctggccca gagcatagcc 540 cttcagaatc ccagccttcg tcgccttctc cgaccccatc accatcccca gtcttggaac 600 cggggtctga gcctaatctc gcagtcctct ctattcctgg ggacactatg acaactatac 660 aaatgtctgt agaagaatca acccccatct cccgtgaaac tggggagcca tatcgcctct 720 ctccagaacc cactcctctc gccgaaccca tactggaagt agaagtgaca cttagcaaac 780 cggttccaga atctgagttt tcttccagtc ctctccaggc tcccacccct ttggcatctc 840 acacagtgga aattcatgag cctaatggca tggtcccatc tgaagatctg gaaccagagg 900 tggagtcaag cccagagctt gctcctcccc cagcttgccc ctccgaatcc cctgtgccca 960 ttgctccaac tgcccaacct gaggaactgc tcaacggagc cccctcgcca ccagctgtgg 1020 acttaagccc agtcagtgag ccagaggagc aggccaagga ggtgacagca tcaatggcgc 1080 cccccaccat cccctctgct actccagcta cggctccttc agctacttcc ccagctcagg 1140 aggaggaaat ggaagaagaa gaagaagagg aagaaggaga agcaggagaa gcaggagaag 1200 ctgagagtga gaaaggagga gaggaactgc tccccccaga gagtacccct attccagcca 1260 acttgtctca gaatttggag gcagcagcag ccactcaagt ggcagtatct gtgccaaaga 1320 ggagacggaa aattaaggag ctaaataaga aggaggctgt tggagacctt ctggatgcct 1380 tcaaggaggc gaacccggca gtaccagagg tggaaaatca gcctcctgca ggcagcaatc 1440 caggcccaga gtctgagggc agtggtgtgc ccccacgtcc tgaggaagca gatgagacct 1500 gggactcaaa ggaagacaaa attcacaatg ctgagaacat ccagcccggg gaacagaagt 1560 atgaatataa gtcagatcag tggaagcctc taaacctaga ggagaaaaaa cgttacgacc 1620 gtgagttcct gcttggtttt cagttcatct ttgccagtat gcagaagcca gagggattgc 1680 cacatatcag tgacgtggtg ctggacaagg ccaataaaac accactgcgg ccactggatc 1740 ccactagact acaaggcata aattgtggcc cagacttcac tccatccttt gccaaccttg 1800 gccggacaac ccttagcacc cgtgggcccc caaggggtgg gccaggtggg gagctgcccc 1860 gtgggccgca ggctggcctg ggaccccggc gctctcagca gggaccccga aaagaaccac 1920 gcaagatcat tgccacagtg ttaatgaccg aagatataaa actgaacaaa gcagagaaag 1980 cctggaaacc cagcagcaag cggacggcgg ctgataagga tcgaggggaa gaagatgctg 2040 atggcagcaa aacccaggac ctattccgca gggtgcgctc catcctgaat aaactgacac 2100 cccagatgtt ccagcagctg atgaagcaag tgacgcagct ggccatcgac accgaggaac 2160 gcctcaaagg ggtcattgac ctcatttttg agaaggccat ttcagagccc aacttctctg 2220 tggcctatgc caacatgtgc cgctgcctca tggcgctgaa agtgcccact acggaaaagc 2280 caacagtgac tgtgaacttc cgaaagctgt tgttgaatcg atgtcagaag gagtttgaga 2340 aagacaaaga tgatgatgag gtttttgaga agaagcaaaa agagatggat gaagctgcta 2400 cggcagagga acgaggacgc ctgaaggaag agctggaaga ggctcgggac atagcccggc 2460 ggcgctcttt agggaatatc aagtttattg gagagttgtt caaactgaag atgttaacag 2520 aggcaataat gcatgactgt gtggtcaaac tgcttaagaa ccatgatgaa gagtcccttg 2580 agtgcctttg tcgtctgctc accaccattg gcaaagacct ggactttgaa aaagccaagc 2640 cccgaatgga tcagtatttc aaccagatgg aaaaaatcat taaagaaaag aagacgtcat 2700 cccgcatccg ctttatgctg caggacgtgc tggatctgcg agggagcaat tgggtgccac 2760 gccgagggga tcagggtccc aagaccattg accagatcca taaggaggct gagatggaag 2820 aacatcgaga gcacatcaaa gtgcagcagc tcatggccaa gggcagtgac aagcgtcggg 2880 gcggtcctcc aggccctccc atcagccgtg gacttcccct tgtggatgat ggtggctgga 2940 acacagttcc catcagcaaa ggtagccgcc ccattgacac ctcacgactc accaagatca 3000 ccaagcctgg ctccatcgat tctaacaacc agctctttgc acctggaggg cgactgagct 3060 ggggcaaggg cagcagcgga ggctcaggag ccaagccctc agacgcagca tcagaagctg 3120 ctcgcccagc tactagtact ttgaatcgct tctcagccct tcaacaagcg gtacccacag 3180 aaagcacaga taatagacgt gtggtgcaga ggagtagctt gagccgagaa cgaggcgaga 3240 aagctggaga ccgaggagac cgcctagagc ggagtgaacg gggaggggac cgtggggacc 3300 ggcttgatcg tgcgcggaca cctgctacca agcggagctt cagcaaggaa gtggaggagc 3360 ggagtagaga acggccctcc cagcctgagg ggctgcgcaa ggcagctagc ctcacggagg 3420 atcgggaccg tgggcgggat gccgtgaagc gagaagctgc cctaccccca gtgagccccc 3480 tgaaggcggc tctctctgag gaggagttag agaagaaatc caaggctatc attgaggaat 3540 atctccatct caatgacatg aaagaggcag tccagtgcgt gcaggagctg gcctcaccct 3600 ccttgctctt catctttgta cggcatggtg tcgagtctac gctggagcgc agtgccattg 3660 ctcgtgagca tatggggcag ctgctgcacc agctgctctg tgctgggcat ctgtctactg 3720 ctcagtacta ccaagggttg tatgaaatct tggaattggc tgaggacatg gaaattgaca 3780 tcccccacgt gtggctctac ctagcggaac tggtaacacc cattctgcag gaaggtgggg 3840 tgcccatggg ggagctgttc agggagatta caaagcctct gagaccgttg ggcaaagctg 3900 cttccctgtt gctggagatc ctgggcctcc tgtgcaaaag catgggtcct aaaaaggtgg 3960 ggacgctgtg gcgagaagcc gggcttagct ggaaggaatt tctacctgaa ggccaggaca 4020 ttggtgcatt cgtcgctgaa cagaaggtgg agtataccct gggagaggag tcggaagccc 4080 ctggccagag ggcactcccc tccgaggagc tgaacaggca gctggagaag ctgctgaagg 4140 agggcagcag taaccagcgg gtgttcgact ggatagaggc caacctgagt gagcagcaga 4200 tagtatccaa cacgttagtt cgagccctca tgacggctgt ctgctattct gcaattattt 4260 ttgagactcc cctccgagtg gacgttgcag tgctgaaagc gcgagcgaag ctgctgcaga 4320 aatacctgtg tgacgagcag aaggagctac aggcgctcta cgccctccag gcccttgtag 4380 tgaccttaga acagcctccc aacctgctgc ggatgttctt tgacgcactg tatgacgagg 4440 acgtggtgaa ggaggatgcc ttctacagtt gggagagtag caaggacccc gctgagcagc 4500 agggcaaggg tgtggccctt aaatctgtca cagccttctt caagtggctc cgtgaagcag 4560 aggaggagtc tgaccacaac tgagggctgg tggggccggg gacctggagc cccatggaca 4620 cacagatggc ccggctagcc gcctggactg caggggggcg gcagcagcgg cggtggcagt 4680 gggtgcctgt agtgtgatgt gtctgaacta ataaagtggc tgaagaggca ggatggcttg 4740 gggctgcctg ggcccccctc caggatgccg ccaggtgtcc ctctcctccc cctggggcac 4800 agagatatat tatatataaa gtcttgaaat ttggtgtgtc ttggggtggg gaggggcacc 4860 aacgcctgcc cctggggtcc ttttttttat tttctgaaaa tcactctcgg gactgccgtc 4920 ctcgctgctg ggggcatatg ccccagcccc tgtaccaccc ctgctgttgc ctgggcaggg 4980 ggaagggggg gcacggtgcc tgtaattatt aaacatgaat tcaattaagc tcaaaaaaaa 5040 aaaaaaaaaa 5050 <210> 23 <211> 1600 <212> PRT <213> Homo sapiens <400> 23 Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro 1 5 10 15 Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val 20 25 30 Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg 35 40 45 Gln His Phe Tyr Pro Ser Arg Ala Gln Pro Pro Ser Ser Ala Ala Ser 50 55 60 Arg Val Gln Ser Ala Ala Pro Ala Arg Pro Gly Pro Ala Ala His Val 65 70 75 80 Tyr Pro Ala Gly Ser Gln Val Met Met Ile Pro Ser Gln Ile Ser Tyr 85 90 95 Pro Ala Ser Gln Gly Ala Tyr Tyr Ile Pro Gly Gln Gly Arg Ser Thr 100 105 110 Tyr Val Val Pro Thr Gln Gln Tyr Pro Val Gln Pro Gly Ala Pro Gly 115 120 125 Phe Tyr Pro Gly Ala Ser Pro Thr Glu Phe Gly Thr Tyr Ala Gly Ala 130 135 140 Tyr Tyr Pro Ala Gln Gly Val Gln Gln Phe Pro Thr Gly Val Ala Pro 145 150 155 160 Ala Pro Val Leu Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu 165 170 175 Arg Lys Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile 180 185 190 Thr Glu Glu Ile Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro 195 200 205 Pro Gln Thr Gly Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro 210 215 220 Gln Val Ala Val Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile 225 230 235 240 Ile Ala Asp Arg Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu 245 250 255 Ser Gln Pro Ser Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu 260 265 270 Glu Pro Gly Ser Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp 275 280 285 Thr Met Thr Thr Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser 290 295 300 Arg Glu Thr Gly Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu 305 310 315 320 Ala Glu Pro Ile Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro 325 330 335 Glu Ser Glu Phe Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala 340 345 350 Ser His Thr Val Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu 355 360 365 Asp Leu Glu Pro Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro 370 375 380 Ala Cys Pro Ser Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro 385 390 395 400 Glu Glu Leu Leu Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser 405 410 415 Pro Val Ser Glu Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met 420 425 430 Ala Pro Pro Thr Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala 435 440 445 Thr Ser Pro Ala Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu 450 455 460 Glu Gly Glu Ala Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly 465 470 475 480 Glu Glu Leu Leu Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser 485 490 495 Gln Asn Leu Glu Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro 500 505 510 Lys Arg Arg Arg Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly 515 520 525 Asp Leu Leu Asp Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val 530 535 540 Glu Asn Gln Pro Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly 545 550 555 560 Ser Gly Val Pro Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser 565 570 575 Lys Glu Asp Lys Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln 580 585 590 Lys Tyr Glu Tyr Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu 595 600 605 Lys Lys Arg Tyr Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe 610 615 620 Ala Ser Met Gln Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val 625 630 635 640 Leu Asp Lys Ala Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg 645 650 655 Leu Gln Gly Ile Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn 660 665 670 Leu Gly Arg Thr Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro 675 680 685 Gly Gly Glu Leu Pro Arg Gly Pro Gln Ala Gly Leu Gly Pro Arg Arg 690 695 700 Ser Gln Gln Gly Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val 705 710 715 720 Leu Met Thr Glu Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys 725 730 735 Pro Ser Ser Lys Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp 740 745 750 Ala Asp Gly Ser Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile 755 760 765 Leu Asn Lys Leu Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val 770 775 780 Thr Gln Leu Ala Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp 785 790 795 800 Leu Ile Phe Glu Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr 805 810 815 Ala Asn Met Cys Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu 820 825 830 Lys Pro Thr Val Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys 835 840 845 Gln Lys Glu Phe Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys 850 855 860 Lys Gln Lys Glu Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg 865 870 875 880 Leu Lys Glu Glu Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser 885 890 895 Leu Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu 900 905 910 Thr Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu Lys Asn His 915 920 925 Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly 930 935 940 Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe 945 950 955 960 Asn Gln Met Glu Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile 965 970 975 Arg Phe Met Leu Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val 980 985 990 Pro Arg Arg Gly Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys 995 1000 1005 Glu Ala Glu Met Glu Glu His Arg Glu His Ile Lys Val Gln Gln 1010 1015 1020 Leu Met Ala Lys Gly Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly 1025 1030 1035 Pro Pro Ile Ser Arg Gly Leu Pro Leu Val Asp Asp Gly Gly Trp 1040 1045 1050 Asn Thr Val Pro Ile Ser Lys Gly Ser Arg Pro Ile Asp Thr Ser 1055 1060 1065 Arg Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp Ser Asn Asn 1070 1075 1080 Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys Gly Ser 1085 1090 1095 Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser Glu Ala 1100 1105 1110 Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala Leu Gln 1115 1120 1125 Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val Val Gln 1130 1135 1140 Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp Arg 1145 1150 1155 Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp 1160 1165 1170 Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser 1175 1180 1185 Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu 1190 1195 1200 Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly 1205 1210 1215 Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro 1220 1225 1230 Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys 1235 1240 1245 Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala 1250 1255 1260 Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile 1265 1270 1275 Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile 1280 1285 1290 Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala 1295 1300 1305 Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile 1310 1315 1320 Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp 1325 1330 1335 Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly 1340 1345 1350 Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg 1355 1360 1365 Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu 1370 1375 1380 Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg 1385 1390 1395 Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp 1400 1405 1410 Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly 1415 1420 1425 Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu 1430 1435 1440 Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn 1445 1450 1455 Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln 1460 1465 1470 Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys 1475 1480 1485 Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala 1490 1495 1500 Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp 1505 1510 1515 Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val 1520 1525 1530 Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp 1535 1540 1545 Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser 1550 1555 1560 Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val 1565 1570 1575 Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala 1580 1585 1590 Glu Glu Glu Ser Asp His Asn 1595 1600 <210> 24 <211> 5686 <212> DNA <213> Homo sapiens <400> 24 tcacttgcct gaaaccggct cctcgacggc cgccgcccgc ctggcctttt agggcctgac 60 tcccgccctt cctggcctac actcctgggc ggcggcaggc ctagcttctg gcccagtgcg 120 ggttccccgg cggcaggcgt atcctgtgtg cccctgggcc aggcccgaac ccggtgtccc 180 cgggtggggg gtggggacgc cacggccgaa gcagctagct ccgttcgtga tccgggagcc 240 tggtgccagc gagacctgga atttccggtc tggttggtct ggggccccgc ggagccaggt 300 tgataccctc acctcccaac cccaggccct cggatgccca gaacctgtag gccgcaccgt 360 ggacttgttc ttaatcgagg gggtgctggg gggaccctga tgtggcacca aatgaaatga 420 acaaagctcc acagtccaca ggccccccac ccgccccatc ccccggactc ccacagccag 480 cgtttccccc ggggcagaca gcgccggtgg tgttcagtac gccacaagcg acacaaatga 540 acacgccttc tcagccccgc cagcacttct accctagccg ggcccagccc ccgagcagtg 600 cagcctcccg agtgcagagt gcagcccctg cccgccctgg cccagctgcc catgtctacc 660 ctgctggatc ccaagtaatg atgatccctt cccagatctc ctacccagcc tcccaggggg 720 cctactacat ccctggacag gggcgttcca catacgttgt cccgacacag cagtaccctg 780 tgcagccagg agccccaggc ttctatccag gtgcaagccc tacagaattt gggacctacg 840 ctggcgccta ctatccagcc caaggggtgc agcagtttcc cactggcgtg gcccccgccc 900 cagttttgat gaaccagcca ccccagattg ctcccaagag ggagcgtaag acgatccgaa 960 ttcgagatcc aaaccaagga ggaaaggata tcacagagga gatcatgtct ggggcccgca 1020 ctgcctccac acccacccct ccccagacgg gaggcggtct ggagcctcaa gctaatgggg 1080 agacgcccca ggttgctgtc attgtccggc cagatgaccg gtcacaggga gcaatcattg 1140 ctgaccggcc agggctgcct ggcccagagc atagcccttc agaatcccag ccttcgtcgc 1200 cttctccgac cccatcacca tccccagtct tggaaccggg gtctgagcct aatctcgcag 1260 tcctctctat tcctggggac actatgacaa ctatacaaat gtctgtagaa gaatcaaccc 1320 ccatctcccg tgaaactggg gagccatatc gcctctctcc agaacccact cctctcgccg 1380 aacccatact ggaagtagaa gtgacactta gcaaaccggt tccagaatct gagttttctt 1440 ccagtcctct ccaggctccc acccctttgg catctcacac agtggaaatt catgagccta 1500 atggcatggt cccatctgaa gatctggaac cagaggtgga gtcaagccca gagcttgctc 1560 ctcccccagc ttgcccctcc gaatcccctg tgcccattgc tccaactgcc caacctgagg 1620 aactgctcaa cggagccccc tcgccaccag ctgtggactt aagcccagtc agtgagccag 1680 aggagcaggc caaggaggtg acagcatcaa tggcgccccc caccatcccc tctgctactc 1740 cagctacggc tccttcagct acttccccag ctcaggagga ggaaatggaa gaagaagaag 1800 aagaggaaga aggagaagca ggagaagcag gagaagctga gagtgagaaa ggaggagagg 1860 aactgctccc cccagagagt acccctattc cagccaactt gtctcagaat ttggaggcag 1920 cagcagccac tcaagtggca gtatctgtgc caaagaggag acggaaaatt aaggagctaa 1980 ataagaagga ggctgttgga gaccttctgg atgccttcaa ggaggcgaac ccggcagtac 2040 cagaggtgga aaatcagcct cctgcaggca gcaatccagg cccagagtct gagggcagtg 2100 gtgtgccccc acgtcctgag gaagcagatg agacctggga ctcaaaggaa gacaaaattc 2160 acaatgctga gaacatccag cccggggaac agaagtatga atataagtca gatcagtgga 2220 agcctctaaa cctagaggag aaaaaacgtt acgaccgtga gttcctgctt ggttttcagt 2280 tcatctttgc cagtatgcag aagccagagg gattgccaca tatcagtgac gtggtgctgg 2340 acaaggccaa taaaacacca ctgcggccac tggatcccac tagactacaa ggcataaatt 2400 gtggcccaga cttcactcca tcctttgcca accttggccg gacaaccctt agcacccgtg 2460 ggcccccaag gggtgggcca ggtggggagc tgccccgtgg gccgcaggct ggcctgggac 2520 cccggcgctc tcagcaggga ccccgaaaag aaccacgcaa gatcattgcc acagtgttaa 2580 tgaccgaaga tataaaactg aacaaagcag agaaagcctg gaaacccagc agcaagcgga 2640 cggcggctga taaggatcga ggggaagaag atgctgatgg cagcaaaacc caggacctat 2700 tccgcagggt gcgctccatc ctgaataaac tgacacccca gatgttccag cagctgatga 2760 agcaagtgac gcagctggcc atcgacaccg aggaacgcct caaaggggtc attgacctca 2820 tttttgagaa ggccatttca gagcccaact tctctgtggc ctatgccaac atgtgccgct 2880 gcctcatggc gctgaaagtg cccactacgg aaaagccaac agtgactgtg aacttccgaa 2940 agctgttgtt gaatcgatgt cagaaggagt ttgagaaaga caaagatgat gatgaggttt 3000 ttgagaagaa gcaaaaagag atggatgaag ctgctacggc agaggaacga ggacgcctga 3060 aggaagagct ggaagaggct cgggacatag cccggcggcg ctctttaggg aatatcaagt 3120 ttattggaga gttgttcaaa ctgaagatgt taacagaggc aataatgcat gactgtgtgg 3180 tcaaactgct taagaaccat gatgaagagt cccttgagtg cctttgtcgt ctgctcacca 3240 ccattggcaa agacctggac tttgaaaaag ccaagccccg aatggatcag tatttcaacc 3300 agatggaaaa aatcattaaa gaaaagaaga cgtcatcccg catccgcttt atgctgcagg 3360 acgtgctgga tctgcgaggg agcaattggg tgccacgccg aggggatcag ggtcccaaga 3420 ccattgacca gatccataag gaggctgaga tggaagaaca tcgagagcac atcaaagtgc 3480 agcagctcat ggccaagggc agtgacaagc gtcggggcgg tcctccaggc cctcccatca 3540 gccgtggact tccccttgtg gatgatggtg gctggaacac agttcccatc agcaaaggta 3600 gccgccccat tgacacctca cgactcacca agatcaccaa gcctggctcc atcgattcta 3660 acaaccagct ctttgcacct ggagggcgac tgagctgggg caagggcagc agcggaggct 3720 caggagccaa gccctcagac gcagcatcag aagctgctcg cccagctact agtactttga 3780 atcgcttctc agcccttcaa caagcggtac ccacagaaag cacagataat agacgtgtgg 3840 tgcagaggag tagcttgagc cgagaacgag gcgagaaagc tggagaccga ggagaccgcc 3900 tagagcggag tgaacgggga ggggaccgtg gggaccggct tgatcgtgcg cggacacctg 3960 ctaccaagcg gagcttcagc aaggaagtgg aggagcggag tagagaacgg ccctcccagc 4020 ctgaggggct gcgcaaggca gctagcctca cggaggatcg ggaccgtggg cgggatgccg 4080 tgaagcgaga agctgcccta cccccagtga gccccctgaa ggcggctctc tctgaggagg 4140 agttagagaa gaaatccaag gctatcattg aggaatatct ccatctcaat gacatgaaag 4200 aggcagtcca gtgcgtgcag gagctggcct caccctcctt gctcttcatc tttgtacggc 4260 atggtgtcga gtctacgctg gagcgcagtg ccattgctcg tgagcatatg gggcagctgc 4320 tgcaccagct gctctgtgct gggcatctgt ctactgctca gtactaccaa gggttgtatg 4380 aaatcttgga attggctgag gacatggaaa ttgacatccc ccacgtgtgg ctctacctag 4440 cggaactggt aacacccatt ctgcaggaag gtggggtgcc catgggggag ctgttcaggg 4500 agattacaaa gcctctgaga ccgttgggca aagctgcttc cctgttgctg gagatcctgg 4560 gcctcctgtg caaaagcatg ggtcctaaaa aggtggggac gctgtggcga gaagccgggc 4620 ttagctggaa ggaatttcta cctgaaggcc aggacattgg tgcattcgtc gctgaacaga 4680 aggtggagta taccctggga gaggagtcgg aagcccctgg ccagagggca ctcccctccg 4740 aggagctgaa caggcagctg gagaagctgc tgaaggaggg cagcagtaac cagcgggtgt 4800 tcgactggat agaggccaac ctgagtgagc agcagatagt atccaacacg ttagttcgag 4860 ccctcatgac ggctgtctgc tattctgcaa ttatttttga gactcccctc cgagtggacg 4920 ttgcagtgct gaaagcgcga gcgaagctgc tgcagaaata cctgtgtgac gagcagaagg 4980 agctacaggc gctctacgcc ctccaggccc ttgtagtgac cttagaacag cctcccaacc 5040 tgctgcggat gttctttgac gcactgtatg acgaggacgt ggtgaaggag gatgccttct 5100 acagttggga gagtagcaag gaccccgctg agcagcaggg caagggtgtg gcccttaaat 5160 ctgtcacagc cttcttcaag tggctccgtg aagcagagga ggagtctgac cacaactgag 5220 ggctggtggg gccggggacc tggagcccca tggacacaca gatggcccgg ctagccgcct 5280 ggactgcagg ggggcggcag cagcggcggt ggcagtgggt gcctgtagtg tgatgtgtct 5340 gaactaataa agtggctgaa gaggcaggat ggcttggggc tgcctgggcc cccctccagg 5400 atgccgccag gtgtccctct cctccccctg gggcacagag atatattata tataaagtct 5460 tgaaatttgg tgtgtcttgg ggtggggagg ggcaccaacg cctgcccctg gggtcctttt 5520 ttttattttc tgaaaatcac tctcgggact gccgtcctcg ctgctggggg catatgcccc 5580 agcccctgta ccacccctgc tgttgcctgg gcagggggaa gggggggcac ggtgcctgta 5640 attattaaac atgaattcaa ttaagctcaa aaaaaaaaaa aaaaaa 5686 <210> 25 <211> 1599 <212> PRT <213> Homo sapiens <400> 25 Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro 1 5 10 15 Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val 20 25 30 Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg 35 40 45 Gln His Phe Tyr Pro Ser Arg Ala Gln Pro Pro Ser Ser Ala Ala Ser 50 55 60 Arg Val Gln Ser Ala Ala Pro Ala Arg Pro Gly Pro Ala Ala His Val 65 70 75 80 Tyr Pro Ala Gly Ser Gln Val Met Met Ile Pro Ser Gln Ile Ser Tyr 85 90 95 Pro Ala Ser Gln Gly Ala Tyr Tyr Ile Pro Gly Gln Gly Arg Ser Thr 100 105 110 Tyr Val Val Pro Thr Gln Gln Tyr Pro Val Gln Pro Gly Ala Pro Gly 115 120 125 Phe Tyr Pro Gly Ala Ser Pro Thr Glu Phe Gly Thr Tyr Ala Gly Ala 130 135 140 Tyr Tyr Pro Ala Gln Gly Val Gln Gln Phe Pro Thr Gly Val Ala Pro 145 150 155 160 Ala Pro Val Leu Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu 165 170 175 Arg Lys Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile 180 185 190 Thr Glu Glu Ile Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro 195 200 205 Pro Gln Thr Gly Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro 210 215 220 Gln Val Ala Val Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile 225 230 235 240 Ile Ala Asp Arg Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu 245 250 255 Ser Gln Pro Ser Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu 260 265 270 Glu Pro Gly Ser Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp 275 280 285 Thr Met Thr Thr Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser 290 295 300 Arg Glu Thr Gly Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu 305 310 315 320 Ala Glu Pro Ile Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro 325 330 335 Glu Ser Glu Phe Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala 340 345 350 Ser His Thr Val Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu 355 360 365 Asp Leu Glu Pro Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro 370 375 380 Ala Cys Pro Ser Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro 385 390 395 400 Glu Glu Leu Leu Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser 405 410 415 Pro Val Ser Glu Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met 420 425 430 Ala Pro Pro Thr Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala 435 440 445 Thr Ser Pro Ala Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu 450 455 460 Glu Gly Glu Ala Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly 465 470 475 480 Glu Glu Leu Leu Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser 485 490 495 Gln Asn Leu Glu Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro 500 505 510 Lys Arg Arg Arg Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly 515 520 525 Asp Leu Leu Asp Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val 530 535 540 Glu Asn Gln Pro Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly 545 550 555 560 Ser Gly Val Pro Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser 565 570 575 Lys Glu Asp Lys Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln 580 585 590 Lys Tyr Glu Tyr Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu 595 600 605 Lys Lys Arg Tyr Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe 610 615 620 Ala Ser Met Gln Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val 625 630 635 640 Leu Asp Lys Ala Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg 645 650 655 Leu Gln Gly Ile Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn 660 665 670 Leu Gly Arg Thr Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro 675 680 685 Gly Gly Glu Leu Pro Arg Gly Pro Ala Gly Leu Gly Pro Arg Arg Ser 690 695 700 Gln Gln Gly Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu 705 710 715 720 Met Thr Glu Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro 725 730 735 Ser Ser Lys Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala 740 745 750 Asp Gly Ser Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu 755 760 765 Asn Lys Leu Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr 770 775 780 Gln Leu Ala Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu 785 790 795 800 Ile Phe Glu Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala 805 810 815 Asn Met Cys Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys 820 825 830 Pro Thr Val Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln 835 840 845 Lys Glu Phe Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys 850 855 860 Gln Lys Glu Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu 865 870 875 880 Lys Glu Glu Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu 885 890 895 Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr 900 905 910 Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp 915 920 925 Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys 930 935 940 Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn 945 950 955 960 Gln Met Glu Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg 965 970 975 Phe Met Leu Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro 980 985 990 Arg Arg Gly Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu 995 1000 1005 Ala Glu Met Glu Glu His Arg Glu His Ile Lys Val Gln Gln Leu 1010 1015 1020 Met Ala Lys Gly Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro 1025 1030 1035 Pro Ile Ser Arg Gly Leu Pro Leu Val Asp Asp Gly Gly Trp Asn 1040 1045 1050 Thr Val Pro Ile Ser Lys Gly Ser Arg Pro Ile Asp Thr Ser Arg 1055 1060 1065 Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp Ser Asn Asn Gln 1070 1075 1080 Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys Gly Ser Ser 1085 1090 1095 Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser Glu Ala Ala 1100 1105 1110 Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala Leu Gln Gln 1115 1120 1125 Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val Val Gln Arg 1130 1135 1140 Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp Arg Gly 1145 1150 1155 Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp Arg 1160 1165 1170 Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser Lys 1175 1180 1185 Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu Gly 1190 1195 1200 Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly Arg 1205 1210 1215 Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro Leu 1220 1225 1230 Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys Ala 1235 1240 1245 Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala Val 1250 1255 1260 Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile Phe 1265 1270 1275 Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile Ala 1280 1285 1290 Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala Gly 1295 1300 1305 His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile Leu 1310 1315 1320 Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp Leu 1325 1330 1335 Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly Val 1340 1345 1350 Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg Pro 1355 1360 1365 Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu Leu 1370 1375 1380 Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg Glu 1385 1390 1395 Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp Ile 1400 1405 1410 Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly Glu 1415 1420 1425 Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu Leu 1430 1435 1440 Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn Gln 1445 1450 1455 Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln Ile 1460 1465 1470 Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys Tyr 1475 1480 1485 Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala Val 1490 1495 1500 Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp Glu 1505 1510 1515 Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val Val 1520 1525 1530 Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp Ala 1535 1540 1545 Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser Trp 1550 1555 1560 Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val Ala 1565 1570 1575 Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala Glu 1580 1585 1590 Glu Glu Ser Asp His Asn 1595 <210> 26 <211> 5538 <212> DNA <213> Homo sapiens <400> 26 cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60 ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120 tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180 gccctcggat gcccagaacc tgtaggccgc accgtggact tgttcttaat cgagggggtg 240 ctggggggac cctgatgtgg caccaaatga aatgaacaaa gctccacagt ccacaggccc 300 cccacccgcc ccatcccccg gactcccaca gccagcgttt cccccggggc agacagcgcc 360 ggtggtgttc agtacgccac aagcgacaca aatgaacacg ccttctcagc cccgccagca 420 cttctaccct agccgggccc agcccccgag cagtgcagcc tcccgagtgc agagtgcagc 480 ccctgcccgc cctggcccag ctgcccatgt ctaccctgct ggatcccaag taatgatgat 540 cccttcccag atctcctacc cagcctccca gggggcctac tacatccctg gacaggggcg 600 ttccacatac gttgtcccga cacagcagta ccctgtgcag ccaggagccc caggcttcta 660 tccaggtgca agccctacag aatttgggac ctacgctggc gcctactatc cagcccaagg 720 ggtgcagcag tttcccactg gcgtggcccc cgccccagtt ttgatgaacc agccacccca 780 gattgctccc aagagggagc gtaagacgat ccgaattcga gatccaaacc aaggaggaaa 840 ggatatcaca gaggagatca tgtctggggc ccgcactgcc tccacaccca cccctcccca 900 gacgggaggc ggtctggagc ctcaagctaa tggggagacg ccccaggttg ctgtcattgt 960 ccggccagat gaccggtcac agggagcaat cattgctgac cggccagggc tgcctggccc 1020 agagcatagc ccttcagaat cccagccttc gtcgccttct ccgaccccat caccatcccc 1080 agtcttggaa ccggggtctg agcctaatct cgcagtcctc tctattcctg gggacactat 1140 gacaactata caaatgtctg tagaagaatc aacccccatc tcccgtgaaa ctggggagcc 1200 atatcgcctc tctccagaac ccactcctct cgccgaaccc atactggaag tagaagtgac 1260 acttagcaaa ccggttccag aatctgagtt ttcttccagt cctctccagg ctcccacccc 1320 tttggcatct cacacagtgg aaattcatga gcctaatggc atggtcccat ctgaagatct 1380 ggaaccagag gtggagtcaa gcccagagct tgctcctccc ccagcttgcc cctccgaatc 1440 ccctgtgccc attgctccaa ctgcccaacc tgaggaactg ctcaacggag ccccctcgcc 1500 accagctgtg gacttaagcc cagtcagtga gccagaggag caggccaagg aggtgacagc 1560 atcaatggcg ccccccacca tcccctctgc tactccagct acggctcctt cagctacttc 1620 cccagctcag gaggaggaaa tggaagaaga agaagaagag gaagaaggag aagcaggaga 1680 agcaggagaa gctgagagtg agaaaggagg agaggaactg ctccccccag agagtacccc 1740 tattccagcc aacttgtctc agaatttgga ggcagcagca gccactcaag tggcagtatc 1800 tgtgccaaag aggagacgga aaattaagga gctaaataag aaggaggctg ttggagacct 1860 tctggatgcc ttcaaggagg cgaacccggc agtaccagag gtggaaaatc agcctcctgc 1920 aggcagcaat ccaggcccag agtctgaggg cagtggtgtg cccccacgtc ctgaggaagc 1980 agatgagacc tgggactcaa aggaagacaa aattcacaat gctgagaaca tccagcccgg 2040 ggaacagaag tatgaatata agtcagatca gtggaagcct ctaaacctag aggagaaaaa 2100 acgttacgac cgtgagttcc tgcttggttt tcagttcatc tttgccagta tgcagaagcc 2160 agagggattg ccacatatca gtgacgtggt gctggacaag gccaataaaa caccactgcg 2220 gccactggat cccactagac tacaaggcat aaattgtggc ccagacttca ctccatcctt 2280 tgccaacctt ggccggacaa cccttagcac ccgtgggccc ccaaggggtg ggccaggtgg 2340 ggagctgccc cgtgggccgg ctggcctggg accccggcgc tctcagcagg gaccccgaaa 2400 agaaccacgc aagatcattg ccacagtgtt aatgaccgaa gatataaaac tgaacaaagc 2460 agagaaagcc tggaaaccca gcagcaagcg gacggcggct gataaggatc gaggggaaga 2520 agatgctgat ggcagcaaaa cccaggacct attccgcagg gtgcgctcca tcctgaataa 2580 actgacaccc cagatgttcc agcagctgat gaagcaagtg acgcagctgg ccatcgacac 2640 cgaggaacgc ctcaaagggg tcattgacct catttttgag aaggccattt cagagcccaa 2700 cttctctgtg gcctatgcca acatgtgccg ctgcctcatg gcgctgaaag tgcccactac 2760 ggaaaagcca acagtgactg tgaacttccg aaagctgttg ttgaatcgat gtcagaagga 2820 gtttgagaaa gacaaagatg atgatgaggt ttttgagaag aagcaaaaag agatggatga 2880 agctgctacg gcagaggaac gaggacgcct gaaggaagag ctggaagagg ctcgggacat 2940 agcccggcgg cgctctttag ggaatatcaa gtttattgga gagttgttca aactgaagat 3000 gttaacagag gcaataatgc atgactgtgt ggtcaaactg cttaagaacc atgatgaaga 3060 gtcccttgag tgcctttgtc gtctgctcac caccattggc aaagacctgg actttgaaaa 3120 agccaagccc cgaatggatc agtatttcaa ccagatggaa aaaatcatta aagaaaagaa 3180 gacgtcatcc cgcatccgct ttatgctgca ggacgtgctg gatctgcgag ggagcaattg 3240 ggtgccacgc cgaggggatc agggtcccaa gaccattgac cagatccata aggaggctga 3300 gatggaagaa catcgagagc acatcaaagt gcagcagctc atggccaagg gcagtgacaa 3360 gcgtcggggc ggtcctccag gccctcccat cagccgtgga cttccccttg tggatgatgg 3420 tggctggaac acagttccca tcagcaaagg tagccgcccc attgacacct cacgactcac 3480 caagatcacc aagcctggct ccatcgattc taacaaccag ctctttgcac ctggagggcg 3540 actgagctgg ggcaagggca gcagcggagg ctcaggagcc aagccctcag acgcagcatc 3600 agaagctgct cgcccagcta ctagtacttt gaatcgcttc tcagcccttc aacaagcggt 3660 acccacagaa agcacagata atagacgtgt ggtgcagagg agtagcttga gccgagaacg 3720 aggcgagaaa gctggagacc gaggagaccg cctagagcgg agtgaacggg gaggggaccg 3780 tggggaccgg cttgatcgtg cgcggacacc tgctaccaag cggagcttca gcaaggaagt 3840 ggaggagcgg agtagagaac ggccctccca gcctgagggg ctgcgcaagg cagctagcct 3900 cacggaggat cgggaccgtg ggcgggatgc cgtgaagcga gaagctgccc tacccccagt 3960 gagccccctg aaggcggctc tctctgagga ggagttagag aagaaatcca aggctatcat 4020 tgaggaatat ctccatctca atgacatgaa agaggcagtc cagtgcgtgc aggagctggc 4080 ctcaccctcc ttgctcttca tctttgtacg gcatggtgtc gagtctacgc tggagcgcag 4140 tgccattgct cgtgagcata tggggcagct gctgcaccag ctgctctgtg ctgggcatct 4200 gtctactgct cagtactacc aagggttgta tgaaatcttg gaattggctg aggacatgga 4260 aattgacatc ccccacgtgt ggctctacct agcggaactg gtaacaccca ttctgcagga 4320 aggtggggtg cccatggggg agctgttcag ggagattaca aagcctctga gaccgttggg 4380 caaagctgct tccctgttgc tggagatcct gggcctcctg tgcaaaagca tgggtcctaa 4440 aaaggtgggg acgctgtggc gagaagccgg gcttagctgg aaggaatttc tacctgaagg 4500 ccaggacatt ggtgcattcg tcgctgaaca gaaggtggag tataccctgg gagaggagtc 4560 ggaagcccct ggccagaggg cactcccctc cgaggagctg aacaggcagc tggagaagct 4620 gctgaaggag ggcagcagta accagcgggt gttcgactgg atagaggcca acctgagtga 4680 gcagcagata gtatccaaca cgttagttcg agccctcatg acggctgtct gctattctgc 4740 aattattttt gagactcccc tccgagtgga cgttgcagtg ctgaaagcgc gagcgaagct 4800 gctgcagaaa tacctgtgtg acgagcagaa ggagctacag gcgctctacg ccctccaggc 4860 ccttgtagtg accttagaac agcctcccaa cctgctgcgg atgttctttg acgcactgta 4920 tgacgaggac gtggtgaagg aggatgcctt ctacagttgg gagagtagca aggaccccgc 4980 tgagcagcag ggcaagggtg tggcccttaa atctgtcaca gccttcttca agtggctccg 5040 tgaagcagag gaggagtctg accacaactg agggctggtg gggccgggga cctggagccc 5100 catggacaca cagatggccc ggctagccgc ctggactgca ggggggcggc agcagcggcg 5160 gtggcagtgg gtgcctgtag tgtgatgtgt ctgaactaat aaagtggctg aagaggcagg 5220 atggcttggg gctgcctggg cccccctcca ggatgccgcc aggtgtccct ctcctccccc 5280 tggggcacag agatatatta tatataaagt cttgaaattt ggtgtgtctt ggggtgggga 5340 ggggcaccaa cgcctgcccc tggggtcctt ttttttattt tctgaaaatc actctcggga 5400 ctgccgtcct cgctgctggg ggcatatgcc ccagcccctg taccacccct gctgttgcct 5460 gggcaggggg aagggggggc acggtgcctg taattattaa acatgaattc aattaagctc 5520 aaaaaaaaaa aaaaaaaa 5538 <210> 27 <211> 1435 <212> PRT <213> Homo sapiens <400> 27 Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile 1 5 10 15 Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile 20 25 30 Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly 35 40 45 Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val 50 55 60 Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg 65 70 75 80 Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser 85 90 95 Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser 100 105 110 Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr 115 120 125 Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly 130 135 140 Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile 145 150 155 160 Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe 165 170 175 Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val 180 185 190 Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro 195 200 205 Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser 210 215 220 Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu 225 230 235 240 Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu 245 250 255 Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr 260 265 270 Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala 275 280 285 Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala 290 295 300 Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu 305 310 315 320 Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu 325 330 335 Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg 340 345 350 Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp 355 360 365 Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro 370 375 380 Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro 385 390 395 400 Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys 405 410 415 Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr 420 425 430 Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr 435 440 445 Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln 450 455 460 Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala 465 470 475 480 Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile 485 490 495 Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr 500 505 510 Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu 515 520 525 Pro Arg Gly Pro Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro 530 535 540 Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp 545 550 555 560 Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg 565 570 575 Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys 580 585 590 Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr 595 600 605 Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile 610 615 620 Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys 625 630 635 640 Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg 645 650 655 Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr 660 665 670 Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu 675 680 685 Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met 690 695 700 Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu 705 710 715 720 Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys 725 730 735 Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met 740 745 750 His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu 755 760 765 Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe 770 775 780 Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys 785 790 795 800 Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln 805 810 815 Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp 820 825 830 Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu 835 840 845 Glu His Arg Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser 850 855 860 Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu 865 870 875 880 Pro Leu Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly 885 890 895 Ser Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly 900 905 910 Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser 915 920 925 Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala 930 935 940 Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser 945 950 955 960 Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val 965 970 975 Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp 980 985 990 Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp 995 1000 1005 Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser 1010 1015 1020 Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu 1025 1030 1035 Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly 1040 1045 1050 Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro 1055 1060 1065 Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys 1070 1075 1080 Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala 1085 1090 1095 Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile 1100 1105 1110 Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile 1115 1120 1125 Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala 1130 1135 1140 Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile 1145 1150 1155 Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp 1160 1165 1170 Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly 1175 1180 1185 Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg 1190 1195 1200 Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu 1205 1210 1215 Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg 1220 1225 1230 Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp 1235 1240 1245 Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly 1250 1255 1260 Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu 1265 1270 1275 Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn 1280 1285 1290 Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln 1295 1300 1305 Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys 1310 1315 1320 Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala 1325 1330 1335 Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp 1340 1345 1350 Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val 1355 1360 1365 Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp 1370 1375 1380 Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser 1385 1390 1395 Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val 1400 1405 1410 Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala 1415 1420 1425 Glu Glu Glu Ser Asp His Asn 1430 1435 <210> 28 <211> 5123 <212> DNA <213> Homo sapiens <400> 28 cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60 ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120 tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180 gggcgttcca catacgttgt cccgacacag cagtaccctg tgcagccagg agccccaggc 240 ttctatccag gtgcaagccc tacagaattt gggacctacg ctggcgccta ctatccagcc 300 caaggggtgc agcagtttcc cactggcgtg gcccccgccc cagttttgat gaaccagcca 360 ccccagattg ctcccaagag ggagcgtaag acgatccgaa ttcgagatcc aaaccaagga 420 ggaaaggata tcacagagga gatcatgtct ggggcccgca ctgcctccac acccacccct 480 ccccagacgg gaggcggtct ggagcctcaa gctaatgggg agacgcccca ggttgctgtc 540 attgtccggc cagatgaccg gtcacaggga gcaatcattg ctgaccggcc agggctgcct 600 ggcccagagc atagcccttc agaatcccag ccttcgtcgc cttctccgac cccatcacca 660 tccccagtct tggaaccggg gtctgagcct aatctcgcag tcctctctat tcctggggac 720 actatgacaa ctatacaaat gtctgtagaa gaatcaaccc ccatctcccg tgaaactggg 780 gagccatatc gcctctctcc agaacccact cctctcgccg aacccatact ggaagtagaa 840 gtgacactta gcaaaccggt tccagaatct gagttttctt ccagtcctct ccaggctccc 900 acccctttgg catctcacac agtggaaatt catgagccta atggcatggt cccatctgaa 960 gatctggaac cagaggtgga gtcaagccca gagcttgctc ctcccccagc ttgcccctcc 1020 gaatcccctg tgcccattgc tccaactgcc caacctgagg aactgctcaa cggagccccc 1080 tcgccaccag ctgtggactt aagcccagtc agtgagccag aggagcaggc caaggaggtg 1140 acagcatcaa tggcgccccc caccatcccc tctgctactc cagctacggc tccttcagct 1200 acttccccag ctcaggagga ggaaatggaa gaagaagaag aagaggaaga aggagaagca 1260 ggagaagcag gagaagctga gagtgagaaa ggaggagagg aactgctccc cccagagagt 1320 acccctattc cagccaactt gtctcagaat ttggaggcag cagcagccac tcaagtggca 1380 gtatctgtgc caaagaggag acggaaaatt aaggagctaa ataagaagga ggctgttgga 1440 gaccttctgg atgccttcaa ggaggcgaac ccggcagtac cagaggtgga aaatcagcct 1500 cctgcaggca gcaatccagg cccagagtct gagggcagtg gtgtgccccc acgtcctgag 1560 gaagcagatg agacctggga ctcaaaggaa gacaaaattc acaatgctga gaacatccag 1620 cccggggaac agaagtatga atataagtca gatcagtgga agcctctaaa cctagaggag 1680 aaaaaacgtt acgaccgtga gttcctgctt ggttttcagt tcatctttgc cagtatgcag 1740 aagccagagg gattgccaca tatcagtgac gtggtgctgg acaaggccaa taaaacacca 1800 ctgcggccac tggatcccac tagactacaa ggcataaatt gtggcccaga cttcactcca 1860 tcctttgcca accttggccg gacaaccctt agcacccgtg ggcccccaag gggtgggcca 1920 ggtggggagc tgccccgtgg gccggctggc ctgggacccc ggcgctctca gcagggaccc 1980 cgaaaagaac cacgcaagat cattgccaca gtgttaatga ccgaagatat aaaactgaac 2040 aaagcagaga aagcctggaa acccagcagc aagcggacgg cggctgataa ggatcgaggg 2100 gaagaagatg ctgatggcag caaaacccag gacctattcc gcagggtgcg ctccatcctg 2160 aataaactga caccccagat gttccagcag ctgatgaagc aagtgacgca gctggccatc 2220 gacaccgagg aacgcctcaa aggggtcatt gacctcattt ttgagaaggc catttcagag 2280 cccaacttct ctgtggccta tgccaacatg tgccgctgcc tcatggcgct gaaagtgccc 2340 actacggaaa agccaacagt gactgtgaac ttccgaaagc tgttgttgaa tcgatgtcag 2400 aaggagtttg agaaagacaa agatgatgat gaggtttttg agaagaagca aaaagagatg 2460 gatgaagctg ctacggcaga ggaacgagga cgcctgaagg aagagctgga agaggctcgg 2520 gacatagccc ggcggcgctc tttagggaat atcaagttta ttggagagtt gttcaaactg 2580 aagatgttaa cagaggcaat aatgcatgac tgtgtggtca aactgcttaa gaaccatgat 2640 gaagagtccc ttgagtgcct ttgtcgtctg ctcaccacca ttggcaaaga cctggacttt 2700 gaaaaagcca agccccgaat ggatcagtat ttcaaccaga tggaaaaaat cattaaagaa 2760 aagaagacgt catcccgcat ccgctttatg ctgcaggacg tgctggatct gcgagggagc 2820 aattgggtgc cacgccgagg ggatcagggt cccaagacca ttgaccagat ccataaggag 2880 gctgagatgg aagaacatcg agagcacatc aaagtgcagc agctcatggc caagggcagt 2940 gacaagcgtc ggggcggtcc tccaggccct cccatcagcc gtggacttcc ccttgtggat 3000 gatggtggct ggaacacagt tcccatcagc aaaggtagcc gccccattga cacctcacga 3060 ctcaccaaga tcaccaagcc tggctccatc gattctaaca accagctctt tgcacctgga 3120 gggcgactga gctggggcaa gggcagcagc ggaggctcag gagccaagcc ctcagacgca 3180 gcatcagaag ctgctcgccc agctactagt actttgaatc gcttctcagc ccttcaacaa 3240 gcggtaccca cagaaagcac agataataga cgtgtggtgc agaggagtag cttgagccga 3300 gaacgaggcg agaaagctgg agaccgagga gaccgcctag agcggagtga acggggaggg 3360 gaccgtgggg accggcttga tcgtgcgcgg acacctgcta ccaagcggag cttcagcaag 3420 gaagtggagg agcggagtag agaacggccc tcccagcctg aggggctgcg caaggcagct 3480 agcctcacgg aggatcggga ccgtgggcgg gatgccgtga agcgagaagc tgccctaccc 3540 ccagtgagcc ccctgaaggc ggctctctct gaggaggagt tagagaagaa atccaaggct 3600 atcattgagg aatatctcca tctcaatgac atgaaagagg cagtccagtg cgtgcaggag 3660 ctggcctcac cctccttgct cttcatcttt gtacggcatg gtgtcgagtc tacgctggag 3720 cgcagtgcca ttgctcgtga gcatatgggg cagctgctgc accagctgct ctgtgctggg 3780 catctgtcta ctgctcagta ctaccaaggg ttgtatgaaa tcttggaatt ggctgaggac 3840 atggaaattg acatccccca cgtgtggctc tacctagcgg aactggtaac acccattctg 3900 caggaaggtg gggtgcccat gggggagctg ttcagggaga ttacaaagcc tctgagaccg 3960 ttgggcaaag ctgcttccct gttgctggag atcctgggcc tcctgtgcaa aagcatgggt 4020 cctaaaaagg tggggacgct gtggcgagaa gccgggctta gctggaagga atttctacct 4080 gaaggccagg acattggtgc attcgtcgct gaacagaagg tggagtatac cctgggagag 4140 gagtcggaag cccctggcca gagggcactc ccctccgagg agctgaacag gcagctggag 4200 aagctgctga aggagggcag cagtaaccag cgggtgttcg actggataga ggccaacctg 4260 agtgagcagc agatagtatc caacacgtta gttcgagccc tcatgacggc tgtctgctat 4320 tctgcaatta tttttgagac tcccctccga gtggacgttg cagtgctgaa agcgcgagcg 4380 aagctgctgc agaaatacct gtgtgacgag cagaaggagc tacaggcgct ctacgccctc 4440 caggcccttg tagtgacctt agaacagcct cccaacctgc tgcggatgtt ctttgacgca 4500 ctgtatgacg aggacgtggt gaaggaggat gccttctaca gttgggagag tagcaaggac 4560 cccgctgagc agcagggcaa gggtgtggcc cttaaatctg tcacagcctt cttcaagtgg 4620 ctccgtgaag cagaggagga gtctgaccac aactgagggc tggtggggcc ggggacctgg 4680 agccccatgg acacacagat ggcccggcta gccgcctgga ctgcaggggg gcggcagcag 4740 cggcggtggc agtgggtgcc tgtagtgtga tgtgtctgaa ctaataaagt ggctgaagag 4800 gcaggatggc ttggggctgc ctgggccccc ctccaggatg ccgccaggtg tccctctcct 4860 ccccctgggg cacagagata tattatatat aaagtcttga aatttggtgt gtcttggggt 4920 ggggaggggc accaacgcct gcccctgggg tccttttttt tattttctga aaatcactct 4980 cgggactgcc gtcctcgctg ctgggggcat atgccccagc ccctgtacca cccctgctgt 5040 tgcctgggca gggggaaggg ggggcacggt gcctgtaatt attaaacatg aattcaatta 5100 agctcaaaaa aaaaaaaaaa aaa 5123 <210> 29 <211> 1512 <212> PRT <213> Homo sapiens <400> 29 Met Met Ile Pro Ser Gln Ile Ser Tyr Pro Ala Ser Gln Gly Ala Tyr 1 5 10 15 Tyr Ile Pro Gly Gln Gly Arg Ser Thr Tyr Val Val Pro Thr Gln Gln 20 25 30 Tyr Pro Val Gln Pro Gly Ala Pro Gly Phe Tyr Pro Gly Ala Ser Pro 35 40 45 Thr Glu Phe Gly Thr Tyr Ala Gly Ala Tyr Tyr Pro Ala Gln Gly Val 50 55 60 Gln Gln Phe Pro Thr Gly Val Ala Pro Ala Pro Val Leu Met Asn Gln 65 70 75 80 Pro Pro Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile Arg Ile Arg 85 90 95 Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile Met Ser Gly 100 105 110 Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly Gly Gly Leu 115 120 125 Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val Ile Val Arg 130 135 140 Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg Pro Gly Leu 145 150 155 160 Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser Ser Pro Ser 165 170 175 Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser Glu Pro Asn 180 185 190 Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr Ile Gln Met 195 200 205 Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly Glu Pro Tyr 210 215 220 Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile Leu Glu Val 225 230 235 240 Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe Ser Ser Ser 245 250 255 Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val Glu Ile His 260 265 270 Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro Glu Val Glu 275 280 285 Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser Glu Ser Pro 290 295 300 Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu Asn Gly Ala 305 310 315 320 Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu Pro Glu Glu 325 330 335 Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr Ile Pro Ser 340 345 350 Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala Gln Glu Glu 355 360 365 Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala Gly Glu Ala 370 375 380 Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu Pro Pro Glu 385 390 395 400 Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu Ala Ala Ala 405 410 415 Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg Lys Ile Lys 420 425 430 Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp Ala Phe Lys 435 440 445 Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro Pro Ala Gly 450 455 460 Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro Pro Arg Pro 465 470 475 480 Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys Ile His Asn 485 490 495 Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr Lys Ser Asp 500 505 510 Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr Asp Arg Glu 515 520 525 Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln Lys Pro Glu 530 535 540 Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala Asn Lys Thr 545 550 555 560 Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile Asn Cys Gly 565 570 575 Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr Thr Leu Ser 580 585 590 Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu Pro Arg Gly 595 600 605 Pro Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro Arg Lys Glu 610 615 620 Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp Ile Lys Leu 625 630 635 640 Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg Thr Ala Ala 645 650 655 Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys Thr Gln Asp 660 665 670 Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met 675 680 685 Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile Asp Thr Glu 690 695 700 Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys Ala Ile Ser 705 710 715 720 Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Met 725 730 735 Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr Val Asn Phe 740 745 750 Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys 755 760 765 Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met Asp Glu Ala 770 775 780 Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu Glu Glu Ala 785 790 795 800 Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys Phe Ile Gly 805 810 815 Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp Cys 820 825 830 Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu 835 840 845 Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala 850 855 860 Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Ile Lys 865 870 875 880 Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Leu 885 890 895 Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp Gln Gly Pro 900 905 910 Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu Glu His Arg 915 920 925 Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser Asp Lys Arg 930 935 940 Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu Pro Leu Val 945 950 955 960 Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly Ser Arg Pro 965 970 975 Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp 980 985 990 Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys 995 1000 1005 Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser 1010 1015 1020 Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala 1025 1030 1035 Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val 1040 1045 1050 Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly 1055 1060 1065 Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg 1070 1075 1080 Gly Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser 1085 1090 1095 Phe Ser Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln 1100 1105 1110 Pro Glu Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp 1115 1120 1125 Arg Gly Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val 1130 1135 1140 Ser Pro Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys 1145 1150 1155 Ser Lys Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys 1160 1165 1170 Glu Ala Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu 1175 1180 1185 Phe Ile Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser 1190 1195 1200 Ala Ile Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu 1205 1210 1215 Cys Ala Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr 1220 1225 1230 Glu Ile Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His 1235 1240 1245 Val Trp Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu 1250 1255 1260 Gly Gly Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro 1265 1270 1275 Leu Arg Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu 1280 1285 1290 Gly Leu Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu 1295 1300 1305 Trp Arg Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly 1310 1315 1320 Gln Asp Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr 1325 1330 1335 Leu Gly Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser 1340 1345 1350 Glu Glu Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser 1355 1360 1365 Ser Asn Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu 1370 1375 1380 Gln Gln Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala 1385 1390 1395 Val Cys Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp 1400 1405 1410 Val Ala Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu 1415 1420 1425 Cys Asp Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala 1430 1435 1440 Leu Val Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe 1445 1450 1455 Phe Asp Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe 1460 1465 1470 Tyr Ser Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys 1475 1480 1485 Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg 1490 1495 1500 Glu Ala Glu Glu Glu Ser Asp His Asn 1505 1510 <210> 30 <211> 5300 <212> DNA <213> Homo sapiens <400> 30 cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60 ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120 tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180 cacttctacc ctagccgggc ccagcccccg agcagtgcag cctcccgagt gcagagtgca 240 gcccctgccc gccctggccc agctgcccat gtctaccctg ctggatccca agtaatgatg 300 atcccttccc agatctccta cccagcctcc cagggggcct actacatccc tggacagggg 360 cgttccacat acgttgtccc gacacagcag taccctgtgc agccaggagc cccaggcttc 420 tatccaggtg caagccctac agaatttggg acctacgctg gcgcctacta tccagcccaa 480 ggggtgcagc agtttcccac tggcgtggcc cccgccccag ttttgatgaa ccagccaccc 540 cagattgctc ccaagaggga gcgtaagacg atccgaattc gagatccaaa ccaaggagga 600 aaggatatca cagaggagat catgtctggg gcccgcactg cctccacacc cacccctccc 660 cagacgggag gcggtctgga gcctcaagct aatggggaga cgccccaggt tgctgtcatt 720 gtccggccag atgaccggtc acagggagca atcattgctg accggccagg gctgcctggc 780 ccagagcata gcccttcaga atcccagcct tcgtcgcctt ctccgacccc atcaccatcc 840 ccagtcttgg aaccggggtc tgagcctaat ctcgcagtcc tctctattcc tggggacact 900 atgacaacta tacaaatgtc tgtagaagaa tcaaccccca tctcccgtga aactggggag 960 ccatatcgcc tctctccaga acccactcct ctcgccgaac ccatactgga agtagaagtg 1020 acacttagca aaccggttcc agaatctgag ttttcttcca gtcctctcca ggctcccacc 1080 cctttggcat ctcacacagt ggaaattcat gagcctaatg gcatggtccc atctgaagat 1140 ctggaaccag aggtggagtc aagcccagag cttgctcctc ccccagcttg cccctccgaa 1200 tcccctgtgc ccattgctcc aactgcccaa cctgaggaac tgctcaacgg agccccctcg 1260 ccaccagctg tggacttaag cccagtcagt gagccagagg agcaggccaa ggaggtgaca 1320 gcatcaatgg cgccccccac catcccctct gctactccag ctacggctcc ttcagctact 1380 tccccagctc aggaggagga aatggaagaa gaagaagaag aggaagaagg agaagcagga 1440 gaagcaggag aagctgagag tgagaaagga ggagaggaac tgctcccccc agagagtacc 1500 cctattccag ccaacttgtc tcagaatttg gaggcagcag cagccactca agtggcagta 1560 tctgtgccaa agaggagacg gaaaattaag gagctaaata agaaggaggc tgttggagac 1620 cttctggatg ccttcaagga ggcgaacccg gcagtaccag aggtggaaaa tcagcctcct 1680 gcaggcagca atccaggccc agagtctgag ggcagtggtg tgcccccacg tcctgaggaa 1740 gcagatgaga cctgggactc aaaggaagac aaaattcaca atgctgagaa catccagccc 1800 ggggaacaga agtatgaata taagtcagat cagtggaagc ctctaaacct agaggagaaa 1860 aaacgttacg accgtgagtt cctgcttggt tttcagttca tctttgccag tatgcagaag 1920 ccagagggat tgccacatat cagtgacgtg gtgctggaca aggccaataa aacaccactg 1980 cggccactgg atcccactag actacaaggc ataaattgtg gcccagactt cactccatcc 2040 tttgccaacc ttggccggac aacccttagc acccgtgggc ccccaagggg tgggccaggt 2100 ggggagctgc cccgtgggcc ggctggcctg ggaccccggc gctctcagca gggaccccga 2160 aaagaaccac gcaagatcat tgccacagtg ttaatgaccg aagatataaa actgaacaaa 2220 gcagagaaag cctggaaacc cagcagcaag cggacggcgg ctgataagga tcgaggggaa 2280 gaagatgctg atggcagcaa aacccaggac ctattccgca gggtgcgctc catcctgaat 2340 aaactgacac cccagatgtt ccagcagctg atgaagcaag tgacgcagct ggccatcgac 2400 accgaggaac gcctcaaagg ggtcattgac ctcatttttg agaaggccat ttcagagccc 2460 aacttctctg tggcctatgc caacatgtgc cgctgcctca tggcgctgaa agtgcccact 2520 acggaaaagc caacagtgac tgtgaacttc cgaaagctgt tgttgaatcg atgtcagaag 2580 gagtttgaga aagacaaaga tgatgatgag gtttttgaga agaagcaaaa agagatggat 2640 gaagctgcta cggcagagga acgaggacgc ctgaaggaag agctggaaga ggctcgggac 2700 atagcccggc ggcgctcttt agggaatatc aagtttattg gagagttgtt caaactgaag 2760 atgttaacag aggcaataat gcatgactgt gtggtcaaac tgcttaagaa ccatgatgaa 2820 gagtcccttg agtgcctttg tcgtctgctc accaccattg gcaaagacct ggactttgaa 2880 aaagccaagc cccgaatgga tcagtatttc aaccagatgg aaaaaatcat taaagaaaag 2940 aagacgtcat cccgcatccg ctttatgctg caggacgtgc tggatctgcg agggagcaat 3000 tgggtgccac gccgagggga tcagggtccc aagaccattg accagatcca taaggaggct 3060 gagatggaag aacatcgaga gcacatcaaa gtgcagcagc tcatggccaa gggcagtgac 3120 aagcgtcggg gcggtcctcc aggccctccc atcagccgtg gacttcccct tgtggatgat 3180 ggtggctgga acacagttcc catcagcaaa ggtagccgcc ccattgacac ctcacgactc 3240 accaagatca ccaagcctgg ctccatcgat tctaacaacc agctctttgc acctggaggg 3300 cgactgagct ggggcaaggg cagcagcgga ggctcaggag ccaagccctc agacgcagca 3360 tcagaagctg ctcgcccagc tactagtact ttgaatcgct tctcagccct tcaacaagcg 3420 gtacccacag aaagcacaga taatagacgt gtggtgcaga ggagtagctt gagccgagaa 3480 cgaggcgaga aagctggaga ccgaggagac cgcctagagc ggagtgaacg gggaggggac 3540 cgtggggacc ggcttgatcg tgcgcggaca cctgctacca agcggagctt cagcaaggaa 3600 gtggaggagc ggagtagaga acggccctcc cagcctgagg ggctgcgcaa ggcagctagc 3660 ctcacggagg atcgggaccg tgggcgggat gccgtgaagc gagaagctgc cctaccccca 3720 gtgagccccc tgaaggcggc tctctctgag gaggagttag agaagaaatc caaggctatc 3780 attgaggaat atctccatct caatgacatg aaagaggcag tccagtgcgt gcaggagctg 3840 gcctcaccct ccttgctctt catctttgta cggcatggtg tcgagtctac gctggagcgc 3900 agtgccattg ctcgtgagca tatggggcag ctgctgcacc agctgctctg tgctgggcat 3960 ctgtctactg ctcagtacta ccaagggttg tatgaaatct tggaattggc tgaggacatg 4020 gaaattgaca tcccccacgt gtggctctac ctagcggaac tggtaacacc cattctgcag 4080 gaaggtgggg tgcccatggg ggagctgttc agggagatta caaagcctct gagaccgttg 4140 ggcaaagctg cttccctgtt gctggagatc ctgggcctcc tgtgcaaaag catgggtcct 4200 aaaaaggtgg ggacgctgtg gcgagaagcc gggcttagct ggaaggaatt tctacctgaa 4260 ggccaggaca ttggtgcatt cgtcgctgaa cagaaggtgg agtataccct gggagaggag 4320 tcggaagccc ctggccagag ggcactcccc tccgaggagc tgaacaggca gctggagaag 4380 ctgctgaagg agggcagcag taaccagcgg gtgttcgact ggatagaggc caacctgagt 4440 gagcagcaga tagtatccaa cacgttagtt cgagccctca tgacggctgt ctgctattct 4500 gcaattattt ttgagactcc cctccgagtg gacgttgcag tgctgaaagc gcgagcgaag 4560 ctgctgcaga aatacctgtg tgacgagcag aaggagctac aggcgctcta cgccctccag 4620 gcccttgtag tgaccttaga acagcctccc aacctgctgc ggatgttctt tgacgcactg 4680 tatgacgagg acgtggtgaa ggaggatgcc ttctacagtt gggagagtag caaggacccc 4740 gctgagcagc agggcaaggg tgtggccctt aaatctgtca cagccttctt caagtggctc 4800 cgtgaagcag aggaggagtc tgaccacaac tgagggctgg tggggccggg gacctggagc 4860 cccatggaca cacagatggc ccggctagcc gcctggactg caggggggcg gcagcagcgg 4920 cggtggcagt gggtgcctgt agtgtgatgt gtctgaacta ataaagtggc tgaagaggca 4980 ggatggcttg gggctgcctg ggcccccctc caggatgccg ccaggtgtcc ctctcctccc 5040 cctggggcac agagatatat tatatataaa gtcttgaaat ttggtgtgtc ttggggtggg 5100 gaggggcacc aacgcctgcc cctggggtcc ttttttttat tttctgaaaa tcactctcgg 5160 gactgccgtc ctcgctgctg ggggcatatg ccccagcccc tgtaccaccc ctgctgttgc 5220 ctgggcaggg ggaagggggg gcacggtgcc tgtaattatt aaacatgaat tcaattaagc 5280 tcaaaaaaaa aaaaaaaaaa 5300 <210> 31 <211> 434 <212> PRT <213> Homo sapiens <400> 31 Met Ser Ile Leu Lys Ile His Ala Arg Glu Ile Phe Asp Ser Arg Gly 1 5 10 15 Asn Pro Thr Val Glu Val Asp Leu Phe Thr Ser Lys Gly Leu Phe Arg 20 25 30 Ala Ala Val Pro Ser Gly Ala Ser Thr Gly Ile Tyr Glu Ala Leu Glu 35 40 45 Leu Arg Asp Asn Asp Lys Thr Arg Tyr Met Gly Lys Gly Val Ser Lys 50 55 60 Ala Val Glu His Ile Asn Lys Thr Ile Ala Pro Ala Leu Val Ser Lys 65 70 75 80 Lys Leu Asn Val Thr Glu Gln Glu Lys Ile Asp Lys Leu Met Ile Glu 85 90 95 Met Asp Gly Thr Glu Asn Lys Ser Lys Phe Gly Ala Asn Ala Ile Leu 100 105 110 Gly Val Ser Leu Ala Val Cys Lys Ala Gly Ala Val Glu Lys Gly Val 115 120 125 Pro Leu Tyr Arg His Ile Ala Asp Leu Ala Gly Asn Ser Glu Val Ile 130 135 140 Leu Pro Val Pro Ala Phe Asn Val Ile Asn Gly Gly Ser His Ala Gly 145 150 155 160 Asn Lys Leu Ala Met Gln Glu Phe Met Ile Leu Pro Val Gly Ala Ala 165 170 175 Asn Phe Arg Glu Ala Met Arg Ile Gly Ala Glu Val Tyr His Asn Leu 180 185 190 Lys Asn Val Ile Lys Glu Lys Tyr Gly Lys Asp Ala Thr Asn Val Gly 195 200 205 Asp Glu Gly Gly Phe Ala Pro Asn Ile Leu Glu Asn Lys Glu Gly Leu 210 215 220 Glu Leu Leu Lys Thr Ala Ile Gly Lys Ala Gly Tyr Thr Asp Lys Val 225 230 235 240 Val Ile Gly Met Asp Val Ala Ala Ser Glu Phe Phe Arg Ser Gly Lys 245 250 255 Tyr Asp Leu Asp Phe Lys Ser Pro Asp Asp Pro Ser Arg Tyr Ile Ser 260 265 270 Pro Asp Gln Leu Ala Asp Leu Tyr Lys Ser Phe Ile Lys Asp Tyr Pro 275 280 285 Val Val Ser Ile Glu Asp Pro Phe Asp Gln Asp Asp Trp Gly Ala Trp 290 295 300 Gln Lys Phe Thr Ala Ser Ala Gly Ile Gln Val Val Gly Asp Asp Leu 305 310 315 320 Thr Val Thr Asn Pro Lys Arg Ile Ala Lys Ala Val Asn Glu Lys Ser 325 330 335 Cys Asn Cys Leu Leu Leu Lys Val Asn Gln Ile Gly Ser Val Thr Glu 340 345 350 Ser Leu Gln Ala Cys Lys Leu Ala Gln Ala Asn Gly Trp Gly Val Met 355 360 365 Val Ser His Arg Ser Gly Glu Thr Glu Asp Thr Phe Ile Ala Asp Leu 370 375 380 Val Val Gly Leu Cys Thr Gly Gln Ile Lys Thr Gly Ala Pro Cys Arg 385 390 395 400 Ser Glu Arg Leu Ala Lys Tyr Asn Gln Leu Leu Arg Ile Glu Glu Glu 405 410 415 Leu Gly Ser Lys Ala Lys Phe Ala Gly Arg Asn Phe Arg Asn Pro Leu 420 425 430 Ala Lys <210> 32 <211> 2204 <212> DNA <213> Homo sapiens <400> 32 gtggggcccc agagcgacgc tgagtgcgtg cgggactcgg agtacgtgac ggagccccga 60 gctctcatgc ccgccacgcc gccccgggcc atcccccgga gccccggctc cgcacacccc 120 agttcggctc accggtccta tctggggcca gagtttcgcc cgcaccacta cagggccgct 180 ggggagtcgg ggccccccag atctgcccgc ctcaagtccg cgggacgtca cccccctttc 240 cacgctactg cagccgtcgc agtcccaccc ctttccggga ggtgagggaa tgagtgacgg 300 ctctcccgac gaatggcgag gcggagctga gggggcgtgc cccggaggcg ggaagtgggt 360 ggggctcgcc ttagctaggc aggaagtcgg cgcgggcggc gcggacagta tctgtgggta 420 cccggagcac ggagatctcg ccggctttac gttcacctcg gtgtctgcag caccctccgc 480 ttcctctcct aggcgacgag acccagtggc tagaagttca ccatgtctat tctcaagatc 540 catgccaggg agatctttga ctctcgcggg aatcccactg ttgaggttga tctcttcacc 600 tcaaaaggtc tcttcagagc tgctgtgccc agtggtgctt caactggtat ctatgaggcc 660 ctagagctcc gggacaatga taagactcgc tatatgggga agggtgtctc aaaggctgtt 720 gagcacatca ataaaactat tgcgcctgcc ctggttagca agaaactgaa cgtcacagaa 780 caagagaaga ttgacaaact gatgatcgag atggatggaa cagaaaataa atctaagttt 840 ggtgcgaacg ccattctggg ggtgtccctt gccgtctgca aagctggtgc cgttgagaag 900 ggggtccccc tgtaccgcca catcgctgac ttggctggca actctgaagt catcctgcca 960 gtcccggcgt tcaatgtcat caatggcggt tctcatgctg gcaacaagct ggccatgcag 1020 gagttcatga tcctcccagt cggtgcagca aacttcaggg aagccatgcg cattggagca 1080 gaggtttacc acaacctgaa gaatgtcatc aaggagaaat atgggaaaga tgccaccaat 1140 gtgggggatg aaggcgggtt tgctcccaac atcctggaga ataaagaagg cctggagctg 1200 ctgaagactg ctattgggaa agctggctac actgataagg tggtcatcgg catggacgta 1260 gcggcctccg agttcttcag gtctgggaag tatgacctgg acttcaagtc tcccgatgac 1320 cccagcaggt acatctcgcc tgaccagctg gctgacctgt acaagtcctt catcaaggac 1380 tacccagtgg tgtctatcga agatcccttt gaccaggatg actggggagc ttggcagaag 1440 ttcacagcca gtgcaggaat ccaggtagtg ggggatgatc tcacagtgac caacccaaag 1500 aggatcgcca aggccgtgaa cgagaagtcc tgcaactgcc tcctgctcaa agtcaaccag 1560 attggctccg tgaccgagtc tcttcaggcg tgcaagctgg cccaggccaa tggttggggc 1620 gtcatggtgt ctcatcgttc gggggagact gaagatacct tcatcgctga cctggttgtg 1680 gggctgtgca ctgggcagat caagactggt gccccttgcc gatctgagcg cttggccaag 1740 tacaaccagc tcctcagaat tgaagaggag ctgggcagca aggctaagtt tgccggcagg 1800 aacttcagaa accccttggc caagtaagct gtgggcaggc aagcccttcg gtcacctgtt 1860 ggctacacag acccctcccc tcgtgtcagc tcaggcagct cgaggccccc gaccaacact 1920 tgcaggggtc cctgctagtt agcgccccac cgccgtggag ttcgtaccgc ttccttagaa 1980 cttctacaga agccaagctc cctggagccc tgttggcagc tctagctttg cagtcgtgta 2040 attggcccaa gtcattgttt ttctcgcctc actttccacc aagtgtctag agtcatgtga 2100 gcctcgtgtc atctccgggg tggccacagg ctagatcccc ggtggttttg tgctcaaaat 2160 aaaaagcctc agtgacccat gagaataaaa aaaaaaaaaa aaaa 2204 <210> 33 <211> 321 <212> PRT <213> Homo sapiens <400> 33 Met Lys Pro Gly Phe Ser Pro Arg Gly Gly Gly Phe Gly Gly Arg Gly 1 5 10 15 Gly Phe Gly Asp Arg Gly Gly Arg Gly Gly Arg Gly Gly Phe Gly Gly 20 25 30 Gly Arg Gly Arg Gly Gly Gly Phe Arg Gly Arg Gly Arg Gly Gly Gly 35 40 45 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Arg Gly Gly Gly Gly Phe 50 55 60 His Ser Gly Gly Asn Arg Gly Arg Gly Arg Gly Gly Lys Arg Gly Asn 65 70 75 80 Gln Ser Gly Lys Asn Val Met Val Glu Pro His Arg His Glu Gly Val 85 90 95 Phe Ile Cys Arg Gly Lys Glu Asp Ala Leu Val Thr Lys Asn Leu Val 100 105 110 Pro Gly Glu Ser Val Tyr Gly Glu Lys Arg Val Ser Ile Ser Glu Gly 115 120 125 Asp Asp Lys Ile Glu Tyr Arg Ala Trp Asn Pro Phe Arg Ser Lys Leu 130 135 140 Ala Ala Ala Ile Leu Gly Gly Val Asp Gln Ile His Ile Lys Pro Gly 145 150 155 160 Ala Lys Val Leu Tyr Leu Gly Ala Ala Ser Gly Thr Thr Val Ser His 165 170 175 Val Ser Asp Ile Val Gly Pro Asp Gly Leu Val Tyr Ala Val Glu Phe 180 185 190 Ser His Arg Ser Gly Arg Asp Leu Ile Asn Leu Ala Lys Lys Arg Thr 195 200 205 Asn Ile Ile Pro Val Ile Glu Asp Ala Arg His Pro His Lys Tyr Arg 210 215 220 Met Leu Ile Ala Met Val Asp Val Ile Phe Ala Asp Val Ala Gln Pro 225 230 235 240 Asp Gln Thr Arg Ile Val Ala Leu Asn Ala His Thr Phe Leu Arg Asn 245 250 255 Gly Gly His Phe Val Ile Ser Ile Lys Ala Asn Cys Ile Asp Ser Thr 260 265 270 Ala Ser Ala Glu Ala Val Phe Ala Ser Glu Val Lys Lys Met Gln Gln 275 280 285 Glu Asn Met Lys Pro Gln Glu Gln Leu Thr Leu Glu Pro Tyr Glu Arg 290 295 300 Asp His Ala Val Val Val Gly Val Tyr Arg Pro Pro Pro Lys Val Lys 305 310 315 320 Asn <210> 34 <211> 1171 <212> DNA <213> Homo sapiens <400> 34 gcgtcacgca gcgcacgtcg ccgcgcgcct gcgctctttt ccacgtgcga aagccccgga 60 ctcgtggagt tgtgaacgcc gcggactccg gagccgcaca aaccagggct cgccatgaag 120 ccaggattca gtccccgtgg gggtggcttt ggcggccgag ggggctttgg tgaccgtggt 180 ggtcgtggag gccgaggggg ctttggcggg ggccgaggtc gaggcggagg ctttagaggt 240 cgtggacgag gaggaggtgg aggcggcggc ggcggtggag gaggaggaag aggtggtgga 300 ggcttccatt ctggtggcaa ccggggtcgt ggtcggggag gaaaaagagg aaaccagtcg 360 gggaagaatg tgatggtgga gccgcatcgg catgagggtg tcttcatttg tcgaggaaag 420 gaagatgcac tggtcaccaa gaacctggtc cctggggaat cagtttatgg agagaagaga 480 gtctcgattt cggaaggaga tgacaaaatt gagtaccgag cctggaaccc cttccgctcc 540 aagctagcag cagcaatcct gggtggtgtg gaccagatcc acatcaaacc gggggctaag 600 gttctctacc tcggggctgc ctcgggcacc acggtctccc atgtctctga catcgttggt 660 ccggatggtc tagtctatgc agtcgagttc tcccaccgct ctggccgtga cctcattaac 720 ttggccaaga agaggaccaa catcattcct gtgatcgagg atgctcgaca cccacacaaa 780 taccgcatgc tcatcgcaat ggtggatgtg atctttgctg atgtggccca gccagaccag 840 acccggattg tggccctgaa tgcccacacc ttcctgcgta atggaggaca ctttgtgatt 900 tccattaagg ccaactgcat tgactccaca gcctcagccg aggccgtgtt tgcctccgaa 960 gtgaaaaaga tgcaacagga gaacatgaag ccgcaggagc agttgaccct tgagccatat 1020 gaaagagacc atgccgtggt cgtgggagtg tacaggccac cccccaaggt gaagaactga 1080 agttcagcgc tgtcaggatt gcgagagatg tgtgttgata ctgttgcacg tgtgtttttc 1140 tattaaaaga ctcatccgtc tcccaaaaaa a 1171 <210> 35 <211> 420 <212> PRT <213> Homo sapiens <400> 35 Met Ser Gly Arg Pro Arg Thr Thr Ser Phe Ala Glu Ser Cys Lys Pro 1 5 10 15 Val Gln Gln Pro Ser Ala Phe Gly Ser Met Lys Val Ser Arg Asp Lys 20 25 30 Asp Gly Ser Lys Val Thr Thr Val Val Ala Thr Pro Gly Gln Gly Pro 35 40 45 Asp Arg Pro Gln Glu Val Ser Tyr Thr Asp Thr Lys Val Ile Gly Asn 50 55 60 Gly Ser Phe Gly Val Val Tyr Gln Ala Lys Leu Cys Asp Ser Gly Glu 65 70 75 80 Leu Val Ala Ile Lys Lys Val Leu Gln Asp Lys Arg Phe Lys Asn Arg 85 90 95 Glu Leu Gln Ile Met Arg Lys Leu Asp His Cys Asn Ile Val Arg Leu 100 105 110 Arg Tyr Phe Phe Tyr Ser Ser Gly Glu Lys Lys Asp Glu Val Tyr Leu 115 120 125 Asn Leu Val Leu Asp Tyr Val Pro Glu Thr Val Tyr Arg Val Ala Arg 130 135 140 His Tyr Ser Arg Ala Lys Gln Thr Leu Pro Val Ile Tyr Val Lys Leu 145 150 155 160 Tyr Met Tyr Gln Leu Phe Arg Ser Leu Ala Tyr Ile His Ser Phe Gly 165 170 175 Ile Cys His Arg Asp Ile Lys Pro Gln Asn Leu Leu Leu Asp Pro Asp 180 185 190 Thr Ala Val Leu Lys Leu Cys Asp Phe Gly Ser Ala Lys Gln Leu Val 195 200 205 Arg Gly Glu Pro Asn Val Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala 210 215 220 Pro Glu Leu Ile Phe Gly Ala Thr Asp Tyr Thr Ser Ser Ile Asp Val 225 230 235 240 Trp Ser Ala Gly Cys Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Ile 245 250 255 Phe Pro Gly Asp Ser Gly Val Asp Gln Leu Val Glu Ile Ile Lys Val 260 265 270 Leu Gly Thr Pro Thr Arg Glu Gln Ile Arg Glu Met Asn Pro Asn Tyr 275 280 285 Thr Glu Phe Lys Phe Pro Gln Ile Lys Ala His Pro Trp Thr Lys Val 290 295 300 Phe Arg Pro Arg Thr Pro Pro Glu Ala Ile Ala Leu Cys Ser Arg Leu 305 310 315 320 Leu Glu Tyr Thr Pro Thr Ala Arg Leu Thr Pro Leu Glu Ala Cys Ala 325 330 335 His Ser Phe Phe Asp Glu Leu Arg Asp Pro Asn Val Lys Leu Pro Asn 340 345 350 Gly Arg Asp Thr Pro Ala Leu Phe Asn Phe Thr Thr Gln Glu Leu Ser 355 360 365 Ser Asn Pro Pro Leu Ala Thr Ile Leu Ile Pro Pro His Ala Arg Ile 370 375 380 Gln Ala Ala Ala Ser Thr Pro Thr Asn Ala Thr Ala Ala Ser Asp Ala 385 390 395 400 Asn Thr Gly Asp Arg Gly Gln Thr Asn Asn Ala Ala Ser Ala Ser Ala 405 410 415 Ser Asn Ser Thr 420 <210> 36 <211> 7095 <212> DNA <213> Homo sapiens <400> 36 cgggcttgtg ccgccgccgc cgccgccgcc gcccgggcca agtgacaaag gaaggaagga 60 agcgaggagg agccggcccc gcagccgctg acagggctct gggctggggc aaagcgcgga 120 cacttcctga gcgggcaccg agcagagccg aggggcggga gggcggccga gctgttgccg 180 cggacggggg agggggcccc gagggacgga agcggttgcc gggttcccat gtccccggcg 240 aatggggaac agtcgaggag ccgctgcctg gggtctgaag ggagctgcct ccgccaccgc 300 catggccgct ggatccagcc gccgcctgca gctgctcctg gcgcaatgag gagaggagcc 360 gccgccaccg ccaccgcccg cctctgactg actcgcgact ccgccgccct ctagttcgcc 420 gggcccctgc cgtcagcccg ccggatcccg cggcttgccg gagctgcagc gtttcccgtc 480 gcatctccga gccaccccct ccctccctct ccctccctcc tacccatccc cctttctctt 540 caagcgtgag actcgtgatc cttccgccgc ttcccttctt cattgactcg gaaaaaaaat 600 ccccgaggaa aatataatat tcgaagtact cattttcaat caagtatttg cccccgtttc 660 acgtgataca tattttttta ggatttgccc tctcttttct ctcctcccag gaaagggagg 720 ggaaagaatt gtattttttc ccaagtccta aatcatctat atgttaaata tccgtgccga 780 tctgtcttga aggagaaata tatcgcttgt tttgtttttt atagtataca aaaggagtga 840 aaagccaaga ggacgaagtc tttttctttt tcttctgtgg gagaacttaa tgctgcattt 900 atcgttaacc taacacccca acataaagac aaaaggaaga aaaggaggaa ggaaggaaaa 960 ggtgattcgc gaagagagtg atcatgtcag ggcggcccag aaccacctcc tttgcggaga 1020 gctgcaagcc ggtgcagcag ccttcagctt ttggcagcat gaaagttagc agagacaagg 1080 acggcagcaa ggtgacaaca gtggtggcaa ctcctgggca gggtccagac aggccacaag 1140 aagtcagcta tacagacact aaagtgattg gaaatggatc atttggtgtg gtatatcaag 1200 ccaaactttg tgattcagga gaactggtcg ccatcaagaa agtattgcag gacaagagat 1260 ttaagaatcg agagctccag atcatgagaa agctagatca ctgtaacata gtccgattgc 1320 gttatttctt ctactccagt ggtgagaaga aagatgaggt ctatcttaat ctggtgctgg 1380 actatgttcc ggaaacagta tacagagttg ccagacacta tagtcgagcc aaacagacgc 1440 tccctgtgat ttatgtcaag ttgtatatgt atcagctgtt ccgaagttta gcctatatcc 1500 attcctttgg aatctgccat cgggatatta aaccgcagaa cctcttgttg gatcctgata 1560 ctgctgtatt aaaactctgt gactttggaa gtgcaaagca gctggtccga ggagaaccca 1620 atgtttcgta tatctgttct cggtactata gggcaccaga gttgatcttt ggagccactg 1680 attatacctc tagtatagat gtatggtctg ctggctgtgt gttggctgag ctgttactag 1740 gacaaccaat atttccaggg gatagtggtg tggatcagtt ggtagaaata atcaaggtcc 1800 tgggaactcc aacaagggag caaatcagag aaatgaaccc aaactacaca gaatttaaat 1860 tccctcaaat taaggcacat ccttggacta aggtcttccg accccgaact ccaccggagg 1920 caattgcact gtgtagccgt ctgctggagt atacaccaac tgcccgacta acaccactgg 1980 aagcttgtgc acattcattt tttgatgaat tacgggaccc aaatgtcaaa ctaccaaatg 2040 ggcgagacac acctgcactc ttcaacttca ccactcaaga actgtcaagt aatccacctc 2100 tggctaccat ccttattcct cctcatgctc ggattcaagc agctgcttca acccccacaa 2160 atgccacagc agcgtcagat gctaatactg gagaccgtgg acagaccaat aatgctgctt 2220 ctgcatcagc ttccaactcc acctgaacag tcccgagcag ccagctgcac aggaaaaacc 2280 accagttact tgagtgtcac tcagcaacac tggtcacgtt tggaaagaat attaaaaaga 2340 gaaaaaaatc ctgttcattt tagtgttcaa tttttttatt attattgttg ttcttattta 2400 accttgtaaa atatctataa atacaaacca atttcattgt attctcactt tgagggagat 2460 ccagggggtg ggaggggttg tggggagggg gaaagcggag cactagaaca tacaatctct 2520 ctcccacgac aatctttttt tattaaaagt ctgctgttgt atactttaaa aacaggactc 2580 ctgcctcatg ccccttccac aaaagaagaa aacctttttc tgtgctgatg ggtttttttg 2640 aactttgttt tcttttaaag tctagtgtga gactttggta tagtgcacag cttgaaattg 2700 gttgggagct tagcaggtat aactcaacgg ggacttaaat gtcacttgta aaattaatcc 2760 atatcttcgg gtatttatag acttgccttt ggcatgttgg tggcaggtgt ggcagacaaa 2820 gaaatgtgta tcattcgtaa cccagggagg tcaataaagt ttggaactct acagggaaga 2880 ttcttagtag atttgttaag gttttgtttt gctctcagtt agtgctagtg atgtagaggc 2940 ttgtacagga ggctgccaga ggggaagcag caagcaagac tcaggcacac atgctctaca 3000 ggtggctctt tgtttgcctg accaaagttc tttgcaaatc ttagcacagt ttcaaactag 3060 tgacctggga ggagatggaa ggggtgttga gcaggctgag ctagctgctg aggtcaaagg 3120 ctgatgagcc cagaggaagg ggacaggtca gggatacatc tcaccactgt gaataagttt 3180 gtccagattt ttttctaaag ttacttccct tggaaagata cacttgagag gacattgtag 3240 ttaaataatg tgaactgtaa cagtcatcta ctggtttatt tttcatattt tttaattgaa 3300 aattgagctt gcagaaatag ccacattcta cacatagttc taattttaaa tccaaatcta 3360 gaatctgtat ttaatttgtt ttttaacctc atgcttttta catttattta ttgatgcatg 3420 tcagatggta gaaatattaa aaactacaca tcagaatgat acagtcactt atacctgctg 3480 actttatagg aaagctgatg atataaatgt gtgtatatat gttatatata catatattca 3540 atactgcctt tttttttgtc tacagtatca aaattgactg gttgaagcat gagaagaatg 3600 tttcccccac acccagttaa gagtttttgt gtctgttttc tttgtgtatc agtgaacgat 3660 gttaagaatc agtctctctt tttgaagaaa aagcaatatt ccttggaaag caaggagaat 3720 tgaaggacta tgtttgccgt gaggaaatag attttcatga ctagtttgtt ttatactttt 3780 aaggttggca tctatgtggg ccttatatac tctaaaatga actttagtca ccttggtgct 3840 tatgggccat tacttgacct atgaatcttt aaggcacaat cagttgtact ttacatttaa 3900 agatcacttg agtgatggcc gcctttccct cctacccgct ccttccccac atgccttcca 3960 aggttagctg gtaactgtag ggctgcagag ctgagcccat ggttgtgtgt aacttgccct 4020 caccctcctc attgccacct taggtcactt tatgggtctc gtcctccaga gggttcggaa 4080 gtggagtctg ttggcagccc tcctgcaggc cctagcaccc tgtcctgctc cttaactgtg 4140 tgtgtgactc tccaagagag ttgtcctgcc tgctgaagtg aaccagtacc cagaaagaca 4200 actgtgagcc atcttggttt tcactcgctg tttagctgag gtcttgggcc acaaaagggg 4260 tttcacaaac ctctggatat atcagagttt atgagaaagg aaacatgctc agtcaaacca 4320 aatcaaacaa attgaatttt atgttttata aagtgcttct gaaagctaag atttgaaaga 4380 agtctgaaat caaagtattt ggcagcataa ctccttaaag gtagtggcgt tgatagacca 4440 ttttcagaca gaatttataa agaatctgaa aaggcaggtc tgtgatagag aaatggacct 4500 gcattcagat ccaactgccc agcaagcgtt tggatgcaga cactgctctg gacgtggtat 4560 actccccaga gtccataaaa atcagtgctt attttaggaa acaggttgcc ccccacaact 4620 ggggtaaaag aagagagaaa agtcacgctt ttctctcatt tcattgtgtg tgcatgtgtg 4680 cgtgtgtgtg tgtgtgtgtg tgtgctgaga tgtgtgattt ttctttctca aggatcatgg 4740 tgggatcaca gaactctttt atacaagtga gatccaggtc tctgaatatc tttttgtata 4800 taataataat aaaaagctcc tcaccaaatt caagcttgta cattatattt tctttctgtg 4860 tttttaaatt taagttttat tgttttgtat gtaaatatgt ggacccagga actgttatta 4920 atgagcaaaa agttactgtt cagggcagtg attctgttta ataatcagac aaaatgtaga 4980 cgagcttttt aaagccatat agttttaact ctgtacagta ggtaccggcc tgtattattg 5040 taacaataac tctagcaatg tatagtgtat ctatatagtt tggagtgcct tcgcttccat 5100 gtgttttttt ttttaatttg ttctttttta aattttaatt ggtttccttt atccatgtct 5160 ccctgtccac cccctttccc tttgaaataa taactcactc ataacagtat ctttgcccct 5220 tccacagtta agtttcagtg ataccatact caggagtggg aagaggaaat catattcgta 5280 atttcatttc gttgaagccc tgcctttgtt ttggttctga atgtctttcc tcctcggtag 5340 cagtgagacc ggtttcattt catacttagt ccattcaggg acttagtgta gcaccaggga 5400 gccctagagc tggaggatat cgaatagatt aaattttgct cgtctcttcc acaagcccta 5460 accatgggtc ttaaaaacag cagattctgg gagccttcca tgctctctct ctctcctctt 5520 ttatctactt ccctcccaaa tgagagagtg acagagaatt gtttttttat aaatcgaagt 5580 ttcttaatag tatcaggttt tgatacgtca gtggtctaaa atgctatagt gcaattacta 5640 gcagttactg cacggagtgc caccgtgcca atagaggact gttgttttaa caagggaact 5700 cttagcccat ttcctccctc ccgccatctc tacccttgct caatgaaata tcattttaat 5760 ttcttttaaa aaaaatcagt ttaattctta ctgtgtgccc aacacgaagg ccttttttga 5820 aagaaaaata gaatgttttg cctcaaagta gtccatataa aatgtcttga atagaagaaa 5880 aaactaccaa accaaaggtt actatttttg aaacatcgtg tgttcattcc agcaaggcag 5940 aagactgcac cttctttcca gtgacatgct gtgtcatttt ttttaagtcc tcttaatttt 6000 tagacacatt tttggtttat gttttaacaa tgtatgccta accagtcatc ttgtctgcac 6060 caatgcaaag gtttctgaga ggagtattct ctatccctgt ggatatgaag acactggcat 6120 ttcatctatt tttccctttc ctttttaaag gatttaactt tggaatcttc caaaggaagt 6180 ttggccaatg ccagatcccc aggaatttgg ggggttttct ttcttttcaa ctgaaattgt 6240 atctgattcc tactgttcat gttagtgatc atctaatcac agagccaaac acttttctcc 6300 cctgtgtgga aaagtaggta tgctttacaa taaaatctgt cttttctggt agaaacctga 6360 gccactgaaa ataaaagaga caactagaag cacagtagag tcccagactg agatctacct 6420 ttgagaggct ttgaaagtaa tccctggggt ttggattatt ttcacaaggg ttatgccgtt 6480 ttattcaagt ttgttgctcc gttttgcacc tctgcaataa aagcaaaatg acaaccagta 6540 cataaggggt tagcttgaca aagtagactt ccttgtgtta atttttaagt ttttttttcc 6600 ttaactatat ctgtctacag gcagatacag atagttgtat gaaaatctgc ttgcctgtaa 6660 aatttgcatt tataaatgtg ttgccgatgg atcacttggg cctgtacaca taccaattag 6720 cgtgaccact tccatcttaa aaacaaacct aaaaaacaaa atttattata tatatatata 6780 tatatatata aaggactgtg ggttgtatac aaactattgc aaacacttgt gcaaatctgt 6840 cttgatataa aggaaaagca aaatctgtat aacattatta ctacttgaat gcctctgtga 6900 ctgatttttt tttcatttta aatataaact tttttgtgaa aagtatgctc aatgtttttt 6960 ttccctttcc ccattccctt gtaaatacat tttgttctat gtgacttggt ttggaaatag 7020 ttaactggta ctgtaatttg cattaaataa aaagtaggtt agcctggaaa tgaaattaaa 7080 aaaaaaaaaa aaaaa 7095 <210> 37 <211> 433 <212> PRT <213> Homo sapiens <400> 37 Met Ser Gly Arg Pro Arg Thr Thr Ser Phe Ala Glu Ser Cys Lys Pro 1 5 10 15 Val Gln Gln Pro Ser Ala Phe Gly Ser Met Lys Val Ser Arg Asp Lys 20 25 30 Asp Gly Ser Lys Val Thr Thr Val Val Ala Thr Pro Gly Gln Gly Pro 35 40 45 Asp Arg Pro Gln Glu Val Ser Tyr Thr Asp Thr Lys Val Ile Gly Asn 50 55 60 Gly Ser Phe Gly Val Val Tyr Gln Ala Lys Leu Cys Asp Ser Gly Glu 65 70 75 80 Leu Val Ala Ile Lys Lys Val Leu Gln Asp Lys Arg Phe Lys Asn Arg 85 90 95 Glu Leu Gln Ile Met Arg Lys Leu Asp His Cys Asn Ile Val Arg Leu 100 105 110 Arg Tyr Phe Phe Tyr Ser Ser Gly Glu Lys Lys Asp Glu Val Tyr Leu 115 120 125 Asn Leu Val Leu Asp Tyr Val Pro Glu Thr Val Tyr Arg Val Ala Arg 130 135 140 His Tyr Ser Arg Ala Lys Gln Thr Leu Pro Val Ile Tyr Val Lys Leu 145 150 155 160 Tyr Met Tyr Gln Leu Phe Arg Ser Leu Ala Tyr Ile His Ser Phe Gly 165 170 175 Ile Cys His Arg Asp Ile Lys Pro Gln Asn Leu Leu Leu Asp Pro Asp 180 185 190 Thr Ala Val Leu Lys Leu Cys Asp Phe Gly Ser Ala Lys Gln Leu Val 195 200 205 Arg Gly Glu Pro Asn Val Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala 210 215 220 Pro Glu Leu Ile Phe Gly Ala Thr Asp Tyr Thr Ser Ser Ile Asp Val 225 230 235 240 Trp Ser Ala Gly Cys Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Ile 245 250 255 Phe Pro Gly Asp Ser Gly Val Asp Gln Leu Val Glu Ile Ile Lys Val 260 265 270 Leu Gly Thr Pro Thr Arg Glu Gln Ile Arg Glu Met Asn Pro Asn Tyr 275 280 285 Thr Glu Phe Lys Phe Pro Gln Ile Lys Ala His Pro Trp Thr Lys Asp 290 295 300 Ser Ser Gly Thr Gly His Phe Thr Ser Gly Val Arg Val Phe Arg Pro 305 310 315 320 Arg Thr Pro Pro Glu Ala Ile Ala Leu Cys Ser Arg Leu Leu Glu Tyr 325 330 335 Thr Pro Thr Ala Arg Leu Thr Pro Leu Glu Ala Cys Ala His Ser Phe 340 345 350 Phe Asp Glu Leu Arg Asp Pro Asn Val Lys Leu Pro Asn Gly Arg Asp 355 360 365 Thr Pro Ala Leu Phe Asn Phe Thr Thr Gln Glu Leu Ser Ser Asn Pro 370 375 380 Pro Leu Ala Thr Ile Leu Ile Pro Pro His Ala Arg Ile Gln Ala Ala 385 390 395 400 Ala Ser Thr Pro Thr Asn Ala Thr Ala Ala Ser Asp Ala Asn Thr Gly 405 410 415 Asp Arg Gly Gln Thr Asn Asn Ala Ala Ser Ala Ser Ala Ser Asn Ser 420 425 430 Thr <210> 38 <211> 7134 <212> DNA <213> Homo sapiens <400> 38 cgggcttgtg ccgccgccgc cgccgccgcc gcccgggcca agtgacaaag gaaggaagga 60 agcgaggagg agccggcccc gcagccgctg acagggctct gggctggggc aaagcgcgga 120 cacttcctga gcgggcaccg agcagagccg aggggcggga gggcggccga gctgttgccg 180 cggacggggg agggggcccc gagggacgga agcggttgcc gggttcccat gtccccggcg 240 aatggggaac agtcgaggag ccgctgcctg gggtctgaag ggagctgcct ccgccaccgc 300 catggccgct ggatccagcc gccgcctgca gctgctcctg gcgcaatgag gagaggagcc 360 gccgccaccg ccaccgcccg cctctgactg actcgcgact ccgccgccct ctagttcgcc 420 gggcccctgc cgtcagcccg ccggatcccg cggcttgccg gagctgcagc gtttcccgtc 480 gcatctccga gccaccccct ccctccctct ccctccctcc tacccatccc cctttctctt 540 caagcgtgag actcgtgatc cttccgccgc ttcccttctt cattgactcg gaaaaaaaat 600 ccccgaggaa aatataatat tcgaagtact cattttcaat caagtatttg cccccgtttc 660 acgtgataca tattttttta ggatttgccc tctcttttct ctcctcccag gaaagggagg 720 ggaaagaatt gtattttttc ccaagtccta aatcatctat atgttaaata tccgtgccga 780 tctgtcttga aggagaaata tatcgcttgt tttgtttttt atagtataca aaaggagtga 840 aaagccaaga ggacgaagtc tttttctttt tcttctgtgg gagaacttaa tgctgcattt 900 atcgttaacc taacacccca acataaagac aaaaggaaga aaaggaggaa ggaaggaaaa 960 ggtgattcgc gaagagagtg atcatgtcag ggcggcccag aaccacctcc tttgcggaga 1020 gctgcaagcc ggtgcagcag ccttcagctt ttggcagcat gaaagttagc agagacaagg 1080 acggcagcaa ggtgacaaca gtggtggcaa ctcctgggca gggtccagac aggccacaag 1140 aagtcagcta tacagacact aaagtgattg gaaatggatc atttggtgtg gtatatcaag 1200 ccaaactttg tgattcagga gaactggtcg ccatcaagaa agtattgcag gacaagagat 1260 ttaagaatcg agagctccag atcatgagaa agctagatca ctgtaacata gtccgattgc 1320 gttatttctt ctactccagt ggtgagaaga aagatgaggt ctatcttaat ctggtgctgg 1380 actatgttcc ggaaacagta tacagagttg ccagacacta tagtcgagcc aaacagacgc 1440 tccctgtgat ttatgtcaag ttgtatatgt atcagctgtt ccgaagttta gcctatatcc 1500 attcctttgg aatctgccat cgggatatta aaccgcagaa cctcttgttg gatcctgata 1560 ctgctgtatt aaaactctgt gactttggaa gtgcaaagca gctggtccga ggagaaccca 1620 atgtttcgta tatctgttct cggtactata gggcaccaga gttgatcttt ggagccactg 1680 attatacctc tagtatagat gtatggtctg ctggctgtgt gttggctgag ctgttactag 1740 gacaaccaat atttccaggg gatagtggtg tggatcagtt ggtagaaata atcaaggtcc 1800 tgggaactcc aacaagggag caaatcagag aaatgaaccc aaactacaca gaatttaaat 1860 tccctcaaat taaggcacat ccttggacta aggattcgtc aggaacagga catttcacct 1920 caggagtgcg ggtcttccga ccccgaactc caccggaggc aattgcactg tgtagccgtc 1980 tgctggagta tacaccaact gcccgactaa caccactgga agcttgtgca cattcatttt 2040 ttgatgaatt acgggaccca aatgtcaaac taccaaatgg gcgagacaca cctgcactct 2100 tcaacttcac cactcaagaa ctgtcaagta atccacctct ggctaccatc cttattcctc 2160 ctcatgctcg gattcaagca gctgcttcaa cccccacaaa tgccacagca gcgtcagatg 2220 ctaatactgg agaccgtgga cagaccaata atgctgcttc tgcatcagct tccaactcca 2280 cctgaacagt cccgagcagc cagctgcaca ggaaaaacca ccagttactt gagtgtcact 2340 cagcaacact ggtcacgttt ggaaagaata ttaaaaagag aaaaaaatcc tgttcatttt 2400 agtgttcaat ttttttatta ttattgttgt tcttatttaa ccttgtaaaa tatctataaa 2460 tacaaaccaa tttcattgta ttctcacttt gagggagatc cagggggtgg gaggggttgt 2520 ggggaggggg aaagcggagc actagaacat acaatctctc tcccacgaca atcttttttt 2580 attaaaagtc tgctgttgta tactttaaaa acaggactcc tgcctcatgc cccttccaca 2640 aaagaagaaa acctttttct gtgctgatgg gtttttttga actttgtttt cttttaaagt 2700 ctagtgtgag actttggtat agtgcacagc ttgaaattgg ttgggagctt agcaggtata 2760 actcaacggg gacttaaatg tcacttgtaa aattaatcca tatcttcggg tatttataga 2820 cttgcctttg gcatgttggt ggcaggtgtg gcagacaaag aaatgtgtat cattcgtaac 2880 ccagggaggt caataaagtt tggaactcta cagggaagat tcttagtaga tttgttaagg 2940 ttttgttttg ctctcagtta gtgctagtga tgtagaggct tgtacaggag gctgccagag 3000 gggaagcagc aagcaagact caggcacaca tgctctacag gtggctcttt gtttgcctga 3060 ccaaagttct ttgcaaatct tagcacagtt tcaaactagt gacctgggag gagatggaag 3120 gggtgttgag caggctgagc tagctgctga ggtcaaaggc tgatgagccc agaggaaggg 3180 gacaggtcag ggatacatct caccactgtg aataagtttg tccagatttt tttctaaagt 3240 tacttccctt ggaaagatac acttgagagg acattgtagt taaataatgt gaactgtaac 3300 agtcatctac tggtttattt ttcatatttt ttaattgaaa attgagcttg cagaaatagc 3360 cacattctac acatagttct aattttaaat ccaaatctag aatctgtatt taatttgttt 3420 tttaacctca tgctttttac atttatttat tgatgcatgt cagatggtag aaatattaaa 3480 aactacacat cagaatgata cagtcactta tacctgctga ctttatagga aagctgatga 3540 tataaatgtg tgtatatatg ttatatatac atatattcaa tactgccttt ttttttgtct 3600 acagtatcaa aattgactgg ttgaagcatg agaagaatgt ttcccccaca cccagttaag 3660 agtttttgtg tctgttttct ttgtgtatca gtgaacgatg ttaagaatca gtctctcttt 3720 ttgaagaaaa agcaatattc cttggaaagc aaggagaatt gaaggactat gtttgccgtg 3780 aggaaataga ttttcatgac tagtttgttt tatactttta aggttggcat ctatgtgggc 3840 cttatatact ctaaaatgaa ctttagtcac cttggtgctt atgggccatt acttgaccta 3900 tgaatcttta aggcacaatc agttgtactt tacatttaaa gatcacttga gtgatggccg 3960 cctttccctc ctacccgctc cttccccaca tgccttccaa ggttagctgg taactgtagg 4020 gctgcagagc tgagcccatg gttgtgtgta acttgccctc accctcctca ttgccacctt 4080 aggtcacttt atgggtctcg tcctccagag ggttcggaag tggagtctgt tggcagccct 4140 cctgcaggcc ctagcaccct gtcctgctcc ttaactgtgt gtgtgactct ccaagagagt 4200 tgtcctgcct gctgaagtga accagtaccc agaaagacaa ctgtgagcca tcttggtttt 4260 cactcgctgt ttagctgagg tcttgggcca caaaaggggt ttcacaaacc tctggatata 4320 tcagagttta tgagaaagga aacatgctca gtcaaaccaa atcaaacaaa ttgaatttta 4380 tgttttataa agtgcttctg aaagctaaga tttgaaagaa gtctgaaatc aaagtatttg 4440 gcagcataac tccttaaagg tagtggcgtt gatagaccat tttcagacag aatttataaa 4500 gaatctgaaa aggcaggtct gtgatagaga aatggacctg cattcagatc caactgccca 4560 gcaagcgttt ggatgcagac actgctctgg acgtggtata ctccccagag tccataaaaa 4620 tcagtgctta ttttaggaaa caggttgccc cccacaactg gggtaaaaga agagagaaaa 4680 gtcacgcttt tctctcattt cattgtgtgt gcatgtgtgc gtgtgtgtgt gtgtgtgtgt 4740 gtgctgagat gtgtgatttt tctttctcaa ggatcatggt gggatcacag aactctttta 4800 tacaagtgag atccaggtct ctgaatatct ttttgtatat aataataata aaaagctcct 4860 caccaaattc aagcttgtac attatatttt ctttctgtgt ttttaaattt aagttttatt 4920 gttttgtatg taaatatgtg gacccaggaa ctgttattaa tgagcaaaaa gttactgttc 4980 agggcagtga ttctgtttaa taatcagaca aaatgtagac gagcttttta aagccatata 5040 gttttaactc tgtacagtag gtaccggcct gtattattgt aacaataact ctagcaatgt 5100 atagtgtatc tatatagttt ggagtgcctt cgcttccatg tgtttttttt tttaatttgt 5160 tcttttttaa attttaattg gtttccttta tccatgtctc cctgtccacc ccctttccct 5220 ttgaaataat aactcactca taacagtatc tttgcccctt ccacagttaa gtttcagtga 5280 taccatactc aggagtggga agaggaaatc atattcgtaa tttcatttcg ttgaagccct 5340 gcctttgttt tggttctgaa tgtctttcct cctcggtagc agtgagaccg gtttcatttc 5400 atacttagtc cattcaggga cttagtgtag caccagggag ccctagagct ggaggatatc 5460 gaatagatta aattttgctc gtctcttcca caagccctaa ccatgggtct taaaaacagc 5520 agattctggg agccttccat gctctctctc tctcctcttt tatctacttc cctcccaaat 5580 gagagagtga cagagaattg tttttttata aatcgaagtt tcttaatagt atcaggtttt 5640 gatacgtcag tggtctaaaa tgctatagtg caattactag cagttactgc acggagtgcc 5700 accgtgccaa tagaggactg ttgttttaac aagggaactc ttagcccatt tcctccctcc 5760 cgccatctct acccttgctc aatgaaatat cattttaatt tcttttaaaa aaaatcagtt 5820 taattcttac tgtgtgccca acacgaaggc cttttttgaa agaaaaatag aatgttttgc 5880 ctcaaagtag tccatataaa atgtcttgaa tagaagaaaa aactaccaaa ccaaaggtta 5940 ctatttttga aacatcgtgt gttcattcca gcaaggcaga agactgcacc ttctttccag 6000 tgacatgctg tgtcattttt tttaagtcct cttaattttt agacacattt ttggtttatg 6060 ttttaacaat gtatgcctaa ccagtcatct tgtctgcacc aatgcaaagg tttctgagag 6120 gagtattctc tatccctgtg gatatgaaga cactggcatt tcatctattt ttccctttcc 6180 tttttaaagg atttaacttt ggaatcttcc aaaggaagtt tggccaatgc cagatcccca 6240 ggaatttggg gggttttctt tcttttcaac tgaaattgta tctgattcct actgttcatg 6300 ttagtgatca tctaatcaca gagccaaaca cttttctccc ctgtgtggaa aagtaggtat 6360 gctttacaat aaaatctgtc ttttctggta gaaacctgag ccactgaaaa taaaagagac 6420 aactagaagc acagtagagt cccagactga gatctacctt tgagaggctt tgaaagtaat 6480 ccctggggtt tggattattt tcacaagggt tatgccgttt tattcaagtt tgttgctccg 6540 ttttgcacct ctgcaataaa agcaaaatga caaccagtac ataaggggtt agcttgacaa 6600 agtagacttc cttgtgttaa tttttaagtt tttttttcct taactatatc tgtctacagg 6660 cagatacaga tagttgtatg aaaatctgct tgcctgtaaa atttgcattt ataaatgtgt 6720 tgccgatgga tcacttgggc ctgtacacat accaattagc gtgaccactt ccatcttaaa 6780 aacaaaccta aaaaacaaaa tttattatat atatatatat atatatataa aggactgtgg 6840 gttgtataca aactattgca aacacttgtg caaatctgtc ttgatataaa ggaaaagcaa 6900 aatctgtata acattattac tacttgaatg cctctgtgac tgattttttt ttcattttaa 6960 atataaactt ttttgtgaaa agtatgctca atgttttttt tccctttccc cattcccttg 7020 taaatacatt ttgttctatg tgacttggtt tggaaatagt taactggtac tgtaatttgc 7080 attaaataaa aagtaggtta gcctggaaat gaaattaaaa aaaaaaaaaa aaaa 7134 <210> 39 <211> 1235 <212> PRT <213> Homo sapiens <400> 39 Met His Leu Ala Glu Arg Asp Arg Trp Leu Phe Val Ala Thr Val Met 1 5 10 15 Met His Phe Val Ser Ile Lys Ser Gly Phe Pro Gly Leu Cys Val Gly 20 25 30 Val Arg Ser Thr Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe 35 40 45 Ala Glu His Arg Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr 50 55 60 Leu Asn Ser Glu Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe 65 70 75 80 Pro Pro Leu Pro Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro 85 90 95 Ala Gly Ala Trp Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile 100 105 110 Thr Gln Val Phe His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met 115 120 125 Asn Gln Phe Gly Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met 130 135 140 Gln Arg Thr Gly Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly 145 150 155 160 Leu Ser Ile Met Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg 165 170 175 Lys Asp Ile Val Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala 180 185 190 Ile Pro Lys Glu His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys 195 200 205 Leu Gln Asp Leu Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg 210 215 220 Pro Asp Asp Pro Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly 225 230 235 240 Ile Glu Lys Ala Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp 245 250 255 Lys Arg Ala Val Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe 260 265 270 Ile Ala Gly Pro Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr 275 280 285 Gly Thr Arg Ile Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile 290 295 300 Val Phe Thr Gly Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile 305 310 315 320 Lys Lys Ile Tyr Glu Glu Lys Ala Asn Ser Phe Thr Val Ser Ser Val 325 330 335 Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly Gln 340 345 350 Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu Phe 355 360 365 Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp Val 370 375 380 Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile Asn 385 390 395 400 Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg His 405 410 415 Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln Tyr 420 425 430 Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu Ile 435 440 445 Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu Leu 450 455 460 Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu Ile 465 470 475 480 Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu Arg 485 490 495 Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe Pro 500 505 510 Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys Asn 515 520 525 Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp Leu 530 535 540 Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe His 545 550 555 560 Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg Glu 565 570 575 Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser Glu 580 585 590 Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg Ser 595 600 605 Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val Glu 610 615 620 Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys Gly 625 630 635 640 Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile His 645 650 655 Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly Pro 660 665 670 Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala Glu 675 680 685 Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro Glu 690 695 700 Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys Val 705 710 715 720 Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp Lys 725 730 735 Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg Glu 740 745 750 Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val Val 755 760 765 Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val Ile 770 775 780 Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly Val 785 790 795 800 Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr Leu 805 810 815 Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln Glu 820 825 830 Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile Pro 835 840 845 Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile Gln 850 855 860 Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg Glu 865 870 875 880 Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly Asp 885 890 895 Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser Pro 900 905 910 Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys Glu 915 920 925 Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu Val 930 935 940 Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly Ser 945 950 955 960 Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val Pro 965 970 975 Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu Ala Ala 980 985 990 Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val Lys Glu Leu 995 1000 1005 Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe Lys Leu Ser 1010 1015 1020 Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile Gly Arg Lys 1025 1030 1035 Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp Val Asn Ile 1040 1045 1050 Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln Asp Gln Ile 1055 1060 1065 Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala Arg Asp Ala 1070 1075 1080 Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val Ser Glu Asp 1085 1090 1095 Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile Gly Ala Arg 1100 1105 1110 Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys Val Asp Ile 1115 1120 1125 Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys Val Thr Val 1130 1135 1140 Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp His Ile Leu 1145 1150 1155 Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp Ser Glu Ala 1160 1165 1170 Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu Ala Lys Ala 1175 1180 1185 Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp Thr Ala Ser 1190 1195 1200 Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu Glu Phe Pro 1205 1210 1215 Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro Trp Gly Pro 1220 1225 1230 Lys Arg 1235 <210> 40 <211> 6291 <212> DNA <213> Homo sapiens <400> 40 ggagcgtccc ggcttctccc gcgcgggggg cgagtaagcc agcggcagga ccagcgggcg 60 ggggcccacg acaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 120 actgaccgtt ttgctgctac cacttataac cacctggtta agtcgagatt tggaggtggt 180 ttagtttggg gcctggatgc accttgcaga gagagaccgc tggctttttg tagcaactgt 240 catgatgcat tttgtaagca ttaagagtgg ttttcccgga ttgtgtgtag gtgtgagatc 300 aaccatgagt tccgttgcag ttttgaccca agagagtttt gctgaacacc gaagtgggct 360 ggttccgcaa caaatcaaag ttgccactct aaattcagaa gaggagagcg accctccaac 420 ctacaaggat gccttccctc cacttcctga gaaagctgct tgcctggaaa gtgcccagga 480 acccgctgga gcctggggga acaagatccg acccatcaag gcttctgtca tcactcaggt 540 gttccatgta cccctggagg agagaaaata caaggatatg aaccagtttg gagaaggtga 600 acaagcaaaa atctgccttg agatcatgca gagaactggt gctcacttgg agctgtcttt 660 ggccaaagac caaggcctct ccatcatggt gtcaggaaag ctggatgctg tcatgaaagc 720 tcggaaggac attgttgcta gactgcagac tcaggcctca gcaactgttg ccattcccaa 780 agaacaccat cgctttgtta ttggcaaaaa tggagagaaa ctgcaagact tggagctaaa 840 aactgcaacc aaaatccaga tcccacgccc agatgacccc agcaatcaga tcaagatcac 900 tggcaccaaa gagggcatcg agaaagctcg ccatgaagtc ttactcatct ctgccgagca 960 ggacaaacgt gctgtggaga ggctagaagt agaaaaggca ttccacccct tcatcgctgg 1020 gccgtataat agactggttg gcgagatcat gcaggagaca ggcacgcgca tcaacatccc 1080 cccacccagc gtgaaccgga cagagattgt cttcactgga gagaaggaac agttggctca 1140 ggctgtggct cgcatcaaga agatttatga ggagaaggcc aatagcttca ccgtctcctc 1200 tgtcgccgcc ccttcctggc ttcaccgttt catcattggc aagaaagggc agaacctggc 1260 caaaatcact cagcagatgc caaaggttca catcgagttc acagagggcg aagacaagat 1320 caccctggag ggccctacag aggatgtcaa tgtggcccag gaacagatag aaggcatggt 1380 caaagatttg attaaccgga tggactatgt ggagatcaac atcgaccaca agttccacag 1440 gcacctcatt gggaagagcg gtgccaacat aaacagaatc aaagaccagt acaaggtgtc 1500 cgtgcgcatc cctcctgaca gtgagaagag caatttgatc cgcatcgagg gggacccaca 1560 gggcgtgcag caggccaagc gagagctgct ggagcttgca tctcgcatgg aaaatgagcg 1620 taccaaggat ctaatcattg agcaaagatt tcatcgcaca atcattgggc agaagggtga 1680 acggatccgt gaaattcgtg acaaattccc agaggtcatc attaactttc cagacccagc 1740 acaaaaaagt gacattgtcc agctcagagg acctaagaat gaggtggaaa aatgcacaaa 1800 atacatgcag aagatggtgg cagatctggt ggaaaatagc tattcaattt ctgttccgat 1860 cttcaaacag tttcacaaga atatcattgg gaaaggaggc gcaaacatta aaaagattcg 1920 tgaagaaagc aacaccaaaa tcgaccttcc agcagagaat agcaattcag agaccattat 1980 catcacaggc aagcgagcca actgcgaagc tgcccggagc aggattctgt ctattcagaa 2040 agacctggcc aacatagccg aggtagaggt ctccatccct gccaagctgc acaactccct 2100 cattggcacc aagggccgtc tgatccgctc catcatggag gagtgcggcg gggtccacat 2160 tcactttccc gtggaaggtt caggaagcga caccgttgtt atcaggggcc cttcctcgga 2220 tgtggagaag gccaagaagc agctcctgca tctggcggag gagaagcaaa ccaagagttt 2280 cactgttgac atccgcgcca agccagaata ccacaaattc ctcatcggca aggggggcgg 2340 caaaattcgc aaggtgcgcg acagcactgg agcacgtgtc atcttccctg cggctgagga 2400 caaggaccag gacctgatca ccatcattgg aaaggaggac gccgtccgag aggcacagaa 2460 ggagctggag gccttgatcc aaaacctgga taatgtggtg gaagactcca tgctggtgga 2520 ccccaagcac caccgccact tcgtcatccg cagaggccag gtcttgcggg agattgctga 2580 agagtatggc ggggtgatgg tcagcttccc acgctctggc acacagagcg acaaagtcac 2640 cctcaagggc gccaaggact gtgtggaggc agccaagaaa cgcattcagg agatcattga 2700 ggacctggaa gctcaggtga cattagaatg tgctataccc cagaaattcc atcgatctgt 2760 catgggcccc aaaggttcca gaatccagca gattactcgg gatttcagtg ttcaaattaa 2820 attcccagac agagaggaga acgcagttca cagtacagag ccagttgtcc aggagaatgg 2880 ggacgaagct ggggagggga gagaggctaa agattgtgac cccggctctc caaggaggtg 2940 tgacatcatc atcatctctg gccggaaaga aaagtgtgag gctgccaagg aagctctgga 3000 ggcattggtt cctgtcacca ttgaagtaga ggtgcccttt gaccttcacc gttacgttat 3060 tgggcagaaa ggaagtggga tccgcaagat gatggatgag tttgaggtga acatacatgt 3120 cccggcacct gagctgcagt ctgacatcat cgccatcacg ggcctcgctg caaatttgga 3180 ccgggccaag gctggactgc tggagcgtgt gaaggagcta caggccgagc aggaggaccg 3240 ggctttaagg agttttaagc tgagtgtcac tgtagacccc aaataccatc ccaagattat 3300 cgggagaaag ggggcagtaa ttacccaaat ccggttggag catgacgtga acatccagtt 3360 tcctgataag gacgatggga accagcccca ggaccaaatt accatcacag ggtacgaaaa 3420 gaacacagaa gctgccaggg atgctatact gagaattgtg ggtgaacttg agcagatggt 3480 ttctgaggac gtcccgctgg accaccgcgt tcacgcccgc atcattggtg cccgcggcaa 3540 agccattcgc aaaatcatgg acgaattcaa ggtggacatt cgcttcccac agagcggagc 3600 cccagacccc aactgcgtca ctgtgacggg gctcccagag aatgtggagg aagccatcga 3660 ccacatcctc aatctggagg aggaatacct agctgacgtg gtggacagtg aggcgctgca 3720 ggtatacatg aaacccccag cacacgaaga ggccaaggca ccttccagag gctttgtggt 3780 gcgggacgca ccctggaccg ccagcagcag tgagaaggct cctgacatga gcagctctga 3840 ggaatttccc agctttgggg ctcaggtggc tcccaagacc ctcccttggg gccccaaacg 3900 ataatgatca aaaagaacag aaccctctcc agcctgctga cccaaaccca accacacaat 3960 ggtttgtctc aatctgaccc agcggctgga ccctccgtaa attgttgacg ctcttccccc 4020 ttcccgaggt cccgcaggga gcctagcgcc tggctgtgtg tgcggccgct cctccaggcc 4080 tggccgtgcc cgctcaggac ctgctccact gtttaacact aaaccaaggt catgagcatt 4140 cgtgctaaga taacagactc cagctcctgg tccacccggc atgtcagtca gcactctggc 4200 cttcatcacg agagctccgc agccgtggct aggattccac ttcctgtgtc atgacctcag 4260 gaaataaacg tccttgactt tataaaagcc aaacgtttgc cctcttcctt tcccacctcc 4320 ctcctgccag tttcccttgg tccagacagt cctgtttgtg gagtgcaatc agcctcctcc 4380 agctgccaga gcgcctcagc acaggtgtca gggtgcaagg aagacctggc aatggacagc 4440 aggaggcagg ttcctggagc tggggggtga cctgagaggc agagggtgac gggttctcag 4500 gcagtcctga ttttacctgc cgtggggtct gaaagcacca agggtccctg cccctacctc 4560 cactgccaga ccctcagcct gaggtctggt gagtggagcc tggaggcaag gtggtaggca 4620 ccatctgggt cccctgtggc cgtcacagtg tctgctgtga ttgagatgcg cacaggttgg 4680 gggaggtagg gccttacgct tgtcctcagt gggggcagtt tgccttagat gacagctggg 4740 ctcttcttca caccacctgc agcccctccc tgcccctgcc ctagctgctg tgtgttcagt 4800 tgccttcttt ctacctcagc cggcgtggag tggtctctgt gcagttagtg ccaccccaca 4860 cacccgtctc ttgattgaga tgtttctggt ggttatgggt ttcccgtgga gctgggggtg 4920 ggcgccgtgt acctaagctg gaggctggcg ctctccctca gcacaggtgg gtcagtggcc 4980 agcaggccca tctggagtgg gagtgggcac ttccaccccg cccacaggcc atccggctgt 5040 gcaggccagc ccctaggagc aggtcccggg tgactggcag ttttcacggt ctagggccga 5100 gacgatggca tggggcctag agcatgaggt agagcagaat gcagaccacg ccgctggatg 5160 ccgagagacc ctgctctccg agggaggcat ctgtgtcatg ctgtgagggc tgaggacggg 5220 gccctagtct ctggttttct ggtcttaaca tccttatctg tgtccgccac ggaggtgact 5280 gagctgctag cgagttgtcc tgtcccaggt acttgagttt tggaaaagct gactcacgcc 5340 catccatctc acagcccttc cctggggaca gtcgcttccg ccttgacacc tcactctcag 5400 ttgaataact caagcttggt catcttcaga ctcgaattct tgagtagacc cagacggctt 5460 agcccaagtc tagttgcagc tgcctcggca agtccccatt tgctcaggca gccctgaatg 5520 ggcctgttta caggaatggt aaattgggat tggaaggaat atagcttcca gcttcatagg 5580 ctagggtgac cacggcttag gaaacaggga aagaaagcaa ggcccttttc ctgcctttcc 5640 cgggatctgt ctactccacc tccacggggg aggccagtgg ggaagggctg tcacctcttc 5700 cccatctgca tgagttctgg aactctgtcc tgttggctgc ttgcttccag ctccccccaa 5760 tctccatcgc agcgggttcc tcctgtcttt tctacagtgt cataaaacat cctgccccta 5820 ccctctccca aaggtcaatt ttaattctca ccaagttttg cacatctctg tatgtcgctt 5880 gatgtcttag acgcgagccc tttcctaaac tgttcagcgc tctcttttcc tttgggtggt 5940 tgttgcaagg gtgatgacat gactgtcccc aggcctgtct ccctgaagcg tctgtgctgt 6000 caggacagcc ctgggcagag atgaggcagg ggtgaggcgt gcgtgtgctt ttcctccttg 6060 ttggatgtct tccatatcat ctgtttccat agctacaatc catcccttgg ccttaacttt 6120 ggaatttgga gattatatgc aaacatgtgt aaaggctcat gaatatggat gacactggaa 6180 ttttataaat tctaaaataa aacccgaaac cagatgtagc atgctgggac tcattttgaa 6240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 6291 <210> 41 <211> 1268 <212> PRT <213> Homo sapiens <400> 41 Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe Ala Glu His Arg 1 5 10 15 Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr Leu Asn Ser Glu 20 25 30 Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe Pro Pro Leu Pro 35 40 45 Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro Ala Gly Ala Trp 50 55 60 Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile Thr Gln Val Phe 65 70 75 80 His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met Asn Gln Phe Gly 85 90 95 Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met Gln Arg Thr Gly 100 105 110 Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly Leu Ser Ile Met 115 120 125 Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg Lys Asp Ile Val 130 135 140 Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala Ile Pro Lys Glu 145 150 155 160 His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys Leu Gln Asp Leu 165 170 175 Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg Pro Asp Asp Pro 180 185 190 Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly Ile Glu Lys Ala 195 200 205 Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp Lys Arg Ala Val 210 215 220 Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe Ile Ala Gly Pro 225 230 235 240 Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr Gly Thr Arg Ile 245 250 255 Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile Val Phe Thr Gly 260 265 270 Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile Lys Lys Ile Tyr 275 280 285 Glu Glu Lys Lys Lys Lys Thr Thr Thr Ile Ala Val Glu Val Lys Lys 290 295 300 Ser Gln His Lys Tyr Val Ile Gly Pro Lys Gly Asn Ser Leu Gln Glu 305 310 315 320 Ile Leu Glu Arg Thr Gly Val Ser Val Glu Ile Pro Pro Ser Asp Ser 325 330 335 Ile Ser Glu Thr Val Ile Leu Arg Gly Glu Pro Glu Lys Leu Gly Gln 340 345 350 Ala Leu Thr Glu Val Tyr Ala Lys Ala Asn Ser Phe Thr Val Ser Ser 355 360 365 Val Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly 370 375 380 Gln Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu 385 390 395 400 Phe Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp 405 410 415 Val Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile 420 425 430 Asn Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg 435 440 445 His Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln 450 455 460 Tyr Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu 465 470 475 480 Ile Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu 485 490 495 Leu Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu 500 505 510 Ile Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu 515 520 525 Arg Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe 530 535 540 Pro Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys 545 550 555 560 Asn Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp 565 570 575 Leu Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe 580 585 590 His Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg 595 600 605 Glu Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser 610 615 620 Glu Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg 625 630 635 640 Ser Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val 645 650 655 Glu Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys 660 665 670 Gly Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile 675 680 685 His Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly 690 695 700 Pro Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala 705 710 715 720 Glu Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro 725 730 735 Glu Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys 740 745 750 Val Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp 755 760 765 Lys Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg 770 775 780 Glu Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val 785 790 795 800 Val Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val 805 810 815 Ile Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly 820 825 830 Val Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr 835 840 845 Leu Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln 850 855 860 Glu Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile 865 870 875 880 Pro Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile 885 890 895 Gln Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg 900 905 910 Glu Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly 915 920 925 Asp Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser 930 935 940 Pro Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys 945 950 955 960 Glu Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu 965 970 975 Val Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly 980 985 990 Ser Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val 995 1000 1005 Pro Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu 1010 1015 1020 Ala Ala Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val 1025 1030 1035 Lys Glu Leu Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe 1040 1045 1050 Lys Leu Ser Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile 1055 1060 1065 Gly Arg Lys Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp 1070 1075 1080 Val Asn Ile Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln 1085 1090 1095 Asp Gln Ile Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala 1100 1105 1110 Arg Asp Ala Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val 1115 1120 1125 Ser Glu Asp Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile 1130 1135 1140 Gly Ala Arg Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys 1145 1150 1155 Val Asp Ile Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys 1160 1165 1170 Val Thr Val Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp 1175 1180 1185 His Ile Leu Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp 1190 1195 1200 Ser Glu Ala Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu 1205 1210 1215 Ala Lys Ala Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp 1220 1225 1230 Thr Ala Ser Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu 1235 1240 1245 Glu Phe Pro Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro 1250 1255 1260 Trp Gly Pro Lys Arg 1265 <210> 42 <211> 6427 <212> DNA <213> Homo sapiens <400> 42 atagaggctg ggggtggggg gggaggtcaa gcgtagcctc ttctccttta ccaagatggc 60 ggcttgtccc tgtttcgcca cagttcctac cttatgagct cggttttctt atgcttataa 120 gagtggaaca gcaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 180 actgaccgtt ttgctgtggt tttcccggat tgtgtgtagg tgtgagatca accatgagtt 240 ccgttgcagt tttgacccaa gagagttttg ctgaacaccg aagtgggctg gttccgcaac 300 aaatcaaagt tgccactcta aattcagaag aggagagcga ccctccaacc tacaaggatg 360 ccttccctcc acttcctgag aaagctgctt gcctggaaag tgcccaggaa cccgctggag 420 cctgggggaa caagatccga cccatcaagg cttctgtcat cactcaggtg ttccatgtac 480 ccctggagga gagaaaatac aaggatatga accagtttgg agaaggtgaa caagcaaaaa 540 tctgccttga gatcatgcag agaactggtg ctcacttgga gctgtctttg gccaaagacc 600 aaggcctctc catcatggtg tcaggaaagc tggatgctgt catgaaagct cggaaggaca 660 ttgttgctag actgcagact caggcctcag caactgttgc cattcccaaa gaacaccatc 720 gctttgttat tggcaaaaat ggagagaaac tgcaagactt ggagctaaaa actgcaacca 780 aaatccagat cccacgccca gatgacccca gcaatcagat caagatcact ggcaccaaag 840 agggcatcga gaaagctcgc catgaagtct tactcatctc tgccgagcag gacaaacgtg 900 ctgtggagag gctagaagta gaaaaggcat tccacccctt catcgctggg ccgtataata 960 gactggttgg cgagatcatg caggagacag gcacgcgcat caacatcccc ccacccagcg 1020 tgaaccggac agagattgtc ttcactggag agaaggaaca gttggctcag gctgtggctc 1080 gcatcaagaa gatttatgag gagaagaaaa agaagactac aaccattgca gtggaagtga 1140 agaaatccca acacaagtat gtcattgggc ccaagggcaa ttcattgcag gagatccttg 1200 agagaactgg agtttccgtt gagatcccac cctcagacag catctctgag actgtaatac 1260 ttcgaggcga acctgaaaag ttaggtcagg cgttgactga agtctatgcc aaggccaata 1320 gcttcaccgt ctcctctgtc gccgcccctt cctggcttca ccgtttcatc attggcaaga 1380 aagggcagaa cctggccaaa atcactcagc agatgccaaa ggttcacatc gagttcacag 1440 agggcgaaga caagatcacc ctggagggcc ctacagagga tgtcaatgtg gcccaggaac 1500 agatagaagg catggtcaaa gatttgatta accggatgga ctatgtggag atcaacatcg 1560 accacaagtt ccacaggcac ctcattggga agagcggtgc caacataaac agaatcaaag 1620 accagtacaa ggtgtccgtg cgcatccctc ctgacagtga gaagagcaat ttgatccgca 1680 tcgaggggga cccacagggc gtgcagcagg ccaagcgaga gctgctggag cttgcatctc 1740 gcatggaaaa tgagcgtacc aaggatctaa tcattgagca aagatttcat cgcacaatca 1800 ttgggcagaa gggtgaacgg atccgtgaaa ttcgtgacaa attcccagag gtcatcatta 1860 actttccaga cccagcacaa aaaagtgaca ttgtccagct cagaggacct aagaatgagg 1920 tggaaaaatg cacaaaatac atgcagaaga tggtggcaga tctggtggaa aatagctatt 1980 caatttctgt tccgatcttc aaacagtttc acaagaatat cattgggaaa ggaggcgcaa 2040 acattaaaaa gattcgtgaa gaaagcaaca ccaaaatcga ccttccagca gagaatagca 2100 attcagagac cattatcatc acaggcaagc gagccaactg cgaagctgcc cggagcagga 2160 ttctgtctat tcagaaagac ctggccaaca tagccgaggt agaggtctcc atccctgcca 2220 agctgcacaa ctccctcatt ggcaccaagg gccgtctgat ccgctccatc atggaggagt 2280 gcggcggggt ccacattcac tttcccgtgg aaggttcagg aagcgacacc gttgttatca 2340 ggggcccttc ctcggatgtg gagaaggcca agaagcagct cctgcatctg gcggaggaga 2400 agcaaaccaa gagtttcact gttgacatcc gcgccaagcc agaataccac aaattcctca 2460 tcggcaaggg gggcggcaaa attcgcaagg tgcgcgacag cactggagca cgtgtcatct 2520 tccctgcggc tgaggacaag gaccaggacc tgatcaccat cattggaaag gaggacgccg 2580 tccgagaggc acagaaggag ctggaggcct tgatccaaaa cctggataat gtggtggaag 2640 actccatgct ggtggacccc aagcaccacc gccacttcgt catccgcaga ggccaggtct 2700 tgcgggagat tgctgaagag tatggcgggg tgatggtcag cttcccacgc tctggcacac 2760 agagcgacaa agtcaccctc aagggcgcca aggactgtgt ggaggcagcc aagaaacgca 2820 ttcaggagat cattgaggac ctggaagctc aggtgacatt agaatgtgct ataccccaga 2880 aattccatcg atctgtcatg ggccccaaag gttccagaat ccagcagatt actcgggatt 2940 tcagtgttca aattaaattc ccagacagag aggagaacgc agttcacagt acagagccag 3000 ttgtccagga gaatggggac gaagctgggg aggggagaga ggctaaagat tgtgaccccg 3060 gctctccaag gaggtgtgac atcatcatca tctctggccg gaaagaaaag tgtgaggctg 3120 ccaaggaagc tctggaggca ttggttcctg tcaccattga agtagaggtg ccctttgacc 3180 ttcaccgtta cgttattggg cagaaaggaa gtgggatccg caagatgatg gatgagtttg 3240 aggtgaacat acatgtcccg gcacctgagc tgcagtctga catcatcgcc atcacgggcc 3300 tcgctgcaaa tttggaccgg gccaaggctg gactgctgga gcgtgtgaag gagctacagg 3360 ccgagcagga ggaccgggct ttaaggagtt ttaagctgag tgtcactgta gaccccaaat 3420 accatcccaa gattatcggg agaaaggggg cagtaattac ccaaatccgg ttggagcatg 3480 acgtgaacat ccagtttcct gataaggacg atgggaacca gccccaggac caaattacca 3540 tcacagggta cgaaaagaac acagaagctg ccagggatgc tatactgaga attgtgggtg 3600 aacttgagca gatggtttct gaggacgtcc cgctggacca ccgcgttcac gcccgcatca 3660 ttggtgcccg cggcaaagcc attcgcaaaa tcatggacga attcaaggtg gacattcgct 3720 tcccacagag cggagcccca gaccccaact gcgtcactgt gacggggctc ccagagaatg 3780 tggaggaagc catcgaccac atcctcaatc tggaggagga atacctagct gacgtggtgg 3840 acagtgaggc gctgcaggta tacatgaaac ccccagcaca cgaagaggcc aaggcacctt 3900 ccagaggctt tgtggtgcgg gacgcaccct ggaccgccag cagcagtgag aaggctcctg 3960 acatgagcag ctctgaggaa tttcccagct ttggggctca ggtggctccc aagaccctcc 4020 cttggggccc caaacgataa tgatcaaaaa gaacagaacc ctctccagcc tgctgaccca 4080 aacccaacca cacaatggtt tgtctcaatc tgacccagcg gctggaccct ccgtaaattg 4140 ttgacgctct tcccccttcc cgaggtcccg cagggagcct agcgcctggc tgtgtgtgcg 4200 gccgctcctc caggcctggc cgtgcccgct caggacctgc tccactgttt aacactaaac 4260 caaggtcatg agcattcgtg ctaagataac agactccagc tcctggtcca cccggcatgt 4320 cagtcagcac tctggccttc atcacgagag ctccgcagcc gtggctagga ttccacttcc 4380 tgtgtcatga cctcaggaaa taaacgtcct tgactttata aaagccaaac gtttgccctc 4440 ttcctttccc acctccctcc tgccagtttc ccttggtcca gacagtcctg tttgtggagt 4500 gcaatcagcc tcctccagct gccagagcgc ctcagcacag gtgtcagggt gcaaggaaga 4560 cctggcaatg gacagcagga ggcaggttcc tggagctggg gggtgacctg agaggcagag 4620 ggtgacgggt tctcaggcag tcctgatttt acctgccgtg gggtctgaaa gcaccaaggg 4680 tccctgcccc tacctccact gccagaccct cagcctgagg tctggtgagt ggagcctgga 4740 ggcaaggtgg taggcaccat ctgggtcccc tgtggccgtc acagtgtctg ctgtgattga 4800 gatgcgcaca ggttggggga ggtagggcct tacgcttgtc ctcagtgggg gcagtttgcc 4860 ttagatgaca gctgggctct tcttcacacc acctgcagcc cctccctgcc cctgccctag 4920 ctgctgtgtg ttcagttgcc ttctttctac ctcagccggc gtggagtggt ctctgtgcag 4980 ttagtgccac cccacacacc cgtctcttga ttgagatgtt tctggtggtt atgggtttcc 5040 cgtggagctg ggggtgggcg ccgtgtacct aagctggagg ctggcgctct ccctcagcac 5100 aggtgggtca gtggccagca ggcccatctg gagtgggagt gggcacttcc accccgccca 5160 caggccatcc ggctgtgcag gccagcccct aggagcaggt cccgggtgac tggcagtttt 5220 cacggtctag ggccgagacg atggcatggg gcctagagca tgaggtagag cagaatgcag 5280 accacgccgc tggatgccga gagaccctgc tctccgaggg aggcatctgt gtcatgctgt 5340 gagggctgag gacggggccc tagtctctgg ttttctggtc ttaacatcct tatctgtgtc 5400 cgccacggag gtgactgagc tgctagcgag ttgtcctgtc ccaggtactt gagttttgga 5460 aaagctgact cacgcccatc catctcacag cccttccctg gggacagtcg cttccgcctt 5520 gacacctcac tctcagttga ataactcaag cttggtcatc ttcagactcg aattcttgag 5580 tagacccaga cggcttagcc caagtctagt tgcagctgcc tcggcaagtc cccatttgct 5640 caggcagccc tgaatgggcc tgtttacagg aatggtaaat tgggattgga aggaatatag 5700 cttccagctt cataggctag ggtgaccacg gcttaggaaa cagggaaaga aagcaaggcc 5760 cttttcctgc ctttcccggg atctgtctac tccacctcca cgggggaggc cagtggggaa 5820 gggctgtcac ctcttcccca tctgcatgag ttctggaact ctgtcctgtt ggctgcttgc 5880 ttccagctcc ccccaatctc catcgcagcg ggttcctcct gtcttttcta cagtgtcata 5940 aaacatcctg cccctaccct ctcccaaagg tcaattttaa ttctcaccaa gttttgcaca 6000 tctctgtatg tcgcttgatg tcttagacgc gagccctttc ctaaactgtt cagcgctctc 6060 ttttcctttg ggtggttgtt gcaagggtga tgacatgact gtccccaggc ctgtctccct 6120 gaagcgtctg tgctgtcagg acagccctgg gcagagatga ggcaggggtg aggcgtgcgt 6180 gtgcttttcc tccttgttgg atgtcttcca tatcatctgt ttccatagct acaatccatc 6240 ccttggcctt aactttggaa tttggagatt atatgcaaac atgtgtaaag gctcatgaat 6300 atggatgaca ctggaatttt ataaattcta aaataaaacc cgaaaccaga tgtagcatgc 6360 tgggactcat tttgaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6420 aaaaaaa 6427 <210> 43 <211> 1268 <212> PRT <213> Homo sapiens <400> 43 Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe Ala Glu His Arg 1 5 10 15 Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr Leu Asn Ser Glu 20 25 30 Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe Pro Pro Leu Pro 35 40 45 Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro Ala Gly Ala Trp 50 55 60 Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile Thr Gln Val Phe 65 70 75 80 His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met Asn Gln Phe Gly 85 90 95 Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met Gln Arg Thr Gly 100 105 110 Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly Leu Ser Ile Met 115 120 125 Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg Lys Asp Ile Val 130 135 140 Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala Ile Pro Lys Glu 145 150 155 160 His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys Leu Gln Asp Leu 165 170 175 Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg Pro Asp Asp Pro 180 185 190 Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly Ile Glu Lys Ala 195 200 205 Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp Lys Arg Ala Val 210 215 220 Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe Ile Ala Gly Pro 225 230 235 240 Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr Gly Thr Arg Ile 245 250 255 Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile Val Phe Thr Gly 260 265 270 Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile Lys Lys Ile Tyr 275 280 285 Glu Glu Lys Lys Lys Lys Thr Thr Thr Ile Ala Val Glu Val Lys Lys 290 295 300 Ser Gln His Lys Tyr Val Ile Gly Pro Lys Gly Asn Ser Leu Gln Glu 305 310 315 320 Ile Leu Glu Arg Thr Gly Val Ser Val Glu Ile Pro Pro Ser Asp Ser 325 330 335 Ile Ser Glu Thr Val Ile Leu Arg Gly Glu Pro Glu Lys Leu Gly Gln 340 345 350 Ala Leu Thr Glu Val Tyr Ala Lys Ala Asn Ser Phe Thr Val Ser Ser 355 360 365 Val Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly 370 375 380 Gln Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu 385 390 395 400 Phe Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp 405 410 415 Val Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile 420 425 430 Asn Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg 435 440 445 His Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln 450 455 460 Tyr Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu 465 470 475 480 Ile Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu 485 490 495 Leu Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu 500 505 510 Ile Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu 515 520 525 Arg Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe 530 535 540 Pro Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys 545 550 555 560 Asn Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp 565 570 575 Leu Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe 580 585 590 His Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg 595 600 605 Glu Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser 610 615 620 Glu Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg 625 630 635 640 Ser Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val 645 650 655 Glu Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys 660 665 670 Gly Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile 675 680 685 His Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly 690 695 700 Pro Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala 705 710 715 720 Glu Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro 725 730 735 Glu Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys 740 745 750 Val Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp 755 760 765 Lys Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg 770 775 780 Glu Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val 785 790 795 800 Val Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val 805 810 815 Ile Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly 820 825 830 Val Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr 835 840 845 Leu Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln 850 855 860 Glu Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile 865 870 875 880 Pro Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile 885 890 895 Gln Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg 900 905 910 Glu Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly 915 920 925 Asp Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser 930 935 940 Pro Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys 945 950 955 960 Glu Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu 965 970 975 Val Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly 980 985 990 Ser Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val 995 1000 1005 Pro Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu 1010 1015 1020 Ala Ala Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val 1025 1030 1035 Lys Glu Leu Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe 1040 1045 1050 Lys Leu Ser Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile 1055 1060 1065 Gly Arg Lys Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp 1070 1075 1080 Val Asn Ile Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln 1085 1090 1095 Asp Gln Ile Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala 1100 1105 1110 Arg Asp Ala Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val 1115 1120 1125 Ser Glu Asp Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile 1130 1135 1140 Gly Ala Arg Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys 1145 1150 1155 Val Asp Ile Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys 1160 1165 1170 Val Thr Val Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp 1175 1180 1185 His Ile Leu Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp 1190 1195 1200 Ser Glu Ala Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu 1205 1210 1215 Ala Lys Ala Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp 1220 1225 1230 Thr Ala Ser Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu 1235 1240 1245 Glu Phe Pro Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro 1250 1255 1260 Trp Gly Pro Lys Arg 1265 <210> 44 <211> 6367 <212> DNA <213> Homo sapiens <400> 44 ggagcgtccc ggcttctccc gcgcgggggg cgagtaagcc agcggcagga ccagcgggcg 60 ggggcccacg acaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 120 actgaccgtt ttgctgtggt tttcccggat tgtgtgtagg tgtgagatca accatgagtt 180 ccgttgcagt tttgacccaa gagagttttg ctgaacaccg aagtgggctg gttccgcaac 240 aaatcaaagt tgccactcta aattcagaag aggagagcga ccctccaacc tacaaggatg 300 ccttccctcc acttcctgag aaagctgctt gcctggaaag tgcccaggaa cccgctggag 360 cctgggggaa caagatccga cccatcaagg cttctgtcat cactcaggtg ttccatgtac 420 ccctggagga gagaaaatac aaggatatga accagtttgg agaaggtgaa caagcaaaaa 480 tctgccttga gatcatgcag agaactggtg ctcacttgga gctgtctttg gccaaagacc 540 aaggcctctc catcatggtg tcaggaaagc tggatgctgt catgaaagct cggaaggaca 600 ttgttgctag actgcagact caggcctcag caactgttgc cattcccaaa gaacaccatc 660 gctttgttat tggcaaaaat ggagagaaac tgcaagactt ggagctaaaa actgcaacca 720 aaatccagat cccacgccca gatgacccca gcaatcagat caagatcact ggcaccaaag 780 agggcatcga gaaagctcgc catgaagtct tactcatctc tgccgagcag gacaaacgtg 840 ctgtggagag gctagaagta gaaaaggcat tccacccctt catcgctggg ccgtataata 900 gactggttgg cgagatcatg caggagacag gcacgcgcat caacatcccc ccacccagcg 960 tgaaccggac agagattgtc ttcactggag agaaggaaca gttggctcag gctgtggctc 1020 gcatcaagaa gatttatgag gagaagaaaa agaagactac aaccattgca gtggaagtga 1080 agaaatccca acacaagtat gtcattgggc ccaagggcaa ttcattgcag gagatccttg 1140 agagaactgg agtttccgtt gagatcccac cctcagacag catctctgag actgtaatac 1200 ttcgaggcga acctgaaaag ttaggtcagg cgttgactga agtctatgcc aaggccaata 1260 gcttcaccgt ctcctctgtc gccgcccctt cctggcttca ccgtttcatc attggcaaga 1320 aagggcagaa cctggccaaa atcactcagc agatgccaaa ggttcacatc gagttcacag 1380 agggcgaaga caagatcacc ctggagggcc ctacagagga tgtcaatgtg gcccaggaac 1440 agatagaagg catggtcaaa gatttgatta accggatgga ctatgtggag atcaacatcg 1500 accacaagtt ccacaggcac ctcattggga agagcggtgc caacataaac agaatcaaag 1560 accagtacaa ggtgtccgtg cgcatccctc ctgacagtga gaagagcaat ttgatccgca 1620 tcgaggggga cccacagggc gtgcagcagg ccaagcgaga gctgctggag cttgcatctc 1680 gcatggaaaa tgagcgtacc aaggatctaa tcattgagca aagatttcat cgcacaatca 1740 ttgggcagaa gggtgaacgg atccgtgaaa ttcgtgacaa attcccagag gtcatcatta 1800 actttccaga cccagcacaa aaaagtgaca ttgtccagct cagaggacct aagaatgagg 1860 tggaaaaatg cacaaaatac atgcagaaga tggtggcaga tctggtggaa aatagctatt 1920 caatttctgt tccgatcttc aaacagtttc acaagaatat cattgggaaa ggaggcgcaa 1980 acattaaaaa gattcgtgaa gaaagcaaca ccaaaatcga ccttccagca gagaatagca 2040 attcagagac cattatcatc acaggcaagc gagccaactg cgaagctgcc cggagcagga 2100 ttctgtctat tcagaaagac ctggccaaca tagccgaggt agaggtctcc atccctgcca 2160 agctgcacaa ctccctcatt ggcaccaagg gccgtctgat ccgctccatc atggaggagt 2220 gcggcggggt ccacattcac tttcccgtgg aaggttcagg aagcgacacc gttgttatca 2280 ggggcccttc ctcggatgtg gagaaggcca agaagcagct cctgcatctg gcggaggaga 2340 agcaaaccaa gagtttcact gttgacatcc gcgccaagcc agaataccac aaattcctca 2400 tcggcaaggg gggcggcaaa attcgcaagg tgcgcgacag cactggagca cgtgtcatct 2460 tccctgcggc tgaggacaag gaccaggacc tgatcaccat cattggaaag gaggacgccg 2520 tccgagaggc acagaaggag ctggaggcct tgatccaaaa cctggataat gtggtggaag 2580 actccatgct ggtggacccc aagcaccacc gccacttcgt catccgcaga ggccaggtct 2640 tgcgggagat tgctgaagag tatggcgggg tgatggtcag cttcccacgc tctggcacac 2700 agagcgacaa agtcaccctc aagggcgcca aggactgtgt ggaggcagcc aagaaacgca 2760 ttcaggagat cattgaggac ctggaagctc aggtgacatt agaatgtgct ataccccaga 2820 aattccatcg atctgtcatg ggccccaaag gttccagaat ccagcagatt actcgggatt 2880 tcagtgttca aattaaattc ccagacagag aggagaacgc agttcacagt acagagccag 2940 ttgtccagga gaatggggac gaagctgggg aggggagaga ggctaaagat tgtgaccccg 3000 gctctccaag gaggtgtgac atcatcatca tctctggccg gaaagaaaag tgtgaggctg 3060 ccaaggaagc tctggaggca ttggttcctg tcaccattga agtagaggtg ccctttgacc 3120 ttcaccgtta cgttattggg cagaaaggaa gtgggatccg caagatgatg gatgagtttg 3180 aggtgaacat acatgtcccg gcacctgagc tgcagtctga catcatcgcc atcacgggcc 3240 tcgctgcaaa tttggaccgg gccaaggctg gactgctgga gcgtgtgaag gagctacagg 3300 ccgagcagga ggaccgggct ttaaggagtt ttaagctgag tgtcactgta gaccccaaat 3360 accatcccaa gattatcggg agaaaggggg cagtaattac ccaaatccgg ttggagcatg 3420 acgtgaacat ccagtttcct gataaggacg atgggaacca gccccaggac caaattacca 3480 tcacagggta cgaaaagaac acagaagctg ccagggatgc tatactgaga attgtgggtg 3540 aacttgagca gatggtttct gaggacgtcc cgctggacca ccgcgttcac gcccgcatca 3600 ttggtgcccg cggcaaagcc attcgcaaaa tcatggacga attcaaggtg gacattcgct 3660 tcccacagag cggagcccca gaccccaact gcgtcactgt gacggggctc ccagagaatg 3720 tggaggaagc catcgaccac atcctcaatc tggaggagga atacctagct gacgtggtgg 3780 acagtgaggc gctgcaggta tacatgaaac ccccagcaca cgaagaggcc aaggcacctt 3840 ccagaggctt tgtggtgcgg gacgcaccct ggaccgccag cagcagtgag aaggctcctg 3900 acatgagcag ctctgaggaa tttcccagct ttggggctca ggtggctccc aagaccctcc 3960 cttggggccc caaacgataa tgatcaaaaa gaacagaacc ctctccagcc tgctgaccca 4020 aacccaacca cacaatggtt tgtctcaatc tgacccagcg gctggaccct ccgtaaattg 4080 ttgacgctct tcccccttcc cgaggtcccg cagggagcct agcgcctggc tgtgtgtgcg 4140 gccgctcctc caggcctggc cgtgcccgct caggacctgc tccactgttt aacactaaac 4200 caaggtcatg agcattcgtg ctaagataac agactccagc tcctggtcca cccggcatgt 4260 cagtcagcac tctggccttc atcacgagag ctccgcagcc gtggctagga ttccacttcc 4320 tgtgtcatga cctcaggaaa taaacgtcct tgactttata aaagccaaac gtttgccctc 4380 ttcctttccc acctccctcc tgccagtttc ccttggtcca gacagtcctg tttgtggagt 4440 gcaatcagcc tcctccagct gccagagcgc ctcagcacag gtgtcagggt gcaaggaaga 4500 cctggcaatg gacagcagga ggcaggttcc tggagctggg gggtgacctg agaggcagag 4560 ggtgacgggt tctcaggcag tcctgatttt acctgccgtg gggtctgaaa gcaccaaggg 4620 tccctgcccc tacctccact gccagaccct cagcctgagg tctggtgagt ggagcctgga 4680 ggcaaggtgg taggcaccat ctgggtcccc tgtggccgtc acagtgtctg ctgtgattga 4740 gatgcgcaca ggttggggga ggtagggcct tacgcttgtc ctcagtgggg gcagtttgcc 4800 ttagatgaca gctgggctct tcttcacacc acctgcagcc cctccctgcc cctgccctag 4860 ctgctgtgtg ttcagttgcc ttctttctac ctcagccggc gtggagtggt ctctgtgcag 4920 ttagtgccac cccacacacc cgtctcttga ttgagatgtt tctggtggtt atgggtttcc 4980 cgtggagctg ggggtgggcg ccgtgtacct aagctggagg ctggcgctct ccctcagcac 5040 aggtgggtca gtggccagca ggcccatctg gagtgggagt gggcacttcc accccgccca 5100 caggccatcc ggctgtgcag gccagcccct aggagcaggt cccgggtgac tggcagtttt 5160 cacggtctag ggccgagacg atggcatggg gcctagagca tgaggtagag cagaatgcag 5220 accacgccgc tggatgccga gagaccctgc tctccgaggg aggcatctgt gtcatgctgt 5280 gagggctgag gacggggccc tagtctctgg ttttctggtc ttaacatcct tatctgtgtc 5340 cgccacggag gtgactgagc tgctagcgag ttgtcctgtc ccaggtactt gagttttgga 5400 aaagctgact cacgcccatc catctcacag cccttccctg gggacagtcg cttccgcctt 5460 gacacctcac tctcagttga ataactcaag cttggtcatc ttcagactcg aattcttgag 5520 tagacccaga cggcttagcc caagtctagt tgcagctgcc tcggcaagtc cccatttgct 5580 caggcagccc tgaatgggcc tgtttacagg aatggtaaat tgggattgga aggaatatag 5640 cttccagctt cataggctag ggtgaccacg gcttaggaaa cagggaaaga aagcaaggcc 5700 cttttcctgc ctttcccggg atctgtctac tccacctcca cgggggaggc cagtggggaa 5760 gggctgtcac ctcttcccca tctgcatgag ttctggaact ctgtcctgtt ggctgcttgc 5820 ttccagctcc ccccaatctc catcgcagcg ggttcctcct gtcttttcta cagtgtcata 5880 aaacatcctg cccctaccct ctcccaaagg tcaattttaa ttctcaccaa gttttgcaca 5940 tctctgtatg tcgcttgatg tcttagacgc gagccctttc ctaaactgtt cagcgctctc 6000 ttttcctttg ggtggttgtt gcaagggtga tgacatgact gtccccaggc ctgtctccct 6060 gaagcgtctg tgctgtcagg acagccctgg gcagagatga ggcaggggtg aggcgtgcgt 6120 gtgcttttcc tccttgttgg atgtcttcca tatcatctgt ttccatagct acaatccatc 6180 ccttggcctt aactttggaa tttggagatt atatgcaaac atgtgtaaag gctcatgaat 6240 atggatgaca ctggaatttt ataaattcta aaataaaacc cgaaaccaga tgtagcatgc 6300 tgggactcat tttgaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6360 aaaaaaa 6367 <210> 45 <211> 127 <212> PRT <213> Homo sapiens <400> 45 Met Pro Glu Val Ser Ser Lys Gly Ala Thr Ile Ser Lys Lys Gly Phe 1 5 10 15 Lys Lys Ala Val Val Lys Thr Gln Lys Lys Glu Gly Lys Lys Arg Lys 20 25 30 Arg Thr Arg Lys Glu Ser Tyr Ser Ile Tyr Ile Tyr Lys Val Leu Lys 35 40 45 Gln Val His Pro Asp Thr Gly Ile Ser Ser Lys Ala Met Ser Ile Met 50 55 60 Asn Ser Phe Val Thr Asp Ile Phe Glu Arg Ile Ala Ser Glu Ala Ser 65 70 75 80 Arg Leu Ala His Tyr Ser Lys Arg Ser Thr Ile Ser Ser Arg Glu Ile 85 90 95 Gln Thr Ala Val Arg Leu Leu Leu Pro Gly Glu Leu Ala Lys His Ala 100 105 110 Val Ser Glu Gly Thr Lys Ala Val Thr Lys Tyr Thr Ser Ser Lys 115 120 125 <210> 46 <211> 437 <212> DNA <213> Homo sapiens <400> 46 atgccggagg tgtcatctaa aggtgctacc atttccaaga agggctttaa gaaagctgtc 60 gttaagaccc agaaaaagga aggcaaaaag cgcaagagga cccgtaagga gagttattct 120 atttacatct acaaagtgct aaagcaggtc catccggaca ctggcatctc ttcgaaagct 180 atgagcatta tgaattcctt cgtcactgat atctttgagc gtatagcgag cgaggcatca 240 cgtttggctc actacagcaa gcgctccacc atttcttcca gagagattca gacagcagtg 300 cgcttgctac tgccgggaga gctggctaaa catgctgtgt ctgagggcac caaggctgtc 360 actaagtaca ccagctccaa gtaagcctgc taagtaaacg tcatttctaa cccaaaggct 420 cttttcagag ccactta 437 <210> 47 <211> 209 <212> PRT <213> Homo sapiens <400> 47 Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr 1 5 10 15 Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro 20 25 30 Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg 35 40 45 Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala 50 55 60 Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro 65 70 75 80 Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys 85 90 95 Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys 100 105 110 Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys 115 120 125 Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr 130 135 140 Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala 145 150 155 160 Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly 165 170 175 Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu 180 185 190 Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu 195 200 205 Glu <210> 48 <211> 1467 <212> DNA <213> Homo sapiens <400> 48 aaaccagttc acgccggagc cccgtgaggg aagcgtctcc gttgggtccg gccgctctgc 60 gggactctga ggaaaagctc gcaccaggca agaataccct ccaataccct cgggtggacg 120 cggatctgtc aacatgggta aaggagaccc caacaagccg cggggcaaaa tgtcctcgta 180 cgccttcttc gtgcagacct gccgggaaga gcacaagaag aaacacccgg actcttccgt 240 caatttcgcg gaattctcca agaagtgttc ggagagatgg aagaccatgt ctgcaaagga 300 gaagtcgaag tttgaagata tggcaaaaag tgacaaagct cgctatgaca gggagatgaa 360 aaattacgtt cctcccaaag gtgataagaa ggggaagaaa aaggacccca atgctcctaa 420 aaggccacca tctgccttct tcctgttttg ctctgaacat cgcccaaaga tcaaaagtga 480 acaccctggc ctatccattg gggatactgc aaagaaattg ggtgaaatgt ggtctgagca 540 gtcagccaaa gataaacaac catatgaaca gaaagcagct aagctaaagg agaaatatga 600 aaaggatatt gctgcatatc gtgccaaggg caaaagtgaa gcaggaaaga agggccctgg 660 caggccaaca ggctcaaaga agaagaacga accagaagat gaggaggagg aggaggaaga 720 agaagatgaa gatgaggagg aagaggatga agatgaagaa taaatggcta tcctttaatg 780 atgcgtgtgg aatgtgtgtg tgtgctcagg caattatttt gctaagaatg tgaattcaag 840 tgcagctcaa tactagcttc agtataaaaa ctgtacagat ttttgtatag ctgataagat 900 tctctgtaga gaaaatactt ttaaaaaatg caggttgtag ctttttgatg ggctactcat 960 acagttagat tttacagctt ctgatgttga atgttcctaa atatttaatg gtttttttaa 1020 tttcttgtgt atggtagcac agcaaacttg taggaattag tatcaatagt aaattttggg 1080 ttttttagga tgttgcattt cgttttttta aaaaaaattt tgtaataaaa ttatgtatat 1140 tatttctatt gtctttgtct taatatgcta agttaatttt cactttaaaa aagccatttg 1200 aagaccagag ctatgttgat ttttttcggt atttctgcct agtagttctt agacacagtt 1260 gacctagtaa aatgtttgag aattaaaacc aaacatgctc atatttgcaa aatgttcttt 1320 aaaagttaca tgttgaactc agtgaacttt ataagaattt atgcagtttt acagaacgtt 1380 aagttttgta cttgacgttt ctgtttatta gctaaattgt tcctcaggtg tgtgtatata 1440 tatatacata tatatatata tatatat 1467 <210> 49 <211> 209 <212> PRT <213> Homo sapiens <400> 49 Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr 1 5 10 15 Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro 20 25 30 Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg 35 40 45 Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala 50 55 60 Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro 65 70 75 80 Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys 85 90 95 Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys 100 105 110 Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys 115 120 125 Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr 130 135 140 Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala 145 150 155 160 Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly 165 170 175 Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu 180 185 190 Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu 195 200 205 Glu <210> 50 <211> 1454 <212> DNA <213> Homo sapiens <400> 50 ggatttgggc gggaagcgga gccccgccag cgcccgccct ggcagctgcg ggctccgcgc 60 cgaccctccg gcttcccctc tcccccctcg gccccgtcag gtggacgcgg atctgtcaac 120 atgggtaaag gagaccccaa caagccgcgg ggcaaaatgt cctcgtacgc cttcttcgtg 180 cagacctgcc gggaagagca caagaagaaa cacccggact cttccgtcaa tttcgcggaa 240 ttctccaaga agtgttcgga gagatggaag accatgtctg caaaggagaa gtcgaagttt 300 gaagatatgg caaaaagtga caaagctcgc tatgacaggg agatgaaaaa ttacgttcct 360 cccaaaggtg ataagaaggg gaagaaaaag gaccccaatg ctcctaaaag gccaccatct 420 gccttcttcc tgttttgctc tgaacatcgc ccaaagatca aaagtgaaca ccctggccta 480 tccattgggg atactgcaaa gaaattgggt gaaatgtggt ctgagcagtc agccaaagat 540 aaacaaccat atgaacagaa agcagctaag ctaaaggaga aatatgaaaa ggatattgct 600 gcatatcgtg ccaagggcaa aagtgaagca ggaaagaagg gccctggcag gccaacaggc 660 tcaaagaaga agaacgaacc agaagatgag gaggaggagg aggaagaaga agatgaagat 720 gaggaggaag aggatgaaga tgaagaataa atggctatcc tttaatgatg cgtgtggaat 780 gtgtgtgtgt gctcaggcaa ttattttgct aagaatgtga attcaagtgc agctcaatac 840 tagcttcagt ataaaaactg tacagatttt tgtatagctg ataagattct ctgtagagaa 900 aatactttta aaaaatgcag gttgtagctt tttgatgggc tactcataca gttagatttt 960 acagcttctg atgttgaatg ttcctaaata tttaatggtt tttttaattt cttgtgtatg 1020 gtagcacagc aaacttgtag gaattagtat caatagtaaa ttttgggttt tttaggatgt 1080 tgcatttcgt ttttttaaaa aaaattttgt aataaaatta tgtatattat ttctattgtc 1140 tttgtcttaa tatgctaagt taattttcac tttaaaaaag ccatttgaag accagagcta 1200 tgttgatttt tttcggtatt tctgcctagt agttcttaga cacagttgac ctagtaaaat 1260 gtttgagaat taaaaccaaa catgctcata tttgcaaaat gttctttaaa agttacatgt 1320 tgaactcagt gaactttata agaatttatg cagttttaca gaacgttaag ttttgtactt 1380 gacgtttctg tttattagct aaattgttcc tcaggtgtgt gtatatatat atacatatat 1440 atatatatat atat 1454 <210> 51 <211> 209 <212> PRT <213> Homo sapiens <400> 51 Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr 1 5 10 15 Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro 20 25 30 Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg 35 40 45 Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala 50 55 60 Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro 65 70 75 80 Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys 85 90 95 Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys 100 105 110 Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys 115 120 125 Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr 130 135 140 Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala 145 150 155 160 Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly 165 170 175 Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu 180 185 190 Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu 195 200 205 Glu <210> 52 <211> 1527 <212> DNA <213> Homo sapiens <400> 52 ggggatgtgg cccgtggcct agctcgtcaa gttgccgtgg cgcggagaac tctgcaaaac 60 aagaggctga ggattgcgtt agagataaac cagttcacgc cggagccccg tgagggaagc 120 gtctccgttg ggtccggccg ctctgcggga ctctgaggaa aagctcgcac caggtggacg 180 cggatctgtc aacatgggta aaggagaccc caacaagccg cggggcaaaa tgtcctcgta 240 cgccttcttc gtgcagacct gccgggaaga gcacaagaag aaacacccgg actcttccgt 300 caatttcgcg gaattctcca agaagtgttc ggagagatgg aagaccatgt ctgcaaagga 360 gaagtcgaag tttgaagata tggcaaaaag tgacaaagct cgctatgaca gggagatgaa 420 aaattacgtt cctcccaaag gtgataagaa ggggaagaaa aaggacccca atgctcctaa 480 aaggccacca tctgccttct tcctgttttg ctctgaacat cgcccaaaga tcaaaagtga 540 acaccctggc ctatccattg gggatactgc aaagaaattg ggtgaaatgt ggtctgagca 600 gtcagccaaa gataaacaac catatgaaca gaaagcagct aagctaaagg agaaatatga 660 aaaggatatt gctgcatatc gtgccaaggg caaaagtgaa gcaggaaaga agggccctgg 720 caggccaaca ggctcaaaga agaagaacga accagaagat gaggaggagg aggaggaaga 780 agaagatgaa gatgaggagg aagaggatga agatgaagaa taaatggcta tcctttaatg 840 atgcgtgtgg aatgtgtgtg tgtgctcagg caattatttt gctaagaatg tgaattcaag 900 tgcagctcaa tactagcttc agtataaaaa ctgtacagat ttttgtatag ctgataagat 960 tctctgtaga gaaaatactt ttaaaaaatg caggttgtag ctttttgatg ggctactcat 1020 acagttagat tttacagctt ctgatgttga atgttcctaa atatttaatg gtttttttaa 1080 tttcttgtgt atggtagcac agcaaacttg taggaattag tatcaatagt aaattttggg 1140 ttttttagga tgttgcattt cgttttttta aaaaaaattt tgtaataaaa ttatgtatat 1200 tatttctatt gtctttgtct taatatgcta agttaatttt cactttaaaa aagccatttg 1260 aagaccagag ctatgttgat ttttttcggt atttctgcct agtagttctt agacacagtt 1320 gacctagtaa aatgtttgag aattaaaacc aaacatgctc atatttgcaa aatgttcttt 1380 aaaagttaca tgttgaactc agtgaacttt ataagaattt atgcagtttt acagaacgtt 1440 aagttttgta cttgacgttt ctgtttatta gctaaattgt tcctcaggtg tgtgtatata 1500 tatatacata tatatatata tatatat 1527 <210> 53 <211> 464 <212> PRT <213> Homo sapiens <400> 53 Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn 1 5 10 15 Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala 20 25 30 Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu 35 40 45 Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn 50 55 60 Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp 65 70 75 80 Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr 85 90 95 Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu 100 105 110 Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp 115 120 125 Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp 130 135 140 Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile 145 150 155 160 Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr 165 170 175 Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val 180 185 190 Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile 195 200 205 Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro 210 215 220 Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr 225 230 235 240 Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg 245 250 255 Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro 260 265 270 Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly 275 280 285 Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala 290 295 300 Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu 305 310 315 320 Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met 325 330 335 Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp 340 345 350 Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly 355 360 365 Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly 370 375 380 Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly 385 390 395 400 Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu 405 410 415 Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp 420 425 430 Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln 435 440 445 Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ala Asp Val Glu Gly Phe 450 455 460 <210> 54 <211> 2995 <212> DNA <213> Homo sapiens <400> 54 ccctagccgc ccctcccccc agctagtgag tgcgcgaacg agaaaggagg agggcgctcc 60 aggcgacagc actgcagacg ccattatcct ctgtttctct gctgcaccga cctcgacgtc 120 ttgcctgtgt cccacttgtt cgcggcctat aggctactgc agcactgggg tgtcagttgt 180 tggtccgacc cagaacgctt cagttctgct ctgcaaggat atataataac tgattggtgt 240 gcccgtttaa taaaagaata tggaaactga acagccagaa gaaaccttcc ctaacactga 300 aaccaatggt gaatttggta aacgccctgc agaagatatg gaagaggaac aagcatttaa 360 aagatctaga aacactgatg agatggttga attacgcatt ctgcttcaga gcaagaatgc 420 tggggcagtg attggaaaag gaggcaagaa tattaaggct ctccgtacag actacaatgc 480 cagtgtttca gtcccagaca gcagtggccc cgagcgcata ttgagtatca gtgctgatat 540 tgaaacaatt ggagaaattc tgaagaaaat catccctacc ttggaagagg gcctgcagtt 600 gccatcaccc actgcaacca gccagctccc gctcgaatct gatgctgtgg aatgcttaaa 660 ttaccaacac tataaaggaa gtgactttga ctgcgagttg aggctgttga ttcatcagag 720 tctagcagga ggaattattg gggtcaaagg tgctaaaatc aaagaacttc gagagaacac 780 tcaaaccacc atcaagcttt tccaggaatg ctgtcctcat tccactgaca gagttgttct 840 tattggagga aaacccgata gggttgtaga gtgcataaag atcatccttg atcttatatc 900 tgagtctccc atcaaaggac gtgcacagcc ttatgatccc aatttttacg atgaaaccta 960 tgattatggt ggttttacaa tgatgtttga tgaccgtcgc ggacgcccag tgggatttcc 1020 catgcgggga agaggtggtt ttgacagaat gcctcctggt cggggtgggc gtcccatgcc 1080 tccatctaga agagattatg atgatatgag ccctcgtcga ggaccacctc cccctcctcc 1140 cggacgaggc ggccggggtg gtagcagagc tcggaatctt cctcttcctc caccaccacc 1200 acctagaggg ggagacctca tggcctatga cagaagaggg agacctggag accgttacga 1260 cggcatggtt ggtttcagtg ctgatgaaac ttgggactct gcaatagata catggagccc 1320 atcagaatgg cagatggctt atgaaccaca gggtggctcc ggatatgatt attcctatgc 1380 agggggtcgt ggctcatatg gtgatcttgg tggacctatt attactacac aagtaactat 1440 tcccaaagat ttggctggat ctattattgg caaaggtggt cagcggatta aacaaatccg 1500 tcatgagtcg ggagcttcga tcaaaattga tgagccttta gaaggatccg aagatcggat 1560 cattaccatt acaggaacac aggaccagat acagaatgca cagtatttgc tgcagaacag 1620 tgtgaagcag tatgcagatg ttgaaggatt ctaatgcaag atattttttc ttttttatag 1680 tgtgaagcag tattctggaa agtttttcta agactagtga agaactgaag gagtcctgca 1740 tctttttttt tttatctgct tctgtttaaa aagccaacat tcctctgctt cataggtgtt 1800 ctgcatttga ggtgtagtga aatctttgct gttcaccaga tgtaatgttt tagttcctta 1860 caaacagggt tggggggggg aagggcgtgc aaaaactaac attgaaattt tgaaacagca 1920 gcagagtgag tggattttat ttttcgttat tgttggtggt ttaaaaaatt ccccccatgt 1980 aattattgtg aacaccttgc tttgtggtca ctgtaacatt tggggggtgg gacagggagg 2040 aaaagtaaca atagtccaca tgtccctggc atctgttcag agcagtgtgc agaatgtaat 2100 gctcttttgt aagaaacgtt ttatgatttt taaaataaat ttagtgaacc tatttttggt 2160 ggtcattttt tttttaagac agtcatttta aaatggtggc tgaatttccc aacccacccc 2220 caaactaaac actaagttta attttcagct cctctgttgg acatataagt gcatctcttg 2280 ttggacatag gcaaaataac ttggcaaact tagttctggt gatttcttga tggtttggaa 2340 gtctattgct gggaagaaat tccatcatac atattcatgc ttataataag ctggggattt 2400 tttgtttgtt tttgcaaatg cttgccccta cttttcaaca attttctatg ttagttgtga 2460 agaactaagg tggggagcag tactacaagt tgagtaatgg tatgagtata taccagaatt 2520 ctgattggca gcaagtttta ttaatcagaa taacacttgg ttatggaagt gactaatgct 2580 gaaaaaattg attattttta ttagataatt tctcacctat agacttaaac tgtcaatttg 2640 ctctagtgtc ttattagtta aactttgtaa aatatatata tacttgtttt tccattgtat 2700 gcaaattgaa agaaaaagat gtaccatttc tctgttgtat gttggattat gtaggaaatg 2760 tttgtgtaca attcaaaaaa aaaaaagatg aaaaaagttc ctgtggatgt tttgtgtagt 2820 atcttggcat ttgtattgat agttaaaatt cacttccaaa taaataaaac acccatgatg 2880 ctagatttga tgtgtgcccg atttgaacaa gggttgattg acacctgtaa aatttgttga 2940 aacgttcctc ttaaaaggaa atatagtaat cttatgtaaa aaaaaaaaaa aaaaa 2995 <210> 55 <211> 463 <212> PRT <213> Homo sapiens <400> 55 Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn 1 5 10 15 Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala 20 25 30 Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu 35 40 45 Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn 50 55 60 Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp 65 70 75 80 Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr 85 90 95 Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu 100 105 110 Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp 115 120 125 Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp 130 135 140 Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile 145 150 155 160 Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr 165 170 175 Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val 180 185 190 Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile 195 200 205 Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro 210 215 220 Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr 225 230 235 240 Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg 245 250 255 Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro 260 265 270 Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly 275 280 285 Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala 290 295 300 Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu 305 310 315 320 Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met 325 330 335 Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp 340 345 350 Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly 355 360 365 Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly 370 375 380 Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly 385 390 395 400 Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu 405 410 415 Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp 420 425 430 Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln 435 440 445 Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ser Gly Lys Phe Phe 450 455 460 <210> 56 <211> 2935 <212> DNA <213> Homo sapiens <400> 56 ccctagccgc ccctcccccc agctagtgag tgcgcgaacg agaaaggagg agggcgctcc 60 aggcgacagc actgcagacg ccattatcct ctgtttctct gctgcaccga cctcgacgtc 120 ttgcctgtgt cccacttgtt cgcggcctat aggctactgc agcactgggg tgtcagttgt 180 tggtccgacc cagaacgctt cagttctgct ctgcaaggat atataataac tgattggtgt 240 gcccgtttaa taaaagaata tggaaactga acagccagaa gaaaccttcc ctaacactga 300 aaccaatggt gaatttggta aacgccctgc agaagatatg gaagaggaac aagcatttaa 360 aagatctaga aacactgatg agatggttga attacgcatt ctgcttcaga gcaagaatgc 420 tggggcagtg attggaaaag gaggcaagaa tattaaggct ctccgtacag actacaatgc 480 cagtgtttca gtcccagaca gcagtggccc cgagcgcata ttgagtatca gtgctgatat 540 tgaaacaatt ggagaaattc tgaagaaaat catccctacc ttggaagagg gcctgcagtt 600 gccatcaccc actgcaacca gccagctccc gctcgaatct gatgctgtgg aatgcttaaa 660 ttaccaacac tataaaggaa gtgactttga ctgcgagttg aggctgttga ttcatcagag 720 tctagcagga ggaattattg gggtcaaagg tgctaaaatc aaagaacttc gagagaacac 780 tcaaaccacc atcaagcttt tccaggaatg ctgtcctcat tccactgaca gagttgttct 840 tattggagga aaacccgata gggttgtaga gtgcataaag atcatccttg atcttatatc 900 tgagtctccc atcaaaggac gtgcacagcc ttatgatccc aatttttacg atgaaaccta 960 tgattatggt ggttttacaa tgatgtttga tgaccgtcgc ggacgcccag tgggatttcc 1020 catgcgggga agaggtggtt ttgacagaat gcctcctggt cggggtgggc gtcccatgcc 1080 tccatctaga agagattatg atgatatgag ccctcgtcga ggaccacctc cccctcctcc 1140 cggacgaggc ggccggggtg gtagcagagc tcggaatctt cctcttcctc caccaccacc 1200 acctagaggg ggagacctca tggcctatga cagaagaggg agacctggag accgttacga 1260 cggcatggtt ggtttcagtg ctgatgaaac ttgggactct gcaatagata catggagccc 1320 atcagaatgg cagatggctt atgaaccaca gggtggctcc ggatatgatt attcctatgc 1380 agggggtcgt ggctcatatg gtgatcttgg tggacctatt attactacac aagtaactat 1440 tcccaaagat ttggctggat ctattattgg caaaggtggt cagcggatta aacaaatccg 1500 tcatgagtcg ggagcttcga tcaaaattga tgagccttta gaaggatccg aagatcggat 1560 cattaccatt acaggaacac aggaccagat acagaatgca cagtatttgc tgcagaacag 1620 tgtgaagcag tattctggaa agtttttcta agactagtga agaactgaag gagtcctgca 1680 tctttttttt tttatctgct tctgtttaaa aagccaacat tcctctgctt cataggtgtt 1740 ctgcatttga ggtgtagtga aatctttgct gttcaccaga tgtaatgttt tagttcctta 1800 caaacagggt tggggggggg aagggcgtgc aaaaactaac attgaaattt tgaaacagca 1860 gcagagtgag tggattttat ttttcgttat tgttggtggt ttaaaaaatt ccccccatgt 1920 aattattgtg aacaccttgc tttgtggtca ctgtaacatt tggggggtgg gacagggagg 1980 aaaagtaaca atagtccaca tgtccctggc atctgttcag agcagtgtgc agaatgtaat 2040 gctcttttgt aagaaacgtt ttatgatttt taaaataaat ttagtgaacc tatttttggt 2100 ggtcattttt tttttaagac agtcatttta aaatggtggc tgaatttccc aacccacccc 2160 caaactaaac actaagttta attttcagct cctctgttgg acatataagt gcatctcttg 2220 ttggacatag gcaaaataac ttggcaaact tagttctggt gatttcttga tggtttggaa 2280 gtctattgct gggaagaaat tccatcatac atattcatgc ttataataag ctggggattt 2340 tttgtttgtt tttgcaaatg cttgccccta cttttcaaca attttctatg ttagttgtga 2400 agaactaagg tggggagcag tactacaagt tgagtaatgg tatgagtata taccagaatt 2460 ctgattggca gcaagtttta ttaatcagaa taacacttgg ttatggaagt gactaatgct 2520 gaaaaaattg attattttta ttagataatt tctcacctat agacttaaac tgtcaatttg 2580 ctctagtgtc ttattagtta aactttgtaa aatatatata tacttgtttt tccattgtat 2640 gcaaattgaa agaaaaagat gtaccatttc tctgttgtat gttggattat gtaggaaatg 2700 tttgtgtaca attcaaaaaa aaaaaagatg aaaaaagttc ctgtggatgt tttgtgtagt 2760 atcttggcat ttgtattgat agttaaaatt cacttccaaa taaataaaac acccatgatg 2820 ctagatttga tgtgtgcccg atttgaacaa gggttgattg acacctgtaa aatttgttga 2880 aacgttcctc ttaaaaggaa atatagtaat cttatgtaaa aaaaaaaaaa aaaaa 2935 <210> 57 <211> 464 <212> PRT <213> Homo sapiens <400> 57 Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn 1 5 10 15 Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala 20 25 30 Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu 35 40 45 Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn 50 55 60 Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp 65 70 75 80 Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr 85 90 95 Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu 100 105 110 Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp 115 120 125 Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp 130 135 140 Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile 145 150 155 160 Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr 165 170 175 Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val 180 185 190 Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile 195 200 205 Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro 210 215 220 Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr 225 230 235 240 Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg 245 250 255 Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro 260 265 270 Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly 275 280 285 Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala 290 295 300 Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu 305 310 315 320 Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met 325 330 335 Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp 340 345 350 Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly 355 360 365 Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly 370 375 380 Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly 385 390 395 400 Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu 405 410 415 Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp 420 425 430 Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln 435 440 445 Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ala Asp Val Glu Gly Phe 450 455 460 <210> 58 <211> 2960 <212> DNA <213> Homo sapiens <400> 58 tagggcgcga cggcggggag gacgcgagaa ggcgggggag gggagcctgc gctcgttttc 60 tgtctagctc cgaccggctg aggcggcgcg gcagcggagg gacggcagtc tcgcgcggct 120 actgcagcac tggggtgtca gttgttggtc cgacccagaa cgcttcagtt ctgctctgca 180 aggatatata ataactgatt ggtgtgcccg tttaataaaa gaatatggaa actgaacagc 240 cagaagaaac cttccctaac actgaaacca atggtgaatt tggtaaacgc cctgcagaag 300 atatggaaga ggaacaagca tttaaaagat ctagaaacac tgatgagatg gttgaattac 360 gcattctgct tcagagcaag aatgctgggg cagtgattgg aaaaggaggc aagaatatta 420 aggctctccg tacagactac aatgccagtg tttcagtccc agacagcagt ggccccgagc 480 gcatattgag tatcagtgct gatattgaaa caattggaga aattctgaag aaaatcatcc 540 ctaccttgga agagggcctg cagttgccat cacccactgc aaccagccag ctcccgctcg 600 aatctgatgc tgtggaatgc ttaaattacc aacactataa aggaagtgac tttgactgcg 660 agttgaggct gttgattcat cagagtctag caggaggaat tattggggtc aaaggtgcta 720 aaatcaaaga acttcgagag aacactcaaa ccaccatcaa gcttttccag gaatgctgtc 780 ctcattccac tgacagagtt gttcttattg gaggaaaacc cgatagggtt gtagagtgca 840 taaagatcat ccttgatctt atatctgagt ctcccatcaa aggacgtgca cagccttatg 900 atcccaattt ttacgatgaa acctatgatt atggtggttt tacaatgatg tttgatgacc 960 gtcgcggacg cccagtggga tttcccatgc ggggaagagg tggttttgac agaatgcctc 1020 ctggtcgggg tgggcgtccc atgcctccat ctagaagaga ttatgatgat atgagccctc 1080 gtcgaggacc acctccccct cctcccggac gaggcggccg gggtggtagc agagctcgga 1140 atcttcctct tcctccacca ccaccaccta gagggggaga cctcatggcc tatgacagaa 1200 gagggagacc tggagaccgt tacgacggca tggttggttt cagtgctgat gaaacttggg 1260 actctgcaat agatacatgg agcccatcag aatggcagat ggcttatgaa ccacagggtg 1320 gctccggata tgattattcc tatgcagggg gtcgtggctc atatggtgat cttggtggac 1380 ctattattac tacacaagta actattccca aagatttggc tggatctatt attggcaaag 1440 gtggtcagcg gattaaacaa atccgtcatg agtcgggagc ttcgatcaaa attgatgagc 1500 ctttagaagg atccgaagat cggatcatta ccattacagg aacacaggac cagatacaga 1560 atgcacagta tttgctgcag aacagtgtga agcagtatgc agatgttgaa ggattctaat 1620 gcaagatatt ttttcttttt tatagtgtga agcagtattc tggaaagttt ttctaagact 1680 agtgaagaac tgaaggagtc ctgcatcttt ttttttttat ctgcttctgt ttaaaaagcc 1740 aacattcctc tgcttcatag gtgttctgca tttgaggtgt agtgaaatct ttgctgttca 1800 ccagatgtaa tgttttagtt ccttacaaac agggttgggg gggggaaggg cgtgcaaaaa 1860 ctaacattga aattttgaaa cagcagcaga gtgagtggat tttatttttc gttattgttg 1920 gtggtttaaa aaattccccc catgtaatta ttgtgaacac cttgctttgt ggtcactgta 1980 acatttgggg ggtgggacag ggaggaaaag taacaatagt ccacatgtcc ctggcatctg 2040 ttcagagcag tgtgcagaat gtaatgctct tttgtaagaa acgttttatg atttttaaaa 2100 taaatttagt gaacctattt ttggtggtca tttttttttt aagacagtca ttttaaaatg 2160 gtggctgaat ttcccaaccc acccccaaac taaacactaa gtttaatttt cagctcctct 2220 gttggacata taagtgcatc tcttgttgga cataggcaaa ataacttggc aaacttagtt 2280 ctggtgattt cttgatggtt tggaagtcta ttgctgggaa gaaattccat catacatatt 2340 catgcttata ataagctggg gattttttgt ttgtttttgc aaatgcttgc ccctactttt 2400 caacaatttt ctatgttagt tgtgaagaac taaggtgggg agcagtacta caagttgagt 2460 aatggtatga gtatatacca gaattctgat tggcagcaag ttttattaat cagaataaca 2520 cttggttatg gaagtgacta atgctgaaaa aattgattat ttttattaga taatttctca 2580 cctatagact taaactgtca atttgctcta gtgtcttatt agttaaactt tgtaaaatat 2640 atatatactt gtttttccat tgtatgcaaa ttgaaagaaa aagatgtacc atttctctgt 2700 tgtatgttgg attatgtagg aaatgtttgt gtacaattca aaaaaaaaaa agatgaaaaa 2760 agttcctgtg gatgttttgt gtagtatctt ggcatttgta ttgatagtta aaattcactt 2820 ccaaataaat aaaacaccca tgatgctaga tttgatgtgt gcccgatttg aacaagggtt 2880 gattgacacc tgtaaaattt gttgaaacgt tcctcttaaa aggaaatata gtaatcttat 2940 gtaaaaaaaa aaaaaaaaaa 2960 <210> 59 <211> 363 <212> PRT <213> Homo sapiens <400> 59 Met Glu Val Pro Pro Arg Leu Ser His Val Pro Pro Pro Leu Phe Pro 1 5 10 15 Ser Ala Pro Ala Thr Leu Ala Ser Arg Ser Leu Ser His Trp Arg Pro 20 25 30 Arg Pro Pro Arg Gln Leu Ala Pro Leu Leu Pro Ser Leu Ala Pro Ser 35 40 45 Ser Ala Arg Gln Gly Ala Arg Arg Ala Gln Arg His Val Thr Ala Gln 50 55 60 Gln Pro Ser Arg Leu Ala Gly Gly Ala Ala Ile Lys Gly Gly Arg Arg 65 70 75 80 Arg Arg Pro Asp Leu Phe Arg Arg His Phe Lys Ser Ser Ser Ile Gln 85 90 95 Arg Ser Ala Ala Ala Ala Ala Ala Thr Arg Thr Ala Arg Gln His Pro 100 105 110 Pro Ala Asp Ser Ser Val Thr Met Glu Asp Met Asn Glu Tyr Ser Asn 115 120 125 Ile Glu Glu Phe Ala Glu Gly Ser Lys Ile Asn Ala Ser Lys Asn Gln 130 135 140 Gln Asp Asp Gly Lys Met Phe Ile Gly Gly Leu Ser Trp Asp Thr Ser 145 150 155 160 Lys Lys Asp Leu Thr Glu Tyr Leu Ser Arg Phe Gly Glu Val Val Asp 165 170 175 Cys Thr Ile Lys Thr Asp Pro Val Thr Gly Arg Ser Arg Gly Phe Gly 180 185 190 Phe Val Leu Phe Lys Asp Ala Ala Ser Val Asp Lys Val Leu Glu Leu 195 200 205 Lys Glu His Lys Leu Asp Gly Lys Leu Ile Asp Pro Lys Arg Ala Lys 210 215 220 Ala Leu Lys Gly Lys Glu Pro Pro Lys Lys Val Phe Val Gly Gly Leu 225 230 235 240 Ser Pro Asp Thr Ser Glu Glu Gln Ile Lys Glu Tyr Phe Gly Ala Phe 245 250 255 Gly Glu Ile Glu Asn Ile Glu Leu Pro Met Asp Thr Lys Thr Asn Glu 260 265 270 Arg Arg Gly Phe Cys Phe Ile Thr Tyr Thr Asp Glu Glu Pro Val Lys 275 280 285 Lys Leu Leu Glu Ser Arg Tyr His Gln Ile Gly Ser Gly Lys Cys Glu 290 295 300 Ile Lys Val Ala Gln Pro Lys Glu Val Tyr Arg Gln Gln Gln Gln Gln 305 310 315 320 Gln Lys Gly Gly Arg Gly Ala Ala Ala Gly Gly Arg Gly Gly Thr Arg 325 330 335 Gly Arg Gly Arg Gly Gln Gln Ser Thr Tyr Gly Lys Ala Ser Arg Gly 340 345 350 Gly Gly Asn His Gln Asn Asn Tyr Gln Pro Tyr 355 360 <210> 60 <211> 3986 <212> DNA <213> Homo sapiens <400> 60 gaggccgcgc ggggcccggg cttcggccga tcagcccggg aggccccgcc gcgccccctt 60 ggcccgcgcg cccgtggtca cagtggaaga ggcgcccgcg ctgcgctgcc cggaggagcc 120 gtcgcgcgcc cgcttcctgt tcggctggtt cctgccagct cgaggacaaa acacgcgtgc 180 gcgcggcggg cgagcgcgct cgccgcctca gtcgccagcg ccgggcgcag tccgcctttt 240 tccggagcag actggccgcg gtgctagtcg gtagcagcgg ccgccgcagc ggctccgcac 300 tggcgaaccg agggcagaaa aaggcggggt tgacggcttt ttggtaggag tgggctggac 360 cggacgccag agacaaaggc tcccaaggca agagggactg tggccctgcg tcggctctgc 420 tcgggactgc tgaccccagg aatttacgcc ccttcgtttt tctcttctga ttcttctctt 480 ctcccaagcc cgcgtcccct cacgcgtggc ctctctcctt gccgggaggg ccgcgatgga 540 ggtcccgccc aggctttccc atgtgccgcc gccattgttc ccctccgctc ccgctacttt 600 agcctcccgc agcctctccc attggcggcc gcggccgccg cggcagctag ccccgctcct 660 cccttcgctc gctcccagct ccgcccggca gggggcgcgc cgggcccagc gccacgtcac 720 cgcccagcag ccctcccgat tggcgggcgg ggcggctata aagggagggc gcaggcggcg 780 cccggatctc ttccgccgcc attttaaatc cagctccata caacgctccg ccgccgctgc 840 tgccgcgacc cggactgcgc gccagcaccc ccctgccgac agctccgtca ctatggagga 900 tatgaacgag tacagcaata tagaggaatt cgcagaggga tccaagatca acgcgagcaa 960 gaatcagcag gatgacggta aaatgtttat tggaggcttg agctgggata caagcaaaaa 1020 agatctgaca gagtacttgt ctcgatttgg ggaagttgta gactgcacaa ttaaaacaga 1080 tccagtcact gggagatcaa gaggatttgg atttgtgctt ttcaaagatg ctgctagtgt 1140 tgataaggtt ttggaactga aagaacacaa actggatggc aaattgatag atcccaaaag 1200 ggccaaagct ttaaaaggga aagaacctcc caaaaaggtt tttgtgggtg gattgagccc 1260 ggatacttct gaagaacaaa ttaaagaata ttttggagcc tttggagaga ttgaaaatat 1320 tgaacttccc atggatacaa aaacaaatga aagaagagga ttttgtttta tcacatatac 1380 tgatgaagag ccagtaaaaa aattgttaga aagcagatac catcaaattg gttctgggaa 1440 gtgtgaaatc aaagttgcac aacccaaaga ggtatatagg cagcaacagc aacaacaaaa 1500 aggtggaaga ggtgctgcag ctggtggacg aggtggtacg aggggtcgtg gccgaggcca 1560 acagagcact tatggcaagg catctcgagg gggtggcaat caccaaaaca attaccagcc 1620 atactaaagg agaacattgg agaaaacagg aggagatgtt aaagtaaccc atcttgcagg 1680 acgacattga agattggtct tctgttgatc taagatgatt attttgtaaa agactttcta 1740 gtgtacaaga caccattgtg tccaactgta tatagctgcc aattagtttt ctttgttttt 1800 actttgtcct ttgctatctg tgttatgact caatgtggat ttgtttatac acattttatt 1860 tgtatcattt catgttaaac ctcaaataaa tgcttcctta tgtgattgct tttctgcgtc 1920 aggtactaca tagctctgta aaaaatgtaa tttaaaataa gcaataatta aggcacagtt 1980 gattttgtag agtattggtc catacagaga aactgtggtc ctttataaat agccagccag 2040 cgtcaccctc ttctccaatt tgtaggtgta ttttatgctc ttaaggcttc atcttctccc 2100 tgtaactgag atttctacca cacctttgaa caatgttctt tcccttctgg ttatctgaag 2160 actgtcctga aaggaagaca taagtgttgt gattagtaga agctttctag tagaccatat 2220 ttcttctgga ttgtaataaa attgttagta gctcctttta ctttgttcct gtctctggaa 2280 agccattttt gaattgctga ttactttggc tttaatcagt ggtcacctag aaaaagcttt 2340 gtaatcataa cacaatgagt aattcttgat aaaagttcag atacaaaagg agcactgtaa 2400 aactggtagg agctatggtt taagagcatt ggaagtagtt acaactcaag gattttggta 2460 gaaaggtatg agtttggtcg aaaaattaaa atagtggcaa aataagattt agttgtgttt 2520 tctcagagcc gccacaagat tgaacaaaat gttttctgtt tgggcatcct gaggaagttg 2580 tattagctgt taatgctctg tgagtttaga aaaagtcttg atagtaaatc tagtttttga 2640 cacagtgcat gaactaagta gttaaatatt tacatattca gaaaggaata gtggaaaagg 2700 tatcttggtt atgacaaagt cattacaaat gtgactaagt cattacaaat gtgactgagt 2760 cattacagtg gaccctctgg gtgcattgaa aagaatccgt tttatatcca ggtttcagag 2820 gacctggaat aataaaaagc tttggatttt gcattcagtg tagttggatt ttgggacctt 2880 ggcctcagtg ttatttactg ggattggcat acgtgttcac aggcagagta gttgatctca 2940 cacaacgggt gatctcacaa aactggtaag tttcttatgc tcatgagccc tccctttttt 3000 tttttaattt ggtgcctgca actttcttaa caatgattct acttcctggg ctatcacatt 3060 ataatgctct tggcctcttt tttgctgctg ttttgctatt cttaaactta ggccaagtac 3120 caatgttggc tgttagaagg gattctgttc attcaacatg caactttagg gaatggaagt 3180 aagttcattt ttaagttgtg ttgtcagtag gtgcggtgtc tagggtagtg aatcctgtaa 3240 gttcaaattt atgattaggt gacgagttga cattgagatt gtccttttcc ctgatcaaaa 3300 aatgaataaa gcctttttaa acaaaatcca aacttttaat caagtcttga tatgtatgac 3360 tgagaaaaaa tacactacat ctagagatga ttgagatgtt ttgcaaagaa ttgaaggggg 3420 agtgagaatt ggtttttctt gcaggggctt tgaactctag atttgggctt tgaactctag 3480 atttaattca gatttcaggg tctatcagtt caccaactga tgcaaatttg aacagatact 3540 ctaaggctaa gtgtcctagg ttggatgaac tgaagctact atcaagatct cgttcccaag 3600 gattaattta gaacaaagta attggacaag tttattgggg aggggataga aatgaattct 3660 aaagtaccta taacaaatac tctgtgtatg ttttttacat cgtatttgcc ttttacattg 3720 tttagaccaa attctgtgtg atgttatcct cgggaagagg atagaaatta attctaaagt 3780 acctataaca aatgctcggt ttgtatatgt ttttatacat cgtatttgcc ttttgcattg 3840 ttcagaccaa attctgtgtg atgttatcct aacaaaacac cttagtaatt tctttggtta 3900 acatgttaat ctgtaatctc acttttataa gatgaggact attaaaatga gatgtctgtt 3960 gggatgctaa aaaaaaaaaa aaaaaa 3986 <210> 61 <211> 420 <212> PRT <213> Homo sapiens <400> 61 Met Glu Val Pro Pro Arg Leu Ser His Val Pro Pro Pro Leu Phe Pro 1 5 10 15 Ser Ala Pro Ala Thr Leu Ala Ser Arg Ser Leu Ser His Trp Arg Pro 20 25 30 Arg Pro Pro Arg Gln Leu Ala Pro Leu Leu Pro Ser Leu Ala Pro Ser 35 40 45 Ser Ala Arg Gln Gly Ala Arg Arg Ala Gln Arg His Val Thr Ala Gln 50 55 60 Gln Pro Ser Arg Leu Ala Gly Gly Ala Ala Ile Lys Gly Gly Arg Arg 65 70 75 80 Arg Arg Pro Asp Leu Phe Arg Arg His Phe Lys Ser Ser Ser Ile Gln 85 90 95 Arg Ser Ala Ala Ala Ala Ala Ala Thr Arg Thr Ala Arg Gln His Pro 100 105 110 Pro Ala Asp Ser Ser Val Thr Met Glu Asp Met Asn Glu Tyr Ser Asn 115 120 125 Ile Glu Glu Phe Ala Glu Gly Ser Lys Ile Asn Ala Ser Lys Asn Gln 130 135 140 Gln Asp Asp Gly Lys Met Phe Ile Gly Gly Leu Ser Trp Asp Thr Ser 145 150 155 160 Lys Lys Asp Leu Thr Glu Tyr Leu Ser Arg Phe Gly Glu Val Val Asp 165 170 175 Cys Thr Ile Lys Thr Asp Pro Val Thr Gly Arg Ser Arg Gly Phe Gly 180 185 190 Phe Val Leu Phe Lys Asp Ala Ala Ser Val Asp Lys Val Leu Glu Leu 195 200 205 Lys Glu His Lys Leu Asp Gly Lys Leu Ile Asp Pro Lys Arg Ala Lys 210 215 220 Ala Leu Lys Gly Lys Glu Pro Pro Lys Lys Val Phe Val Gly Gly Leu 225 230 235 240 Ser Pro Asp Thr Ser Glu Glu Gln Ile Lys Glu Tyr Phe Gly Ala Phe 245 250 255 Gly Glu Ile Glu Asn Ile Glu Leu Pro Met Asp Thr Lys Thr Asn Glu 260 265 270 Arg Arg Gly Phe Cys Phe Ile Thr Tyr Thr Asp Glu Glu Pro Val Lys 275 280 285 Lys Leu Leu Glu Ser Arg Tyr His Gln Ile Gly Ser Gly Lys Cys Glu 290 295 300 Ile Lys Val Ala Gln Pro Lys Glu Val Tyr Arg Gln Gln Gln Gln Gln 305 310 315 320 Gln Lys Gly Gly Arg Gly Ala Ala Ala Gly Gly Arg Gly Gly Thr Arg 325 330 335 Gly Arg Gly Arg Gly Gln Gly Gln Asn Trp Asn Gln Gly Phe Asn Asn 340 345 350 Tyr Tyr Asp Gln Gly Tyr Gly Asn Tyr Asn Ser Ala Tyr Gly Gly Asp 355 360 365 Gln Asn Tyr Ser Gly Tyr Gly Gly Tyr Asp Tyr Thr Gly Tyr Asn Tyr 370 375 380 Gly Asn Tyr Gly Tyr Gly Gln Gly Tyr Ala Asp Tyr Ser Gly Gln Gln 385 390 395 400 Ser Thr Tyr Gly Lys Ala Ser Arg Gly Gly Gly Asn His Gln Asn Asn 405 410 415 Tyr Gln Pro Tyr 420 <210> 62 <211> 4157 <212> DNA <213> Homo sapiens <400> 62 gaggccgcgc ggggcccggg cttcggccga tcagcccggg aggccccgcc gcgccccctt 60 ggcccgcgcg cccgtggtca cagtggaaga ggcgcccgcg ctgcgctgcc cggaggagcc 120 gtcgcgcgcc cgcttcctgt tcggctggtt cctgccagct cgaggacaaa acacgcgtgc 180 gcgcggcggg cgagcgcgct cgccgcctca gtcgccagcg ccgggcgcag tccgcctttt 240 tccggagcag actggccgcg gtgctagtcg gtagcagcgg ccgccgcagc ggctccgcac 300 tggcgaaccg agggcagaaa aaggcggggt tgacggcttt ttggtaggag tgggctggac 360 cggacgccag agacaaaggc tcccaaggca agagggactg tggccctgcg tcggctctgc 420 tcgggactgc tgaccccagg aatttacgcc ccttcgtttt tctcttctga ttcttctctt 480 ctcccaagcc cgcgtcccct cacgcgtggc ctctctcctt gccgggaggg ccgcgatgga 540 ggtcccgccc aggctttccc atgtgccgcc gccattgttc ccctccgctc ccgctacttt 600 agcctcccgc agcctctccc attggcggcc gcggccgccg cggcagctag ccccgctcct 660 cccttcgctc gctcccagct ccgcccggca gggggcgcgc cgggcccagc gccacgtcac 720 cgcccagcag ccctcccgat tggcgggcgg ggcggctata aagggagggc gcaggcggcg 780 cccggatctc ttccgccgcc attttaaatc cagctccata caacgctccg ccgccgctgc 840 tgccgcgacc cggactgcgc gccagcaccc ccctgccgac agctccgtca ctatggagga 900 tatgaacgag tacagcaata tagaggaatt cgcagaggga tccaagatca acgcgagcaa 960 gaatcagcag gatgacggta aaatgtttat tggaggcttg agctgggata caagcaaaaa 1020 agatctgaca gagtacttgt ctcgatttgg ggaagttgta gactgcacaa ttaaaacaga 1080 tccagtcact gggagatcaa gaggatttgg atttgtgctt ttcaaagatg ctgctagtgt 1140 tgataaggtt ttggaactga aagaacacaa actggatggc aaattgatag atcccaaaag 1200 ggccaaagct ttaaaaggga aagaacctcc caaaaaggtt tttgtgggtg gattgagccc 1260 ggatacttct gaagaacaaa ttaaagaata ttttggagcc tttggagaga ttgaaaatat 1320 tgaacttccc atggatacaa aaacaaatga aagaagagga ttttgtttta tcacatatac 1380 tgatgaagag ccagtaaaaa aattgttaga aagcagatac catcaaattg gttctgggaa 1440 gtgtgaaatc aaagttgcac aacccaaaga ggtatatagg cagcaacagc aacaacaaaa 1500 aggtggaaga ggtgctgcag ctggtggacg aggtggtacg aggggtcgtg gccgaggtca 1560 gggccaaaac tggaaccaag gatttaataa ctattatgat caaggatatg gaaattacaa 1620 tagtgcctat ggtggtgatc aaaactatag tggctatggc ggatatgatt atactgggta 1680 taactatggg aactatggat atggacaggg atatgcagac tacagtggcc aacagagcac 1740 ttatggcaag gcatctcgag ggggtggcaa tcaccaaaac aattaccagc catactaaag 1800 gagaacattg gagaaaacag gaggagatgt taaagtaacc catcttgcag gacgacattg 1860 aagattggtc ttctgttgat ctaagatgat tattttgtaa aagactttct agtgtacaag 1920 acaccattgt gtccaactgt atatagctgc caattagttt tctttgtttt tactttgtcc 1980 tttgctatct gtgttatgac tcaatgtgga tttgtttata cacattttat ttgtatcatt 2040 tcatgttaaa cctcaaataa atgcttcctt atgtgattgc ttttctgcgt caggtactac 2100 atagctctgt aaaaaatgta atttaaaata agcaataatt aaggcacagt tgattttgta 2160 gagtattggt ccatacagag aaactgtggt cctttataaa tagccagcca gcgtcaccct 2220 cttctccaat ttgtaggtgt attttatgct cttaaggctt catcttctcc ctgtaactga 2280 gatttctacc acacctttga acaatgttct ttcccttctg gttatctgaa gactgtcctg 2340 aaaggaagac ataagtgttg tgattagtag aagctttcta gtagaccata tttcttctgg 2400 attgtaataa aattgttagt agctcctttt actttgttcc tgtctctgga aagccatttt 2460 tgaattgctg attactttgg ctttaatcag tggtcaccta gaaaaagctt tgtaatcata 2520 acacaatgag taattcttga taaaagttca gatacaaaag gagcactgta aaactggtag 2580 gagctatggt ttaagagcat tggaagtagt tacaactcaa ggattttggt agaaaggtat 2640 gagtttggtc gaaaaattaa aatagtggca aaataagatt tagttgtgtt ttctcagagc 2700 cgccacaaga ttgaacaaaa tgttttctgt ttgggcatcc tgaggaagtt gtattagctg 2760 ttaatgctct gtgagtttag aaaaagtctt gatagtaaat ctagtttttg acacagtgca 2820 tgaactaagt agttaaatat ttacatattc agaaaggaat agtggaaaag gtatcttggt 2880 tatgacaaag tcattacaaa tgtgactaag tcattacaaa tgtgactgag tcattacagt 2940 ggaccctctg ggtgcattga aaagaatccg ttttatatcc aggtttcaga ggacctggaa 3000 taataaaaag ctttggattt tgcattcagt gtagttggat tttgggacct tggcctcagt 3060 gttatttact gggattggca tacgtgttca caggcagagt agttgatctc acacaacggg 3120 tgatctcaca aaactggtaa gtttcttatg ctcatgagcc ctcccttttt ttttttaatt 3180 tggtgcctgc aactttctta acaatgattc tacttcctgg gctatcacat tataatgctc 3240 ttggcctctt ttttgctgct gttttgctat tcttaaactt aggccaagta ccaatgttgg 3300 ctgttagaag ggattctgtt cattcaacat gcaactttag ggaatggaag taagttcatt 3360 tttaagttgt gttgtcagta ggtgcggtgt ctagggtagt gaatcctgta agttcaaatt 3420 tatgattagg tgacgagttg acattgagat tgtccttttc cctgatcaaa aaatgaataa 3480 agccttttta aacaaaatcc aaacttttaa tcaagtcttg atatgtatga ctgagaaaaa 3540 atacactaca tctagagatg attgagatgt tttgcaaaga attgaagggg gagtgagaat 3600 tggtttttct tgcaggggct ttgaactcta gatttgggct ttgaactcta gatttaattc 3660 agatttcagg gtctatcagt tcaccaactg atgcaaattt gaacagatac tctaaggcta 3720 agtgtcctag gttggatgaa ctgaagctac tatcaagatc tcgttcccaa ggattaattt 3780 agaacaaagt aattggacaa gtttattggg gaggggatag aaatgaattc taaagtacct 3840 ataacaaata ctctgtgtat gttttttaca tcgtatttgc cttttacatt gtttagacca 3900 aattctgtgt gatgttatcc tcgggaagag gatagaaatt aattctaaag tacctataac 3960 aaatgctcgg tttgtatatg tttttataca tcgtatttgc cttttgcatt gttcagacca 4020 aattctgtgt gatgttatcc taacaaaaca ccttagtaat ttctttggtt aacatgttaa 4080 tctgtaatct cacttttata agatgaggac tattaaaatg agatgtctgt tgggatgcta 4140 aaaaaaaaaa aaaaaaa 4157 <210> 63 <211> 679 <212> PRT <213> Homo sapiens <400> 63 Met Ile Ser Ala Ser Arg Ala Ala Ala Ala Arg Leu Val Gly Ala Ala 1 5 10 15 Ala Ser Arg Gly Pro Thr Ala Ala Arg His Gln Asp Ser Trp Asn Gly 20 25 30 Leu Ser His Glu Ala Phe Arg Leu Val Ser Arg Arg Asp Tyr Ala Ser 35 40 45 Glu Ala Ile Lys Gly Ala Val Val Gly Ile Asp Leu Gly Thr Thr Asn 50 55 60 Ser Cys Val Ala Val Met Glu Gly Lys Gln Ala Lys Val Leu Glu Asn 65 70 75 80 Ala Glu Gly Ala Arg Thr Thr Pro Ser Val Val Ala Phe Thr Ala Asp 85 90 95 Gly Glu Arg Leu Val Gly Met Pro Ala Lys Arg Gln Ala Val Thr Asn 100 105 110 Pro Asn Asn Thr Phe Tyr Ala Thr Lys Arg Leu Ile Gly Arg Arg Tyr 115 120 125 Asp Asp Pro Glu Val Gln Lys Asp Ile Lys Asn Val Pro Phe Lys Ile 130 135 140 Val Arg Ala Ser Asn Gly Asp Ala Trp Val Glu Ala His Gly Lys Leu 145 150 155 160 Tyr Ser Pro Ser Gln Ile Gly Ala Phe Val Leu Met Lys Met Lys Glu 165 170 175 Thr Ala Glu Asn Tyr Leu Gly His Thr Ala Lys Asn Ala Val Ile Thr 180 185 190 Val Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp Ala 195 200 205 Gly Gln Ile Ser Gly Leu Asn Val Leu Arg Val Ile Asn Glu Pro Thr 210 215 220 Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Ser Glu Asp Lys Val Ile 225 230 235 240 Ala Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Ile Ser Ile Leu Glu 245 250 255 Ile Gln Lys Gly Val Phe Glu Val Lys Ser Thr Asn Gly Asp Thr Phe 260 265 270 Leu Gly Gly Glu Asp Phe Asp Gln Ala Leu Leu Arg His Ile Val Lys 275 280 285 Glu Phe Lys Arg Glu Thr Gly Val Asp Leu Thr Lys Asp Asn Met Ala 290 295 300 Leu Gln Arg Val Arg Glu Ala Ala Glu Lys Ala Lys Cys Glu Leu Ser 305 310 315 320 Ser Ser Val Gln Thr Asp Ile Asn Leu Pro Tyr Leu Thr Met Asp Ser 325 330 335 Ser Gly Pro Lys His Leu Asn Met Lys Leu Thr Arg Ala Gln Phe Glu 340 345 350 Gly Ile Val Thr Asp Leu Ile Arg Arg Thr Ile Ala Pro Cys Gln Lys 355 360 365 Ala Met Gln Asp Ala Glu Val Ser Lys Ser Asp Ile Gly Glu Val Ile 370 375 380 Leu Val Gly Gly Met Thr Arg Met Pro Lys Val Gln Gln Thr Val Gln 385 390 395 400 Asp Leu Phe Gly Arg Ala Pro Ser Lys Ala Val Asn Pro Asp Glu Ala 405 410 415 Val Ala Ile Gly Ala Ala Ile Gln Gly Gly Val Leu Ala Gly Asp Val 420 425 430 Thr Asp Val Leu Leu Leu Asp Val Thr Pro Leu Ser Leu Gly Ile Glu 435 440 445 Thr Leu Gly Gly Val Phe Thr Lys Leu Ile Asn Arg Asn Thr Thr Ile 450 455 460 Pro Thr Lys Lys Ser Gln Val Phe Ser Thr Ala Ala Asp Gly Gln Thr 465 470 475 480 Gln Val Glu Ile Lys Val Cys Gln Gly Glu Arg Glu Met Ala Gly Asp 485 490 495 Asn Lys Leu Leu Gly Gln Phe Thr Leu Ile Gly Ile Pro Pro Ala Pro 500 505 510 Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Ile Asp Ala Asn Gly 515 520 525 Ile Val His Val Ser Ala Lys Asp Lys Gly Thr Gly Arg Glu Gln Gln 530 535 540 Ile Val Ile Gln Ser Ser Gly Gly Leu Ser Lys Asp Asp Ile Glu Asn 545 550 555 560 Met Val Lys Asn Ala Glu Lys Tyr Ala Glu Glu Asp Arg Arg Lys Lys 565 570 575 Glu Arg Val Glu Ala Val Asn Met Ala Glu Gly Ile Ile His Asp Thr 580 585 590 Glu Thr Lys Met Glu Glu Phe Lys Asp Gln Leu Pro Ala Asp Glu Cys 595 600 605 Asn Lys Leu Lys Glu Glu Ile Ser Lys Met Arg Glu Leu Leu Ala Arg 610 615 620 Lys Asp Ser Glu Thr Gly Glu Asn Ile Arg Gln Ala Ala Ser Ser Leu 625 630 635 640 Gln Gln Ala Ser Leu Lys Leu Phe Glu Met Ala Tyr Lys Lys Met Ala 645 650 655 Ser Glu Arg Glu Gly Ser Gly Ser Ser Gly Thr Gly Glu Gln Lys Glu 660 665 670 Asp Gln Lys Glu Glu Lys Gln 675 <210> 64 <211> 3506 <212> DNA <213> Homo sapiens <400> 64 ttcctcccct ggactctttc tgagctcaga gccgccgcag ccgggacagg agggcaggct 60 ttctccaacc atcatgctgc ggagcatatt acctgtacgc cctggctccg ggagcggcag 120 tcgagtatcc tctggtcagg cggcgcgggc ggcgcctcag cggaagagcg ggcctctggg 180 ccgcagtgac caacccccgc ccctcacccc acgtggttgg aggtttccag aagcgctgcc 240 gccaccgcat cgcgcagctc tttgccgtcg gagcgcttgt ttgctgcctc gtactcctcc 300 atttatccgc catgataagt gccagccgag ctgcagcagc ccgtctcgtg ggcgccgcag 360 cctcccgggg ccctacggcc gcccgccacc aggatagctg gaatggcctt agtcatgagg 420 cttttagact tgtttcaagg cgggattatg catcagaagc aatcaaggga gcagttgttg 480 gtattgattt gggtactacc aactcctgcg tggcagttat ggaaggtaaa caagcaaagg 540 tgctggagaa tgccgaaggt gccagaacca ccccttcagt tgtggccttt acagcagatg 600 gtgagcgact tgttggaatg ccggccaagc gacaggctgt caccaaccca aacaatacat 660 tttatgctac caagcgtctc attggccggc gatatgatga tcctgaagta cagaaagaca 720 ttaaaaatgt tccctttaaa attgtccgtg cctccaatgg tgatgcctgg gttgaggctc 780 atgggaaatt gtattctccg agtcagattg gagcatttgt gttgatgaag atgaaagaga 840 ctgcagaaaa ttacttgggg cacacagcaa aaaatgctgt gatcacagtc ccagcttatt 900 tcaatgactc gcagagacag gccactaaag atgctggcca gatatctgga ctgaatgtgc 960 ttcgggtgat taatgagccc acagctgctg ctcttgccta tggtctagac aaatcagaag 1020 acaaagtcat tgctgtatat gatttaggtg gtggaacttt tgatatttct atcctggaaa 1080 ttcagaaagg agtatttgag gtgaaatcca caaatgggga taccttctta ggtggggaag 1140 actttgacca ggccttgcta cggcacattg tgaaggagtt caagagagag acaggggttg 1200 atttgactaa agacaacatg gcacttcaga gggtacggga agctgctgaa aaggctaaat 1260 gtgaactctc ctcatctgtg cagactgaca tcaatttgcc ctatcttaca atggattctt 1320 ctggacccaa gcatttgaat atgaagttga cccgtgctca atttgaaggg attgtcactg 1380 atctaatcag aaggactatc gctccatgcc aaaaagctat gcaagatgca gaagtcagca 1440 agagtgacat aggagaagtg attcttgtgg gtggcatgac taggatgccc aaggttcagc 1500 agactgtaca ggatcttttt ggcagagccc caagtaaagc tgtcaatcct gatgaggctg 1560 tggccattgg agctgccatt cagggaggtg tgttggccgg cgatgtcacg gatgtgctgc 1620 tccttgatgt cactcccctg tctctgggta ttgaaactct aggaggtgtc tttaccaaac 1680 ttattaatag gaataccact attccaacca agaagagcca ggtattctct actgccgctg 1740 atggtcaaac gcaagtggaa attaaagtgt gtcagggtga aagagagatg gctggagaca 1800 acaaactcct tggacagttt actttgattg gaattccacc agcccctcgt ggagttcctc 1860 agattgaagt tacatttgac attgatgcca atgggatagt acatgtttct gctaaagata 1920 aaggcacagg acgtgagcag cagattgtaa tccagtcttc tggtggatta agcaaagatg 1980 atattgaaaa tatggttaaa aatgcagaga aatatgctga agaagaccgg cgaaagaagg 2040 aacgagttga agcagttaat atggctgaag gaatcattca cgacacagaa accaagatgg 2100 aagaattcaa ggaccaatta cctgctgatg agtgcaacaa gctgaaagaa gagatttcca 2160 aaatgaggga gctcctggct agaaaagaca gcgaaacagg agaaaatatt agacaggcag 2220 catcctctct tcagcaggca tcactgaagc tgttcgaaat ggcatacaaa aagatggcat 2280 ctgagcgaga aggctctgga agttctggca ctggggaaca aaaggaagat caaaaggagg 2340 aaaaacagta ataatagcag aaattttgaa gccagaagga caacatatga agcttaggag 2400 tgaagagact tcctgagcag aaatgggcga acttcagtct ttttactgtg tttttgcagt 2460 attctatata taatttcctt aatttgtaaa tttagtgacc attagctagt gatcatttaa 2520 tggacagtga ttctaacagt ataaagttca caatattcta tgtccctagc ctgtcatttt 2580 tcagctgcat gtaaaaggag gtaggatgaa ttgatcatta taaagattta actattttat 2640 gctgaagtga ccatattttc aaggggtgaa accatctcgc acacagcaat gaaggtagtc 2700 atccatagac ttgaaatgag accacatatg gggatgagat ccttctagtt agcctagtac 2760 tgctgtactg gcctgtatgt acatggggtc cttcaactga ggccttgcaa gtcaagctgg 2820 ctgtgccatg tttgtagatg gggcagagga atctagaaca atgggaaact tagctattta 2880 tattaggtac agctattaaa acaaggtagg aatgaggcta gacctttaac ttccctaagg 2940 catacttttc tagctacctt ctgccctgtg tctggcacct acatccttga tgattgttct 3000 cttacccatt ctggaatttt ttttttttta aataaataca gaaagcatct tgatctcttg 3060 tttgtgaggg gtgatgccct gagatttagc ttcaagaata tgccatggct catgcttccc 3120 atatttccca aagagggaaa tacaggattt gctaacactg gttaaaaatg caaattcaag 3180 atttggaagg gctgttataa tgaaataatg agcagtatca gcatgtgcaa atcttgtttg 3240 aaggatttta ttttctcccc ttagaccttt ggtacattta gaatcttgaa agtttctaga 3300 tctctaacat gaaagtttct agatctctaa catgaaagtt tttagatctc taacatgaaa 3360 accaaggtgg ctattttcag gttgctttca gctccaagta gaaataacca gaattggctt 3420 acattaaaga aactgcatct agaaataagt cctaagatac tatttctatg gctcaaaaat 3480 aaaaggaacc cagatttctt tcccta 3506 <210> 65 <211> 400 <212> PRT <213> Homo sapiens <400> 65 Met Leu Ala Arg Arg Lys Pro Val Leu Pro Ala Leu Thr Ile Asn Pro 1 5 10 15 Thr Ile Ala Glu Gly Pro Ser Pro Thr Ser Glu Gly Ala Ser Glu Ala 20 25 30 Asn Leu Val Asp Leu Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu 35 40 45 Gln Gln Lys Lys Arg Leu Glu Ala Phe Leu Thr Gln Lys Ala Lys Val 50 55 60 Gly Glu Leu Lys Asp Asp Asp Phe Glu Arg Ile Ser Glu Leu Gly Ala 65 70 75 80 Gly Asn Gly Gly Val Val Thr Lys Val Gln His Arg Pro Ser Gly Leu 85 90 95 Ile Met Ala Arg Lys Leu Ile His Leu Glu Ile Lys Pro Ala Ile Arg 100 105 110 Asn Gln Ile Ile Arg Glu Leu Gln Val Leu His Glu Cys Asn Ser Pro 115 120 125 Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser Asp Gly Glu Ile Ser 130 135 140 Ile Cys Met Glu His Met Asp Gly Gly Ser Leu Asp Gln Val Leu Lys 145 150 155 160 Glu Ala Lys Arg Ile Pro Glu Glu Ile Leu Gly Lys Val Ser Ile Ala 165 170 175 Val Leu Arg Gly Leu Ala Tyr Leu Arg Glu Lys His Gln Ile Met His 180 185 190 Arg Asp Val Lys Pro Ser Asn Ile Leu Val Asn Ser Arg Gly Glu Ile 195 200 205 Lys Leu Cys Asp Phe Gly Val Ser Gly Gln Leu Ile Asp Ser Met Ala 210 215 220 Asn Ser Phe Val Gly Thr Arg Ser Tyr Met Ala Pro Glu Arg Leu Gln 225 230 235 240 Gly Thr His Tyr Ser Val Gln Ser Asp Ile Trp Ser Met Gly Leu Ser 245 250 255 Leu Val Glu Leu Ala Val Gly Arg Tyr Pro Ile Pro Pro Pro Asp Ala 260 265 270 Lys Glu Leu Glu Ala Ile Phe Gly Arg Pro Val Val Asp Gly Glu Glu 275 280 285 Gly Glu Pro His Ser Ile Ser Pro Arg Pro Arg Pro Pro Gly Arg Pro 290 295 300 Val Ser Gly His Gly Met Asp Ser Arg Pro Ala Met Ala Ile Phe Glu 305 310 315 320 Leu Leu Asp Tyr Ile Val Asn Glu Pro Pro Pro Lys Leu Pro Asn Gly 325 330 335 Val Phe Thr Pro Asp Phe Gln Glu Phe Val Asn Lys Cys Leu Ile Lys 340 345 350 Asn Pro Ala Glu Arg Ala Asp Leu Lys Met Leu Thr Asn His Thr Phe 355 360 365 Ile Lys Arg Ser Glu Val Glu Glu Val Asp Phe Ala Gly Trp Leu Cys 370 375 380 Lys Thr Leu Arg Leu Asn Gln Pro Gly Thr Pro Thr Arg Thr Ala Val 385 390 395 400 <210> 66 <211> 1759 <212> DNA <213> Homo sapiens <400> 66 cccctgcctc tcggactcgg gctgcggcgt cagccttctt cgggcctcgg cagcggtagc 60 ggctcgctcg cctcagcccc agcgcccctc ggctaccctc ggcccaggcc cgcagcgccg 120 cccgccctcg gccgccccga cgccggcctg ggccgcggcc gcagccccgg gctcgcgtag 180 gcgccgaccg ctcccggccc gccccctatg ggccccggct agaggcgccg ccgccgccgg 240 cccgcggagc cccgatgctg gcccggagga agccggtgct gccggcgctc accatcaacc 300 ctaccatcgc cgagggccca tcccctacca gcgagggcgc ctccgaggca aacctggtgg 360 acctgcagaa gaagctggag gagctggaac ttgacgagca gcagaagaag cggctggaag 420 cctttctcac ccagaaagcc aaggtcggcg aactcaaaga cgatgacttc gaaaggatct 480 cagagctggg cgcgggcaac ggcggggtgg tcaccaaagt ccagcacaga ccctcgggcc 540 tcatcatggc caggaagctg atccaccttg agatcaagcc ggccatccgg aaccagatca 600 tccgcgagct gcaggtcctg cacgaatgca actcgccgta catcgtgggc ttctacgggg 660 ccttctacag tgacggggag atcagcattt gcatggaaca catggacggc ggctccctgg 720 accaggtgct gaaagaggcc aagaggattc ccgaggagat cctggggaaa gtcagcatcg 780 cggttctccg gggcttggcg tacctccgag agaagcacca gatcatgcac cgagatgtga 840 agccctccaa catcctcgtg aactctagag gggagatcaa gctgtgtgac ttcggggtga 900 gcggccagct catcgactcc atggccaact ccttcgtggg cacgcgctcc tacatggctc 960 cggagcggtt gcagggcaca cattactcgg tgcagtcgga catctggagc atgggcctgt 1020 ccctggtgga gctggccgtc ggaaggtacc ccatcccccc gcccgacgcc aaagagctgg 1080 aggccatctt tggccggccc gtggtcgacg gggaagaagg agagcctcac agcatctcgc 1140 ctcggccgag gccccccggg cgccccgtca gcggtcacgg gatggatagc cggcctgcca 1200 tggccatctt tgaactcctg gactatattg tgaacgagcc acctcctaag ctgcccaacg 1260 gtgtgttcac ccccgacttc caggagtttg tcaataaatg cctcatcaag aacccagcgg 1320 agcgggcgga cctgaagatg ctcacaaacc acaccttcat caagcggtcc gaggtggaag 1380 aagtggattt tgccggctgg ttgtgtaaaa ccctgcggct gaaccagccc ggcacaccca 1440 cgcgcaccgc cgtgtgacag tggccgggct ccctgcgtcc cgctggtgac ctgcccaccg 1500 tccctgtcca tgccccgccc ttccagctga ggacaggctg gcgcctccac ccaccctcct 1560 gcctcacccc tgcggagagc accgtggcgg ggcgacagcg catgcaggaa cgggggtctc 1620 ctctcctgcc cgtcctggcc ggggtgcctc tggggacggg cgacgctgct gtgtgtggtc 1680 tcagaggctc tgcttcctta ggttacaaaa caaaacaggg agagaaaaag caaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaa 1759 <210> 67 <211> 274 <212> PRT <213> Homo sapiens <400> 67 Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu 1 5 10 15 Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Val Asp Ile Leu Thr Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro 85 90 95 Lys Asn Arg Val Ile Gly Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe 100 105 110 Arg Tyr Leu Met Gly Glu Arg Leu Gly Val His Pro Leu Ser Cys His 115 120 125 Gly Trp Val Leu Gly Glu His Gly Asp Ser Ser Val Pro Val Trp Ser 130 135 140 Gly Met Asn Val Ala Gly Val Ser Leu Lys Thr Leu His Pro Asp Leu 145 150 155 160 Gly Thr Asp Lys Asp Lys Glu Gln Trp Lys Glu Val His Lys Gln Val 165 170 175 Val Glu Ser Ala Tyr Glu Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp 180 185 190 Ala Ile Gly Leu Ser Val Ala Asp Leu Ala Glu Ser Ile Met Lys Asn 195 200 205 Leu Arg Arg Val His Pro Val Ser Thr Met Ile Lys Gly Leu Tyr Gly 210 215 220 Ile Lys Asp Asp Val Phe Leu Ser Val Pro Cys Ile Leu Gly Gln Asn 225 230 235 240 Gly Ile Ser Asp Leu Val Lys Val Thr Leu Thr Ser Glu Glu Glu Ala 245 250 255 Arg Leu Lys Lys Ser Ala Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu 260 265 270 Gln Phe <210> 68 <211> 2052 <212> DNA <213> Homo sapiens <400> 68 gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60 ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120 cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180 cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240 cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300 ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360 ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420 ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480 ttttccttag aacaccaaag attgtctctg gcaaagtgga tatcttgacc tacgtggctt 540 ggaagataag tggttttccc aaaaaccgtg ttattggaag cggttgcaat ctggattcag 600 cccgattccg ttacctaatg ggggaaaggc tgggagttca cccattaagc tgtcatgggt 660 gggtccttgg ggaacatgga gattccagtg tgcctgtatg gagtggaatg aatgttgctg 720 gtgtctctct gaagactctg cacccagatt tagggactga taaagataag gaacagtgga 780 aagaggttca caagcaggtg gttgagagtg cttatgaggt gatcaaactc aaaggctaca 840 catcctgggc tattggactc tctgtagcag atttggcaga gagtataatg aagaatctta 900 ggcgggtgca cccagtttcc accatgatta agggtcttta cggaataaag gatgatgtct 960 tccttagtgt tccttgcatt ttgggacaga atggaatctc agaccttgtg aaggtgactc 1020 tgacttctga ggaagaggcc cgtttgaaga agagtgcaga tacactttgg gggatccaaa 1080 aggagctgca attttaaagt cttctgatgt catatcattt cactgtctag gctacaacag 1140 gattctaggt ggaggttgtg catgttgtcc tttttatctg atctgtgatt aaagcagtaa 1200 tattttaaga tggactggga aaaacatcaa ctcctgaagt tagaaataag aatggtttgt 1260 aaaatccaca gctatatcct gatgctggat ggtattaatc ttgtgtagtc ttcaactggt 1320 tagtgtgaaa tagttctgcc acctctgacg caccactgcc aatgctgtac gtactgcatt 1380 tgccccttga gccaggtgga tgtttaccgt gtgttatata acttcctggc tccttcactg 1440 aacatgccta gtccaacatt ttttcccagt gagtcacatc ctgggatcca gtgtataaat 1500 ccaatatcat gtcttgtgca taattcttcc aaaggatctt attttgtgaa ctatatcagt 1560 agtgtacatt accatataat gtaaaaagat ctacatacaa acaatgcaac caactatcca 1620 agtgttatac caactaaaac ccccaataaa ccttgaacag tgactacttt ggttaattca 1680 ttatattaag atataaagtc ataaagctgc tagttattat attaatttgg aaatattagg 1740 ctattcttgg gcaaccctgc aacgattttt tctaacaggg atattattga ctaatagcag 1800 aggatgtaat agtcaactga gttgtattgg taccacttcc attgtaagtc ccaaagtatt 1860 atatatttga taataatgct aatcataatt ggaaagtaac attctatatg taaatgtaaa 1920 atttatttgc caactgaata taggcaatga tagtgtgtca ctatagggaa cacagatttt 1980 tgagatcttg tcctctggaa gctggtaaca attaaaaaca atcttaaggc agggaaaaaa 2040 aaaaaaaaaa aa 2052 <210> 69 <211> 361 <212> PRT <213> Homo sapiens <400> 69 Met Gly Glu Pro Ser Gly Gly Tyr Thr Tyr Thr Gln Thr Ser Ile Phe 1 5 10 15 Leu Phe His Ala Lys Ile Pro Phe Gly Ser Lys Ser Asn Met Ala Thr 20 25 30 Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu Gln Thr Pro 35 40 45 Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly Met Ala Cys 50 55 60 Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu Ala Leu Val 65 70 75 80 Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp Leu Gln His 85 90 95 Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly Lys Asp Tyr 100 105 110 Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala Gly Ala Arg 115 120 125 Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg Asn Val Asn 130 135 140 Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser Pro Asn Cys 145 150 155 160 Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr Tyr Val Ala 165 170 175 Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly Ser Gly Cys 180 185 190 Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu Arg Leu Gly 195 200 205 Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu His Gly Asp 210 215 220 Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly Val Ser Leu 225 230 235 240 Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys Glu Gln Trp 245 250 255 Lys Glu Val His Lys Gln Val Val Glu Ser Ala Tyr Glu Val Ile Lys 260 265 270 Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val Ala Asp Leu 275 280 285 Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro Val Ser Thr 290 295 300 Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Asp Val Phe Leu Ser Val 305 310 315 320 Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Leu Val Lys Val Thr 325 330 335 Leu Thr Ser Glu Glu Glu Ala Arg Leu Lys Lys Ser Ala Asp Thr Leu 340 345 350 Trp Gly Ile Gln Lys Glu Leu Gln Phe 355 360 <210> 70 <211> 2323 <212> DNA <213> Homo sapiens <400> 70 ttgggcgggg cgtaaaagcc gggcgttcgg aggacccagc aattagtctg atttccgccc 60 acctttccga gcgggaagga gagccacaaa gcgcgcatgc gcgcggatca ccgcaggctc 120 ctgtgccttg ggcttgagct ttgtggcagt taatggcttt tctgcacgta tctctggtgt 180 ttacttgaga agcctggctg tgtccttgct gtaggagccg gagtagctca gagtgatctt 240 gtctgaggaa aggccagccc cacttggggt taataaaccg cgatgggtga accctcagga 300 ggctatactt acacccaaac gtcgatattc cttttccacg ctaagattcc ttttggttcc 360 aagtccaata tggcaactct aaaggatcag ctgatttata atcttctaaa ggaagaacag 420 accccccaga ataagattac agttgttggg gttggtgctg ttggcatggc ctgtgccatc 480 agtatcttaa tgaaggactt ggcagatgaa cttgctcttg ttgatgtcat cgaagacaaa 540 ttgaagggag agatgatgga tctccaacat ggcagccttt tccttagaac accaaagatt 600 gtctctggca aagactataa tgtaactgca aactccaagc tggtcattat cacggctggg 660 gcacgtcagc aagagggaga aagccgtctt aatttggtcc agcgtaacgt gaacatcttt 720 aaattcatca ttcctaatgt tgtaaaatac agcccgaact gcaagttgct tattgtttca 780 aatccagtgg atatcttgac ctacgtggct tggaagataa gtggttttcc caaaaaccgt 840 gttattggaa gcggttgcaa tctggattca gcccgattcc gttacctaat gggggaaagg 900 ctgggagttc acccattaag ctgtcatggg tgggtccttg gggaacatgg agattccagt 960 gtgcctgtat ggagtggaat gaatgttgct ggtgtctctc tgaagactct gcacccagat 1020 ttagggactg ataaagataa ggaacagtgg aaagaggttc acaagcaggt ggttgagagt 1080 gcttatgagg tgatcaaact caaaggctac acatcctggg ctattggact ctctgtagca 1140 gatttggcag agagtataat gaagaatctt aggcgggtgc acccagtttc caccatgatt 1200 aagggtcttt acggaataaa ggatgatgtc ttccttagtg ttccttgcat tttgggacag 1260 aatggaatct cagaccttgt gaaggtgact ctgacttctg aggaagaggc ccgtttgaag 1320 aagagtgcag atacactttg ggggatccaa aaggagctgc aattttaaag tcttctgatg 1380 tcatatcatt tcactgtcta ggctacaaca ggattctagg tggaggttgt gcatgttgtc 1440 ctttttatct gatctgtgat taaagcagta atattttaag atggactggg aaaaacatca 1500 actcctgaag ttagaaataa gaatggtttg taaaatccac agctatatcc tgatgctgga 1560 tggtattaat cttgtgtagt cttcaactgg ttagtgtgaa atagttctgc cacctctgac 1620 gcaccactgc caatgctgta cgtactgcat ttgccccttg agccaggtgg atgtttaccg 1680 tgtgttatat aacttcctgg ctccttcact gaacatgcct agtccaacat tttttcccag 1740 tgagtcacat cctgggatcc agtgtataaa tccaatatca tgtcttgtgc ataattcttc 1800 caaaggatct tattttgtga actatatcag tagtgtacat taccatataa tgtaaaaaga 1860 tctacataca aacaatgcaa ccaactatcc aagtgttata ccaactaaaa cccccaataa 1920 accttgaaca gtgactactt tggttaattc attatattaa gatataaagt cataaagctg 1980 ctagttatta tattaatttg gaaatattag gctattcttg ggcaaccctg caacgatttt 2040 ttctaacagg gatattattg actaatagca gaggatgtaa tagtcaactg agttgtattg 2100 gtaccacttc cattgtaagt cccaaagtat tatatatttg ataataatgc taatcataat 2160 tggaaagtaa cattctatat gtaaatgtaa aatttatttg ccaactgaat ataggcaatg 2220 atagtgtgtc actataggga acacagattt ttgagatctt gtcctctgga agctggtaac 2280 aattaaaaac aatcttaagg cagggaaaaa aaaaaaaaaa aaa 2323 <210> 71 <211> 274 <212> PRT <213> Homo sapiens <400> 71 Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu 1 5 10 15 Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys 210 215 220 Glu Gln Trp Lys Glu Cys Arg Tyr Thr Leu Gly Asp Pro Lys Gly Ala 225 230 235 240 Ala Ile Leu Lys Ser Ser Asp Val Ile Ser Phe His Cys Leu Gly Tyr 245 250 255 Asn Arg Ile Leu Gly Gly Gly Cys Ala Cys Cys Pro Phe Tyr Leu Ile 260 265 270 Cys Asp <210> 72 <211> 1957 <212> DNA <213> Homo sapiens <400> 72 gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60 ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120 cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180 cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240 cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300 ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360 ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420 ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480 ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540 agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600 tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660 actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720 taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780 tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840 ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900 ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagt 960 gcagatacac tttgggggat ccaaaaggag ctgcaatttt aaagtcttct gatgtcatat 1020 catttcactg tctaggctac aacaggattc taggtggagg ttgtgcatgt tgtccttttt 1080 atctgatctg tgattaaagc agtaatattt taagatggac tgggaaaaac atcaactcct 1140 gaagttagaa ataagaatgg tttgtaaaat ccacagctat atcctgatgc tggatggtat 1200 taatcttgtg tagtcttcaa ctggttagtg tgaaatagtt ctgccacctc tgacgcacca 1260 ctgccaatgc tgtacgtact gcatttgccc cttgagccag gtggatgttt accgtgtgtt 1320 atataacttc ctggctcctt cactgaacat gcctagtcca acattttttc ccagtgagtc 1380 acatcctggg atccagtgta taaatccaat atcatgtctt gtgcataatt cttccaaagg 1440 atcttatttt gtgaactata tcagtagtgt acattaccat ataatgtaaa aagatctaca 1500 tacaaacaat gcaaccaact atccaagtgt tataccaact aaaaccccca ataaaccttg 1560 aacagtgact actttggtta attcattata ttaagatata aagtcataaa gctgctagtt 1620 attatattaa tttggaaata ttaggctatt cttgggcaac cctgcaacga ttttttctaa 1680 cagggatatt attgactaat agcagaggat gtaatagtca actgagttgt attggtacca 1740 cttccattgt aagtcccaaa gtattatata tttgataata atgctaatca taattggaaa 1800 gtaacattct atatgtaaat gtaaaattta tttgccaact gaatataggc aatgatagtg 1860 tgtcactata gggaacacag atttttgaga tcttgtcctc tggaagctgg taacaattaa 1920 aaacaatctt aaggcaggga aaaaaaaaaa aaaaaaa 1957 <210> 73 <211> 241 <212> PRT <213> Homo sapiens <400> 73 Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu 1 5 10 15 Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys 210 215 220 Glu Gln Trp Lys Glu Val His Lys Gln Val Val Glu Arg Val Phe Thr 225 230 235 240 Glu <210> 74 <211> 2102 <212> DNA <213> Homo sapiens <400> 74 gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60 ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120 cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180 cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240 cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300 ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360 ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420 ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480 ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540 agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600 tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660 actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720 taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780 tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840 ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900 ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagg 960 ttcacaagca ggtggttgag agggtcttta cggaataaag gatgatgtct tccttagtgt 1020 tccttgcatt ttgggacaga atggaatctc agaccttgtg aaggtgactc tgacttctga 1080 ggaagaggcc cgtttgaaga agagtgcaga tacactttgg gggatccaaa aggagctgca 1140 attttaaagt cttctgatgt catatcattt cactgtctag gctacaacag gattctaggt 1200 ggaggttgtg catgttgtcc tttttatctg atctgtgatt aaagcagtaa tattttaaga 1260 tggactggga aaaacatcaa ctcctgaagt tagaaataag aatggtttgt aaaatccaca 1320 gctatatcct gatgctggat ggtattaatc ttgtgtagtc ttcaactggt tagtgtgaaa 1380 tagttctgcc acctctgacg caccactgcc aatgctgtac gtactgcatt tgccccttga 1440 gccaggtgga tgtttaccgt gtgttatata acttcctggc tccttcactg aacatgccta 1500 gtccaacatt ttttcccagt gagtcacatc ctgggatcca gtgtataaat ccaatatcat 1560 gtcttgtgca taattcttcc aaaggatctt attttgtgaa ctatatcagt agtgtacatt 1620 accatataat gtaaaaagat ctacatacaa acaatgcaac caactatcca agtgttatac 1680 caactaaaac ccccaataaa ccttgaacag tgactacttt ggttaattca ttatattaag 1740 atataaagtc ataaagctgc tagttattat attaatttgg aaatattagg ctattcttgg 1800 gcaaccctgc aacgattttt tctaacaggg atattattga ctaatagcag aggatgtaat 1860 agtcaactga gttgtattgg taccacttcc attgtaagtc ccaaagtatt atatatttga 1920 taataatgct aatcataatt ggaaagtaac attctatatg taaatgtaaa atttatttgc 1980 caactgaata taggcaatga tagtgtgtca ctatagggaa cacagatttt tgagatcttg 2040 tcctctggaa gctggtaaca attaaaaaca atcttaaggc agggaaaaaa aaaaaaaaaa 2100 aa 2102 <210> 75 <211> 332 <212> PRT <213> Homo sapiens <400> 75 Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu 1 5 10 15 Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys 210 215 220 Glu Gln Trp Lys Glu Val His Lys Gln Val Val Glu Ser Ala Tyr Glu 225 230 235 240 Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val 245 250 255 Ala Asp Leu Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro 260 265 270 Val Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Asp Val Phe 275 280 285 Leu Ser Val Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Leu Val 290 295 300 Lys Val Thr Leu Thr Ser Glu Glu Glu Ala Arg Leu Lys Lys Ser Ala 305 310 315 320 Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe 325 330 <210> 76 <211> 2226 <212> DNA <213> Homo sapiens <400> 76 gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60 ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120 cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180 cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240 cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300 ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360 ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420 ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480 ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540 agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600 tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660 actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720 taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780 tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840 ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900 ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagg 960 ttcacaagca ggtggttgag agtgcttatg aggtgatcaa actcaaaggc tacacatcct 1020 gggctattgg actctctgta gcagatttgg cagagagtat aatgaagaat cttaggcggg 1080 tgcacccagt ttccaccatg attaagggtc tttacggaat aaaggatgat gtcttcctta 1140 gtgttccttg cattttggga cagaatggaa tctcagacct tgtgaaggtg actctgactt 1200 ctgaggaaga ggcccgtttg aagaagagtg cagatacact ttgggggatc caaaaggagc 1260 tgcaatttta aagtcttctg atgtcatatc atttcactgt ctaggctaca acaggattct 1320 aggtggaggt tgtgcatgtt gtccttttta tctgatctgt gattaaagca gtaatatttt 1380 aagatggact gggaaaaaca tcaactcctg aagttagaaa taagaatggt ttgtaaaatc 1440 cacagctata tcctgatgct ggatggtatt aatcttgtgt agtcttcaac tggttagtgt 1500 gaaatagttc tgccacctct gacgcaccac tgccaatgct gtacgtactg catttgcccc 1560 ttgagccagg tggatgttta ccgtgtgtta tataacttcc tggctccttc actgaacatg 1620 cctagtccaa cattttttcc cagtgagtca catcctggga tccagtgtat aaatccaata 1680 tcatgtcttg tgcataattc ttccaaagga tcttattttg tgaactatat cagtagtgta 1740 cattaccata taatgtaaaa agatctacat acaaacaatg caaccaacta tccaagtgtt 1800 ataccaacta aaacccccaa taaaccttga acagtgacta ctttggttaa ttcattatat 1860 taagatataa agtcataaag ctgctagtta ttatattaat ttggaaatat taggctattc 1920 ttgggcaacc ctgcaacgat tttttctaac agggatatta ttgactaata gcagaggatg 1980 taatagtcaa ctgagttgta ttggtaccac ttccattgta agtcccaaag tattatatat 2040 ttgataataa tgctaatcat aattggaaag taacattcta tatgtaaatg taaaatttat 2100 ttgccaactg aatataggca atgatagtgt gtcactatag ggaacacaga tttttgagat 2160 cttgtcctct ggaagctggt aacaattaaa aacaatctta aggcagggaa aaaaaaaaaa 2220 aaaaaa 2226 <210> 77 <211> 1135 <212> PRT <213> Homo sapiens <400> 77 Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp 1 5 10 15 Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu 20 25 30 Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile 35 40 45 Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys 50 55 60 Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys 65 70 75 80 Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr 85 90 95 Thr Gly Ser Pro Thr Glu Phe Leu Glu Glu Lys Met Ala Tyr Gln Glu 100 105 110 Tyr Pro Asn Ser Gln Asn Trp Pro Glu Asp Thr Asn Phe Cys Phe Gln 115 120 125 Pro Glu Gln Val Val Asp Pro Ile Gln Thr Asp Pro Phe Lys Met Tyr 130 135 140 His Asp Asp Asp Leu Ala Asp Leu Val Phe Pro Ser Ser Ala Thr Ala 145 150 155 160 Asp Thr Ser Ile Phe Ala Gly Gln Asn Asp Pro Leu Lys Asp Ser Tyr 165 170 175 Gly Met Ser Pro Cys Asn Thr Ala Val Val Pro Gln Gly Trp Ser Val 180 185 190 Glu Ala Leu Asn Ser Pro His Ser Glu Ser Phe Val Ser Pro Glu Ala 195 200 205 Val Ala Glu Pro Pro Gln Pro Thr Ala Val Pro Leu Glu Leu Ala Lys 210 215 220 Glu Ile Glu Met Ala Ser Glu Glu Arg Pro Pro Ala Gln Ala Leu Glu 225 230 235 240 Ile Met Met Gly Leu Lys Thr Thr Asp Met Ala Pro Ser Lys Glu Thr 245 250 255 Glu Met Ala Leu Ala Lys Asp Met Ala Leu Ala Thr Lys Thr Glu Val 260 265 270 Ala Leu Ala Lys Asp Met Glu Ser Pro Thr Lys Leu Asp Val Thr Leu 275 280 285 Ala Lys Asp Met Gln Pro Ser Met Glu Ser Asp Met Ala Leu Val Lys 290 295 300 Asp Met Glu Leu Pro Thr Glu Lys Glu Val Ala Leu Val Lys Asp Val 305 310 315 320 Arg Trp Pro Thr Glu Thr Asp Val Ser Ser Ala Lys Asn Val Val Leu 325 330 335 Pro Thr Glu Thr Glu Val Ala Pro Ala Lys Asp Val Thr Leu Leu Lys 340 345 350 Glu Thr Glu Arg Ala Ser Pro Ile Lys Met Asp Leu Ala Pro Ser Lys 355 360 365 Asp Met Gly Pro Pro Lys Glu Asn Lys Lys Glu Thr Glu Arg Ala Ser 370 375 380 Pro Ile Lys Met Asp Leu Ala Pro Ser Lys Asp Met Gly Pro Pro Lys 385 390 395 400 Glu Asn Lys Ile Val Pro Ala Lys Asp Leu Val Leu Leu Ser Glu Ile 405 410 415 Glu Val Ala Gln Ala Asn Asp Ile Ile Ser Ser Thr Glu Ile Ser Ser 420 425 430 Ala Glu Lys Val Ala Leu Ser Ser Glu Thr Glu Val Ala Leu Ala Arg 435 440 445 Asp Met Thr Leu Pro Pro Glu Thr Asn Val Ile Leu Thr Lys Asp Lys 450 455 460 Ala Leu Pro Leu Glu Ala Glu Val Ala Pro Val Lys Asp Met Ala Gln 465 470 475 480 Leu Pro Glu Thr Glu Ile Ala Pro Ala Lys Asp Val Ala Pro Ser Thr 485 490 495 Val Lys Glu Val Gly Leu Leu Lys Asp Met Ser Pro Leu Ser Glu Thr 500 505 510 Glu Met Ala Leu Gly Lys Asp Val Thr Pro Pro Pro Glu Thr Glu Val 515 520 525 Val Leu Ile Lys Asn Val Cys Leu Pro Pro Glu Met Glu Val Ala Leu 530 535 540 Thr Glu Asp Gln Val Pro Ala Leu Lys Thr Glu Ala Pro Leu Ala Lys 545 550 555 560 Asp Gly Val Leu Thr Leu Ala Asn Asn Val Thr Pro Ala Lys Asp Val 565 570 575 Pro Pro Leu Ser Glu Thr Glu Ala Thr Pro Val Pro Ile Lys Asp Met 580 585 590 Glu Ile Ala Gln Thr Gln Lys Gly Ile Ser Glu Asp Ser His Leu Glu 595 600 605 Ser Leu Gln Asp Val Gly Gln Ser Ala Ala Pro Thr Phe Met Ile Ser 610 615 620 Pro Glu Thr Val Thr Gly Thr Gly Lys Lys Cys Ser Leu Pro Ala Glu 625 630 635 640 Glu Asp Ser Val Leu Glu Lys Leu Gly Glu Arg Lys Pro Cys Asn Ser 645 650 655 Gln Pro Ser Glu Leu Ser Ser Glu Thr Ser Gly Ile Ala Arg Pro Glu 660 665 670 Glu Gly Arg Pro Val Val Ser Gly Thr Gly Asn Asp Ile Thr Thr Pro 675 680 685 Pro Asn Lys Glu Leu Pro Pro Ser Pro Glu Lys Lys Thr Lys Pro Leu 690 695 700 Ala Thr Thr Gln Pro Ala Lys Thr Ser Thr Ser Lys Ala Lys Thr Gln 705 710 715 720 Pro Thr Ser Leu Pro Lys Gln Pro Ala Pro Thr Thr Ile Gly Gly Leu 725 730 735 Asn Lys Lys Pro Met Ser Leu Ala Ser Gly Leu Val Pro Ala Ala Pro 740 745 750 Pro Lys Arg Pro Ala Val Ala Ser Ala Arg Pro Ser Ile Leu Pro Ser 755 760 765 Lys Asp Val Lys Pro Lys Pro Ile Ala Asp Ala Lys Ala Pro Glu Lys 770 775 780 Arg Ala Ser Pro Ser Lys Pro Ala Ser Ala Pro Ala Ser Arg Ser Gly 785 790 795 800 Ser Lys Ser Thr Gln Thr Val Ala Lys Thr Thr Thr Ala Ala Ala Val 805 810 815 Ala Ser Thr Gly Pro Ser Ser Arg Ser Pro Ser Thr Leu Leu Pro Lys 820 825 830 Lys Pro Thr Ala Ile Lys Thr Glu Gly Lys Pro Ala Glu Val Lys Lys 835 840 845 Met Thr Ala Lys Ser Val Pro Ala Asp Leu Ser Arg Pro Lys Ser Thr 850 855 860 Ser Thr Ser Ser Met Lys Lys Thr Thr Thr Leu Ser Gly Thr Ala Pro 865 870 875 880 Ala Ala Gly Val Val Pro Ser Arg Val Lys Ala Thr Pro Met Pro Ser 885 890 895 Arg Pro Ser Thr Thr Pro Phe Ile Asp Lys Lys Pro Thr Ser Ala Lys 900 905 910 Pro Ser Ser Thr Thr Pro Arg Leu Ser Arg Leu Ala Thr Asn Thr Ser 915 920 925 Ala Pro Asp Leu Lys Asn Val Arg Ser Lys Val Gly Ser Thr Glu Asn 930 935 940 Ile Lys His Gln Pro Gly Gly Gly Arg Ala Lys Val Glu Lys Lys Thr 945 950 955 960 Glu Ala Ala Ala Thr Thr Arg Lys Pro Glu Ser Asn Ala Val Thr Lys 965 970 975 Thr Ala Gly Pro Ile Ala Ser Ala Gln Lys Gln Pro Ala Gly Lys Val 980 985 990 Gln Ile Val Ser Lys Lys Val Ser Tyr Ser His Ile Gln Ser Lys Cys 995 1000 1005 Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Asn Val 1010 1015 1020 Gln Ile Gln Asn Lys Lys Val Asp Ile Ser Lys Val Ser Ser Lys 1025 1030 1035 Cys Gly Ser Lys Ala Asn Ile Lys His Lys Pro Gly Gly Gly Asp 1040 1045 1050 Val Lys Ile Glu Ser Gln Lys Leu Asn Phe Lys Glu Lys Ala Gln 1055 1060 1065 Ala Lys Val Gly Ser Leu Asp Asn Val Gly His Leu Pro Ala Gly 1070 1075 1080 Gly Ala Val Lys Ile Glu Thr Tyr Arg Leu Thr Phe Arg Ala Asn 1085 1090 1095 Ala Arg Ala Arg Thr Asp His Gly Ala Asp Ile Val Ser Arg Pro 1100 1105 1110 Pro His Phe Pro Gly Gly Pro Asn Ser Gly Ser Arg Val Leu Gly 1115 1120 1125 Pro Leu Ser Arg Ala Val His 1130 1135 <210> 78 <211> 6046 <212> DNA <213> Homo sapiens <400> 78 aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60 cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120 ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180 acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240 agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300 cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360 cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420 ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480 gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540 tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600 cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660 agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720 accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780 caatggtggt catggagtag aagggagcga tactacaggg tctccaactg aattccttga 840 agagaaaatg gcctaccagg aatacccaaa tagccagaac tggccagaag ataccaactt 900 ttgtttccaa cctgagcaag tggtcgatcc tatccagact gatcccttta agatgtacca 960 tgatgatgac ctggcagatt tggtctttcc ctccagtgcg acagctgata cttcaatatt 1020 tgcaggacaa aatgatccct tgaaagacag ttacggtatg tctccctgca acacagctgt 1080 tgtacctcag gggtggtctg tggaagcctt aaactctcca cactcagagt cctttgtttc 1140 cccagaggct gttgcagaac ctcctcagcc aacggcagtt cccttagagc tagccaagga 1200 gatagaaatg gcatcagaag agaggccacc agcacaagca ttggaaataa tgatgggact 1260 gaagactact gacatggcac catctaaaga aacagagatg gccctcgcca aggacatggc 1320 actagctaca aaaaccgagg tggcattggc taaagatatg gaatcaccca ccaaattaga 1380 tgtgacactg gccaaggaca tgcagccatc catggaatca gatatggccc tagtcaagga 1440 catggaacta cccacagaaa aagaagtggc cctggttaag gatgtcagat ggcccacaga 1500 aacagatgta tcttcagcca agaatgtggt actgcccaca gaaacagagg tagccccagc 1560 caaggatgtg acactgttga aagaaacaga gagggcatct cctataaaaa tggacttagc 1620 cccttccaag gacatgggac cacccaaaga aaacaagaaa gaaacagaga gggcatctcc 1680 tataaaaatg gacttggctc cttccaagga catgggacca cccaaagaaa acaagatagt 1740 cccagccaag gatttggtat tactctcaga aatagaggtg gcacaggcta atgacattat 1800 atcatccaca gaaatatcct ctgctgagaa ggtggctttg tcctcagaaa cagaggtagc 1860 cctggccagg gacatgacac tgcccccgga aaccaacgtg atcttgacca aggataaagc 1920 actaccttta gaagcagagg tggccccagt caaggacatg gctcaactcc cagaaacaga 1980 aatagccccg gccaaggatg tggctccgtc cacagtaaaa gaagtgggct tgttgaagga 2040 catgtctcca ctatcagaaa cagaaatggc tctgggcaag gatgtgactc cacctccaga 2100 aacagaagta gttctcatca agaacgtatg tctgcctcca gaaatggagg tggccctgac 2160 tgaggatcag gtcccagccc tcaaaacaga agcacccctg gctaaggatg gggttctgac 2220 cctggccaac aatgtgactc cagccaaaga tgttccacca ctctcagaaa cagaggcaac 2280 accagttcca attaaagaca tggaaattgc acaaacacaa aaaggaataa gtgaggattc 2340 ccatttagaa tctctgcagg atgtggggca gtcagctgca cctactttca tgatttcacc 2400 agaaaccgtc acaggaacgg ggaaaaagtg cagcttgccg gccgaggagg attctgtgtt 2460 agaaaaacta ggggaaagga aaccatgcaa cagtcaacct tctgagcttt cttcagagac 2520 ctcaggaata gccaggccag aagaaggaag gcctgtggtg agtgggacag gaaatgacat 2580 caccacccca ccgaacaagg agctcccacc aagcccagag aagaaaacaa agcctttggc 2640 caccactcaa cctgcaaaga cttcaacatc gaaagccaaa acacagccca cttctctccc 2700 taagcagcca gctcccacca ccattggtgg gttgaataaa aaacccatga gccttgcttc 2760 aggcttagtg ccagctgccc cacccaaacg ccctgccgtc gcctctgcca ggccttccat 2820 cttaccttca aaagacgtga agccaaagcc cattgcagat gcaaaggctc ctgagaagcg 2880 ggcctcacca tccaagccag cttctgcccc agcctccaga tctgggtcca agagcactca 2940 gactgttgca aaaaccacaa cagctgctgc tgttgcctca actggcccaa gcagtaggag 3000 cccctccacg ctcctgccca agaagcccac tgccattaag actgagggaa aacctgcaga 3060 agtcaagaag atgactgcaa agtctgtacc agctgacttg agtcgcccaa agagcacctc 3120 caccagttcc atgaagaaaa ccaccactct cagtgggaca gcccccgctg caggggtggt 3180 tcccagccga gtcaaggcca cacccatgcc ctcccggccc tccacaactc ctttcataga 3240 caagaagccc acctcggcca aacccagctc caccaccccc cggctcagcc gcctggccac 3300 caatacttct gctcctgatc tgaagaatgt ccgctccaag gttggctcca cggaaaacat 3360 caagcatcag cctggaggag gccgggccaa agtagagaaa aaaacagagg cagctgctac 3420 aacccgaaag cctgaatcta atgcagtcac taaaacagcc ggcccaattg caagtgcaca 3480 gaaacaacct gcggggaaag tccagatagt ctccaaaaaa gtgagctaca gccatattca 3540 gtccaagtgt ggttccaagg acaatattaa gcatgtccct ggaggtggta atgttcagat 3600 tcagaacaag aaagtggaca tctctaaggt ctcctccaag tgtgggtcta aggctaacat 3660 caagcacaag cctggtggag gagatgtcaa gattgaaagt cagaagttga acttcaagga 3720 gaaggcccag gccaaggtgg gatccctcga taatgtgggc cacctacctg caggaggtgc 3780 tgtgaagatt gagacctaca ggctgacgtt ccgggcaaat gccagggccc gcaccgacca 3840 cggggccgac attgtctccc gccccccaca cttccctggc ggccccaact cgggctcccg 3900 ggtccttggc cccctttccc gggctgtcca ctagaccagt gagcgcttgg gcgccgtgct 3960 gggcagcccg ctaggctcgc cttccctcct gctttgcgtg cccggggcag cagcagccct 4020 gccccacacc tcctctcact ccccagcctg ggcccatctc cctgctttgg tcttgcccca 4080 tcactgcgcc actgctccgt ggaggaggtt gggagggggt tggggtggtt gaggctaagt 4140 tgggatctag gagaggagaa ccagattcta tcctcatctt tttttggttc tttggtccaa 4200 acccaaaaga aactgacatg ccctcccttc tccctggatc tacctggagg gaagagtgga 4260 ggtggattcc gagtggtgac aggacgctga ccgtggagct taagccactg cctctccctc 4320 tggtcccaca aatgggcgcc cccccctccc catgcaggtg gtgtcgggcc cttcttgctg 4380 ccctgcccca agttgggggt cagtgctgcc tgtccccatg cttaacatac ccgcctagct 4440 gctgtcacat ttttcttgtt ttgtcctttt atttttttct aataacctaa aaactggcaa 4500 aatagttctg caggttgaag ccatgtctac atgaaagtcc tcagtaagtg ttagagggaa 4560 cagggcggag atatccttat gccacccccg ctggaggatg tgggcagctt agggccctgg 4620 aggcggtgcg gcagggaaga ggggtgcaga ggctgtggct ggtgagccgg tcaggcacac 4680 aaggggccct tggagcgtgg actggttggt tttgccattt tgttgtgtgt atgctgcttt 4740 tcttttctaa ccaagaggct ggttttggca tctctgtccc attccctggg atctggtggt 4800 cagccctagg ataaaaagcc agggctggag aacaagaaag ggccaggaga tggaattcct 4860 tcaggccggc acccacaccc taggacatgt aagccctcat gtccaaggga gcctcatgca 4920 gatagtagga aatcaggtct ggaaatttaa aaataaaagg catgagacta aggctatctg 4980 cttcccttat gccctgactg gagaggggag ggaggagagg caaggcccac agagggcatc 5040 ccagctaggc cttgggatgg ctgcagtgag gagaaatccc gggaactgta ttgacacaaa 5100 gattcttatt gcacttgtat tttttgtatt aaagtttgca tggtttctaa taaaggattc 5160 aaacataagt ttgtagtgaa atggcctggg agattccaag ggcttctctg gagggggatt 5220 ggctgcagtg tagatttgcc tctgaggagg ctgccccaga cttggcctcc tcatgccccc 5280 tcctgacctc tgcccttctc tggtcctggc atccctggag aaggtagggg tcttgaccta 5340 agtttagatt tgatctccat gtgcagggag gctgtcctgg gcctgacagg tcctccccct 5400 ttctgaggta gcagtgcctt gtggaggttt gacaccatgt ccctagctcc ccaagcacac 5460 accaggaaac tgcaggggct cacggaggaa gtgctgcctg ggccaggggg accagctttc 5520 ctccgtagag accatgtgca gaacacttct gctgtgccaa gaacatgagg gagccagtgt 5580 tttgtcagca ggaagaaagg gcctgctggg atgaaagtgg gaaggaaaca gggttgcgta 5640 gtcaggagac acctcagggg caacagcaca ggcccagagt acctgctgcc tccactgcgt 5700 ctgtcctggg gtcatgagga tgctgaggtt gacgacaggt tccaggtcct ttcactcctt 5760 tggccaaagg ttgggggtag gtggcccaag tggcgtgctc tctaggtaga caacaggagt 5820 ggtcagagtt ccctcaaagg atcctccact ccagagcacc tgagaaggcc gggaccagag 5880 gccctgtgtg atgtgtactc cgcagctgtt tggggtggga catttctgta cttctcgatt 5940 tgcttatggc tcagccatta cctgtgtcag tccatgattc tgttgtaaca gttttaagag 6000 taaataaata aagctgcctg atgtcccatc acgcagaaaa aaaaaa 6046 <210> 79 <211> 1152 <212> PRT <213> Homo sapiens <400> 79 Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp 1 5 10 15 Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu 20 25 30 Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile 35 40 45 Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys 50 55 60 Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys 65 70 75 80 Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr 85 90 95 Thr Gly Ser Pro Thr Glu Phe Leu Glu Glu Lys Met Ala Tyr Gln Glu 100 105 110 Tyr Pro Asn Ser Gln Asn Trp Pro Glu Asp Thr Asn Phe Cys Phe Gln 115 120 125 Pro Glu Gln Val Val Asp Pro Ile Gln Thr Asp Pro Phe Lys Met Tyr 130 135 140 His Asp Asp Asp Leu Ala Asp Leu Val Phe Pro Ser Ser Ala Thr Ala 145 150 155 160 Asp Thr Ser Ile Phe Ala Gly Gln Asn Asp Pro Leu Lys Asp Ser Tyr 165 170 175 Gly Met Ser Pro Cys Asn Thr Ala Val Val Pro Gln Gly Trp Ser Val 180 185 190 Glu Ala Leu Asn Ser Pro His Ser Glu Ser Phe Val Ser Pro Glu Ala 195 200 205 Val Ala Glu Pro Pro Gln Pro Thr Ala Val Pro Leu Glu Leu Ala Lys 210 215 220 Glu Ile Glu Met Ala Ser Glu Glu Arg Pro Pro Ala Gln Ala Leu Glu 225 230 235 240 Ile Met Met Gly Leu Lys Thr Thr Asp Met Ala Pro Ser Lys Glu Thr 245 250 255 Glu Met Ala Leu Ala Lys Asp Met Ala Leu Ala Thr Lys Thr Glu Val 260 265 270 Ala Leu Ala Lys Asp Met Glu Ser Pro Thr Lys Leu Asp Val Thr Leu 275 280 285 Ala Lys Asp Met Gln Pro Ser Met Glu Ser Asp Met Ala Leu Val Lys 290 295 300 Asp Met Glu Leu Pro Thr Glu Lys Glu Val Ala Leu Val Lys Asp Val 305 310 315 320 Arg Trp Pro Thr Glu Thr Asp Val Ser Ser Ala Lys Asn Val Val Leu 325 330 335 Pro Thr Glu Thr Glu Val Ala Pro Ala Lys Asp Val Thr Leu Leu Lys 340 345 350 Glu Thr Glu Arg Ala Ser Pro Ile Lys Met Asp Leu Ala Pro Ser Lys 355 360 365 Asp Met Gly Pro Pro Lys Glu Asn Lys Lys Glu Thr Glu Arg Ala Ser 370 375 380 Pro Ile Lys Met Asp Leu Ala Pro Ser Lys Asp Met Gly Pro Pro Lys 385 390 395 400 Glu Asn Lys Ile Val Pro Ala Lys Asp Leu Val Leu Leu Ser Glu Ile 405 410 415 Glu Val Ala Gln Ala Asn Asp Ile Ile Ser Ser Thr Glu Ile Ser Ser 420 425 430 Ala Glu Lys Val Ala Leu Ser Ser Glu Thr Glu Val Ala Leu Ala Arg 435 440 445 Asp Met Thr Leu Pro Pro Glu Thr Asn Val Ile Leu Thr Lys Asp Lys 450 455 460 Ala Leu Pro Leu Glu Ala Glu Val Ala Pro Val Lys Asp Met Ala Gln 465 470 475 480 Leu Pro Glu Thr Glu Ile Ala Pro Ala Lys Asp Val Ala Pro Ser Thr 485 490 495 Val Lys Glu Val Gly Leu Leu Lys Asp Met Ser Pro Leu Ser Glu Thr 500 505 510 Glu Met Ala Leu Gly Lys Asp Val Thr Pro Pro Pro Glu Thr Glu Val 515 520 525 Val Leu Ile Lys Asn Val Cys Leu Pro Pro Glu Met Glu Val Ala Leu 530 535 540 Thr Glu Asp Gln Val Pro Ala Leu Lys Thr Glu Ala Pro Leu Ala Lys 545 550 555 560 Asp Gly Val Leu Thr Leu Ala Asn Asn Val Thr Pro Ala Lys Asp Val 565 570 575 Pro Pro Leu Ser Glu Thr Glu Ala Thr Pro Val Pro Ile Lys Asp Met 580 585 590 Glu Ile Ala Gln Thr Gln Lys Gly Ile Ser Glu Asp Ser His Leu Glu 595 600 605 Ser Leu Gln Asp Val Gly Gln Ser Ala Ala Pro Thr Phe Met Ile Ser 610 615 620 Pro Glu Thr Val Thr Gly Thr Gly Lys Lys Cys Ser Leu Pro Ala Glu 625 630 635 640 Glu Asp Ser Val Leu Glu Lys Leu Gly Glu Arg Lys Pro Cys Asn Ser 645 650 655 Gln Pro Ser Glu Leu Ser Ser Glu Thr Ser Gly Ile Ala Arg Pro Glu 660 665 670 Glu Gly Arg Pro Val Val Ser Gly Thr Gly Asn Asp Ile Thr Thr Pro 675 680 685 Pro Asn Lys Glu Leu Pro Pro Ser Pro Glu Lys Lys Thr Lys Pro Leu 690 695 700 Ala Thr Thr Gln Pro Ala Lys Thr Ser Thr Ser Lys Ala Lys Thr Gln 705 710 715 720 Pro Thr Ser Leu Pro Lys Gln Pro Ala Pro Thr Thr Ile Gly Gly Leu 725 730 735 Asn Lys Lys Pro Met Ser Leu Ala Ser Gly Leu Val Pro Ala Ala Pro 740 745 750 Pro Lys Arg Pro Ala Val Ala Ser Ala Arg Pro Ser Ile Leu Pro Ser 755 760 765 Lys Asp Val Lys Pro Lys Pro Ile Ala Asp Ala Lys Ala Pro Glu Lys 770 775 780 Arg Ala Ser Pro Ser Lys Pro Ala Ser Ala Pro Ala Ser Arg Ser Gly 785 790 795 800 Ser Lys Ser Thr Gln Thr Val Ala Lys Thr Thr Thr Ala Ala Ala Val 805 810 815 Ala Ser Thr Gly Pro Ser Ser Arg Ser Pro Ser Thr Leu Leu Pro Lys 820 825 830 Lys Pro Thr Ala Ile Lys Thr Glu Gly Lys Pro Ala Glu Val Lys Lys 835 840 845 Met Thr Ala Lys Ser Val Pro Ala Asp Leu Ser Arg Pro Lys Ser Thr 850 855 860 Ser Thr Ser Ser Met Lys Lys Thr Thr Thr Leu Ser Gly Thr Ala Pro 865 870 875 880 Ala Ala Gly Val Val Pro Ser Arg Val Lys Ala Thr Pro Met Pro Ser 885 890 895 Arg Pro Ser Thr Thr Pro Phe Ile Asp Lys Lys Pro Thr Ser Ala Lys 900 905 910 Pro Ser Ser Thr Thr Pro Arg Leu Ser Arg Leu Ala Thr Asn Thr Ser 915 920 925 Ala Pro Asp Leu Lys Asn Val Arg Ser Lys Val Gly Ser Thr Glu Asn 930 935 940 Ile Lys His Gln Pro Gly Gly Gly Arg Ala Lys Val Glu Lys Lys Thr 945 950 955 960 Glu Ala Ala Ala Thr Thr Arg Lys Pro Glu Ser Asn Ala Val Thr Lys 965 970 975 Thr Ala Gly Pro Ile Ala Ser Ala Gln Lys Gln Pro Ala Gly Lys Val 980 985 990 Gln Ile Val Ser Lys Lys Val Ser Tyr Ser His Ile Gln Ser Lys Cys 995 1000 1005 Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Asn Val 1010 1015 1020 Gln Ile Gln Asn Lys Lys Val Asp Ile Ser Lys Val Ser Ser Lys 1025 1030 1035 Cys Gly Ser Lys Ala Asn Ile Lys His Lys Pro Gly Gly Gly Asp 1040 1045 1050 Val Lys Ile Glu Ser Gln Lys Leu Asn Phe Lys Glu Lys Ala Gln 1055 1060 1065 Ala Lys Val Gly Ser Leu Asp Asn Val Gly His Leu Pro Ala Gly 1070 1075 1080 Gly Ala Val Lys Thr Glu Gly Gly Gly Ser Glu Ala Pro Leu Cys 1085 1090 1095 Pro Gly Pro Pro Ala Gly Glu Glu Pro Ala Ile Ser Glu Ala Ala 1100 1105 1110 Pro Glu Ala Gly Ala Pro Thr Ser Ala Ser Gly Leu Asn Gly His 1115 1120 1125 Pro Thr Leu Ser Gly Gly Gly Asp Gln Arg Glu Ala Gln Thr Leu 1130 1135 1140 Asp Ser Gln Ile Gln Glu Thr Ser Ile 1145 1150 <210> 80 <211> 6337 <212> DNA <213> Homo sapiens <400> 80 aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60 cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120 ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180 acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240 agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300 cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360 cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420 ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480 gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540 tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600 cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660 agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720 accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780 caatggtggt catggagtag aagggagcga tactacaggg tctccaactg aattccttga 840 agagaaaatg gcctaccagg aatacccaaa tagccagaac tggccagaag ataccaactt 900 ttgtttccaa cctgagcaag tggtcgatcc tatccagact gatcccttta agatgtacca 960 tgatgatgac ctggcagatt tggtctttcc ctccagtgcg acagctgata cttcaatatt 1020 tgcaggacaa aatgatccct tgaaagacag ttacggtatg tctccctgca acacagctgt 1080 tgtacctcag gggtggtctg tggaagcctt aaactctcca cactcagagt cctttgtttc 1140 cccagaggct gttgcagaac ctcctcagcc aacggcagtt cccttagagc tagccaagga 1200 gatagaaatg gcatcagaag agaggccacc agcacaagca ttggaaataa tgatgggact 1260 gaagactact gacatggcac catctaaaga aacagagatg gccctcgcca aggacatggc 1320 actagctaca aaaaccgagg tggcattggc taaagatatg gaatcaccca ccaaattaga 1380 tgtgacactg gccaaggaca tgcagccatc catggaatca gatatggccc tagtcaagga 1440 catggaacta cccacagaaa aagaagtggc cctggttaag gatgtcagat ggcccacaga 1500 aacagatgta tcttcagcca agaatgtggt actgcccaca gaaacagagg tagccccagc 1560 caaggatgtg acactgttga aagaaacaga gagggcatct cctataaaaa tggacttagc 1620 cccttccaag gacatgggac cacccaaaga aaacaagaaa gaaacagaga gggcatctcc 1680 tataaaaatg gacttggctc cttccaagga catgggacca cccaaagaaa acaagatagt 1740 cccagccaag gatttggtat tactctcaga aatagaggtg gcacaggcta atgacattat 1800 atcatccaca gaaatatcct ctgctgagaa ggtggctttg tcctcagaaa cagaggtagc 1860 cctggccagg gacatgacac tgcccccgga aaccaacgtg atcttgacca aggataaagc 1920 actaccttta gaagcagagg tggccccagt caaggacatg gctcaactcc cagaaacaga 1980 aatagccccg gccaaggatg tggctccgtc cacagtaaaa gaagtgggct tgttgaagga 2040 catgtctcca ctatcagaaa cagaaatggc tctgggcaag gatgtgactc cacctccaga 2100 aacagaagta gttctcatca agaacgtatg tctgcctcca gaaatggagg tggccctgac 2160 tgaggatcag gtcccagccc tcaaaacaga agcacccctg gctaaggatg gggttctgac 2220 cctggccaac aatgtgactc cagccaaaga tgttccacca ctctcagaaa cagaggcaac 2280 accagttcca attaaagaca tggaaattgc acaaacacaa aaaggaataa gtgaggattc 2340 ccatttagaa tctctgcagg atgtggggca gtcagctgca cctactttca tgatttcacc 2400 agaaaccgtc acaggaacgg ggaaaaagtg cagcttgccg gccgaggagg attctgtgtt 2460 agaaaaacta ggggaaagga aaccatgcaa cagtcaacct tctgagcttt cttcagagac 2520 ctcaggaata gccaggccag aagaaggaag gcctgtggtg agtgggacag gaaatgacat 2580 caccacccca ccgaacaagg agctcccacc aagcccagag aagaaaacaa agcctttggc 2640 caccactcaa cctgcaaaga cttcaacatc gaaagccaaa acacagccca cttctctccc 2700 taagcagcca gctcccacca ccattggtgg gttgaataaa aaacccatga gccttgcttc 2760 aggcttagtg ccagctgccc cacccaaacg ccctgccgtc gcctctgcca ggccttccat 2820 cttaccttca aaagacgtga agccaaagcc cattgcagat gcaaaggctc ctgagaagcg 2880 ggcctcacca tccaagccag cttctgcccc agcctccaga tctgggtcca agagcactca 2940 gactgttgca aaaaccacaa cagctgctgc tgttgcctca actggcccaa gcagtaggag 3000 cccctccacg ctcctgccca agaagcccac tgccattaag actgagggaa aacctgcaga 3060 agtcaagaag atgactgcaa agtctgtacc agctgacttg agtcgcccaa agagcacctc 3120 caccagttcc atgaagaaaa ccaccactct cagtgggaca gcccccgctg caggggtggt 3180 tcccagccga gtcaaggcca cacccatgcc ctcccggccc tccacaactc ctttcataga 3240 caagaagccc acctcggcca aacccagctc caccaccccc cggctcagcc gcctggccac 3300 caatacttct gctcctgatc tgaagaatgt ccgctccaag gttggctcca cggaaaacat 3360 caagcatcag cctggaggag gccgggccaa agtagagaaa aaaacagagg cagctgctac 3420 aacccgaaag cctgaatcta atgcagtcac taaaacagcc ggcccaattg caagtgcaca 3480 gaaacaacct gcggggaaag tccagatagt ctccaaaaaa gtgagctaca gccatattca 3540 gtccaagtgt ggttccaagg acaatattaa gcatgtccct ggaggtggta atgttcagat 3600 tcagaacaag aaagtggaca tctctaaggt ctcctccaag tgtgggtcta aggctaacat 3660 caagcacaag cctggtggag gagatgtcaa gattgaaagt cagaagttga acttcaagga 3720 gaaggcccag gccaaggtgg gatccctcga taatgtgggc cacctacctg caggaggtgc 3780 tgtgaagact gagggcggtg gcagcgaggc tcctctgtgt ccgggtcccc ctgctgggga 3840 ggagccggcc atctctgagg cagcgcctga agctggcgcc cccacttcag ccagtggcct 3900 caatggccac cccaccctgt cagggggtgg tgaccaaagg gaggcccaga ccttggacag 3960 ccagatccag gagacaagca tctaatgatg acattctggt ctcgtcttcc gtctcccccg 4020 tgttcccctc ttgtctcccc tgttcccctc tcccttccct cctcccatgt cactgcagat 4080 tgagacctac aggctgacgt tccgggcaaa tgccagggcc cgcaccgacc acggggccga 4140 cattgtctcc cgccccccac acttccctgg cggccccaac tcgggctccc gggtccttgg 4200 ccccctttcc cgggctgtcc actagaccag tgagcgcttg ggcgccgtgc tgggcagccc 4260 gctaggctcg ccttccctcc tgctttgcgt gcccggggca gcagcagccc tgccccacac 4320 ctcctctcac tccccagcct gggcccatct ccctgctttg gtcttgcccc atcactgcgc 4380 cactgctccg tggaggaggt tgggaggggg ttggggtggt tgaggctaag ttgggatcta 4440 ggagaggaga accagattct atcctcatct ttttttggtt ctttggtcca aacccaaaag 4500 aaactgacat gccctccctt ctccctggat ctacctggag ggaagagtgg aggtggattc 4560 cgagtggtga caggacgctg accgtggagc ttaagccact gcctctccct ctggtcccac 4620 aaatgggcgc ccccccctcc ccatgcaggt ggtgtcgggc ccttcttgct gccctgcccc 4680 aagttggggg tcagtgctgc ctgtccccat gcttaacata cccgcctagc tgctgtcaca 4740 tttttcttgt tttgtccttt tatttttttc taataaccta aaaactggca aaatagttct 4800 gcaggttgaa gccatgtcta catgaaagtc ctcagtaagt gttagaggga acagggcgga 4860 gatatcctta tgccaccccc gctggaggat gtgggcagct tagggccctg gaggcggtgc 4920 ggcagggaag aggggtgcag aggctgtggc tggtgagccg gtcaggcaca caaggggccc 4980 ttggagcgtg gactggttgg ttttgccatt ttgttgtgtg tatgctgctt ttcttttcta 5040 accaagaggc tggttttggc atctctgtcc cattccctgg gatctggtgg tcagccctag 5100 gataaaaagc cagggctgga gaacaagaaa gggccaggag atggaattcc ttcaggccgg 5160 cacccacacc ctaggacatg taagccctca tgtccaaggg agcctcatgc agatagtagg 5220 aaatcaggtc tggaaattta aaaataaaag gcatgagact aaggctatct gcttccctta 5280 tgccctgact ggagagggga gggaggagag gcaaggccca cagagggcat cccagctagg 5340 ccttgggatg gctgcagtga ggagaaatcc cgggaactgt attgacacaa agattcttat 5400 tgcacttgta ttttttgtat taaagtttgc atggtttcta ataaaggatt caaacataag 5460 tttgtagtga aatggcctgg gagattccaa gggcttctct ggagggggat tggctgcagt 5520 gtagatttgc ctctgaggag gctgccccag acttggcctc ctcatgcccc ctcctgacct 5580 ctgcccttct ctggtcctgg catccctgga gaaggtaggg gtcttgacct aagtttagat 5640 ttgatctcca tgtgcaggga ggctgtcctg ggcctgacag gtcctccccc tttctgaggt 5700 agcagtgcct tgtggaggtt tgacaccatg tccctagctc cccaagcaca caccaggaaa 5760 ctgcaggggc tcacggagga agtgctgcct gggccagggg gaccagcttt cctccgtaga 5820 gaccatgtgc agaacacttc tgctgtgcca agaacatgag ggagccagtg ttttgtcagc 5880 aggaagaaag ggcctgctgg gatgaaagtg ggaaggaaac agggttgcgt agtcaggaga 5940 cacctcaggg gcaacagcac aggcccagag tacctgctgc ctccactgcg tctgtcctgg 6000 ggtcatgagg atgctgaggt tgacgacagg ttccaggtcc tttcactcct ttggccaaag 6060 gttgggggta ggtggcccaa gtggcgtgct ctctaggtag acaacaggag tggtcagagt 6120 tccctcaaag gatcctccac tccagagcac ctgagaaggc cgggaccaga ggccctgtgt 6180 gatgtgtact ccgcagctgt ttggggtggg acatttctgt acttctcgat ttgcttatgg 6240 ctcagccatt acctgtgtca gtccatgatt ctgttgtaac agttttaaga gtaaataaat 6300 aaagctgcct gatgtcccat cacgcagaaa aaaaaaa 6337 <210> 81 <211> 99 <212> PRT <213> Homo sapiens <400> 81 Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp 1 5 10 15 Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu 20 25 30 Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile 35 40 45 Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys 50 55 60 Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys 65 70 75 80 Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr 85 90 95 Thr Glu Ala <210> 82 <211> 3224 <212> DNA <213> Homo sapiens <400> 82 aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60 cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120 ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180 acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240 agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300 cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360 cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420 ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480 gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540 tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600 cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660 agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720 accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780 caatggtggt catggagtag aagggagcga tactacagaa gcctagcgtg tctctcaaca 840 ctggggctgc tgcaacacca gaccagtgat ctttcctaag catcgttata cttctaaaac 900 cttcagcatt ttgcagagct ttgcttttca ttcctggaca tgatgtagaa gaaactgagg 960 gtagttcttc ggggcctatt tctgctgatg cctgagcaaa caacctgctt cctcttgtgc 1020 tctgcagggt ttgatggagc ctcatttccc tttgtgaaca caaagtgcaa aatgaattct 1080 ttttaatttt agtaattttt acaaaggtta tctaatgtct tttatttctt gttttcttta 1140 tgattttatc atttgattca ttctcacatt tttttccttt aaatattttt agttgacctt 1200 tttcctttgg ttttcaaatg ttcaacatga atcagaatag tgtaacacca aatgagaaca 1260 tgtgttttca taaaggggtt gaggccacca gtactgcagc gaatttcctt ttcttctccc 1320 tcctccttcc ttctctgagc ttgcttttag ggaaggttaa tcttacaggc tacctatgtt 1380 tctctccacc ttactaaaat ctaaataatg atagatattt taagttttta aattgagtag 1440 ttctgagtaa tcctagaata tttttccaaa ttaaataatc ctttattatt tgcaagttgg 1500 gccaaatttt tttttttttg gagacggact cttaacaatc taagattgtt tcaacaggac 1560 tttcttattc ccattcctaa ttttttcaaa ctaattgctt aaatctagaa ccagttgaga 1620 ttagtactgt acaatggtat gctttgattg tatttataga aatataacat aaaacatgga 1680 ccatgttttg aaatcttaga ggaattctgg tttaaaatct gaaatacttt aaagttttct 1740 atccttttac tgattatgca gcttcttata acccccaagg tacagattat ttcagcttaa 1800 aagaaataat tggcaccatg ttctgagaaa gattttgaga tatacattgt tttttgtttt 1860 tgagacaggg tctcactctt gcctaggctg gagtgcggtg gcgcgatctt ggcttactgc 1920 accctctgcc tcccaggttc aagtggttct cctgcctcag cctcccaagt agctgggatt 1980 ataggtgtgc gccaccacac cagctaattt ttgtattttt agtagagacg gggttttact 2040 ttgttggcca ggctggtctc gaactcctga tctcaagtga tccacccgcc ttggccaccc 2100 aaagtgctgg gattacaggt gtgagacact gtgcctggcc agatatacat tgttttagat 2160 cccctgatac agaactactt ttgagatggt aagattagaa tatcatgaaa gtttaaactg 2220 aatccttgca gcgacttccg gaatttagga agcattccct cttctacagg ggtctggtca 2280 caagggctgg attctctgac aaaaatttct tctatggatt ctggacagaa gacacttgag 2340 ggtgatatgt tttaaaggaa agaggttatg cttatcttct tagcagttga taaaatatta 2400 aaactctctt gccatagaga atacaccatc aaagaaaaca caaccctttc cctttggtgt 2460 acagttattt attaagttga ttttggggtt tctttcgcca gggatctttt caaaactggt 2520 agtagttatt tttaaaaatc atgtttgaca tctttctatt gctcgtaacc agtccctgta 2580 gctgtctaag ttatgggtgg agaagcctgg gtatgacttt ccgttgtgta cactcacact 2640 tcatgattga catttattta ttcttttatt tccatttggt tatgcttatt tttgtttgaa 2700 atttgttttt ttcaaatatg tttccttttt gaacttacag aattgttgaa attttctact 2760 aacagccagc taaaatttgg tatatgttag ctctatctgt ttcacttgga cgtttcattt 2820 tgaaagaaag aaattttatg tttcacatat agttttatac aaagtagcca gtcccataat 2880 gaaatgctgt attgccatag tggtcacacc caagtggtcc agtatctcaa tggtgaggca 2940 gccagactgg tcagggctgc tttgttgaaa tgtgatgatt ttcatatgcc ttctttctct 3000 ttctctctct cttttttttt ccttttttgg cccaatgttg aagatgtaga actttgtttt 3060 taaataatgt ttttataatt tcattcgtat acctaagttt gtattttttg tgactttgga 3120 cttcaacagt ttgtatattg ggacttctaa tgtgattact gtactaaata aattccacta 3180 ataaacatct tacattaaca ccttaaaaaa aaaaaaaaaa aaaa 3224 <210> 83 <211> 360 <212> PRT <213> Homo sapiens <400> 83 Met Ala Ala Ala Ala Ala Ala Gly Ala Gly Pro Glu Met Val Arg Gly 1 5 10 15 Gln Val Phe Asp Val Gly Pro Arg Tyr Thr Asn Leu Ser Tyr Ile Gly 20 25 30 Glu Gly Ala Tyr Gly Met Val Cys Ser Ala Tyr Asp Asn Val Asn Lys 35 40 45 Val Arg Val Ala Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr Tyr 50 55 60 Cys Gln Arg Thr Leu Arg Glu Ile Lys Ile Leu Leu Arg Phe Arg His 65 70 75 80 Glu Asn Ile Ile Gly Ile Asn Asp Ile Ile Arg Ala Pro Thr Ile Glu 85 90 95 Gln Met Lys Asp Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp Leu 100 105 110 Tyr Lys Leu Leu Lys Thr Gln His Leu Ser Asn Asp His Ile Cys Tyr 115 120 125 Phe Leu Tyr Gln Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala Asn 130 135 140 Val Leu His Arg Asp Leu Lys Pro Ser Asn Leu Leu Leu Asn Thr Thr 145 150 155 160 Cys Asp Leu Lys Ile Cys Asp Phe Gly Leu Ala Arg Val Ala Asp Pro 165 170 175 Asp His Asp His Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg Trp 180 185 190 Tyr Arg Ala Pro Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys Ser 195 200 205 Ile Asp Ile Trp Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser Asn 210 215 220 Arg Pro Ile Phe Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His Ile 225 230 235 240 Leu Gly Ile Leu Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile Ile 245 250 255 Asn Leu Lys Ala Arg Asn Tyr Leu Leu Ser Leu Pro His Lys Asn Lys 260 265 270 Val Pro Trp Asn Arg Leu Phe Pro Asn Ala Asp Ser Lys Ala Leu Asp 275 280 285 Leu Leu Asp Lys Met Leu Thr Phe Asn Pro His Lys Arg Ile Glu Val 290 295 300 Glu Gln Ala Leu Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro Ser 305 310 315 320 Asp Glu Pro Ile Ala Glu Ala Pro Phe Lys Phe Asp Met Glu Leu Asp 325 330 335 Asp Leu Pro Lys Glu Lys Leu Lys Glu Leu Ile Phe Glu Glu Thr Ala 340 345 350 Arg Phe Gln Pro Gly Tyr Arg Ser 355 360 <210> 84 <211> 5916 <212> DNA <213> Homo sapiens <400> 84 gcccctccct ccgcccgccc gccggcccgc ccgtcagtct ggcaggcagg caggcaatcg 60 gtccgagtgg ctgtcggctc ttcagctctc ccgctcggcg tcttccttcc tcctcccggt 120 cagcgtcggc ggctgcaccg gcggcggcgc agtccctgcg ggaggggcga caagagctga 180 gcggcggccg ccgagcgtcg agctcagcgc ggcggaggcg gcggcggccc ggcagccaac 240 atggcggcgg cggcggcggc gggcgcgggc ccggagatgg tccgcgggca ggtgttcgac 300 gtggggccgc gctacaccaa cctctcgtac atcggcgagg gcgcctacgg catggtgtgc 360 tctgcttatg ataatgtcaa caaagttcga gtagctatca agaaaatcag cccctttgag 420 caccagacct actgccagag aaccctgagg gagataaaaa tcttactgcg cttcagacat 480 gagaacatca ttggaatcaa tgacattatt cgagcaccaa ccatcgagca aatgaaagat 540 gtatatatag tacaggacct catggaaaca gatctttaca agctcttgaa gacacaacac 600 ctcagcaatg accatatctg ctattttctc taccagatcc tcagagggtt aaaatatatc 660 cattcagcta acgttctgca ccgtgacctc aagccttcca acctgctgct caacaccacc 720 tgtgatctca agatctgtga ctttggcctg gcccgtgttg cagatccaga ccatgatcac 780 acagggttcc tgacagaata tgtggccaca cgttggtaca gggctccaga aattatgttg 840 aattccaagg gctacaccaa gtccattgat atttggtctg taggctgcat tctggcagaa 900 atgctttcta acaggcccat ctttccaggg aagcattatc ttgaccagct gaaccacatt 960 ttgggtattc ttggatcccc atcacaagaa gacctgaatt gtataataaa tttaaaagct 1020 aggaactatt tgctttctct tccacacaaa aataaggtgc catggaacag gctgttccca 1080 aatgctgact ccaaagctct ggacttattg gacaaaatgt tgacattcaa cccacacaag 1140 aggattgaag tagaacaggc tctggcccac ccatatctgg agcagtatta cgacccgagt 1200 gacgagccca tcgccgaagc accattcaag ttcgacatgg aattggatga cttgcctaag 1260 gaaaagctca aagaactaat ttttgaagag actgctagat tccagccagg atacagatct 1320 taaatttgtc aggacaaggg ctcagaggac tggacgtgct cagacatcgg tgttcttctt 1380 cccagttctt gacccctggt cctgtctcca gcccgtcttg gcttatccac tttgactcct 1440 ttgagccgtt tggaggggcg gtttctggta gttgtggctt ttatgctttc aaagaatttc 1500 ttcagtccag agaattcctc ctggcagccc tgtgtgtgtc acccattggt gacctgcggc 1560 agtatgtact tcagtgcacc tactgcttac tgttgcttta gtcactaatt gctttctggt 1620 ttgaaagatg cagtggttcc tccctctcct gaatcctttt ctacatgatg ccctgctgac 1680 catgcagccg caccagagag agattcttcc ccaattggct ctagtcactg gcatctcact 1740 ttatgatagg gaaggctact acctagggca ctttaagtca gtgacagccc cttatttgca 1800 cttcaccttt tgaccataac tgtttcccca gagcaggagc ttgtggaaat accttggctg 1860 atgttgcagc ctgcagcaag tgcttccgtc tccggaatcc ttggggagca cttgtccacg 1920 tcttttctca tatcatggta gtcactaaca tatataaggt atgtgctatt ggcccagctt 1980 ttagaaaatg cagtcatttt tctaaataaa aaggaagtac tgcacccagc agtgtcactc 2040 tgtagttact gtggtcactt gtaccatata gaggtgtaac acttgtcaag aagcgttatg 2100 tgcagtactt aatgtttgta agacttacaa aaaaagattt aaagtggcag cttcactcga 2160 catttggtga gagaagtaca aaggttgcag tgctgagctg tgggcggttt ctggggatgt 2220 cccagggtgg aactccacat gctggtgcat atacgccctt gagctacttc aaatgtgggt 2280 gtttcagtaa ccacgttcca tgcctgagga tttagcagag aggaacactg cgtctttaaa 2340 tgagaaagta tacaattctt tttccttcta cagcatgtca gcatctcaag ttcatttttc 2400 aacctacagt ataacaattt gtaataaagc ctccaggagc tcatgacgtg aagcactgtt 2460 ctgtcctcaa gtactcaaat atttctgata ctgctgagtc agactgtcag aaaaagctag 2520 cactaactcg tgtttggagc tctatccata ttttactgat ctctttaagt atttgttcct 2580 gccactgtgt actgtggagt tgactcggtg ttctgtccca gtgcggtgcc tcctcttgac 2640 ttccccactg ctctctgtgg tgagaaattt gccttgttca ataattactg taccctcgca 2700 tgactgttac agctttctgt gcagagatga ctgtccaagt gccacatgcc tacgattgaa 2760 atgaaaactc tattgttacc tctgagttgt gttccacgga aaatgctatc cagcagatca 2820 tttaggaaaa ataattctat ttttagcttt tcatttctca gctgtccttt tttcttgttt 2880 gatttttgac agcaatggag aatgggttat ataaagactg cctgctaata tgaacagaaa 2940 tgcatttgta attcatgaaa ataaatgtac atcttctatc ttcacattca tgttaagatt 3000 cagtgttgct ttcctctgga tcagcgtgtc tgaatggaca gtcaggttca ggttgtgctg 3060 aacacagaaa tgctcacagg cctcactttg ccgcccaggc actggcccag cacttggatt 3120 tacataagat gagttagaaa ggtacttctg tagggtcctt tttacctctg ctcggcagag 3180 aatcgatgct gtcatgttcc tttattcaca atcttaggtc tcaaatattc tgtcaaaccc 3240 taacaaagaa gccccgacat ctcaggttgg attccctggt tctctctaaa gagggcctgc 3300 ccttgtgccc cagaggtgct gctgggcaca gccaagagtt gggaagggcc gccccacagt 3360 acgcagtcct caccacccag cccagggtgc tcacgctcac cactcctgtg gctgaggaag 3420 gatagctggc tcatcctcgg aaaacagacc cacatctcta ttcttgccct gaaatacgcg 3480 cttttcactt gcgtgctcag agctgccgtc tgaaggtcca cacagcattg acgggacaca 3540 gaaatgtgac tgttaccgga taacactgat tagtcagttt tcatttataa aaaagcattg 3600 acagttttat tactcttgtt tctttttaaa tggaaagtta ctattataag gttaatttgg 3660 agtcctcttc taaatagaaa accatatcct tggctactaa catctggaga ctgtgagctc 3720 cttcccattc cccttcctgg tactgtggag tcagattggc atgaaaccac taacttcatt 3780 ctagaatcat tgtagccata agttgtgtgc tttttattaa tcatgccaaa cataatgtaa 3840 ctgggcagag aatggtccta accaaggtac ctatgaaaag cgctagctat catgtgtagt 3900 agatgcatca ttttggctct tcttacattt gtaaaaatgt acagattagg tcatcttaat 3960 tcatattagt gacacggaac agcacctcca ctatttgtat gttcaaataa gctttcagac 4020 taatagcttt tttggtgtct aaaatgtaag caaaaaattc ctgctgaaac attccagtcc 4080 tttcatttag tataaaagaa atactgaaca agccagtggg atggaattga aagaactaat 4140 catgaggact ctgtcctgac acaggtcctc aaagctagca gagatacgca gacattgtgg 4200 catctgggta gaagaatact gtattgtgtg tgcagtgcac agtgtgtggt gtgtgcacac 4260 tcattccttc tgctcttggg cacaggcagt gggtgtagag gtaaccagta gctttgagaa 4320 gctacatgta gctcaccagt ggttttctct aaggaatcac aaaagtaaac tacccaacca 4380 catgccacgt aatatttcag ccattcagag gaaactgttt tctctttatt tgcttatatg 4440 ttaatatggt ttttaaattg gtaactttta tatagtatgg taacagtatg ttaatacaca 4500 catacatacg cacacatgct ttgggtcctt ccataatact tttatatttg taaatcaatg 4560 ttttggagca atcccaagtt taagggaaat atttttgtaa atgtaatggt tttgaaaatc 4620 tgagcaatcc ttttgcttat acatttttaa agcatttgtg ctttaaaatt gttatgctgg 4680 tgtttgaaac atgatactcc tgtggtgcag atgagaagct ataacagtga atatgtggtt 4740 tctcttacgt catccacctt gacatgatgg gtcagaaaca aatggaaatc cagagcaagt 4800 cctccagggt tgcaccaggt ttacctaaag cttgttgcct tttcttgtgc tgtttatgcg 4860 tgtagagcac tcaagaaagt tctgaaactg ctttgtatct gctttgtact gttggtgcct 4920 tcttggtatt gtaccccaaa attctgcata gattatttag tataatggta agttaaaaaa 4980 tgttaaagga agattttatt aagaatctga atgtttattc attatattgt tacaatttaa 5040 cattaacatt tatttgtggt atttgtgatt tggttaatct gtataaaaat tgtaagtaga 5100 aaggtttata tttcatctta attcttttga tgttgtaaac gtacttttta aaagatggat 5160 tatttgaatg tttatggcac ctgacttgta aaaaaaaaaa actacaaaaa aatccttaga 5220 atcattaaat tgtgtccctg tattaccaaa ataacacagc accgtgcatg tatagtttaa 5280 ttgcagtttc atctgtgaaa acgtgaaatt gtctagtcct tcgttatgtt ccccagatgt 5340 cttccagatt tgctctgcat gtggtaactt gtgttagggc tgtgagctgt tcctcgagtt 5400 gaatggggat gtcagtgctc ctagggttct ccaggtggtt cttcagacct tcacctgtgg 5460 gggggggggt aggcggtgcc cacgcccatc tcctcatcct cctgaacttc tgcaacccca 5520 ctgctgggca gacatcctgg gcaacccctt ttttcagagc aagaagtcat aaagatagga 5580 tttcttggac atttggttct tatcaatatt gggcattatg taatgactta tttacaaaac 5640 aaagatactg gaaaatgttt tggatgtggt gttatggaaa gagcacaggc cttggaccca 5700 tccagctggg ttcagaacta ccccctgctt ataactgcgg ctggctgtgg gccagtcatt 5760 ctgcgtctct gctttcttcc tctgcttcag actgtcagct gtaaagtgga agcaatatta 5820 cttgccttgt atatggtaaa gattataaaa atacatttca actgttcagc atagtacttc 5880 aaagcaagta ctcagtaaat agcaagtctt tttaaa 5916 <210> 85 <211> 360 <212> PRT <213> Homo sapiens <400> 85 Met Ala Ala Ala Ala Ala Ala Gly Ala Gly Pro Glu Met Val Arg Gly 1 5 10 15 Gln Val Phe Asp Val Gly Pro Arg Tyr Thr Asn Leu Ser Tyr Ile Gly 20 25 30 Glu Gly Ala Tyr Gly Met Val Cys Ser Ala Tyr Asp Asn Val Asn Lys 35 40 45 Val Arg Val Ala Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr Tyr 50 55 60 Cys Gln Arg Thr Leu Arg Glu Ile Lys Ile Leu Leu Arg Phe Arg His 65 70 75 80 Glu Asn Ile Ile Gly Ile Asn Asp Ile Ile Arg Ala Pro Thr Ile Glu 85 90 95 Gln Met Lys Asp Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp Leu 100 105 110 Tyr Lys Leu Leu Lys Thr Gln His Leu Ser Asn Asp His Ile Cys Tyr 115 120 125 Phe Leu Tyr Gln Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala Asn 130 135 140 Val Leu His Arg Asp Leu Lys Pro Ser Asn Leu Leu Leu Asn Thr Thr 145 150 155 160 Cys Asp Leu Lys Ile Cys Asp Phe Gly Leu Ala Arg Val Ala Asp Pro 165 170 175 Asp His Asp His Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg Trp 180 185 190 Tyr Arg Ala Pro Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys Ser 195 200 205 Ile Asp Ile Trp Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser Asn 210 215 220 Arg Pro Ile Phe Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His Ile 225 230 235 240 Leu Gly Ile Leu Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile Ile 245 250 255 Asn Leu Lys Ala Arg Asn Tyr Leu Leu Ser Leu Pro His Lys Asn Lys 260 265 270 Val Pro Trp Asn Arg Leu Phe Pro Asn Ala Asp Ser Lys Ala Leu Asp 275 280 285 Leu Leu Asp Lys Met Leu Thr Phe Asn Pro His Lys Arg Ile Glu Val 290 295 300 Glu Gln Ala Leu Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro Ser 305 310 315 320 Asp Glu Pro Ile Ala Glu Ala Pro Phe Lys Phe Asp Met Glu Leu Asp 325 330 335 Asp Leu Pro Lys Glu Lys Leu Lys Glu Leu Ile Phe Glu Glu Thr Ala 340 345 350 Arg Phe Gln Pro Gly Tyr Arg Ser 355 360 <210> 86 <211> 1499 <212> DNA <213> Homo sapiens <400> 86 gcccctccct ccgcccgccc gccggcccgc ccgtcagtct ggcaggcagg caggcaatcg 60 gtccgagtgg ctgtcggctc ttcagctctc ccgctcggcg tcttccttcc tcctcccggt 120 cagcgtcggc ggctgcaccg gcggcggcgc agtccctgcg ggaggggcga caagagctga 180 gcggcggccg ccgagcgtcg agctcagcgc ggcggaggcg gcggcggccc ggcagccaac 240 atggcggcgg cggcggcggc gggcgcgggc ccggagatgg tccgcgggca ggtgttcgac 300 gtggggccgc gctacaccaa cctctcgtac atcggcgagg gcgcctacgg catggtgtgc 360 tctgcttatg ataatgtcaa caaagttcga gtagctatca agaaaatcag cccctttgag 420 caccagacct actgccagag aaccctgagg gagataaaaa tcttactgcg cttcagacat 480 gagaacatca ttggaatcaa tgacattatt cgagcaccaa ccatcgagca aatgaaagat 540 gtatatatag tacaggacct catggaaaca gatctttaca agctcttgaa gacacaacac 600 ctcagcaatg accatatctg ctattttctc taccagatcc tcagagggtt aaaatatatc 660 cattcagcta acgttctgca ccgtgacctc aagccttcca acctgctgct caacaccacc 720 tgtgatctca agatctgtga ctttggcctg gcccgtgttg cagatccaga ccatgatcac 780 acagggttcc tgacagaata tgtggccaca cgttggtaca gggctccaga aattatgttg 840 aattccaagg gctacaccaa gtccattgat atttggtctg taggctgcat tctggcagaa 900 atgctttcta acaggcccat ctttccaggg aagcattatc ttgaccagct gaaccacatt 960 ttgggtattc ttggatcccc atcacaagaa gacctgaatt gtataataaa tttaaaagct 1020 aggaactatt tgctttctct tccacacaaa aataaggtgc catggaacag gctgttccca 1080 aatgctgact ccaaagctct ggacttattg gacaaaatgt tgacattcaa cccacacaag 1140 aggattgaag tagaacaggc tctggcccac ccatatctgg agcagtatta cgacccgagt 1200 gacgagccca tcgccgaagc accattcaag ttcgacatgg aattggatga cttgcctaag 1260 gaaaagctca aagaactaat ttttgaagag actgctagat tccagccagg atacagatct 1320 taaatttgtc aggtacctgg agtttaatac agtgagctct agcaagggag gcgctgcctt 1380 ttgtttctag aatattatgt tcctcaaggt ccattatttt gtattctttt ccaagctcct 1440 tattggaagg tattttttta aatttagaat taaaaattat ttagaaagtt acatataaa 1499 <210> 87 <211> 332 <212> PRT <213> Homo sapiens <400> 87 Met Gly Ala Gln Phe Ser Lys Thr Ala Ala Lys Gly Glu Ala Ala Ala 1 5 10 15 Glu Arg Pro Gly Glu Ala Ala Val Ala Ser Ser Pro Ser Lys Ala Asn 20 25 30 Gly Gln Glu Asn Gly His Val Lys Val Asn Gly Asp Ala Ser Pro Ala 35 40 45 Ala Ala Glu Ser Gly Ala Lys Glu Glu Leu Gln Ala Asn Gly Ser Ala 50 55 60 Pro Ala Ala Asp Lys Glu Glu Pro Ala Ala Ala Gly Ser Gly Ala Ala 65 70 75 80 Ser Pro Ser Ala Ala Glu Lys Gly Glu Pro Ala Ala Ala Ala Ala Pro 85 90 95 Glu Ala Gly Ala Ser Pro Val Glu Lys Glu Ala Pro Ala Glu Gly Glu 100 105 110 Ala Ala Glu Pro Gly Ser Pro Thr Ala Ala Glu Gly Glu Ala Ala Ser 115 120 125 Ala Ala Ser Ser Thr Ser Ser Pro Lys Ala Glu Asp Gly Ala Thr Pro 130 135 140 Ser Pro Ser Asn Glu Thr Pro Lys Lys Lys Lys Lys Arg Phe Ser Phe 145 150 155 160 Lys Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys 165 170 175 Glu Ala Gly Glu Gly Gly Glu Ala Glu Ala Pro Ala Ala Glu Gly Gly 180 185 190 Lys Asp Glu Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala Glu Ala Gly 195 200 205 Ala Ala Ser Gly Glu Gln Ala Ala Ala Pro Gly Glu Glu Ala Ala Ala 210 215 220 Gly Glu Glu Gly Ala Ala Gly Gly Asp Pro Gln Glu Ala Lys Pro Gln 225 230 235 240 Glu Ala Ala Val Ala Pro Glu Lys Pro Pro Ala Ser Asp Glu Thr Lys 245 250 255 Ala Ala Glu Glu Pro Ser Lys Val Glu Glu Lys Lys Ala Glu Glu Ala 260 265 270 Gly Ala Ser Ala Ala Ala Cys Glu Ala Pro Ser Ala Ala Gly Pro Gly 275 280 285 Ala Pro Pro Glu Gln Glu Ala Ala Pro Ala Glu Glu Pro Ala Ala Ala 290 295 300 Ala Ala Ser Ser Ala Cys Ala Ala Pro Ser Gln Glu Ala Gln Pro Glu 305 310 315 320 Cys Ser Pro Glu Ala Pro Pro Ala Glu Ala Ala Glu 325 330 <210> 88 <211> 4304 <212> DNA <213> Homo sapiens <400> 88 cttgggcgtt ggaccccgca tcttattagc aaccagggag atttctccat tttcctcttg 60 tctacagtgc ggctacaaat ctgggatttt tttattactt cttttttttt cgaactacac 120 ttgggctcct ttttttgtgc tcgacttttc cacccttttt ccctccctcc tgtgctgctg 180 ctttttgatc tcttcgacta aaattttttt atccggagtg tatttaatcg gttctgttct 240 gtcctctcca ccacccccac ccccctccct ccggtgtgtg tgccgctgcc gctgttgccg 300 ccgccgctgc tgctgctcgc cccgtcgtta caccaacccg aggctctttg tttcccctct 360 tggatctgtt gagtttcttt gttgaagaag ccagcatggg tgcccagttc tccaagaccg 420 cagcgaaggg agaagccgcc gcggagaggc ctggggaggc ggctgtggcc tcgtcgcctt 480 ccaaagcgaa cggacaggag aatggccacg tgaaggtaaa cggcgacgct tcgcccgcgg 540 ccgccgagtc gggcgccaag gaggagctgc aggccaacgg cagcgccccg gccgccgaca 600 aggaggagcc cgcggccgcc gggagcgggg cggcgtcgcc ctccgcggcc gagaaaggtg 660 agccggccgc cgccgctgcc cccgaggccg gggccagccc ggtagagaag gaggcccccg 720 cggaaggcga ggctgccgag cccggctcgc ccacggccgc ggagggagag gccgcgtcgg 780 ccgcctcctc gacttcttcg cccaaggccg aggacggggc cacgccctcg cccagcaacg 840 agaccccgaa aaaaaaaaag aagcgctttt ccttcaagaa gtctttcaag ctgagcggct 900 tctccttcaa gaagaacaag aaggaggctg gagaaggcgg tgaggctgag gcgcccgctg 960 ccgaaggcgg caaggacgag gccgccgggg gcgcagctgc ggccgccgcc gaggcgggcg 1020 cggcctccgg ggagcaggca gcggcgccgg gcgaggaggc ggcagcgggc gaggaggggg 1080 cggcgggtgg cgacccgcag gaggccaagc cccaggaggc cgctgtcgcg ccagagaagc 1140 cgcccgccag cgacgagacc aaggccgccg aggagcccag caaggtggag gagaaaaagg 1200 ccgaggaggc cggggccagc gccgccgcct gcgaggcccc ctccgccgcc gggcccggcg 1260 cgcccccgga gcaggaggca gcccccgcgg aggagcccgc ggccgccgca gcctcgtcag 1320 cctgcgcagc cccctcacag gaggcccagc ccgagtgcag tccagaagcc cccccagcgg 1380 aggcggcaga gtaaaagagc aagcttttgt gagataatcg aagaactttt ctcccccgtt 1440 tgtttgttgg agtggtgcca ggtactggtt ttggagaact tgtctacaac cagggattga 1500 ttttaaagat gtcttttttt attttacttt tttttaagca ccaaattttg ttgttttttt 1560 tttttctccc ctccccacag atcccatctc aaatcattct gttaaccacc attccaacag 1620 gtcgaggaga gcttaaacac cttcttcctc tgccttgttt ctcttttatt ttttattttt 1680 tcgcatcagt attaatgttt ttgcatactt tgcatcttta ttcaaaagtg taaactttct 1740 ttgtcaatct atggacatgc ccatatatga aggagatggg tgggtcaaaa agggatatca 1800 aatgaagtga taggggtcac aatggggaaa ttgaagtggt gcataacatt gccaaaatag 1860 tgtgccacta gaaatggtgt aaaggctgtc tttttttttt ttttttaaag aaaagttatt 1920 accatgtatt ttgtgaggca ggtttacaac actacaagtc ttgagttaag aaggaaagag 1980 gaaaaaagaa aaaacaccaa tacccagatt taaaaaaaaa aaaacgatca tagtcttagg 2040 agttcattta aaccatagga acttttcact tatctcatgt tagctgtacc agtcagtgat 2100 taagtagaac tacaagttgt ataggcttta ttgtttattg ctggtttatg accttaataa 2160 agtgtaatta tgtattacca gcagggtgtt tttaactgtg actattgtat aaaaacaaat 2220 cttgatatcc agaagcacat gaagtttgca actttccacc ctgcccattt ttgtaaaact 2280 gcagtcatct tggacctttt aaaacacaaa ttttaaactc aaccaagctg tgataagtgg 2340 aatggttact gtttatactg tggtatgttt ttgattacag cagataatgc tttcttttcc 2400 agtcgtcttt gagaataaag gaaaaaaaaa tcttcagatg caatggtttt gtgtagcatc 2460 ttgtctatca tgttttgtaa atactggaga agctttgacc aatttgactt agagatggaa 2520 tgtaactttg cttacaaaaa ttgctattaa actcctgctt aaggtgttct aattttctgt 2580 gagcacacta aaagcgaaaa ataaatgtga ataaaatgta caaatttgtt gtgttttttt 2640 atgttctaat aatactgaga cttctaggtc ttaggttaat ttttaggaag atcttgcatg 2700 ccatcaggag taaattttat tgtggttctt aatctgaagt tttcaagctc tgaaattcat 2760 aatccgcagt gtcagattac gtagaggaag atcttacaac attccatgtc aaatctgtta 2820 ccatttattg gcatttagtt ttcatttaag aattgaacat aattattttt attgtagcta 2880 tatagcatgt cagattaaat catttacaac aaaaggggtg tgaacctaag actatttaaa 2940 tgtcttatga gaaaatttca taaagccatt ctcttgtcat tcaggtccag aaacaaattt 3000 taaactgagt gagagtctat agaatccata ctgcagatgg gtcatgaaat gtgaccaaat 3060 gtgtttcaaa aattgatggt gtattacctg ctattgtaat tgcttagtgc ttggctaatt 3120 tccaaattat tgcataatat gttctacctt aagaaaacag gtttatgtaa caaagtaatg 3180 gtgttgaatg gatgatgtca gttcatgggc ctttagcata gttttaagca tcattttttt 3240 tttttttttt gaaagtgtgt tagcatcttg ttactcaaag gataagacag acaataatac 3300 ttcactgaat attaataatc tttactagtt tacctcctct gctctttgcc acccgataac 3360 tggatatctt ttccttcaaa ggaccctaaa ctgattgaaa tttaagatat gtatcaaaaa 3420 cattatttca tttaatgcac atctgttttg ctgtttttga gcagtgtgca gtttagggtt 3480 catgataaat cattgaacca catgtgtaac aactgaatgc caaatcttaa actcattaga 3540 aaaataacaa attaggtttt gacacgcatt cttaattgga ataatggatc aaaaatagtg 3600 gttcatgacc ttaccaaaca cccttgctac taataaaatc aaataacact tagaagggta 3660 tgtattttta gttagggttt cttgatcttg gaggatgttt gaaagttaaa aattgaattt 3720 ggtaaccaaa ggactgattt atgggtcttt cctatcttaa ccaacgtttt cttagttacc 3780 tagatggcca agtacagtgc ctggtatgta gtaagactca gtaaaaaagt ggatttttaa 3840 aaataactcc caaagtgaat agtcaaaaat cctgttagca aactgttata tattgctaag 3900 tttgttcttt taacagctgg aatttattaa gatgcattat tttgatttta ttcactgcct 3960 aaaacacttt gggtggtatt gatggagttg gtggattttc ctccaagtga ttaaatgaaa 4020 tttgacgtat cttttcatcc aaagttttgt acatcatgtt ttctaacgga aaaaaatgtt 4080 aatatggctt ttttgtatta ctaaaaatag ctttgagatt aaggaaaaat aaataactct 4140 tgtacagttc agtattgtct attaaatctg tattggcagt atgtataatg gcatttgctg 4200 tggttacaaa atacttcctc tgggttataa taatcatttg atccaattcc tattgcttgt 4260 aaaataaagt tttaccagtt gatataatca aaaaaaaaaa aaaa 4304 <210> 89 <211> 152 <212> PRT <213> Homo sapiens <400> 89 Met Ala Asn Cys Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Gly Leu Lys Phe Met Gln Ala Ser Glu Asp Leu Leu 35 40 45 Lys Glu His Tyr Val Asp Leu Lys Asp Arg Pro Phe Phe Ala Gly Leu 50 55 60 Val Lys Tyr Met His Ser Gly Pro Val Val Ala Met Val Trp Glu Gly 65 70 75 80 Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro 85 90 95 Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val 100 105 110 Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Glu Ser Ala Glu Lys 115 120 125 Glu Ile Gly Leu Trp Phe His Pro Glu Glu Leu Val Asp Tyr Thr Ser 130 135 140 Cys Ala Gln Asn Trp Ile Tyr Glu 145 150 <210> 90 <211> 811 <212> DNA <213> Homo sapiens <400> 90 gcagaagcgt tccgtgcgtg caagtgctgc gaaccacgtg ggtcccgggc gcgtttcggg 60 tgctggcggc tgcagccgga gttcaaacct aagcagctgg aaggaaccat ggccaactgt 120 gagcgtacct tcattgcgat caaaccagat ggggtccagc ggggtcttgt gggagagatt 180 atcaagcgtt ttgagcagaa aggattccgc cttgttggtc tgaaattcat gcaagcttcc 240 gaagatcttc tcaaggaaca ctacgttgac ctgaaggacc gtccattctt tgccggcctg 300 gtgaaataca tgcactcagg gccggtagtt gccatggtct gggaggggct gaatgtggtg 360 aagacgggcc gagtcatgct cggggagacc aaccctgcag actccaagcc tgggaccatc 420 cgtggagact tctgcataca agttggcagg aacattatac atggcagtga ttctgtggag 480 agtgcagaga aggagatcgg cttgtggttt caccctgagg aactggtaga ttacacgagc 540 tgtgctcaga actggatcta tgaatgacag gagggcagac cacattgctt ttcacatcca 600 tttcccctcc ttcccatggg cagaggacca ggctgtagga aatctagtta tttacaggaa 660 cttcatcata atttggaggg aagctcttgg agctgtgagt tctccctgta cagtgttacc 720 atccccgacc atctgattaa aatgcttcct cccagcatag gattcattga gttggttact 780 tcatattgtt gcattgcttt tttttccttc t 811 <210> 91 <211> 177 <212> PRT <213> Homo sapiens <400> 91 Met Val Leu Leu Ser Thr Leu Gly Ile Val Phe Gln Gly Glu Gly Pro 1 5 10 15 Pro Ile Ser Ser Cys Asp Thr Gly Thr Met Ala Asn Cys Glu Arg Thr 20 25 30 Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly Leu Val Gly Glu 35 40 45 Ile Ile Lys Arg Phe Glu Gln Lys Gly Phe Arg Leu Val Gly Leu Lys 50 55 60 Phe Met Gln Ala Ser Glu Asp Leu Leu Lys Glu His Tyr Val Asp Leu 65 70 75 80 Lys Asp Arg Pro Phe Phe Ala Gly Leu Val Lys Tyr Met His Ser Gly 85 90 95 Pro Val Val Ala Met Val Trp Glu Gly Leu Asn Val Val Lys Thr Gly 100 105 110 Arg Val Met Leu Gly Glu Thr Asn Pro Ala Asp Ser Lys Pro Gly Thr 115 120 125 Ile Arg Gly Asp Phe Cys Ile Gln Val Gly Arg Asn Ile Ile His Gly 130 135 140 Ser Asp Ser Val Glu Ser Ala Glu Lys Glu Ile Gly Leu Trp Phe His 145 150 155 160 Pro Glu Glu Leu Val Asp Tyr Thr Ser Cys Ala Gln Asn Trp Ile Tyr 165 170 175 Glu <210> 92 <211> 1031 <212> DNA <213> Homo sapiens <400> 92 gcagaagcgt tccgtgcgtg caagtgctgc gaaccacgtg ggtcccgggc gcgtttcggg 60 tgctggcggc tgcagccgga gttcaaacct aagcagctgg aagggccctg tggctaggta 120 ccatagagtc tctacacagg actaagtcag cctggtgtgc aggggaggca gacacacaaa 180 cagaaaattg gactacagtg ctaagatgct gtaagaagag gttaactaaa ggacaggaag 240 atggggccaa gagatggtgc tactgtctac tttagggatc gtctttcaag gcgaggggcc 300 tcctatctca agctgtgata caggaaccat ggccaactgt gagcgtacct tcattgcgat 360 caaaccagat ggggtccagc ggggtcttgt gggagagatt atcaagcgtt ttgagcagaa 420 aggattccgc cttgttggtc tgaaattcat gcaagcttcc gaagatcttc tcaaggaaca 480 ctacgttgac ctgaaggacc gtccattctt tgccggcctg gtgaaataca tgcactcagg 540 gccggtagtt gccatggtct gggaggggct gaatgtggtg aagacgggcc gagtcatgct 600 cggggagacc aaccctgcag actccaagcc tgggaccatc cgtggagact tctgcataca 660 agttggcagg aacattatac atggcagtga ttctgtggag agtgcagaga aggagatcgg 720 cttgtggttt caccctgagg aactggtaga ttacacgagc tgtgctcaga actggatcta 780 tgaatgacag gagggcagac cacattgctt ttcacatcca tttcccctcc ttcccatggg 840 cagaggacca ggctgtagga aatctagtta tttacaggaa cttcatcata atttggaggg 900 aagctcttgg agctgtgagt tctccctgta cagtgttacc atccccgacc atctgattaa 960 aatgcttcct cccagcatag gattcattga gttggttact tcatattgtt gcattgcttt 1020 tttttccttc t 1031 <210> 93 <211> 152 <212> PRT <213> Homo sapiens <400> 93 Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu 35 40 45 Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu 50 55 60 Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly 65 70 75 80 Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro 85 90 95 Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val 100 105 110 Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys 115 120 125 Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser 130 135 140 Cys Ala His Asp Trp Val Tyr Glu 145 150 <210> 94 <211> 867 <212> DNA <213> Homo sapiens <400> 94 atctcagggc agtaccactg ctgtgcggct gtcagtcagt gctgcaggcg ccgagaggag 60 gggcttgtga ccgccccagg gaagctgggc atcaccaaag ggagcttgtt tgccagggac 120 actgcaagta ggaagtgtct acaggtcgat gacaggccta atctctatga cagggtctag 180 actttcctca gggtccaggg gcgcacctca gggtgaactg gaaaactcga ccgcacttta 240 gtgccaggac catggccaac ctggagcgca ccttcatcgc catcaagccg gacggcgtgc 300 agcgcggcct ggtgggcgag atcatcaagc gcttcgagca gaagggattc cgcctcgtgg 360 ccatgaagtt cctccgggcc tctgaagaac acctgaagca gcactacatt gacctgaaag 420 accgaccatt cttccctggg ctggtgaagt acatgaactc agggccggtt gtggccatgg 480 tctgggaggg gctgaacgtg gtgaagacag gccgagtgat gcttggggag accaatccag 540 cagattcaaa gccaggcacc attcgtgggg acttctgcat tcaggttggc aggaacatca 600 ttcatggcag tgattcagta aaaagtgctg aaaaagaaat cagcctatgg tttaagcctg 660 aagaactggt tgactacaag tcttgtgctc atgactgggt ctatgaataa gaggtggaca 720 caacagcagt ctccttcagc acggcgtggt gtgtccctgg acacagctct tcattccatt 780 gacttagagg caacaggatt gatcattctt ttatagagca tatttgccaa taaagctttt 840 ggaagccgga aaaaaaaaaa aaaaaaa 867 <210> 95 <211> 152 <212> PRT <213> Homo sapiens <400> 95 Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu 35 40 45 Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu 50 55 60 Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly 65 70 75 80 Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro 85 90 95 Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val 100 105 110 Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys 115 120 125 Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser 130 135 140 Cys Ala His Asp Trp Val Tyr Glu 145 150 <210> 96 <211> 763 <212> DNA <213> Homo sapiens <400> 96 gcggccgcgc gtggtggggg aggagggacc ggcggcgccc acgtggcctc cgcgggcccc 60 gccagagcct gcgcccgggc cctgaccgca cctctcgccc cgcaggacca tggccaacct 120 ggagcgcacc ttcatcgcca tcaagccgga cggcgtgcag cgcggcctgg tgggcgagat 180 catcaagcgc ttcgagcaga agggattccg cctcgtggcc atgaagttcc tccgggcctc 240 tgaagaacac ctgaagcagc actacattga cctgaaagac cgaccattct tccctgggct 300 ggtgaagtac atgaactcag ggccggttgt ggccatggtc tgggaggggc tgaacgtggt 360 gaagacaggc cgagtgatgc ttggggagac caatccagca gattcaaagc caggcaccat 420 tcgtggggac ttctgcattc aggttggcag gaacatcatt catggcagtg attcagtaaa 480 aagtgctgaa aaagaaatca gcctatggtt taagcctgaa gaactggttg actacaagtc 540 ttgtgctcat gactgggtct atgaataaga ggtggacaca acagcagtct ccttcagcac 600 ggcgtggtgt gtccctggac acagctcttc attccattga cttagaggca acaggattga 660 tcattctttt atagagcata tttgccaata aagcttttgg aagccggaaa aaaaaaaaaa 720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 763 <210> 97 <211> 152 <212> PRT <213> Homo sapiens <400> 97 Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu 35 40 45 Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu 50 55 60 Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly 65 70 75 80 Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro 85 90 95 Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val 100 105 110 Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys 115 120 125 Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser 130 135 140 Cys Ala His Asp Trp Val Tyr Glu 145 150 <210> 98 <211> 682 <212> DNA <213> Homo sapiens <400> 98 aggcggtggg ggcgcatccc ctggcgactc ctcccgttcc ctcttccgct tgcgctgccg 60 caggaccatg gccaacctgg agcgcacctt catcgccatc aagccggacg gcgtgcagcg 120 cggcctggtg ggcgagatca tcaagcgctt cgagcagaag ggattccgcc tcgtggccat 180 gaagttcctc cgggcctctg aagaacacct gaagcagcac tacattgacc tgaaagaccg 240 accattcttc cctgggctgg tgaagtacat gaactcaggg ccggttgtgg ccatggtctg 300 ggaggggctg aacgtggtga agacaggccg agtgatgctt ggggagacca atccagcaga 360 ttcaaagcca ggcaccattc gtggggactt ctgcattcag gttggcagga acatcattca 420 tggcagtgat tcagtaaaaa gtgctgaaaa agaaatcagc ctatggttta agcctgaaga 480 actggttgac tacaagtctt gtgctcatga ctgggtctat gaataagagg tggacacaac 540 agcagtctcc ttcagcacgg cgtggtgtgt ccctggacac agctcttcat tccattgact 600 tagaggcaac aggattgatc attcttttat agagcatatt tgccaataaa gcttttggaa 660 gccggaaaaa aaaaaaaaaa aa 682 <210> 99 <211> 82 <212> PRT <213> Homo sapiens <400> 99 Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu 35 40 45 Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu 50 55 60 Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Glu His His Ser 65 70 75 80 Trp Gln <210> 100 <211> 733 <212> DNA <213> Homo sapiens <400> 100 tgcctggcga gggcgcgccc cggctgggcg tggacactgt tctccggccg cgtcgggccg 60 ggcgggtggg gcgttcctgc gggttgggcg gctgggccct ccggggtgtg gccaccccgc 120 gctccgccct gcgcccctcc tccgccgccg gctcccgggt gtggtggtcg caccagctct 180 ctgctctccc agcgcagcgc cgccgcccgg cccctccagc ttcccggacc atggccaacc 240 tggagcgcac cttcatcgcc atcaagccgg acggcgtgca gcgcggcctg gtgggcgaga 300 tcatcaagcg cttcgagcag aagggattcc gcctcgtggc catgaagttc ctccgggcct 360 ctgaagaaca cctgaagcag cactacattg acctgaaaga ccgaccattc ttccctgggc 420 tggtgaagta catgaactca gggccggttg tggccatgga acatcattca tggcagtgat 480 tcagtaaaaa gtgctgaaaa agaaatcagc ctatggttta agcctgaaga actggttgac 540 tacaagtctt gtgctcatga ctgggtctat gaataagagg tggacacaac agcagtctcc 600 ttcagcacgg cgtggtgtgt ccctggacac agctcttcat tccattgact tagaggcaac 660 aggattgatc attcttttat agagcatatt tgccaataaa gcttttggaa gccggaaaaa 720 aaaaaaaaaa aaa 733 <210> 101 <211> 152 <212> PRT <213> Homo sapiens <400> 101 Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val 1 5 10 15 Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly 20 25 30 Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu 35 40 45 Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu 50 55 60 Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly 65 70 75 80 Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro 85 90 95 Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val 100 105 110 Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys 115 120 125 Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser 130 135 140 Cys Ala His Asp Trp Val Tyr Glu 145 150 <210> 102 <211> 846 <212> DNA <213> Homo sapiens <400> 102 tgcctggcga gggcgcgccc cggctgggcg tggacactgt tctccggccg cgtcgggccg 60 ggcgggtggg gcgttcctgc gggttgggcg gctgggccct ccggggtgtg gccaccccgc 120 gctccgccct gcgcccctcc tccgccgccg gctcccgggt gtggtggtcg caccagctct 180 ctgctctccc agcgcagcgc cgccgcccgg cccctccagc ttcccggacc atggccaacc 240 tggagcgcac cttcatcgcc atcaagccgg acggcgtgca gcgcggcctg gtgggcgaga 300 tcatcaagcg cttcgagcag aagggattcc gcctcgtggc catgaagttc ctccgggcct 360 ctgaagaaca cctgaagcag cactacattg acctgaaaga ccgaccattc ttccctgggc 420 tggtgaagta catgaactca gggccggttg tggccatggt ctgggagggg ctgaacgtgg 480 tgaagacagg ccgagtgatg cttggggaga ccaatccagc agattcaaag ccaggcacca 540 ttcgtgggga cttctgcatt caggttggca ggaacatcat tcatggcagt gattcagtaa 600 aaagtgctga aaaagaaatc agcctatggt ttaagcctga agaactggtt gactacaagt 660 cttgtgctca tgactgggtc tatgaataag aggtggacac aacagcagtc tccttcagca 720 cggcgtggtg tgtccctgga cacagctctt cattccattg acttagaggc aacaggattg 780 atcattcttt tatagagcat atttgccaat aaagcttttg gaagccggaa aaaaaaaaaa 840 aaaaaa 846 <210> 103 <211> 417 <212> PRT <213> Homo sapiens <400> 103 Met Ser Leu Ser Asn Lys Leu Thr Leu Asp Lys Leu Asp Val Lys Gly 1 5 10 15 Lys Arg Val Val Met Arg Val Asp Phe Asn Val Pro Met Lys Asn Asn 20 25 30 Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ala Val Pro Ser Ile Lys 35 40 45 Phe Cys Leu Asp Asn Gly Ala Lys Ser Val Val Leu Met Ser His Leu 50 55 60 Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Glu Pro 65 70 75 80 Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu 85 90 95 Lys Asp Cys Val Gly Pro Glu Val Glu Lys Ala Cys Ala Asn Pro Ala 100 105 110 Ala Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu 115 120 125 Glu Gly Lys Gly Lys Asp Ala Ser Gly Asn Lys Val Lys Ala Glu Pro 130 135 140 Ala Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val 145 150 155 160 Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met 165 170 175 Val Gly Val Asn Leu Pro Gln Lys Ala Gly Gly Phe Leu Met Lys Lys 180 185 190 Glu Leu Asn Tyr Phe Ala Lys Ala Leu Glu Ser Pro Glu Arg Pro Phe 195 200 205 Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile 210 215 220 Asn Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met 225 230 235 240 Ala Phe Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Thr Ser 245 250 255 Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Leu Met Ser Lys 260 265 270 Ala Glu Lys Asn Gly Val Lys Ile Thr Leu Pro Val Asp Phe Val Thr 275 280 285 Ala Asp Lys Phe Asp Glu Asn Ala Lys Thr Gly Gln Ala Thr Val Ala 290 295 300 Ser Gly Ile Pro Ala Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser 305 310 315 320 Ser Lys Lys Tyr Ala Glu Ala Val Thr Arg Ala Lys Gln Ile Val Trp 325 330 335 Asn Gly Pro Val Gly Val Phe Glu Trp Glu Ala Phe Ala Arg Gly Thr 340 345 350 Lys Ala Leu Met Asp Glu Val Val Lys Ala Thr Ser Arg Gly Cys Ile 355 360 365 Thr Ile Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn 370 375 380 Thr Glu Asp Lys Val Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu 385 390 395 400 Glu Leu Leu Glu Gly Lys Val Leu Pro Gly Val Asp Ala Leu Ser Asn 405 410 415 Ile <210> 104 <211> 2439 <212> DNA <213> Homo sapiens <400> 104 gagagcagcg gccgggaagg ggcggtgcgg gaggcggggt gtggggcggt agtgtgggcc 60 ctgttcctgc ccgcgcggtg ttccgcattc tgcaagcctc cggagcgcac gtcggcagtc 120 ggctccctcg ttgaccgaat caccgacctc tctccccagc tgtatttcca aaatgtcgct 180 ttctaacaag ctgacgctgg acaagctgga cgttaaaggg aagcgggtcg ttatgagagt 240 cgacttcaat gttcctatga agaacaacca gataacaaac aaccagagga ttaaggctgc 300 tgtcccaagc atcaaattct gcttggacaa tggagccaag tcggtagtcc ttatgagcca 360 cctaggccgg cctgatggtg tgcccatgcc tgacaagtac tccttagagc cagttgctgt 420 agaactcaaa tctctgctgg gcaaggatgt tctgttcttg aaggactgtg taggcccaga 480 agtggagaaa gcctgtgcca acccagctgc tgggtctgtc atcctgctgg agaacctccg 540 ctttcatgtg gaggaagaag ggaagggaaa agatgcttct gggaacaagg ttaaagccga 600 gccagccaaa atagaagctt tccgagcttc actttccaag ctaggggatg tctatgtcaa 660 tgatgctttt ggcactgctc acagagccca cagctccatg gtaggagtca atctgccaca 720 gaaggctggt gggtttttga tgaagaagga gctgaactac tttgcaaagg ccttggagag 780 cccagagcga cccttcctgg ccatcctggg cggagctaaa gttgcagaca agatccagct 840 catcaataat atgctggaca aagtcaatga gatgattatt ggtggtggaa tggcttttac 900 cttccttaag gtgctcaaca acatggagat tggcacttct ctgtttgatg aagagggagc 960 caagattgtc aaagacctaa tgtccaaagc tgagaagaat ggtgtgaaga ttaccttgcc 1020 tgttgacttt gtcactgctg acaagtttga tgagaatgcc aagactggcc aagccactgt 1080 ggcttctggc atacctgctg gctggatggg cttggactgt ggtcctgaaa gcagcaagaa 1140 gtatgctgag gctgtcactc gggctaagca gattgtgtgg aatggtcctg tgggggtatt 1200 tgaatgggaa gcttttgccc ggggaaccaa agctctcatg gatgaggtgg tgaaagccac 1260 ttctaggggc tgcatcacca tcataggtgg tggagacact gccacttgct gtgccaaatg 1320 gaacacggag gataaagtca gccatgtgag cactgggggt ggtgccagtt tggagctcct 1380 ggaaggtaaa gtccttcctg gggtggatgc tctcagcaat atttagtact ttcctgcctt 1440 ttagttcctg tgcacagccc ctaagtcaac ttagcatttt ctgcatctcc acttggcatt 1500 agctaaaacc ttccatgtca agattcagct agtggccaag agatgcagtg ccaggaaccc 1560 ttaaacagtt gcacagcatc tcagctcatc ttcactgcac cctggatttg catacattct 1620 tcaagatccc atttgaattt tttagtgact aaaccattgt gcattctaga gtgcatatat 1680 ttatattttg cctgttaaaa agaaagtgag cagtgttagc ttagttctct tttgatgtag 1740 gttattatga ttagctttgt cactgtttca ctactcagca tggaaacaag atgaaattcc 1800 atttgtaggt agtgagacaa aattgatgat ccattaagta aacaataaaa gtgtccattg 1860 aaaccgtgat tttttttttt ttcctgtcat actttgttag gaagggtgag aatagaatct 1920 tgaggaacgg atcagatgtc tatattgctg aatgcaagaa gtggggcagc agcagtggag 1980 agatgggaca attagataaa tgtccattct ttatcaaggg cctactttat ggcagacatt 2040 gtgctagtgc ttttattcta acttttattt ttatcagtta cacatgatca taatttaaaa 2100 agtcaaggct tataacaaaa aagccccagc ccattcctcc cattcaagat tcccactccc 2160 cagaggtgac cactttcaac tcttgagttt ttcaggtata tacctccatg tttctaagta 2220 atatgcttat attgttcact tctttttttt ttatttttta aagaaatcta tttcatacca 2280 tggaggaagg ctctgttcca catatatttc cacttcttca ttctctcggt atagttttgt 2340 cacaattata gattagatca aaagtctaca taactaatac agctgagcta tgtagtatgc 2400 tatgattaaa tttacttatg taaaaaaaaa aaaaaaaaa 2439 <210> 105 <211> 417 <212> PRT <213> Homo sapiens <400> 105 Met Ser Leu Ser Lys Lys Leu Thr Leu Asp Lys Leu Asp Val Arg Gly 1 5 10 15 Lys Arg Val Ile Met Arg Val Asp Phe Asn Val Pro Met Lys Lys Asn 20 25 30 Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ser Ile Pro Ser Ile Lys 35 40 45 Tyr Cys Leu Asp Asn Gly Ala Lys Ala Val Val Leu Met Ser His Leu 50 55 60 Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Ala Pro 65 70 75 80 Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu 85 90 95 Lys Asp Cys Val Gly Ala Glu Val Glu Lys Ala Cys Ala Asn Pro Ala 100 105 110 Pro Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu 115 120 125 Glu Gly Lys Gly Gln Asp Pro Ser Gly Lys Lys Ile Lys Ala Glu Pro 130 135 140 Asp Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val 145 150 155 160 Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met 165 170 175 Val Gly Val Asn Leu Pro His Lys Ala Ser Gly Phe Leu Met Lys Lys 180 185 190 Glu Leu Asp Tyr Phe Ala Lys Ala Leu Glu Asn Pro Val Arg Pro Phe 195 200 205 Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile 210 215 220 Lys Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met 225 230 235 240 Ala Tyr Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Ala Ser 245 250 255 Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Ile Met Ala Lys 260 265 270 Ala Gln Lys Asn Gly Val Arg Ile Thr Phe Pro Val Asp Phe Val Thr 275 280 285 Gly Asp Lys Phe Asp Glu Asn Ala Gln Val Gly Lys Ala Thr Val Ala 290 295 300 Ser Gly Ile Ser Pro Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser 305 310 315 320 Asn Lys Asn His Ala Gln Val Val Ala Gln Ala Arg Leu Ile Val Trp 325 330 335 Asn Gly Pro Leu Gly Val Phe Glu Trp Asp Ala Phe Ala Lys Gly Thr 340 345 350 Lys Ala Leu Met Asp Glu Ile Val Lys Ala Thr Ser Lys Gly Cys Ile 355 360 365 Thr Val Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn 370 375 380 Thr Glu Asp Lys Val Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu 385 390 395 400 Glu Leu Leu Glu Gly Lys Ile Leu Pro Gly Val Glu Ala Leu Ser Asn 405 410 415 Met <210> 106 <211> 1721 <212> DNA <213> Homo sapiens <400> 106 aacagtggcc gttgtgctgg agacagtgag gagaagaaag gggcgggaca agggcaaagg 60 cgttagaagt caccaccgac ccagcccctc aacagcaagt tggttcttca gcattaagat 120 ccaggtgtca gcctatgtct ttatattgtc aagatgtctc tttctaagaa gttgacttta 180 gacaaactgg atgttagagg gaagcgagtc atcatgagag tagacttcaa tgttcccatg 240 aagaagaacc agattacaaa caaccagagg atcaaggctt ccatcccaag catcaagtac 300 tgcctggaca atggagccaa ggcagtagtt cttatgagtc atctaggtcg gcctgatggt 360 gttcccatgc ctgacaaata ttccttagca cctgttgctg ttgagctcaa atccttgctg 420 ggcaaggatg ttctgttcct gaaggactgt gtaggcgcag aagtggagaa agcctgtgcc 480 aacccagctc ctggttcagt catcctgctg gagaacctgc gctttcatgt ggaggaagaa 540 gggaagggcc aagatccctc tggaaagaag attaaagctg agccagataa aatagaagcc 600 ttccgagcat cactttccaa gctaggggac gtctatgtca atgatgcttt tggcactgca 660 caccgcgctc atagttccat ggtgggagtg aatctgcccc ataaagcatc cggattcttg 720 atgaagaagg aactagatta ctttgctaaa gccttggaaa acccagtgag accctttctg 780 gctatacttg gtggagccaa agtggcagac aagatccaac ttatcaaaaa tatgctggac 840 aaagtcaatg agatgattat tggtggtgga atggcttata ccttccttaa ggtactcaac 900 aacatggaga ttggtgcttc cctgtttgat gaagagggag ccaagatcgt taaagatatc 960 atggccaaag cacaaaagaa tggtgtaagg attacttttc ctgttgattt tgttactggg 1020 gacaagtttg acgagaacgc tcaggttgga aaagccactg tagcatctgg catatctcct 1080 ggctggatgg gtttggactg tggtcctgag agcaacaaga atcatgctca agttgtggct 1140 caagcaaggc taattgtttg gaatgggccg ttaggagtat ttgaatggga tgcctttgct 1200 aagggaacca aagccctcat ggatgaaatt gtgaaagcca cttccaaggg ctgcatcact 1260 gttatagggg gtggagacac tgctacttgc tgtgccaaat ggaacactga agataaagtc 1320 agccatgtca gcactggagg cggtgccagt ctagagcttc tggaaggtaa aatccttcct 1380 ggagtagagg ccctcagcaa catgtagtta atatagtgtt acttccttct gttttctgtc 1440 catggccctt aagtcagctt aatgctttta catctcgatg tgacttttgt taaaatctac 1500 tcctagatca agacctatgt aatggacaag cagcaggcca tcaggaactc ttaatatcag 1560 cacagcaatt cattttagtt tggtcacgca tttgcctgtt caagttctca tttgaacttc 1620 accattgtgc tatctaggga ggacatattc ttaagttgcc tattaaagaa agtgagctga 1680 agaaactgaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1721 <210> 107 <211> 207 <212> PRT <213> Homo sapiens <400> 107 Met Thr Ser Arg Lys Lys Val Leu Leu Lys Val Ile Ile Leu Gly Asp 1 5 10 15 Ser Gly Val Gly Lys Thr Ser Leu Met Asn Gln Tyr Val Asn Lys Lys 20 25 30 Phe Ser Asn Gln Tyr Lys Ala Thr Ile Gly Ala Asp Phe Leu Thr Lys 35 40 45 Glu Val Met Val Asp Asp Arg Leu Val Thr Met Gln Ile Trp Asp Thr 50 55 60 Ala Gly Gln Glu Arg Phe Gln Ser Leu Gly Val Ala Phe Tyr Arg Gly 65 70 75 80 Ala Asp Cys Cys Val Leu Val Phe Asp Val Thr Ala Pro Asn Thr Phe 85 90 95 Lys Thr Leu Asp Ser Trp Arg Asp Glu Phe Leu Ile Gln Ala Ser Pro 100 105 110 Arg Asp Pro Glu Asn Phe Pro Phe Val Val Leu Gly Asn Lys Ile Asp 115 120 125 Leu Glu Asn Arg Gln Val Ala Thr Lys Arg Ala Gln Ala Trp Cys Tyr 130 135 140 Ser Lys Asn Asn Ile Pro Tyr Phe Glu Thr Ser Ala Lys Glu Ala Ile 145 150 155 160 Asn Val Glu Gln Ala Phe Gln Thr Ile Ala Arg Asn Ala Leu Lys Gln 165 170 175 Glu Thr Glu Val Glu Leu Tyr Asn Glu Phe Pro Glu Pro Ile Lys Leu 180 185 190 Asp Lys Asn Asp Arg Ala Lys Ala Ser Ala Glu Ser Cys Ser Cys 195 200 205 <210> 108 <211> 2240 <212> DNA <213> Homo sapiens <400> 108 acttccgctc ggggcggcgg cggtggcgga agtgggagcg ggcctggagt cttggccata 60 aagcctgagg cggcggcagc ggcggagttg gcggcttgga gagctcggga gagttccctg 120 gaaccagaac ttggaccttc tcgcttctgt cctccgttta gtctcctcct cggcgggagc 180 cctcgcgacg cgcccggccc ggagccccca gcgcagcggc cgcgtttgaa ggatgacctc 240 taggaagaaa gtgttgctga aggttatcat cctgggagat tctggagtcg ggaagacatc 300 actcatgaac cagtatgtga ataagaaatt cagcaatcag tacaaagcca caataggagc 360 tgactttctg accaaggagg tgatggtgga tgacaggcta gtcacaatgc agatatggga 420 cacagcagga caggaacggt tccagtctct cggtgtggcc ttctacagag gtgcagactg 480 ctgcgttctg gtatttgatg tgactgcccc caacacattc aaaaccctag atagctggag 540 agatgagttt ctcatccagg ccagtccccg agatcctgaa aacttcccat ttgttgtgtt 600 gggaaacaag attgacctcg aaaacagaca agtggccaca aagcgggcac aggcctggtg 660 ctacagcaaa aacaacattc cctactttga gaccagtgcc aaggaggcca tcaacgtgga 720 gcaggcgttc cagacgattg cacggaatgc acttaagcag gaaacggagg tggagctgta 780 caacgaattt cctgaaccta tcaaactgga caagaatgac cgggccaagg cctcggcaga 840 aagctgcagt tgctgagggg gcagtgagag ttgagcacag agtccttcac aaaccaagaa 900 cacacgtagg ccttcaacac aattcccctc tcctcttcca aacaaaacat acattgatct 960 ctcacatcca gctgccaaaa gaaaacccca tcaaacacag ttacacccca catatctctc 1020 acacacacac acacacgcac acacacacac acagatctga cgtaatcaaa ctccagccct 1080 tgcccgtgat ggctccttgg ggtctgcctg cccacccaca tgagcccgcg agtatggcag 1140 caggacaagc cagcggtgga agtcattctg atatggagtt ggcattggaa gcttattctt 1200 tttgttcact ggagagagag agaactgttt acagttaatc tgtgtctaat tatctgattt 1260 tttttattgg tcttgtggtc tttttacccc ccctttcccc tccctccttg aaggctaccc 1320 cttgggaagg ctggtgcccc atgccccatt acaggctcac acccagtctg atcaggctga 1380 gttttgtatg tatctatctg ttaatgcttg ttacttttaa ctaatcagat ctttttacag 1440 tatccattta ttatgtaatg cttcttagaa aagaatctta tagtacatgt taatatatgc 1500 aaccaattaa aatgtataaa ttagtgtaag aaattcttgg attatgtgtt taagtcctgt 1560 aatgcaggcc tgtaaggtgg agggttgaac cctgtttgga ttgcagagtg ttactcagaa 1620 ttgggaaatc cagctagcgg cagtattctg tacagtagac acaagaatta tgtacgcctt 1680 ttatcaaaga cttaagagcc aaaaagcttt tcatctctcc agggggaaaa ctgtctagtt 1740 cccttctgtg tctaaatttt ccaaaacgtt gatttgcata atacagtggt atgtgcaatg 1800 gataaattgc cgttatttca aaaattaaaa ttctcatttt ctttcttttt tttcccccct 1860 gctccacact tcaaaactcc cgttagatca gcattctact acaagagtga aaggaaaacc 1920 ctaacagatc tgtcctagtg attttacctt tgttctagaa ggcgctcctt tcagggttgt 1980 ggtattctta ggttagcgga gctttttcct cttttcccca cccatctccc caatattgcc 2040 cattattaat taacctcttt ctttggttgg aaccctggca gttctgctcc cttcctagga 2100 tctgcccctg cattgtagct tgcttaacgg agcacttctc ctttttccaa aggtctacat 2160 tctagggtgt gggctgagtt cttctgtaaa gagatgaacg caatgccaat aaaattgaac 2220 aagaacaatg ataaaaaaaa 2240 <210> 109 <211> 184 <212> PRT <213> Homo sapiens <400> 109 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 110 <211> 985 <212> DNA <213> Homo sapiens <400> 110 cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60 agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggg ttgactggat 120 tggtgaggcc cgtgtggcta cttctgtgga agcagtgctg tagttactgg aagataaaag 180 ggaaagcaag cccttggtgg gggaaagtat ggctgcgatg atggcatttc ttaggacacc 240 tttggattaa taatgaaaac aactactctc tgagcagctg ttcgaatcat ctgatattta 300 tactgaatga gttactgtaa gtacgtattg acagaattac actgtacttt cctctaggtg 360 atctgtgaaa atggttcgct attcacttga cccggagaac cccacgaaat catgcaaatc 420 aagaggttcc aatcttcgtg ttcactttaa gaacactcgt gaaactgctc aggccatcaa 480 gggtatgcat atacgaaaag ccacgaagta tctgaaagat gtcactttac agaaacagtg 540 tgtaccattc cgacgttaca atggtggagt tggcaggtgt gcgcaggcca agcaatgggg 600 ctggacacaa ggtcggtggc ccaaaaagag tgctgaattt ttgctgcaca tgcttaaaaa 660 cgcagagagt aatgctgaac ttaagggttt agatgtagat tctctggtca ttgagcatat 720 ccaagtgaac aaagcaccta agatgcgccg ccggacctac agagctcatg gtcggattaa 780 cccatacatg agctctccct gccacattga gatgatcctt acggaaaagg aacagattgt 840 tcctaaacca gaagaggagg ttgcccagaa gaaaaagata tcccagaaga aactgaagaa 900 acaaaaactt atggcacggg agtaaattca gcattaaaat aaatgtaatt aaaaggaaaa 960 gaaaaaaaaa aaaaaaaaaa aaaaa 985 <210> 111 <211> 184 <212> PRT <213> Homo sapiens <400> 111 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 112 <211> 736 <212> DNA <213> Homo sapiens <400> 112 cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60 agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggt gatctgtgaa 120 aatggttcgc tattcacttg acccggagaa ccccacgaaa tcatgcaaat caagaggttc 180 caatcttcgt gttcacttta agaacactcg tgaaactgct caggccatca agggtatgca 240 tatacgaaaa gccacgaagt atctgaaaga tgtcacttta cagaaacagt gtgtaccatt 300 ccgacgttac aatggtggag ttggcaggtg tgcgcaggcc aagcaatggg gctggacaca 360 aggtcggtgg cccaaaaaga gtgctgaatt tttgctgcac atgcttaaaa acgcagagag 420 taatgctgaa cttaagggtt tagatgtaga ttctctggtc attgagcata tccaagtgaa 480 caaagcacct aagatgcgcc gccggaccta cagagctcat ggtcggatta acccatacat 540 gagctctccc tgccacattg agatgatcct tacggaaaag gaacagattg ttcctaaacc 600 agaagaggag gttgcccaga agaaaaagat atcccagaag aaactgaaga aacaaaaact 660 tatggcacgg gagtaaattc agcattaaaa taaatgtaat taaaaggaaa agaaaaaaaa 720 aaaaaaaaaa aaaaaa 736 <210> 113 <211> 184 <212> PRT <213> Homo sapiens <400> 113 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 114 <211> 834 <212> DNA <213> Homo sapiens <400> 114 cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60 agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggg ttgactggat 120 tggtgaggcc cgtgtggcta cttctgtgga agcagtgctg tagttactgg aagataaaag 180 ggaaagcaag cccttggtgg gggaaagtga tctgtgaaaa tggttcgcta ttcacttgac 240 ccggagaacc ccacgaaatc atgcaaatca agaggttcca atcttcgtgt tcactttaag 300 aacactcgtg aaactgctca ggccatcaag ggtatgcata tacgaaaagc cacgaagtat 360 ctgaaagatg tcactttaca gaaacagtgt gtaccattcc gacgttacaa tggtggagtt 420 ggcaggtgtg cgcaggccaa gcaatggggc tggacacaag gtcggtggcc caaaaagagt 480 gctgaatttt tgctgcacat gcttaaaaac gcagagagta atgctgaact taagggttta 540 gatgtagatt ctctggtcat tgagcatatc caagtgaaca aagcacctaa gatgcgccgc 600 cggacctaca gagctcatgg tcggattaac ccatacatga gctctccctg ccacattgag 660 atgatcctta cggaaaagga acagattgtt cctaaaccag aagaggaggt tgcccagaag 720 aaaaagatat cccagaagaa actgaagaaa caaaaactta tggcacggga gtaaattcag 780 cattaaaata aatgtaatta aaaggaaaag aaaaaaaaaa aaaaaaaaaa aaaa 834 <210> 115 <211> 184 <212> PRT <213> Homo sapiens <400> 115 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 116 <211> 835 <212> DNA <213> Homo sapiens <400> 116 gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60 catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120 aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180 gggagccggg gtcagtcggc ctctgaggtg atctgtgaaa atggttcgct attcacttga 240 cccggagaac cccacgaaat catgcaaatc aagaggttcc aatcttcgtg ttcactttaa 300 gaacactcgt gaaactgctc aggccatcaa gggtatgcat atacgaaaag ccacgaagta 360 tctgaaagat gtcactttac agaaacagtg tgtaccattc cgacgttaca atggtggagt 420 tggcaggtgt gcgcaggcca agcaatgggg ctggacacaa ggtcggtggc ccaaaaagag 480 tgctgaattt ttgctgcaca tgcttaaaaa cgcagagagt aatgctgaac ttaagggttt 540 agatgtagat tctctggtca ttgagcatat ccaagtgaac aaagcaccta agatgcgccg 600 ccggacctac agagctcatg gtcggattaa cccatacatg agctctccct gccacattga 660 gatgatcctt acggaaaagg aacagattgt tcctaaacca gaagaggagg ttgcccagaa 720 gaaaaagata tcccagaaga aactgaagaa acaaaaactt atggcacggg agtaaattca 780 gcattaaaat aaatgtaatt aaaaggaaaa gaaaaaaaaa aaaaaaaaaa aaaaa 835 <210> 117 <211> 184 <212> PRT <213> Homo sapiens <400> 117 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 118 <211> 933 <212> DNA <213> Homo sapiens <400> 118 gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60 catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120 aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180 gggagccggg gtcagtcggc ctctgagggt tgactggatt ggtgaggccc gtgtggctac 240 ttctgtggaa gcagtgctgt agttactgga agataaaagg gaaagcaagc ccttggtggg 300 ggaaagtgat ctgtgaaaat ggttcgctat tcacttgacc cggagaaccc cacgaaatca 360 tgcaaatcaa gaggttccaa tcttcgtgtt cactttaaga acactcgtga aactgctcag 420 gccatcaagg gtatgcatat acgaaaagcc acgaagtatc tgaaagatgt cactttacag 480 aaacagtgtg taccattccg acgttacaat ggtggagttg gcaggtgtgc gcaggccaag 540 caatggggct ggacacaagg tcggtggccc aaaaagagtg ctgaattttt gctgcacatg 600 cttaaaaacg cagagagtaa tgctgaactt aagggtttag atgtagattc tctggtcatt 660 gagcatatcc aagtgaacaa agcacctaag atgcgccgcc ggacctacag agctcatggt 720 cggattaacc catacatgag ctctccctgc cacattgaga tgatccttac ggaaaaggaa 780 cagattgttc ctaaaccaga agaggaggtt gcccagaaga aaaagatatc ccagaagaaa 840 ctgaagaaac aaaaacttat ggcacgggag taaattcagc attaaaataa atgtaattaa 900 aaggaaaaga aaaaaaaaaa aaaaaaaaaa aaa 933 <210> 119 <211> 184 <212> PRT <213> Homo sapiens <400> 119 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 120 <211> 916 <212> DNA <213> Homo sapiens <400> 120 gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60 catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120 aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180 gggagccggg ggttgactgg attggtgagg cccgtgtggc tacttctgtg gaagcagtgc 240 tgtagttact ggaagataaa agggaaagca agcccttggt gggggaaagt gatctgtgaa 300 aatggttcgc tattcacttg acccggagaa ccccacgaaa tcatgcaaat caagaggttc 360 caatcttcgt gttcacttta agaacactcg tgaaactgct caggccatca agggtatgca 420 tatacgaaaa gccacgaagt atctgaaaga tgtcacttta cagaaacagt gtgtaccatt 480 ccgacgttac aatggtggag ttggcaggtg tgcgcaggcc aagcaatggg gctggacaca 540 aggtcggtgg cccaaaaaga gtgctgaatt tttgctgcac atgcttaaaa acgcagagag 600 taatgctgaa cttaagggtt tagatgtaga ttctctggtc attgagcata tccaagtgaa 660 caaagcacct aagatgcgcc gccggaccta cagagctcat ggtcggatta acccatacat 720 gagctctccc tgccacattg agatgatcct tacggaaaag gaacagattg ttcctaaacc 780 agaagaggag gttgcccaga agaaaaagat atcccagaag aaactgaaga aacaaaaact 840 tatggcacgg gagtaaattc agcattaaaa taaatgtaat taaaaggaaa agaaaaaaaa 900 aaaaaaaaaa aaaaaa 916 <210> 121 <211> 184 <212> PRT <213> Homo sapiens <400> 121 Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys 1 5 10 15 Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr 20 25 30 Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu 35 40 45 Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn 50 55 60 Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln 65 70 75 80 Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys 85 90 95 Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu 100 105 110 Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg 115 120 125 Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys 130 135 140 His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro 145 150 155 160 Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys 165 170 175 Lys Gln Lys Leu Met Ala Arg Glu 180 <210> 122 <211> 818 <212> DNA <213> Homo sapiens <400> 122 gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60 catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120 aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180 gggagccggg gtgatctgtg aaaatggttc gctattcact tgacccggag aaccccacga 240 aatcatgcaa atcaagaggt tccaatcttc gtgttcactt taagaacact cgtgaaactg 300 ctcaggccat caagggtatg catatacgaa aagccacgaa gtatctgaaa gatgtcactt 360 tacagaaaca gtgtgtacca ttccgacgtt acaatggtgg agttggcagg tgtgcgcagg 420 ccaagcaatg gggctggaca caaggtcggt ggcccaaaaa gagtgctgaa tttttgctgc 480 acatgcttaa aaacgcagag agtaatgctg aacttaaggg tttagatgta gattctctgg 540 tcattgagca tatccaagtg aacaaagcac ctaagatgcg ccgccggacc tacagagctc 600 atggtcggat taacccatac atgagctctc cctgccacat tgagatgatc cttacggaaa 660 aggaacagat tgttcctaaa ccagaagagg aggttgccca gaagaaaaag atatcccaga 720 agaaactgaa gaaacaaaaa cttatggcac gggagtaaat tcagcattaa aataaatgta 780 attaaaagga aaagaaaaaa aaaaaaaaaa aaaaaaaa 818 <210> 123 <211> 146 <212> PRT <213> Homo sapiens <400> 123 Met His Ile Arg Lys Ala Thr Lys Tyr Leu Lys Asp Val Thr Leu Gln 1 5 10 15 Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn Gly Gly Val Gly Arg Cys 20 25 30 Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln Gly Arg Trp Pro Lys Lys 35 40 45 Ser Ala Glu Phe Leu Leu His Met Leu Lys Asn Ala Glu Ser Asn Ala 50 55 60 Glu Leu Lys Gly Leu Asp Val Asp Ser Leu Val Ile Glu His Ile Gln 65 70 75 80 Val Asn Lys Ala Pro Lys Met Arg Arg Arg Thr Tyr Arg Ala His Gly 85 90 95 Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys His Ile Glu Met Ile Leu 100 105 110 Thr Glu Lys Glu Gln Ile Val Pro Lys Pro Glu Glu Glu Val Ala Gln 115 120 125 Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys Lys Gln Lys Leu Met Ala 130 135 140 Arg Glu 145 <210> 124 <211> 695 <212> DNA <213> Homo sapiens <400> 124 cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60 agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggt gatctgtgaa 120 aatggttcgc tattcacttg acccggagaa ccccacgaaa taacactcgt gaaactgctc 180 aggccatcaa gggtatgcat atacgaaaag ccacgaagta tctgaaagat gtcactttac 240 agaaacagtg tgtaccattc cgacgttaca atggtggagt tggcaggtgt gcgcaggcca 300 agcaatgggg ctggacacaa ggtcggtggc ccaaaaagag tgctgaattt ttgctgcaca 360 tgcttaaaaa cgcagagagt aatgctgaac ttaagggttt agatgtagat tctctggtca 420 ttgagcatat ccaagtgaac aaagcaccta agatgcgccg ccggacctac agagctcatg 480 gtcggattaa cccatacatg agctctccct gccacattga gatgatcctt acggaaaagg 540 aacagattgt tcctaaacca gaagaggagg ttgcccagaa gaaaaagata tcccagaaga 600 aactgaagaa acaaaaactt atggcacggg agtaaattca gcattaaaat aaatgtaatt 660 aaaaggaaaa gaaaaaaaaa aaaaaaaaaa aaaaa 695 <210> 125 <211> 137 <212> PRT <213> Homo sapiens <400> 125 Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe 1 5 10 15 Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu 20 25 30 Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr 35 40 45 Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile 50 55 60 Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr 65 70 75 80 Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met 85 90 95 Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Ala Ala Ile Arg 100 105 110 Arg Ala Ser Ala Ile Leu Arg Ser Gln Lys Pro Val Met Val Lys Arg 115 120 125 Lys Arg Thr Arg Pro Thr Lys Ser Ser 130 135 <210> 126 <211> 4245 <212> DNA <213> Homo sapiens <400> 126 ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60 tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120 actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180 aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240 agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300 cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360 cgcatggcag ccatccgcag ggccagcgcc atcctgcgca gccagaagcc tgtgatggtg 420 aagaggaagc ggacccgccc caccaagagc tcctgagccc cctgccccca gagcaataaa 480 gtcagctggc tttctcacct gcctcgactg ggcctccctt tttgaaacgc tctggggagc 540 tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa ctctgcatgt caccttgtcc 600 atctggaggt gatgtcaatg gctggccatg caggaggggt ggggtagctg ccttgtccct 660 ggtgagggca agggtcactg tcttcacaga aaaagtttgc tgacttgtga ttgagaccta 720 ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg cagtggcttc cattcagaag 780 aagaaaggcc ttttctagcc cagaagggtg caggctgagg gctgggccct gggccctggt 840 gctgtagcac ggtttgggga cttggggtgt tcccaagacc tgggggacga cagacatcac 900 gggaggaaga tgagatgact tttgcatcca gggagtgggt gcagccacat ttggagggga 960 tgggctttac ttgatgcaac ctcatctctg agatgggcaa cttggtgggt ggtggcttat 1020 aactgtaagg gagatggcag ccccagggta cagccagcag gcattgagca gccttagcat 1080 tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc cctgtctctt tgagctggct 1140 cttgtcactt aggtctcatc tcagtggccg ctcctgggcc accctgtcac ccaagctttc 1200 ctgattgccc agccctcttg tttcctttgg cctgtttgct ccctagtgtt tattacagct 1260 tgtgaggcca ggagtttgag accatcctag gcaacataat gagacaccgt ctctaaaata 1320 aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag ctcctcagag gttgagtaga 1380 ggctgaggtg agcggagcac ttgagccaag agtatgaggc tgcagtgagc ccatgagccc 1440 caccactaca ctccagcctg gaagacacca tgacacacag tgaggcctgg atggggaaag 1500 agtcctgctg ttgatcctca catgtttcct gggcacctaa ctctgtcagc cactgccagg 1560 gaccaaggat ccagcatcca tggcacccct ggttcctgcc atcctggggt acccgattca 1620 aagaaggact ctgctccctg tctgagacca cccccggctc tgactgagag taaggggact 1680 gtcagggcct cgacttgcca ttggttgggg tcgtacgggg ctgggagccc tgcgttttga 1740 ggcagaccac tgcccttccg acctcagtcc tgtctgctcc agtcttgccc agctcgaagg 1800 agagcagatc tgaccacttg ccagcccctg tctgctgtga attaccattt cctttgtcct 1860 tcccttagtt gggtctatta gctcagattg agaggtgttg ccttaaaact gagttgggtg 1920 acttggtacc tgctcaggac cccccgcact gtcccaatcc cactcaggcc cacctccagc 1980 tggcctcact ccgctggtga cttcgtacct gctcaggagc ccccactgtc ccagtcccac 2040 tcaggcccat ctctggctgg cctcactgcg ctgggactcc gccttcataa ggagagctca 2100 ctgctcacgt tagtagatgg ccccttctcg tgaggcctct cccctggcac ctgcttcagt 2160 tgtcctccac agcactgatt tgcagcccac aagctggcag gtttatctgt ctcatgtttg 2220 tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc atataatgag atgcttgatg 2280 aatggtgcat attgaatgta taaagcccac cggtcctgag agtttgctca ctggagactt 2340 tctggagatg gagtctcgct ctgttgccca ggctggcgag tgcaatggcg cgatcttggc 2400 tcactgcagc ctccacctcc tgggttcaag cgattctcct gcctcagcct cccgagtagc 2460 tgggattaca ggtgggtgtc accacaccca gctcagtatt gtatttttag cagagatggg 2520 gtttcaccat tttgcccagg ctggtttgga actcctgact tcaaattacc cacctgcctc 2580 agcctcccaa agtgctggca ttacaggcgc tcgaggcttt ctgatgtggc tgctgctgct 2640 cagaaggcct tgtccttaac cacctccttg cctgccctgg aggcttgtgc ctctaggccc 2700 caccccctgt ggagtcctgc tggctttctc catccctatc tgaatcctcc ctgctgtgtg 2760 gcctcccctg gtctcatccg taacacagcc cagcttagtg ggcctctgtt cctgcgggtg 2820 gccagcctgt ctgtgtggct gggctgggga ggccacgtct ggtatctgaa tgctatcggt 2880 gggttggggt ggaggaacca ggagagggct ggagggaggg agatggtctc agccccacag 2940 agtttggagt cctcagtgtg ctgagcaaac gtggagacac catttccctc ctctagacct 3000 catcttggag agagagatgt tggatggggc catctattcc agctttattc acacaaatca 3060 tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa aacatgatat taagaaaaca 3120 ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca aaattgggag aacaaaagaa 3180 aagcgtcttg tcacatacag aaggtccctg ataaagttag tagctgccct catcagaaac 3240 caggcccagg cagtggggac acatccagag tgctgaaaga acctccccca ggtcatccta 3300 tccccaagag tgatgcccgg cagcattccc agctcagggc taatggttca cggaagccag 3360 gaatcaaact gcctgggttc cagtcccagc tctgccagtt atgcccagct gtggggactt 3420 gggcagctcg tttagtagca ccgtgcctca gtttcccata tgtaaaaggc cattttgagt 3480 gcctttcaca gccctgcata aggcaggtgt ctcagtgttc actgctgtct ctccagctct 3540 tagtccagta gctgcatggt gagtgagcgt agggcgcacc ctggaaggct gccaagccca 3600 aagttgtgca gagcgctggg gactccagac tccccacagc agcagagact cgggactgag 3660 gcatcctctg ttcacaggac atgctggcat ctactgggtc agggctctgc tgctcggtgg 3720 ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct tcgtaccctc atctgtaaca 3780 tgcgtgtcga tagaccctac tactcagggt tgatgagaag attaaatgtg caaaacctgc 3840 ttgactgtgc ccacaaatcc tgattgtagg aataaattaa tgacttttta taaatatttt 3900 gatcagatgg actcatgatc acagatgtct tcacatgcct atgactaatt tgtacacaaa 3960 ctaatgctcg tgtttcccaa gcacctggaa gacatgccag atccatgtgc agtaatgcct 4020 ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga gctttcccag cctcctgccc 4080 gtgtttgtga atatcattct gtcctcagct gcatttccag cccaggctgt ttggcgctgc 4140 ccaggaatgg tatcaattcc cctgtttctc ttgtagccag ttactagaat aaaatcatct 4200 actttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 4245 <210> 127 <211> 163 <212> PRT <213> Homo sapiens <400> 127 Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe 1 5 10 15 Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu 20 25 30 Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr 35 40 45 Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile 50 55 60 Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr 65 70 75 80 Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met 85 90 95 Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Val Ser Trp Gly 100 105 110 Leu Gly Ile Arg Leu Gly Glu Thr Gly Gln Cys Cys Gly Glu Gly Pro 115 120 125 Pro Thr Thr Gly Cys Asn Met Gly Trp Arg Gly Met Asp Ser Cys Phe 130 135 140 Gln Pro Thr Pro His Thr Gln His Trp Pro Arg Gly Arg Leu Val Glu 145 150 155 160 Cys Met Gly <210> 128 <211> 4439 <212> DNA <213> Homo sapiens <400> 128 ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60 tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120 actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180 aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240 agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300 cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360 cgcatggtga gctggggttt ggggatcagg cttggggaga ctggccagtg ctgtggggaa 420 gggcctccca ctactggttg caatatgggc tggagaggga tggattcttg ctttcagcct 480 actccccaca cccagcattg gcctaggggg cggcttgtgg agtgtatggg ctgagccttg 540 ctctgctccc ccgcccccag gcagccatcc gcagggccag cgccatcctg cgcagccaga 600 agcctgtgat ggtgaagagg aagcggaccc gccccaccaa gagctcctga gccccctgcc 660 cccagagcaa taaagtcagc tggctttctc acctgcctcg actgggcctc cctttttgaa 720 acgctctggg gagctctggc cctgtgtgtt gtcattcagg ccatgtcatc aaaactctgc 780 atgtcacctt gtccatctgg aggtgatgtc aatggctggc catgcaggag gggtggggta 840 gctgccttgt ccctggtgag ggcaagggtc actgtcttca cagaaaaagt ttgctgactt 900 gtgattgaga cctactgtcc cattgtgagg tggcctgaag aatcccagct ggggcagtgg 960 cttccattca gaagaagaaa ggccttttct agcccagaag ggtgcaggct gagggctggg 1020 ccctgggccc tggtgctgta gcacggtttg gggacttggg gtgttcccaa gacctggggg 1080 acgacagaca tcacgggagg aagatgagat gacttttgca tccagggagt gggtgcagcc 1140 acatttggag gggatgggct ttacttgatg caacctcatc tctgagatgg gcaacttggt 1200 gggtggtggc ttataactgt aagggagatg gcagccccag ggtacagcca gcaggcattg 1260 agcagcctta gcattgtccc cctactcccg tcctccaggt gtccccatcc ctcccctgtc 1320 tctttgagct ggctcttgtc acttaggtct catctcagtg gccgctcctg ggccaccctg 1380 tcacccaagc tttcctgatt gcccagccct cttgtttcct ttggcctgtt tgctccctag 1440 tgtttattac agcttgtgag gccaggagtt tgagaccatc ctaggcaaca taatgagaca 1500 ccgtctctaa aataaaatta gctgggtgtg gtggtgcacc gcctgtggtc ccagctcctc 1560 agaggttgag tagaggctga ggtgagcgga gcacttgagc caagagtatg aggctgcagt 1620 gagcccatga gccccaccac tacactccag cctggaagac accatgacac acagtgaggc 1680 ctggatgggg aaagagtcct gctgttgatc ctcacatgtt tcctgggcac ctaactctgt 1740 cagccactgc cagggaccaa ggatccagca tccatggcac ccctggttcc tgccatcctg 1800 gggtacccga ttcaaagaag gactctgctc cctgtctgag accacccccg gctctgactg 1860 agagtaaggg gactgtcagg gcctcgactt gccattggtt ggggtcgtac ggggctggga 1920 gccctgcgtt ttgaggcaga ccactgccct tccgacctca gtcctgtctg ctccagtctt 1980 gcccagctcg aaggagagca gatctgacca cttgccagcc cctgtctgct gtgaattacc 2040 atttcctttg tccttccctt agttgggtct attagctcag attgagaggt gttgccttaa 2100 aactgagttg ggtgacttgg tacctgctca ggaccccccg cactgtccca atcccactca 2160 ggcccacctc cagctggcct cactccgctg gtgacttcgt acctgctcag gagcccccac 2220 tgtcccagtc ccactcaggc ccatctctgg ctggcctcac tgcgctggga ctccgccttc 2280 ataaggagag ctcactgctc acgttagtag atggcccctt ctcgtgaggc ctctcccctg 2340 gcacctgctt cagttgtcct ccacagcact gatttgcagc ccacaagctg gcaggtttat 2400 ctgtctcatg tttgtcttgt gctggtgggc aaggggtttg tctagcacac cagcatataa 2460 tgagatgctt gatgaatggt gcatattgaa tgtataaagc ccaccggtcc tgagagtttg 2520 ctcactggag actttctgga gatggagtct cgctctgttg cccaggctgg cgagtgcaat 2580 ggcgcgatct tggctcactg cagcctccac ctcctgggtt caagcgattc tcctgcctca 2640 gcctcccgag tagctgggat tacaggtggg tgtcaccaca cccagctcag tattgtattt 2700 ttagcagaga tggggtttca ccattttgcc caggctggtt tggaactcct gacttcaaat 2760 tacccacctg cctcagcctc ccaaagtgct ggcattacag gcgctcgagg ctttctgatg 2820 tggctgctgc tgctcagaag gccttgtcct taaccacctc cttgcctgcc ctggaggctt 2880 gtgcctctag gccccacccc ctgtggagtc ctgctggctt tctccatccc tatctgaatc 2940 ctccctgctg tgtggcctcc cctggtctca tccgtaacac agcccagctt agtgggcctc 3000 tgttcctgcg ggtggccagc ctgtctgtgt ggctgggctg gggaggccac gtctggtatc 3060 tgaatgctat cggtgggttg gggtggagga accaggagag ggctggaggg agggagatgg 3120 tctcagcccc acagagtttg gagtcctcag tgtgctgagc aaacgtggag acaccatttc 3180 cctcctctag acctcatctt ggagagagag atgttggatg gggccatcta ttccagcttt 3240 attcacacaa atcatgtctg ttggcctgga aattggaaaa ccagttaaac caaaaacatg 3300 atattaagaa aacaggcagg ctcaccatag taaaaatgct gaaagccaaa gacaaaattg 3360 ggagaacaaa agaaaagcgt cttgtcacat acagaaggtc cctgataaag ttagtagctg 3420 ccctcatcag aaaccaggcc caggcagtgg ggacacatcc agagtgctga aagaacctcc 3480 cccaggtcat cctatcccca agagtgatgc ccggcagcat tcccagctca gggctaatgg 3540 ttcacggaag ccaggaatca aactgcctgg gttccagtcc cagctctgcc agttatgccc 3600 agctgtgggg acttgggcag ctcgtttagt agcaccgtgc ctcagtttcc catatgtaaa 3660 aggccatttt gagtgccttt cacagccctg cataaggcag gtgtctcagt gttcactgct 3720 gtctctccag ctcttagtcc agtagctgca tggtgagtga gcgtagggcg caccctggaa 3780 ggctgccaag cccaaagttg tgcagagcgc tggggactcc agactcccca cagcagcaga 3840 gactcgggac tgaggcatcc tctgttcaca ggacatgctg gcatctactg ggtcagggct 3900 ctgctgctcg gtggctgtgc aaccttgggc aagttcctca acctctctgt gtcttcgtac 3960 cctcatctgt aacatgcgtg tcgatagacc ctactactca gggttgatga gaagattaaa 4020 tgtgcaaaac ctgcttgact gtgcccacaa atcctgattg taggaataaa ttaatgactt 4080 tttataaata ttttgatcag atggactcat gatcacagat gtcttcacat gcctatgact 4140 aatttgtaca caaactaatg ctcgtgtttc ccaagcacct ggaagacatg ccagatccat 4200 gtgcagtaat gcctggtggc tccaggtctg ccccgccgtc ctgtggggct gtgagctttc 4260 ccagcctcct gcccgtgttt gtgaatatca ttctgtcctc agctgcattt ccagcccagg 4320 ctgtttggcg ctgcccagga atggtatcaa ttcccctgtt tctcttgtag ccagttacta 4380 gaataaaatc atctacttta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4439 <210> 129 <211> 169 <212> PRT <213> Homo sapiens <400> 129 Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe 1 5 10 15 Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu 20 25 30 Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr 35 40 45 Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile 50 55 60 Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr 65 70 75 80 Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met 85 90 95 Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Asp Met Leu Ala 100 105 110 Ser Thr Gly Ser Gly Leu Cys Cys Ser Val Ala Val Gln Pro Trp Ala 115 120 125 Ser Ser Ser Thr Ser Leu Cys Leu Arg Thr Leu Ile Cys Asn Met Arg 130 135 140 Val Asp Arg Pro Tyr Tyr Ser Gly Leu Met Arg Arg Leu Asn Val Gln 145 150 155 160 Asn Leu Leu Asp Cys Ala His Lys Ser 165 <210> 130 <211> 934 <212> DNA <213> Homo sapiens <400> 130 ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60 tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120 actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180 aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240 agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300 cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360 cgcatggaca tgctggcatc tactgggtca gggctctgct gctcggtggc tgtgcaacct 420 tgggcaagtt cctcaacctc tctgtgtctt cgtaccctca tctgtaacat gcgtgtcgat 480 agaccctact actcagggtt gatgagaaga ttaaatgtgc aaaacctgct tgactgtgcc 540 cacaaatcct gattgtagga ataaattaat gactttttat aaatattttg atcagatgga 600 ctcatgatca cagatgtctt cacatgccta tgactaattt gtacacaaac taatgctcgt 660 gtttcccaag cacctggaag acatgccaga tccatgtgca gtaatgcctg gtggctccag 720 gtctgccccg ccgtcctgtg gggctgtgag ctttcccagc ctcctgcccg tgtttgtgaa 780 tatcattctg tcctcagctg catttccagc ccaggctgtt tggcgctgcc caggaatggt 840 atcaattccc ctgtttctct tgtagccagt tactagaata aaatcatcta ctttaaaaaa 900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 934 <210> 131 <211> 87 <212> PRT <213> Homo sapiens <400> 131 Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe 1 5 10 15 Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu 20 25 30 Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr 35 40 45 Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile 50 55 60 Lys Arg Arg Ser Gly Glu Phe Cys Leu Val Trp Ala Arg Glu Arg Pro 65 70 75 80 Leu Ser Arg Val Trp Glu Leu 85 <210> 132 <211> 594 <212> DNA <213> Homo sapiens <400> 132 ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60 tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120 actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180 aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240 agatccggtg agttttgtct ggtttgggcc agagagcggc ccctttcccg ggtctgggag 300 ctgtgatttt ttactgtcag gcaggaagag cggtaactgc catcgcggcg ggcatccctg 360 gcgccagggt gttggtctgg gtaccggctt ccctctcggc cgacttgtca gctctgtgag 420 ccgcgcgcgt ctgagcccgt gtcctcacct gtaaagtgga gaaatgaaaa aggacctgaa 480 cttcctcggt ggttgttgag agttaaggca cggggttgat gttttcagat gaaattctca 540 aagcaagtca gggtggggat ggatggtttc atcccacagg tgggaagatt gagg 594 <210> 133 <211> 69 <212> PRT <213> Homo sapiens <400> 133 Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe 1 5 10 15 Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu 20 25 30 Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr 35 40 45 Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile 50 55 60 Lys Arg Arg Ser Glu 65 <210> 134 <211> 682 <212> DNA <213> Homo sapiens <400> 134 ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60 tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120 actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180 aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240 agatccgagt gagtttttct caggtccttg attggaactg cctcagagcc aagggtcctt 300 ttactcagtg gcagcaacaa acgcagtctg ttggctagtg atcctcctgt ctcagggaca 360 cgtagtccag ggagcagcca attgcttggc acttggggac cccgttctgg ggagtcctga 420 aagctttcac ctcttggatt gccgaataca tgggtggccc ttcctagact aagggactgg 480 cctgagtgag gctgggcctc tcagccaagc tgatgttgaa ccactgctgt ggggatgggc 540 ctggggttcc tgggaagctg ttcataccca ttgccaggag cgtgggctct ggctggacct 600 ggatcagatc ctaactgaag cggcagcttt ctggcatgag aaaggagtgt tttcatggtg 660 gacagaattg ggctatgagt gt 682 <210> 135 <211> 204 <212> PRT <213> Homo sapiens <400> 135 Met Thr Glu Trp Glu Thr Ala Ala Pro Ala Val Ala Glu Thr Pro Asp 1 5 10 15 Ile Lys Leu Phe Gly Lys Trp Ser Thr Asp Asp Val Gln Ile Asn Asp 20 25 30 Ile Ser Leu Gln Asp Tyr Ile Ala Val Lys Glu Lys Tyr Ala Lys Tyr 35 40 45 Leu Pro His Ser Ala Gly Arg Tyr Ala Ala Lys Arg Phe Arg Lys Ala 50 55 60 Gln Cys Pro Ile Val Glu Arg Leu Thr Asn Ser Met Met Met His Gly 65 70 75 80 Arg Asn Asn Gly Lys Lys Leu Met Thr Val Arg Ile Val Lys His Ala 85 90 95 Phe Glu Ile Ile His Leu Leu Thr Gly Glu Asn Pro Leu Gln Val Leu 100 105 110 Val Asn Ala Ile Ile Asn Ser Gly Pro Arg Glu Asp Ser Thr Arg Ile 115 120 125 Gly Arg Ala Gly Thr Val Arg Arg Gln Ala Val Asp Val Ser Pro Leu 130 135 140 Arg Arg Val Asn Gln Ala Ile Trp Leu Leu Cys Thr Gly Ala Arg Glu 145 150 155 160 Ala Ala Phe Arg Asn Ile Lys Thr Ile Ala Glu Cys Leu Ala Asp Glu 165 170 175 Leu Ile Asn Ala Ala Lys Gly Ser Ser Asn Ser Tyr Ala Ile Lys Lys 180 185 190 Lys Asp Glu Leu Glu Arg Val Ala Lys Ser Asn Arg 195 200 <210> 136 <211> 755 <212> DNA <213> Homo sapiens <400> 136 ctcttcctgt ctgtaccagg gcggcgcgtg gtctacgccg agtgacagag acgctcaggc 60 tgtgttctca ggatgaccga gtgggagaca gcagcaccag cggtggcaga gaccccagac 120 atcaagctct ttgggaagtg gagcaccgat gatgtgcaga tcaatgacat ttccctgcag 180 gattacattg cagtgaagga gaagtatgcc aagtacctgc ctcacagtgc agggcggtat 240 gccgccaaac gcttccgcaa agctcagtgt cccattgtgg agcgcctcac taactccatg 300 atgatgcacg gccgcaacaa cggcaagaag ctcatgactg tgcgcatcgt caagcatgcc 360 ttcgagatca tacacctgct cacaggcgag aaccctctgc aggtcctggt gaacgccatc 420 atcaacagtg gtccccggga ggactccaca cgcattgggc gcgccgggac tgtgagacga 480 caggctgtgg atgtgtcccc cctgcgccgt gtgaaccagg ccatctggct gctgtgcaca 540 ggcgctcgtg aggctgcctt ccggaacatt aagaccattg ctgagtgcct ggcagatgag 600 ctcatcaatg ctgccaaggg ctcctcgaac tcctatgcca ttaagaagaa ggacgagctg 660 gagcgtgtgg ccaagtccaa ccgctgattt tcccagctgc tgcccaataa acctgtctgc 720 cctttggggc agtcccagcc aaaaaaaaaa aaaaa 755 <210> 137 <211> 249 <212> PRT <213> Homo sapiens <400> 137 Met Lys Leu Asn Ile Ser Phe Pro Ala Thr Gly Cys Gln Lys Leu Ile 1 5 10 15 Glu Val Asp Asp Glu Arg Lys Leu Arg Thr Phe Tyr Glu Lys Arg Met 20 25 30 Ala Thr Glu Val Ala Ala Asp Ala Leu Gly Glu Glu Trp Lys Gly Tyr 35 40 45 Val Val Arg Ile Ser Gly Gly Asn Asp Lys Gln Gly Phe Pro Met Lys 50 55 60 Gln Gly Val Leu Thr His Gly Arg Val Arg Leu Leu Leu Ser Lys Gly 65 70 75 80 His Ser Cys Tyr Arg Pro Arg Arg Thr Gly Glu Arg Lys Arg Lys Ser 85 90 95 Val Arg Gly Cys Ile Val Asp Ala Asn Leu Ser Val Leu Asn Leu Val 100 105 110 Ile Val Lys Lys Gly Glu Lys Asp Ile Pro Gly Leu Thr Asp Thr Thr 115 120 125 Val Pro Arg Arg Leu Gly Pro Lys Arg Ala Ser Arg Ile Arg Lys Leu 130 135 140 Phe Asn Leu Ser Lys Glu Asp Asp Val Arg Gln Tyr Val Val Arg Lys 145 150 155 160 Pro Leu Asn Lys Glu Gly Lys Lys Pro Arg Thr Lys Ala Pro Lys Ile 165 170 175 Gln Arg Leu Val Thr Pro Arg Val Leu Gln His Lys Arg Arg Arg Ile 180 185 190 Ala Leu Lys Lys Gln Arg Thr Lys Lys Asn Lys Glu Glu Ala Ala Glu 195 200 205 Tyr Ala Lys Leu Leu Ala Lys Arg Met Lys Glu Ala Lys Glu Lys Arg 210 215 220 Gln Glu Gln Ile Ala Lys Arg Arg Arg Leu Ser Ser Leu Arg Ala Ser 225 230 235 240 Thr Ser Lys Ser Glu Ser Ser Gln Lys 245 <210> 138 <211> 829 <212> DNA <213> Homo sapiens <400> 138 cctcttttcc gtggcgcctc ggaggcgttc agctgcttca agatgaagct gaacatctcc 60 ttcccagcca ctggctgcca gaaactcatt gaagtggacg atgaacgcaa acttcgtact 120 ttctatgaga agcgtatggc cacagaagtt gctgctgacg ctctgggtga agaatggaag 180 ggttatgtgg tccgaatcag tggtgggaac gacaaacaag gtttccccat gaagcagggt 240 gtcttgaccc atggccgtgt ccgcctgcta ctgagtaagg ggcattcctg ttacagacca 300 aggagaactg gagaaagaaa gagaaaatca gttcgtggtt gcattgtgga tgcaaatctg 360 agcgttctca acttggttat tgtaaaaaaa ggagagaagg atattcctgg actgactgat 420 actacagtgc ctcgccgcct gggccccaaa agagctagca gaatccgcaa acttttcaat 480 ctctctaaag aagatgatgt ccgccagtat gttgtaagaa agcccttaaa taaagaaggt 540 aagaaaccta ggaccaaagc acccaagatt cagcgtcttg ttactccacg tgtcctgcag 600 cacaaacggc ggcgtattgc tctgaagaag cagcgtacca agaaaaataa agaagaggct 660 gcagaatatg ctaaactttt ggccaagaga atgaaggagg ctaaggagaa gcgccaggaa 720 caaattgcga agagacgcag actttcctct ctgcgagctt ctacttctaa gtctgaatcc 780 agtcagaaat aagatttttt gagtaacaaa taaataagat cagactctg 829 <210> 139 <211> 1016 <212> PRT <213> Homo sapiens <400> 139 Met Ala Ala Ala Thr Gly Ala Val Ala Ala Ser Ala Ala Ser Gly Gln 1 5 10 15 Ala Glu Gly Lys Lys Ile Thr Asp Leu Arg Val Ile Asp Leu Lys Ser 20 25 30 Glu Leu Lys Arg Arg Asn Leu Asp Ile Thr Gly Val Lys Thr Val Leu 35 40 45 Ile Ser Arg Leu Lys Gln Ala Ile Glu Glu Glu Gly Gly Asp Pro Asp 50 55 60 Asn Ile Glu Leu Thr Val Ser Thr Asp Thr Pro Asn Lys Lys Pro Thr 65 70 75 80 Lys Gly Lys Gly Lys Lys His Glu Ala Asp Glu Leu Ser Gly Asp Ala 85 90 95 Ser Val Glu Asp Asp Ala Phe Ile Lys Asp Cys Glu Leu Glu Asn Gln 100 105 110 Glu Ala His Glu Gln Asp Gly Asn Asp Glu Leu Lys Asp Ser Glu Glu 115 120 125 Phe Gly Glu Asn Glu Glu Glu Asn Val His Ser Lys Glu Leu Leu Ser 130 135 140 Ala Glu Glu Asn Lys Arg Ala His Glu Leu Ile Glu Ala Glu Gly Ile 145 150 155 160 Glu Asp Ile Glu Lys Glu Asp Ile Glu Ser Gln Glu Ile Glu Ala Gln 165 170 175 Glu Gly Glu Asp Asp Thr Phe Leu Thr Ala Gln Asp Gly Glu Glu Glu 180 185 190 Glu Asn Glu Lys Glu Gly Ser Leu Ala Glu Ala Asp His Thr Ala His 195 200 205 Glu Glu Met Glu Ala His Thr Thr Val Lys Glu Ala Glu Asp Asp Asn 210 215 220 Ile Ser Val Thr Ile Gln Ala Glu Asp Ala Ile Thr Leu Asp Phe Asp 225 230 235 240 Gly Asp Asp Leu Leu Glu Thr Gly Lys Asn Val Lys Ile Thr Asp Ser 245 250 255 Glu Ala Ser Lys Pro Lys Asp Gly Gln Asp Ala Ile Ala Gln Ser Pro 260 265 270 Glu Lys Glu Ser Lys Asp Tyr Glu Met Asn Ala Asn His Lys Asp Gly 275 280 285 Lys Lys Glu Asp Cys Val Lys Gly Asp Pro Val Glu Lys Glu Ala Arg 290 295 300 Glu Ser Ser Lys Lys Ala Glu Ser Gly Asp Lys Glu Lys Asp Thr Leu 305 310 315 320 Lys Lys Gly Pro Ser Ser Thr Gly Ala Ser Gly Gln Ala Lys Ser Ser 325 330 335 Ser Lys Glu Ser Lys Asp Ser Lys Thr Ser Ser Lys Asp Asp Lys Gly 340 345 350 Ser Thr Ser Ser Thr Ser Gly Ser Ser Gly Ser Ser Thr Lys Asn Ile 355 360 365 Trp Val Ser Gly Leu Ser Ser Asn Thr Lys Ala Ala Asp Leu Lys Asn 370 375 380 Leu Phe Gly Lys Tyr Gly Lys Val Leu Ser Ala Lys Val Val Thr Asn 385 390 395 400 Ala Arg Ser Pro Gly Ala Lys Cys Tyr Gly Ile Val Thr Met Ser Ser 405 410 415 Ser Thr Glu Val Ser Arg Cys Ile Ala His Leu His Arg Thr Glu Leu 420 425 430 His Gly Gln Leu Ile Ser Val Glu Lys Val Lys Gly Asp Pro Ser Lys 435 440 445 Lys Glu Met Lys Lys Glu Asn Asp Glu Lys Ser Ser Ser Arg Ser Ser 450 455 460 Gly Asp Lys Lys Asn Thr Ser Asp Arg Ser Ser Lys Thr Gln Ala Ser 465 470 475 480 Val Lys Lys Glu Glu Lys Arg Ser Ser Glu Lys Ser Glu Lys Lys Glu 485 490 495 Ser Lys Asp Thr Lys Lys Ile Glu Gly Lys Asp Glu Lys Asn Asp Asn 500 505 510 Gly Ala Ser Gly Gln Thr Ser Glu Ser Ile Lys Lys Ser Glu Glu Lys 515 520 525 Lys Arg Ile Ser Ser Lys Ser Pro Gly His Met Val Ile Leu Asp Gln 530 535 540 Thr Lys Gly Asp His Cys Arg Pro Ser Arg Arg Gly Arg Tyr Glu Lys 545 550 555 560 Ile His Gly Arg Ser Lys Glu Lys Glu Arg Ala Ser Leu Asp Lys Lys 565 570 575 Arg Asp Lys Asp Tyr Arg Arg Lys Glu Ile Leu Pro Phe Glu Lys Met 580 585 590 Lys Glu Gln Arg Leu Arg Glu His Leu Val Arg Phe Glu Arg Leu Arg 595 600 605 Arg Ala Met Glu Leu Arg Arg Arg Arg Glu Ile Ala Glu Arg Glu Arg 610 615 620 Arg Glu Arg Glu Arg Ile Arg Ile Ile Arg Glu Arg Glu Glu Arg Glu 625 630 635 640 Arg Leu Gln Arg Glu Arg Glu Arg Leu Glu Ile Glu Arg Gln Lys Leu 645 650 655 Glu Arg Glu Arg Met Glu Arg Glu Arg Leu Glu Arg Glu Arg Ile Arg 660 665 670 Ile Glu Gln Glu Arg Arg Lys Glu Ala Glu Arg Ile Ala Arg Glu Arg 675 680 685 Glu Glu Leu Arg Arg Gln Gln Gln Gln Leu Arg Tyr Glu Gln Glu Lys 690 695 700 Arg Asn Ser Leu Lys Arg Pro Arg Asp Val Asp His Arg Arg Asp Asp 705 710 715 720 Pro Tyr Trp Ser Glu Asn Lys Lys Leu Ser Leu Asp Thr Asp Ala Arg 725 730 735 Phe Gly His Gly Ser Asp Tyr Ser Arg Gln Gln Asn Arg Phe Asn Asp 740 745 750 Phe Asp His Arg Glu Arg Gly Arg Phe Pro Glu Ser Ser Ala Val Gln 755 760 765 Ser Ser Ser Phe Glu Arg Arg Asp Arg Phe Val Gly Gln Ser Glu Gly 770 775 780 Lys Lys Ala Arg Pro Thr Ala Arg Arg Glu Asp Pro Ser Phe Glu Arg 785 790 795 800 Tyr Pro Lys Asn Phe Ser Asp Ser Arg Arg Asn Glu Pro Pro Pro Pro 805 810 815 Arg Asn Glu Leu Arg Glu Ser Asp Arg Arg Glu Val Arg Gly Glu Arg 820 825 830 Asp Glu Arg Arg Thr Val Ile Ile His Asp Arg Pro Asp Ile Thr His 835 840 845 Pro Arg His Pro Arg Glu Ala Gly Pro Asn Pro Ser Arg Pro Thr Ser 850 855 860 Trp Lys Ser Glu Gly Ser Met Ser Thr Asp Lys Arg Glu Thr Arg Val 865 870 875 880 Glu Arg Pro Glu Arg Ser Gly Arg Glu Val Ser Gly His Ser Val Arg 885 890 895 Gly Ala Pro Pro Gly Asn Arg Ser Ser Ala Ser Gly Tyr Gly Ser Arg 900 905 910 Glu Gly Asp Arg Gly Val Ile Thr Asp Arg Gly Gly Gly Ser Gln His 915 920 925 Tyr Pro Glu Glu Arg His Val Val Glu Arg His Gly Arg Asp Thr Ser 930 935 940 Gly Pro Arg Lys Glu Trp His Gly Pro Pro Ser Gln Gly Pro Ser Tyr 945 950 955 960 His Asp Thr Arg Arg Met Gly Asp Gly Arg Ala Gly Ala Gly Met Ile 965 970 975 Thr Gln His Ser Ser Asn Ala Ser Pro Ile Asn Arg Ile Val Gln Ile 980 985 990 Ser Gly Asn Ser Met Pro Arg Gly Ser Gly Ser Gly Phe Lys Pro Phe 995 1000 1005 Lys Gly Gly Pro Pro Arg Arg Phe 1010 1015 <210> 140 <211> 4110 <212> DNA <213> Homo sapiens <400> 140 gcggccgccg aggcctgggt ggaagttggc gctgctgccg ccgccctgca gcccactcgc 60 tgcctcggca gcgcgctgct cttctaagat ggctgccgct accggtgcgg tggcagcctc 120 ggccgcctcg ggtcaggcgg aaggtaaaaa gatcaccgat ctgcgggtca tcgatctgaa 180 gtccgagctg aagcggcgga acttagacat caccggagtc aagaccgtgc tcatctcccg 240 actcaagcag gctattgaag aggaaggagg cgatccagat aatattgaat taactgtttc 300 aactgatact ccaaacaaga aaccaactaa aggcaaaggt aaaaaacatg aagcagatga 360 gttgagtgga gatgcttctg tggaagatga tgcttttatc aaggactgtg aattggagaa 420 tcaagaggca catgagcaag atggaaatga tgaactaaag gactctgaag aatttggtga 480 aaatgaagaa gaaaatgtgc attccaagga gttactctct gcagaagaaa acaagagagc 540 tcatgaatta atagaggcag aaggaataga agatatagaa aaagaggaca tcgaaagtca 600 ggaaattgaa gctcaagaag gtgaagatga tacctttcta acagcccaag atggtgagga 660 agaagaaaat gagaaagaag ggagcctagc tgaggctgat cacacagctc atgaagagat 720 ggaagctcat acgactgtga aagaagctga ggatgacaac atctcggtca caatccaggc 780 tgaagatgcc atcactctgg attttgatgg tgatgacctc ctagaaacag gtaaaaatgt 840 gaaaattaca gattctgaag caagtaagcc aaaagatggg caggacgcca ttgcacagag 900 cccggagaag gaaagcaagg attatgagat gaatgcgaac cataaagatg gtaagaagga 960 agactgcgtg aagggtgacc ctgtcgagaa ggaagccaga gaaagttcta agaaagcaga 1020 atctggagac aaagaaaagg atactttgaa gaaagggccc tcgtctactg gggcctctgg 1080 tcaagcaaag agctcttcaa aggaatctaa agacagcaag acatcatcta aagatgacaa 1140 aggaagtaca agtagtacta gtggtagcag tggaagctca actaaaaata tctgggttag 1200 tggactttca tctaatacca aagctgctga tttgaagaac ctctttggca aatatggaaa 1260 ggttctgagt gcaaaagtag ttacaaatgc tcgaagtcct ggggcaaaat gctatggcat 1320 tgtaactatg tcttcaagca cagaggtgtc caggtgtatt gcacatcttc atcgcactga 1380 gctgcatgga cagctgattt ctgttgaaaa agtaaaaggt gatccctcta agaaagaaat 1440 gaagaaagaa aatgatgaaa agagtagttc aagaagttct ggagataaaa aaaatacgag 1500 tgatagaagt agcaagacac aagcctctgt caaaaaagaa gagaaaagat cgtctgagaa 1560 atctgaaaaa aaagaaagca aggatactaa gaaaatagaa ggtaaagatg agaagaatga 1620 taatggagca agtggccaaa catcagaatc gattaaaaaa agtgaagaaa agaagcgaat 1680 aagttccaag agtccaggac atatggtaat actagaccaa actaaaggag atcattgtag 1740 accatcaaga agaggaagat atgagaaaat tcatggaaga agtaaggaaa aggagagagc 1800 tagtctagat aaaaaaagag ataaagacta cagaaggaaa gagatcttgc cttttgaaaa 1860 gatgaaggaa caaaggttga gagaacattt agttcgtttt gaaaggctgc gacgagcaat 1920 ggaacttcga agacgaagag agattgcaga gagagagcgt cgagagcgag aacgcattag 1980 aataattcgt gaacgggaag aacgggaacg cttacagaga gagagagagc gcctagaaat 2040 tgaaaggcaa aaactagaga gagagagaat ggaacgcgaa cgcttggaaa gggaacgcat 2100 tcgtattgaa caggaacgtc gtaaggaagc tgaacggatt gctcgagaaa gagaggaact 2160 cagaaggcaa caacagcagc ttcgttatga acaagaaaaa aggaattcct tgaaacgccc 2220 acgtgatgta gatcataggc gagatgatcc ttactggagc gagaataaaa agttgtctct 2280 agatacagat gcacgatttg gccatggatc cgactactct cgccaacaga acagatttaa 2340 tgactttgat caccgagaga ggggcaggtt tcctgagagt tcagcagtac agtcttcatc 2400 ttttgaaagg cgggatcgct ttgttggtca aagtgagggg aaaaaagcac gacctactgc 2460 acgaagggaa gatccaagct tcgaaagata tcccaaaaat ttcagtgact ccagaagaaa 2520 tgagcctcca ccaccaagaa atgaacttag agaatcagac aggcgagaag tacgagggga 2580 gcgagacgaa aggagaacgg tgattattca tgacaggcct gatatcactc atcctagaca 2640 tcctcgagag gcagggccca atccttccag acccaccagc tggaaaagtg aaggaagcat 2700 gtccactgac aaacgggaaa caagagttga aaggccagaa cgatctggga gagaagtatc 2760 agggcacagt gtgagaggcg ctccccctgg gaatcgtagc agcgcttcgg ggtacgggag 2820 cagagaggga gacagaggag tcatcacaga ccgaggaggt ggatcacagc actatcctga 2880 ggagcgacat gtggttgaac gccatggacg ggacacaagc ggaccaagga aagagtggca 2940 tggtccaccc tctcaagggc ctagctatca tgatacgagg cgaatgggtg acggccgggc 3000 aggagcaggc atgataaccc aacattcaag taacgcatcc ccaattaata gaattgtaca 3060 aatcagtggc aattccatgc caagaggaag tggctccgga tttaagccat ttaagggtgg 3120 acctccgcga cgattctgaa aatgagctct ctgccaaggt tttaagataa tttattgaaa 3180 tctcctgtaa actttacttg actacttatg aagaggacct ctgacttgct tgagagttct 3240 gtcagacttt tctttttaaa aatttaacat gattgctttt ctcaattttg gagaagatgt 3300 ttaaatagtt ctgttgtaac ttttaatagt tttgtgtatc attcaacttt ttttcttgca 3360 gcaccgaggc acatttgaaa agatggaatt gaagtcgttt tgtttaacgc tgtgtgaata 3420 taaagagtag tttgcagctg tgtggtagtg gtttaatttg cagccttagc tctgtggtgt 3480 ctggctctag agttacttct ttttaccaag cattttcagc ctccattttg aaggctgtct 3540 acacttaaga agtcttagct gtctaatttt tagagaataa gattgttcat tgcatttctg 3600 agtattatgt aacctatttt tgcagaaggt actgttacat taagtgcatc tgtgtatcct 3660 ggtttaaaaa aatgtaatct tttttgaaat aaaccttcat attctgtata gttgctaaag 3720 tgttgagaac ctttttaatt gtaaaatgag aaccgatttt cagtttagtg tagcagcaca 3780 cttgttcagg tttgcatggt atgaaaccaa atagattcat gaaaccttgg ccatgaggtt 3840 tgtttcacaa ggttcttaga ccgagttgtg caggtaagtg cacttttagg taatctgcac 3900 tgtttgtttg atggataaat tccatctctg ggaattgtgt gggtattaat gtttccatgt 3960 tcccaactat gttgagaagt ggaaaaaaac ccaggttcta gatgggtgaa tcagttgggt 4020 tttgtaaata cttgtatgtg gggaagacat tgttgtcttt ttgtgaaaat aaaaatccac 4080 acctggaagt gtaaaaaaaa aaaaaaaaaa 4110 <210> 141 <211> 1034 <212> PRT <213> Homo sapiens <400> 141 Met Ala Ala Ala Thr Gly Ala Val Ala Ala Ser Ala Ala Ser Gly Gln 1 5 10 15 Ala Glu Gly Lys Lys Ile Thr Asp Leu Arg Val Ile Asp Leu Lys Ser 20 25 30 Glu Leu Lys Arg Arg Asn Leu Asp Ile Thr Gly Val Lys Thr Val Leu 35 40 45 Ile Ser Arg Leu Lys Gln Ala Ile Glu Glu Glu Gly Gly Asp Pro Asp 50 55 60 Asn Ile Glu Leu Thr Val Ser Thr Asp Thr Pro Asn Lys Lys Pro Thr 65 70 75 80 Lys Gly Lys Gly Lys Lys His Glu Ala Asp Glu Leu Ser Gly Asp Ala 85 90 95 Ser Val Glu Asp Asp Ala Phe Ile Lys Asp Cys Glu Leu Glu Asn Gln 100 105 110 Glu Ala His Glu Gln Asp Gly Asn Asp Glu Leu Lys Asp Ser Glu Glu 115 120 125 Phe Gly Glu Asn Glu Glu Glu Asn Val His Ser Lys Glu Leu Leu Ser 130 135 140 Ala Glu Glu Asn Lys Arg Ala His Glu Leu Ile Glu Ala Glu Gly Ile 145 150 155 160 Glu Asp Ile Glu Lys Glu Asp Ile Glu Ser Gln Glu Ile Glu Ala Gln 165 170 175 Glu Gly Glu Asp Asp Thr Phe Leu Thr Ala Gln Asp Gly Glu Glu Glu 180 185 190 Glu Asn Glu Lys Asp Ile Ala Gly Ser Gly Asp Gly Thr Gln Glu Val 195 200 205 Ser Lys Pro Leu Pro Ser Glu Gly Ser Leu Ala Glu Ala Asp His Thr 210 215 220 Ala His Glu Glu Met Glu Ala His Thr Thr Val Lys Glu Ala Glu Asp 225 230 235 240 Asp Asn Ile Ser Val Thr Ile Gln Ala Glu Asp Ala Ile Thr Leu Asp 245 250 255 Phe Asp Gly Asp Asp Leu Leu Glu Thr Gly Lys Asn Val Lys Ile Thr 260 265 270 Asp Ser Glu Ala Ser Lys Pro Lys Asp Gly Gln Asp Ala Ile Ala Gln 275 280 285 Ser Pro Glu Lys Glu Ser Lys Asp Tyr Glu Met Asn Ala Asn His Lys 290 295 300 Asp Gly Lys Lys Glu Asp Cys Val Lys Gly Asp Pro Val Glu Lys Glu 305 310 315 320 Ala Arg Glu Ser Ser Lys Lys Ala Glu Ser Gly Asp Lys Glu Lys Asp 325 330 335 Thr Leu Lys Lys Gly Pro Ser Ser Thr Gly Ala Ser Gly Gln Ala Lys 340 345 350 Ser Ser Ser Lys Glu Ser Lys Asp Ser Lys Thr Ser Ser Lys Asp Asp 355 360 365 Lys Gly Ser Thr Ser Ser Thr Ser Gly Ser Ser Gly Ser Ser Thr Lys 370 375 380 Asn Ile Trp Val Ser Gly Leu Ser Ser Asn Thr Lys Ala Ala Asp Leu 385 390 395 400 Lys Asn Leu Phe Gly Lys Tyr Gly Lys Val Leu Ser Ala Lys Val Val 405 410 415 Thr Asn Ala Arg Ser Pro Gly Ala Lys Cys Tyr Gly Ile Val Thr Met 420 425 430 Ser Ser Ser Thr Glu Val Ser Arg Cys Ile Ala His Leu His Arg Thr 435 440 445 Glu Leu His Gly Gln Leu Ile Ser Val Glu Lys Val Lys Gly Asp Pro 450 455 460 Ser Lys Lys Glu Met Lys Lys Glu Asn Asp Glu Lys Ser Ser Ser Arg 465 470 475 480 Ser Ser Gly Asp Lys Lys Asn Thr Ser Asp Arg Ser Ser Lys Thr Gln 485 490 495 Ala Ser Val Lys Lys Glu Glu Lys Arg Ser Ser Glu Lys Ser Glu Lys 500 505 510 Lys Glu Ser Lys Asp Thr Lys Lys Ile Glu Gly Lys Asp Glu Lys Asn 515 520 525 Asp Asn Gly Ala Ser Gly Gln Thr Ser Glu Ser Ile Lys Lys Ser Glu 530 535 540 Glu Lys Lys Arg Ile Ser Ser Lys Ser Pro Gly His Met Val Ile Leu 545 550 555 560 Asp Gln Thr Lys Gly Asp His Cys Arg Pro Ser Arg Arg Gly Arg Tyr 565 570 575 Glu Lys Ile His Gly Arg Ser Lys Glu Lys Glu Arg Ala Ser Leu Asp 580 585 590 Lys Lys Arg Asp Lys Asp Tyr Arg Arg Lys Glu Ile Leu Pro Phe Glu 595 600 605 Lys Met Lys Glu Gln Arg Leu Arg Glu His Leu Val Arg Phe Glu Arg 610 615 620 Leu Arg Arg Ala Met Glu Leu Arg Arg Arg Arg Glu Ile Ala Glu Arg 625 630 635 640 Glu Arg Arg Glu Arg Glu Arg Ile Arg Ile Ile Arg Glu Arg Glu Glu 645 650 655 Arg Glu Arg Leu Gln Arg Glu Arg Glu Arg Leu Glu Ile Glu Arg Gln 660 665 670 Lys Leu Glu Arg Glu Arg Met Glu Arg Glu Arg Leu Glu Arg Glu Arg 675 680 685 Ile Arg Ile Glu Gln Glu Arg Arg Lys Glu Ala Glu Arg Ile Ala Arg 690 695 700 Glu Arg Glu Glu Leu Arg Arg Gln Gln Gln Gln Leu Arg Tyr Glu Gln 705 710 715 720 Glu Lys Arg Asn Ser Leu Lys Arg Pro Arg Asp Val Asp His Arg Arg 725 730 735 Asp Asp Pro Tyr Trp Ser Glu Asn Lys Lys Leu Ser Leu Asp Thr Asp 740 745 750 Ala Arg Phe Gly His Gly Ser Asp Tyr Ser Arg Gln Gln Asn Arg Phe 755 760 765 Asn Asp Phe Asp His Arg Glu Arg Gly Arg Phe Pro Glu Ser Ser Ala 770 775 780 Val Gln Ser Ser Ser Phe Glu Arg Arg Asp Arg Phe Val Gly Gln Ser 785 790 795 800 Glu Gly Lys Lys Ala Arg Pro Thr Ala Arg Arg Glu Asp Pro Ser Phe 805 810 815 Glu Arg Tyr Pro Lys Asn Phe Ser Asp Ser Arg Arg Asn Glu Pro Pro 820 825 830 Pro Pro Arg Asn Glu Leu Arg Glu Ser Asp Arg Arg Glu Val Arg Gly 835 840 845 Glu Arg Asp Glu Arg Arg Thr Val Ile Ile His Asp Arg Pro Asp Ile 850 855 860 Thr His Pro Arg His Pro Arg Glu Ala Gly Pro Asn Pro Ser Arg Pro 865 870 875 880 Thr Ser Trp Lys Ser Glu Gly Ser Met Ser Thr Asp Lys Arg Glu Thr 885 890 895 Arg Val Glu Arg Pro Glu Arg Ser Gly Arg Glu Val Ser Gly His Ser 900 905 910 Val Arg Gly Ala Pro Pro Gly Asn Arg Ser Ser Ala Ser Gly Tyr Gly 915 920 925 Ser Arg Glu Gly Asp Arg Gly Val Ile Thr Asp Arg Gly Gly Gly Ser 930 935 940 Gln His Tyr Pro Glu Glu Arg His Val Val Glu Arg His Gly Arg Asp 945 950 955 960 Thr Ser Gly Pro Arg Lys Glu Trp His Gly Pro Pro Ser Gln Gly Pro 965 970 975 Ser Tyr His Asp Thr Arg Arg Met Gly Asp Gly Arg Ala Gly Ala Gly 980 985 990 Met Ile Thr Gln His Ser Ser Asn Ala Ser Pro Ile Asn Arg Ile Val 995 1000 1005 Gln Ile Ser Gly Asn Ser Met Pro Arg Gly Ser Gly Ser Gly Phe 1010 1015 1020 Lys Pro Phe Lys Gly Gly Pro Pro Arg Arg Phe 1025 1030 <210> 142 <211> 4164 <212> DNA <213> Homo sapiens <400> 142 gcggccgccg aggcctgggt ggaagttggc gctgctgccg ccgccctgca gcccactcgc 60 tgcctcggca gcgcgctgct cttctaagat ggctgccgct accggtgcgg tggcagcctc 120 ggccgcctcg ggtcaggcgg aaggtaaaaa gatcaccgat ctgcgggtca tcgatctgaa 180 gtccgagctg aagcggcgga acttagacat caccggagtc aagaccgtgc tcatctcccg 240 actcaagcag gctattgaag aggaaggagg cgatccagat aatattgaat taactgtttc 300 aactgatact ccaaacaaga aaccaactaa aggcaaaggt aaaaaacatg aagcagatga 360 gttgagtgga gatgcttctg tggaagatga tgcttttatc aaggactgtg aattggagaa 420 tcaagaggca catgagcaag atggaaatga tgaactaaag gactctgaag aatttggtga 480 aaatgaagaa gaaaatgtgc attccaagga gttactctct gcagaagaaa acaagagagc 540 tcatgaatta atagaggcag aaggaataga agatatagaa aaagaggaca tcgaaagtca 600 ggaaattgaa gctcaagaag gtgaagatga tacctttcta acagcccaag atggtgagga 660 agaagaaaat gagaaagata tagcaggttc tggtgatggt acacaagaag tatctaaacc 720 tcttccttca gaagggagcc tagctgaggc tgatcacaca gctcatgaag agatggaagc 780 tcatacgact gtgaaagaag ctgaggatga caacatctcg gtcacaatcc aggctgaaga 840 tgccatcact ctggattttg atggtgatga cctcctagaa acaggtaaaa atgtgaaaat 900 tacagattct gaagcaagta agccaaaaga tgggcaggac gccattgcac agagcccgga 960 gaaggaaagc aaggattatg agatgaatgc gaaccataaa gatggtaaga aggaagactg 1020 cgtgaagggt gaccctgtcg agaaggaagc cagagaaagt tctaagaaag cagaatctgg 1080 agacaaagaa aaggatactt tgaagaaagg gccctcgtct actggggcct ctggtcaagc 1140 aaagagctct tcaaaggaat ctaaagacag caagacatca tctaaagatg acaaaggaag 1200 tacaagtagt actagtggta gcagtggaag ctcaactaaa aatatctggg ttagtggact 1260 ttcatctaat accaaagctg ctgatttgaa gaacctcttt ggcaaatatg gaaaggttct 1320 gagtgcaaaa gtagttacaa atgctcgaag tcctggggca aaatgctatg gcattgtaac 1380 tatgtcttca agcacagagg tgtccaggtg tattgcacat cttcatcgca ctgagctgca 1440 tggacagctg atttctgttg aaaaagtaaa aggtgatccc tctaagaaag aaatgaagaa 1500 agaaaatgat gaaaagagta gttcaagaag ttctggagat aaaaaaaata cgagtgatag 1560 aagtagcaag acacaagcct ctgtcaaaaa agaagagaaa agatcgtctg agaaatctga 1620 aaaaaaagaa agcaaggata ctaagaaaat agaaggtaaa gatgagaaga atgataatgg 1680 agcaagtggc caaacatcag aatcgattaa aaaaagtgaa gaaaagaagc gaataagttc 1740 caagagtcca ggacatatgg taatactaga ccaaactaaa ggagatcatt gtagaccatc 1800 aagaagagga agatatgaga aaattcatgg aagaagtaag gaaaaggaga gagctagtct 1860 agataaaaaa agagataaag actacagaag gaaagagatc ttgccttttg aaaagatgaa 1920 ggaacaaagg ttgagagaac atttagttcg ttttgaaagg ctgcgacgag caatggaact 1980 tcgaagacga agagagattg cagagagaga gcgtcgagag cgagaacgca ttagaataat 2040 tcgtgaacgg gaagaacggg aacgcttaca gagagagaga gagcgcctag aaattgaaag 2100 gcaaaaacta gagagagaga gaatggaacg cgaacgcttg gaaagggaac gcattcgtat 2160 tgaacaggaa cgtcgtaagg aagctgaacg gattgctcga gaaagagagg aactcagaag 2220 gcaacaacag cagcttcgtt atgaacaaga aaaaaggaat tccttgaaac gcccacgtga 2280 tgtagatcat aggcgagatg atccttactg gagcgagaat aaaaagttgt ctctagatac 2340 agatgcacga tttggccatg gatccgacta ctctcgccaa cagaacagat ttaatgactt 2400 tgatcaccga gagaggggca ggtttcctga gagttcagca gtacagtctt catcttttga 2460 aaggcgggat cgctttgttg gtcaaagtga ggggaaaaaa gcacgaccta ctgcacgaag 2520 ggaagatcca agcttcgaaa gatatcccaa aaatttcagt gactccagaa gaaatgagcc 2580 tccaccacca agaaatgaac ttagagaatc agacaggcga gaagtacgag gggagcgaga 2640 cgaaaggaga acggtgatta ttcatgacag gcctgatatc actcatccta gacatcctcg 2700 agaggcaggg cccaatcctt ccagacccac cagctggaaa agtgaaggaa gcatgtccac 2760 tgacaaacgg gaaacaagag ttgaaaggcc agaacgatct gggagagaag tatcagggca 2820 cagtgtgaga ggcgctcccc ctgggaatcg tagcagcgct tcggggtacg ggagcagaga 2880 gggagacaga ggagtcatca cagaccgagg aggtggatca cagcactatc ctgaggagcg 2940 acatgtggtt gaacgccatg gacgggacac aagcggacca aggaaagagt ggcatggtcc 3000 accctctcaa gggcctagct atcatgatac gaggcgaatg ggtgacggcc gggcaggagc 3060 aggcatgata acccaacatt caagtaacgc atccccaatt aatagaattg tacaaatcag 3120 tggcaattcc atgccaagag gaagtggctc cggatttaag ccatttaagg gtggacctcc 3180 gcgacgattc tgaaaatgag ctctctgcca aggttttaag ataatttatt gaaatctcct 3240 gtaaacttta cttgactact tatgaagagg acctctgact tgcttgagag ttctgtcaga 3300 cttttctttt taaaaattta acatgattgc ttttctcaat tttggagaag atgtttaaat 3360 agttctgttg taacttttaa tagttttgtg tatcattcaa ctttttttct tgcagcaccg 3420 aggcacattt gaaaagatgg aattgaagtc gttttgttta acgctgtgtg aatataaaga 3480 gtagtttgca gctgtgtggt agtggtttaa tttgcagcct tagctctgtg gtgtctggct 3540 ctagagttac ttctttttac caagcatttt cagcctccat tttgaaggct gtctacactt 3600 aagaagtctt agctgtctaa tttttagaga ataagattgt tcattgcatt tctgagtatt 3660 atgtaaccta tttttgcaga aggtactgtt acattaagtg catctgtgta tcctggttta 3720 aaaaaatgta atcttttttg aaataaacct tcatattctg tatagttgct aaagtgttga 3780 gaaccttttt aattgtaaaa tgagaaccga ttttcagttt agtgtagcag cacacttgtt 3840 caggtttgca tggtatgaaa ccaaatagat tcatgaaacc ttggccatga ggtttgtttc 3900 acaaggttct tagaccgagt tgtgcaggta agtgcacttt taggtaatct gcactgtttg 3960 tttgatggat aaattccatc tctgggaatt gtgtgggtat taatgtttcc atgttcccaa 4020 ctatgttgag aagtggaaaa aaacccaggt tctagatggg tgaatcagtt gggttttgta 4080 aatacttgta tgtggggaag acattgttgt ctttttgtga aaataaaaat ccacacctgg 4140 aagtgtaaaa aaaaaaaaaa aaaa 4164 <210> 143 <211> 227 <212> PRT <213> Homo sapiens <400> 143 Met Ala Gly Val Gly Ala Gly Pro Leu Arg Ala Met Gly Arg Gln Ala 1 5 10 15 Leu Leu Leu Leu Ala Leu Cys Ala Thr Gly Ala Gln Gly Leu Tyr Phe 20 25 30 His Ile Gly Glu Thr Glu Lys Arg Cys Phe Ile Glu Glu Ile Pro Asp 35 40 45 Glu Thr Met Val Ile Gly Asn Tyr Arg Thr Gln Met Trp Asp Lys Gln 50 55 60 Lys Glu Val Phe Leu Pro Ser Thr Pro Gly Leu Gly Met His Val Glu 65 70 75 80 Val Lys Asp Pro Asp Gly Lys Val Val Leu Ser Arg Gln Tyr Gly Ser 85 90 95 Glu Gly Arg Phe Thr Phe Thr Ser His Thr Pro Gly Asp His Gln Ile 100 105 110 Cys Leu His Ser Asn Ser Thr Arg Met Ala Leu Phe Ala Gly Gly Lys 115 120 125 Leu Arg Val His Leu Asp Ile Gln Val Gly Glu His Ala Asn Asn Tyr 130 135 140 Pro Glu Ile Ala Ala Lys Asp Lys Leu Thr Glu Leu Gln Leu Arg Ala 145 150 155 160 Arg Gln Leu Leu Asp Gln Val Glu Gln Ile Gln Lys Glu Gln Asp Tyr 165 170 175 Gln Arg Tyr Arg Glu Glu Arg Phe Arg Leu Thr Ser Glu Ser Thr Asn 180 185 190 Gln Arg Val Leu Trp Trp Ser Ile Ala Gln Thr Val Ile Leu Ile Leu 195 200 205 Thr Gly Ile Trp Gln Met Arg His Leu Lys Ser Phe Phe Glu Ala Lys 210 215 220 Lys Leu Val 225 <210> 144 <211> 1048 <212> DNA <213> Homo sapiens <400> 144 ggcgcttagg ggctgaggcg cgatggcagg tgtcggggct gggcctctgc gggcgatggg 60 gcggcaggcc ctgctgcttc tcgcgctgtg cgccacaggc gcccaggggc tctacttcca 120 catcggcgag accgagaagc gctgtttcat cgaggaaatc cccgacgaga ccatggtcat 180 cggcaactat cgtacccaga tgtgggataa gcagaaggag gtcttcctgc cctcgacccc 240 tggcctgggc atgcacgtgg aagtgaagga ccccgacggc aaggtggtgc tgtcccggca 300 gtacggctcg gagggccgct tcacgttcac ctcccacacg cccggtgacc atcaaatctg 360 tctgcactcc aattctacca ggatggctct cttcgctggt ggcaaactgc gtgtgcatct 420 cgacatccag gttggggagc atgccaacaa ctaccctgag attgctgcaa aagataagct 480 gacggagcta cagctccgcg cccgccagtt gcttgatcag gtggaacaga ttcagaagga 540 gcaggattac caaaggtatc gtgaagagcg cttccgactg acgagcgaga gcaccaacca 600 gagggtccta tggtggtcca ttgctcagac tgtcatcctc atcctcactg gcatctggca 660 gatgcgtcac ctcaagagct tctttgaggc caagaagctg gtgtagtgcc ctctttgtat 720 gacccttcct ttttacctca tttatttggt actttcccca cacagtcctt tatccgcctg 780 gatttttagg gaaaaaaatg aaaaagaata agtcacattg gttccatggc cacaaaccat 840 tcagatcagc cacttgctga ccctggttct taaggacaca tgacattagt ccaatctttc 900 aaaatcttgt cttagggctt gtgaggaatc agaactaacc caggactcag tcctgcttct 960 tttgcctcga gtgattttcc tctgtttttc actaaataag caaatgaaaa ctctctccat 1020 taaaaaaaaa aaaaaaaaaa aaaaaaaa 1048 <210> 145 <211> 689 <212> PRT <213> Homo sapiens <400> 145 Met Ala Asp Leu Glu Ala Val Leu Ala Asp Val Ser Tyr Leu Met Ala 1 5 10 15 Met Glu Lys Ser Lys Ala Thr Pro Ala Ala Arg Ala Ser Lys Lys Ile 20 25 30 Leu Leu Pro Glu Pro Ser Ile Arg Ser Val Met Gln Lys Tyr Leu Glu 35 40 45 Asp Arg Gly Glu Val Thr Phe Glu Lys Ile Phe Ser Gln Lys Leu Gly 50 55 60 Tyr Leu Leu Phe Arg Asp Phe Cys Leu Asn His Leu Glu Glu Ala Arg 65 70 75 80 Pro Leu Val Glu Phe Tyr Glu Glu Ile Lys Lys Tyr Glu Lys Leu Glu 85 90 95 Thr Glu Glu Glu Arg Val Ala Arg Ser Arg Glu Ile Phe Asp Ser Tyr 100 105 110 Ile Met Lys Glu Leu Leu Ala Cys Ser His Pro Phe Ser Lys Ser Ala 115 120 125 Thr Glu His Val Gln Gly His Leu Gly Lys Lys Gln Val Pro Pro Asp 130 135 140 Leu Phe Gln Pro Tyr Ile Glu Glu Ile Cys Gln Asn Leu Arg Gly Asp 145 150 155 160 Val Phe Gln Lys Phe Ile Glu Ser Asp Lys Phe Thr Arg Phe Cys Gln 165 170 175 Trp Lys Asn Val Glu Leu Asn Ile His Leu Thr Met Asn Asp Phe Ser 180 185 190 Val His Arg Ile Ile Gly Arg Gly Gly Phe Gly Glu Val Tyr Gly Cys 195 200 205 Arg Lys Ala Asp Thr Gly Lys Met Tyr Ala Met Lys Cys Leu Asp Lys 210 215 220 Lys Arg Ile Lys Met Lys Gln Gly Glu Thr Leu Ala Leu Asn Glu Arg 225 230 235 240 Ile Met Leu Ser Leu Val Ser Thr Gly Asp Cys Pro Phe Ile Val Cys 245 250 255 Met Ser Tyr Ala Phe His Thr Pro Asp Lys Leu Ser Phe Ile Leu Asp 260 265 270 Leu Met Asn Gly Gly Asp Leu His Tyr His Leu Ser Gln His Gly Val 275 280 285 Phe Ser Glu Ala Asp Met Arg Phe Tyr Ala Ala Glu Ile Ile Leu Gly 290 295 300 Leu Glu His Met His Asn Arg Phe Val Val Tyr Arg Asp Leu Lys Pro 305 310 315 320 Ala Asn Ile Leu Leu Asp Glu His Gly His Val Arg Ile Ser Asp Leu 325 330 335 Gly Leu Ala Cys Asp Phe Ser Lys Lys Lys Pro His Ala Ser Val Gly 340 345 350 Thr His Gly Tyr Met Ala Pro Glu Val Leu Gln Lys Gly Val Ala Tyr 355 360 365 Asp Ser Ser Ala Asp Trp Phe Ser Leu Gly Cys Met Leu Phe Lys Leu 370 375 380 Leu Arg Gly His Ser Pro Phe Arg Gln His Lys Thr Lys Asp Lys His 385 390 395 400 Glu Ile Asp Arg Met Thr Leu Thr Met Ala Val Glu Leu Pro Asp Ser 405 410 415 Phe Ser Pro Glu Leu Arg Ser Leu Leu Glu Gly Leu Leu Gln Arg Asp 420 425 430 Val Asn Arg Arg Leu Gly Cys Leu Gly Arg Gly Ala Gln Glu Val Lys 435 440 445 Glu Ser Pro Phe Phe Arg Ser Leu Asp Trp Gln Met Val Phe Leu Gln 450 455 460 Lys Tyr Pro Pro Pro Leu Ile Pro Pro Arg Gly Glu Val Asn Ala Ala 465 470 475 480 Asp Ala Phe Asp Ile Gly Ser Phe Asp Glu Glu Asp Thr Lys Gly Ile 485 490 495 Lys Leu Leu Asp Ser Asp Gln Glu Leu Tyr Arg Asn Phe Pro Leu Thr 500 505 510 Ile Ser Glu Arg Trp Gln Gln Glu Val Ala Glu Thr Val Phe Asp Thr 515 520 525 Ile Asn Ala Glu Thr Asp Arg Leu Glu Ala Arg Lys Lys Ala Lys Asn 530 535 540 Lys Gln Leu Gly His Glu Glu Asp Tyr Ala Leu Gly Lys Asp Cys Ile 545 550 555 560 Met His Gly Tyr Met Ser Lys Met Gly Asn Pro Phe Leu Thr Gln Trp 565 570 575 Gln Arg Arg Tyr Phe Tyr Leu Phe Pro Asn Arg Leu Glu Trp Arg Gly 580 585 590 Glu Gly Glu Ala Pro Gln Ser Leu Leu Thr Met Glu Glu Ile Gln Ser 595 600 605 Val Glu Glu Thr Gln Ile Lys Glu Arg Lys Cys Leu Leu Leu Lys Ile 610 615 620 Arg Gly Gly Lys Gln Phe Ile Leu Gln Cys Asp Ser Asp Pro Glu Leu 625 630 635 640 Val Gln Trp Lys Lys Glu Leu Arg Asp Ala Tyr Arg Glu Ala Gln Gln 645 650 655 Leu Val Gln Arg Val Pro Lys Met Lys Asn Lys Pro Arg Ser Pro Val 660 665 670 Val Glu Leu Ser Lys Val Pro Leu Val Gln Arg Gly Ser Ala Asn Gly 675 680 685 Leu <210> 146 <211> 3478 <212> DNA <213> Homo sapiens <400> 146 cgggcgcgcg ggcggcggcg gcggcggcgc cccgactgca gtcccggcgg gagcggagcg 60 cgagccgggg ccgggcccga gccggcgcca tggggcggcg ccgcctgtga gcggcggcga 120 gcggagccgc gggcgccgag cagggccagg cgggaggcgt cggcgcccga ggccgagcga 180 gccgcggccg ggccgggccg agcgccgagc gagcaggagc ggcggcggcg gcggcggcgg 240 cgggaggagg cagcgccgcc gccaagatgg cggacctgga ggcggtgctg gccgacgtga 300 gctacctgat ggccatggag aagagcaagg ccacgccggc cgcgcgcgcc agcaagaaga 360 tcctgctgcc cgagcccagc atccgcagtg tcatgcagaa gtacctggag gaccggggcg 420 aggtgacctt tgagaagatc ttttcccaga agctggggta cctgctcttc cgagacttct 480 gcctgaacca cctggaggag gccaggccct tggtggaatt ctatgaggag atcaagaagt 540 acgagaagct ggagacggag gaggagcgtg tggcccgcag ccgggagatc ttcgactcat 600 acatcatgaa ggagctgctg gcctgctcgc atcccttctc gaagagtgcc actgagcatg 660 tccaaggcca cctggggaag aagcaggtgc ctccggatct cttccagcca tacatcgaag 720 agatttgtca aaacctccga ggggacgtgt tccagaaatt cattgagagc gataagttca 780 cacggttttg ccagtggaag aatgtggagc tcaacatcca cctgaccatg aatgacttca 840 gcgtgcatcg catcattggg cgcgggggct ttggcgaggt ctatgggtgc cggaaggctg 900 acacaggcaa gatgtacgcc atgaagtgcc tggacaaaaa gcgcatcaag atgaagcagg 960 gggagaccct ggccctgaac gagcgcatca tgctctcgct cgtcagcact ggggactgcc 1020 cattcattgt ctgcatgtca tacgcgttcc acacgccaga caagctcagc ttcatcctgg 1080 acctcatgaa cggtggggac ctgcactacc acctctccca gcacggggtc ttctcagagg 1140 ctgacatgcg cttctatgcg gccgagatca tcctgggcct ggagcacatg cacaaccgct 1200 tcgtggtcta ccgggacctg aagccagcca acatccttct ggacgagcat ggccacgtgc 1260 ggatctcgga cctgggcctg gcctgtgact tctccaagaa gaagccccat gccagcgtgg 1320 gcacccacgg gtacatggct ccggaggtcc tgcagaaggg cgtggcctac gacagcagtg 1380 ccgactggtt ctctctgggg tgcatgctct tcaagttgct gcgggggcac agccccttcc 1440 ggcagcacaa gaccaaagac aagcatgaga tcgaccgcat gacgctgacg atggccgtgg 1500 agctgcccga ctccttctcc cctgaactac gctccctgct ggaggggttg ctgcagaggg 1560 atgtcaaccg gagattgggc tgcctgggcc gaggggctca ggaggtgaaa gagagcccct 1620 ttttccgctc cctggactgg cagatggtct tcttgcagaa gtaccctccc ccgctgatcc 1680 ccccacgagg ggaggtgaac gcggccgacg ccttcgacat tggctccttc gatgaggagg 1740 acacaaaagg aatcaagtta ctggacagtg atcaggagct ctaccgcaac ttccccctca 1800 ccatctcgga gcggtggcag caggaggtgg cagagactgt cttcgacacc atcaacgctg 1860 agacagaccg gctggaggct cgcaagaaag ccaagaacaa gcagctgggc catgaggaag 1920 actacgccct gggcaaggac tgcatcatgc atggctacat gtccaagatg ggcaacccct 1980 tcctgaccca gtggcagcgg cggtacttct acctgttccc caaccgcctc gagtggcggg 2040 gcgagggcga ggccccgcag agcctgctga ccatggagga gatccagtcg gtggaggaga 2100 cgcagatcaa ggagcgcaag tgcctgctcc tcaagatccg cggtgggaaa cagttcattt 2160 tgcagtgcga tagcgaccct gagctggtgc agtggaagaa ggagctgcgc gacgcctacc 2220 gcgaggccca gcagctggtg cagcgggtgc ccaagatgaa gaacaagccg cgctcgcccg 2280 tggtggagct gagcaaggtg ccgctggtcc agcgcggcag tgccaacggc ctctgacccg 2340 cccacccgcc ttttataaac ctctaattta ttttgtcgaa tttttattat ttgttttccc 2400 gccaagcgga aaaggtttta ttttgtaatt attgtgattt cccgtggccc cagcctggcc 2460 cagctccccc gggaggggcc cgcttgcctc ggctcctgct gcaccaaccc agccgctgcc 2520 cggcgccctc tgtcctgact tcaggggctg cccgctccca gtgtcttcct gtgggggaag 2580 agcacagccc tcccgcccct tccccgaggg atgatgccac accaagctgt gccaccctgg 2640 gctctgtggg ctgcactctg tgcccatggg cactgctggg tggcccatcc cccctcacca 2700 ggggcaggca cagcacaggg atccgacttg aattttccca ctgcaccccc tcctgctgca 2760 gaggggcagg ccctgcactg tcctgctcca cagtgttggc gagaggaggg gcccgttgtc 2820 tccctggccc tcaaggcctc ccacagtgac tcgggctcct gtgcccttat tcaggaaaag 2880 cctctgtgtc actggctgcc tccactccca cttccctgac actgcggggc ttggctgaga 2940 gagtggcatt ggcagcaggt gctgctaccc tccctgctgt cccctcttgc cccaaccccc 3000 agcacccggg ctcagggacc acagcaaggc acctgcaggt tgggccatac tggcctcgcc 3060 tggcctgagg tctcgctgat gctgggctgg gtgcgacccc atctgcccag gacggggccg 3120 gccaggtggg cgggcagcac agcaaggagg ctggctgggg cctatcagtg tgccccccat 3180 cctggcccat cagtgtaccc ccgcccaggc tggccagccc cacagcccac gtcctgtcag 3240 tgccgccgcc tcgcccaccg catgccccct cgtgccagtc gcgctgcctg tgtggtgtcg 3300 cgccttctcc cccccggggc tgggttggcg caccctcccc tcccgtctac tcattccccg 3360 gggcgtttct ttgccgattt ttgaatgtga ttttaaagag tgaaaaatga gactatgcgt 3420 ttttataaaa aatggtgcct gattaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 3478 <210> 147 <211> 444 <212> PRT <213> Homo sapiens <400> 147 Met Arg Glu Ile Val His Ile Gln Ala Gly Gln Cys Gly Asn Gln Ile 1 5 10 15 Gly Ala Lys Phe Trp Glu Val Ile Ser Asp Glu His Gly Ile Asp Pro 20 25 30 Thr Gly Thr Tyr His Gly Asp Ser Asp Leu Gln Leu Asp Arg Ile Ser 35 40 45 Val Tyr Tyr Asn Glu Ala Thr Gly Gly Lys Tyr Val Pro Arg Ala Ile 50 55 60 Leu Val Asp Leu Glu Pro Gly Thr Met Asp Ser Val Arg Ser Gly Pro 65 70 75 80 Phe Gly Gln Ile Phe Arg Pro Asp Asn Phe Val Phe Gly Gln Ser Gly 85 90 95 Ala Gly Asn Asn Trp Ala Lys Gly His Tyr Thr Glu Gly Ala Glu Leu 100 105 110 Val Asp Ser Val Leu Asp Val Val Arg Lys Glu Ala Glu Ser Cys Asp 115 120 125 Cys Leu Gln Gly Phe Gln Leu Thr His Ser Leu Gly Gly Gly Thr Gly 130 135 140 Ser Gly Met Gly Thr Leu Leu Ile Ser Lys Ile Arg Glu Glu Tyr Pro 145 150 155 160 Asp Arg Ile Met Asn Thr Phe Ser Val Val Pro Ser Pro Lys Val Ser 165 170 175 Asp Thr Val Val Glu Pro Tyr Asn Ala Thr Leu Ser Val His Gln Leu 180 185 190 Val Glu Asn Thr Asp Glu Thr Tyr Cys Ile Asp Asn Glu Ala Leu Tyr 195 200 205 Asp Ile Cys Phe Arg Thr Leu Lys Leu Thr Thr Pro Thr Tyr Gly Asp 210 215 220 Leu Asn His Leu Val Ser Ala Thr Met Ser Gly Val Thr Thr Cys Leu 225 230 235 240 Arg Phe Pro Gly Gln Leu Asn Ala Asp Leu Arg Lys Leu Ala Val Asn 245 250 255 Met Val Pro Phe Pro Arg Leu His Phe Phe Met Pro Gly Phe Ala Pro 260 265 270 Leu Thr Ser Arg Gly Ser Gln Gln Tyr Arg Ala Leu Thr Val Pro Glu 275 280 285 Leu Thr Gln Gln Val Phe Asp Ala Lys Asn Met Met Ala Ala Cys Asp 290 295 300 Pro Arg His Gly Arg Tyr Leu Thr Val Ala Ala Val Phe Arg Gly Arg 305 310 315 320 Met Ser Met Lys Glu Val Asp Glu Gln Met Leu Asn Val Gln Asn Lys 325 330 335 Asn Ser Ser Tyr Phe Val Glu Trp Ile Pro Asn Asn Val Lys Thr Ala 340 345 350 Val Cys Asp Ile Pro Pro Arg Gly Leu Lys Met Ala Val Thr Phe Ile 355 360 365 Gly Asn Ser Thr Ala Ile Gln Glu Leu Phe Lys Arg Ile Ser Glu Gln 370 375 380 Phe Thr Ala Met Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly 385 390 395 400 Glu Gly Met Asp Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met Asn 405 410 415 Asp Leu Val Ser Glu Tyr Gln Gln Tyr Gln Asp Ala Thr Ala Glu Glu 420 425 430 Glu Glu Asp Phe Gly Glu Glu Ala Glu Glu Glu Ala 435 440 <210> 148 <211> 2510 <212> DNA <213> Homo sapiens <400> 148 gcacctcgct gctccagcct ctggggcgca ttccaacctt ccagcctgcg acctgcggag 60 aaaaaaaatt acttattttc ttgccccata cataccttga ggcgagcaaa aaaattaaat 120 tttaaccatg agggaaatcg tgcacatcca ggctggtcag tgtggcaacc agatcggtgc 180 caagttctgg gaggtgatca gtgatgaaca tggcatcgac cccaccggca cctaccacgg 240 ggacagcgac ctgcagctgg accgcatctc tgtgtactac aatgaagcca caggtggcaa 300 atatgttcct cgtgccatcc tggtggatct agaacctggg accatggact ctgttcgctc 360 aggtcctttt ggccagatct ttagaccaga caactttgta tttggtcagt ctggggcagg 420 taacaactgg gccaaaggcc actacacaga gggcgccgag ctggttgatt ctgtcctgga 480 tgtggtacgg aaggaggcag agagctgtga ctgcctgcag ggcttccagc tgacccactc 540 actgggcggg ggcacaggct ctggaatggg cactctcctt atcagcaaga tccgagaaga 600 ataccctgat cgcatcatga ataccttcag tgtggtgcct tcacccaaag tgtctgacac 660 cgtggtcgag ccctacaatg ccaccctctc cgtccatcag ttggtagaga atactgatga 720 gacctattgc attgacaacg aggccctcta tgatatctgc ttccgcactc tgaagctgac 780 cacaccaacc tacggggatc tgaaccacct tgtctcagcc accatgagtg gtgtcaccac 840 ctgcctccgt ttccctggcc agctcaatgc tgacctccgc aagttggcag tcaacatggt 900 ccccttccca cgtctccatt tctttatgcc tggctttgcc cctctcacca gccgtggaag 960 ccagcagtat cgagctctca cagtgccgga actcacccag caggtcttcg atgccaagaa 1020 catgatggct gcctgtgacc cccgccacgg ccgatacctc accgtggctg ctgtcttccg 1080 tggtcggatg tccatgaagg aggtcgatga gcagatgctt aacgtgcaga acaagaacag 1140 cagctacttt gtggaatgga tccccaacaa tgtcaagaca gccgtctgtg acatcccacc 1200 tcgtggcctc aagatggcag tcaccttcat tggcaatagc acagccatcc aggagctctt 1260 caagcgcatc tcggagcagt tcactgccat gttccgccgg aaggccttcc tccactggta 1320 cacaggcgag ggcatggacg agatggagtt caccgaggct gagagcaaca tgaacgacct 1380 cgtctctgag tatcagcagt accaggatgc caccgcagaa gaggaggagg atttcggtga 1440 ggaggccgaa gaggaggcct aaggcagagc ccccatcacc tcaggcttct cagttccctt 1500 agccgtctta ctcaactgcc cctttcctct ccctcagaat ttgtgtttgc tgcctctatc 1560 ttgttttttg ttttttcttc tggggggggt ctagaacagt gcctggcaca tagtaggcgc 1620 tcaataaata cttgtttgtt gaatgtctcc tctctctttc cactctggga aacctaggtt 1680 tctgccattc tgggtgaccc tgtatttctt tctggtgccc attccatttg tccagttaat 1740 acttcctctt aaaaatctcc aagaagctgg gtctccagat cccatttaga accaaccagg 1800 tgctgaaaac acatgtagat aatggccatc atcctaagcc caaagtagaa aatggtagaa 1860 ggtagtgggt agaagtcact atataaggaa ggggatggga ttttccattc taaaagtttt 1920 ggagagggaa atccaggcta ttaaagtcac taaatttcta agtatgtcca tttcccatct 1980 cagcttcaag ggaggtgtca gcagtattat ctccactttc aatctccctc caagctctac 2040 tctggaggag tctgtcccac tctgtcaagt ggaatccttc cctttccaac tctacctccc 2100 tcactcagct cctttcccct gatcagagaa agggatcaag ggggttggga ggggggaaag 2160 agaccagcct tggtccctaa gcctccagaa acgtcttctt aatccccacc ttttcttact 2220 cccaaaaaag aatgaacacc cctgactctg gagtggtgta tactgccaca tcagtgtttg 2280 agtcagtccc cagaggagag gggaaccctc ctccatcttt tttgcaacat ctcatttctt 2340 ccttttgctg ttgcttcccc cctcacacac ttggttttgt tctatcctac atttgagatt 2400 tctattttat gttgaacttg ctgctttttt tcatattgaa aagatgacat cgccccaaga 2460 gccaaaaata aatgggaatt gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2510 <210> 149 <211> 158 <212> PRT <213> Homo sapiens <400> 149 Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp 1 5 10 15 Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro 20 25 30 Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys 35 40 45 Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe 50 55 60 Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro 65 70 75 80 Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile 85 90 95 Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile 100 105 110 Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro 115 120 125 Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr 130 135 140 Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser 145 150 155 <210> 150 <211> 2871 <212> DNA <213> Homo sapiens <400> 150 gcccgcgcca gggtcctcgg agctgctctg gctgcgcgcg gagcgggctc cggagggaag 60 tcccgagaca aagggaagcg ccgccgccgc cgccccgctc ggtcctccac ctgtccgcta 120 cgctcgccgg ggctgcggcc gcccgaggga ctttgaacat gtcggggatc gccctcagca 180 gactcgccca ggagaggaaa gcatggagga aagaccaccc atttggtttc gtggctgtcc 240 caacaaaaaa tcccgatggc acgatgaacc tcatgaactg ggagtgcgcc attccaggaa 300 agaaagggac tccgtgggaa ggaggcttgt ttaaactacg gatgcttttc aaagatgatt 360 atccatcttc gccaccaaaa tgtaaattcg aaccaccatt atttcacccg aatgtgtacc 420 cttcggggac agtgtgcctg tccatcttag aggaggacaa ggactggagg ccagccatca 480 caatcaaaca gatcctatta ggaatacagg aacttctaaa tgaaccaaat atccaagacc 540 cagctcaagc agaggcctac acgatttact gccaaaacag agtggagtac gagaaaaggg 600 tccgagcaca agccaagaag tttgcgccct cataagcagc gaccttgtgg catcgtcaaa 660 aggaagggat tggtttggca agaacttgtt tacaacattt ttgcaaatct aaagttgctc 720 catacaatga ctagtcacct gggggggttg ggcgggcgcc atcttccatt gccgccgcgg 780 gtgtgcggtc tcgattcgct gaattgcccg tttccataca gggtctcttc cttcggtctt 840 ttgtattttt gattgttatg taaaactcgc ttttatttta atattgatgt cagtatttca 900 actgctgtaa aattataaac ttttatactt gggtaagtcc cccaggggcg agttcctcgc 960 tctgggatgc aggcatgctt ctcaccgtgc agagctgcac ttggcctcag ctggctgtat 1020 ggaaatgcac cctccctcct gccgctcctc tctagaacct tctagaacct gggctgtgct 1080 gcttttgagc ctcagacccc aggtcagcat ctcggttctg cgccacttcc tttgtgttta 1140 tatggcgttt tgtctgtgtt gctgtttaga gtaaataaac tgtttatata aaggttttgg 1200 ttgcattatt atcattgaaa gtgagaggag gcggcctccc agtgcccggc cctccccacc 1260 cacctgcagc cccaccgcgg gccaggacca ggctctccat ctgcttcgga tgcacgcagg 1320 ctgtgaggct ctgtcttgcc ctggatcttt gtaaacaggg ctgtgtacaa agtgctgctg 1380 aggtttctgt gctccccgca tctgcgggct gtagagcgct gggcagctaa gatctgcata 1440 ggtcgggatt ggcatcgaga ccctggcaac tgcaccggtg ccagctgtct tgggggccac 1500 aaggccaggt ccagaccagg gctgggggct gcctgaggac tcctatccgg gcagcctgct 1560 ggcgggggtt cccctcttca gtggccaggt cacagggatg gagctgcgct gtgcataggg 1620 tgccacctca ggtgtctgtc ccttgtgtcc tcaggaggca gccttgctac cacccgtggc 1680 aaacgccagg tgctttttct gggagagccc acagccgtgg ccctccaggg cttccccgac 1740 ccttagcgcc aggtagaggg ccctgggcag cctgtgtctg gaattcttcg tcctgaggcc 1800 acctgagtgt ggtctgtcct ggggaggctg tgcgcctcag cagccgtcct gacgctgagc 1860 cctctgcaaa ggttgggccg gccaggcctc ttggggctgc ctgagccact gcaggaagtg 1920 gcctggctgg gaagttgggt gccggtcacc tcccagcagg aaggcacagt ggacagagat 1980 gggaagccct gggggacaca gcccggtgct cccagccctc caacctctgg ctcccaaccc 2040 agtctcccca tcctagcgag cttggccctc ctcagtttcg tttcaagcct tggggctgga 2100 gctggccctg ctgccctggc accccccggt ggctggagct gggtccccgt ggcccaagtg 2160 cagggtccca agagggcagg gcggggctcc ccaaaggagc aaagaatgca gggagggcgg 2220 tccagggccc tgggaagggg agctcggcac cctccaggtc cgtgtgggac tccagccgct 2280 gttggctggg aatcgaagtt agaggtgact tccaaaggcc ccccgagccg gcagtgcccc 2340 ccaccacccc tccagcgact ctgcggtgcc agtgccttgt tggcttttcc ggctacgcac 2400 cctgcagtca ctgagctctc ggtctgacgt ctgatgtttg tggtttgttt ataacacggg 2460 gccttacctg gggaattcag ctggtttgaa tatttgtagc ccgctcccag aatgtcttat 2520 tttgtaatga ctgaactaca tttagtaata gttacacatg tatatggtta atacatatgg 2580 aaattcaata tattttgtag ttaacgtatt ctgaagtaac ggatgtttct cgccaatcgt 2640 agtgacttca gctaacgaaa tgttcttttg tagtaccacg gtcctcggcc taacgaagga 2700 cgtgaacctt gtaagaggag agctctgaaa cgcggtcacc tttgtttagt ggaagggaaa 2760 gtgtgttccc ggcatgaggt gcctcggaat tagtaaagaa ttgtgggcaa tggattaacc 2820 actgtatcta agaatccacc attaaagcat ttgcacagac aaaaaaaaaa a 2871 <210> 151 <211> 158 <212> PRT <213> Homo sapiens <400> 151 Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp 1 5 10 15 Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro 20 25 30 Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys 35 40 45 Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe 50 55 60 Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro 65 70 75 80 Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile 85 90 95 Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile 100 105 110 Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro 115 120 125 Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr 130 135 140 Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser 145 150 155 <210> 152 <211> 3128 <212> DNA <213> Homo sapiens <400> 152 gcccgcgcca gggtcctcgg agctgctctg gctgcgcgcg gagcgggctc cggagggaag 60 tcccgagaca aagggaagcg ccgccgccgc cgccccgctc ggtcctccac ctgtccgcta 120 cgctcgccgg ggctgcggcc gcccgaggct gccctgagga tctgtgtttg gtgaaaagga 180 gccaaattca cctgcagggc aggcggctct agcagcttca gaagcctggt gccctggcga 240 cactggacct gccttggctt ctttgatccc aaccccaccc ccgatttctg ctctgctgac 300 tggggaagtc atcgtgccac ccagaacctg agtgcgggcc tctcagagct ccttcgtccg 360 tgggtctgcc ggggactggg ccttgtctcc ctaacgagtg ccagggactt tgaacatgtc 420 ggggatcgcc ctcagcagac tcgcccagga gaggaaagca tggaggaaag accacccatt 480 tggtttcgtg gctgtcccaa caaaaaatcc cgatggcacg atgaacctca tgaactggga 540 gtgcgccatt ccaggaaaga aagggactcc gtgggaagga ggcttgttta aactacggat 600 gcttttcaaa gatgattatc catcttcgcc accaaaatgt aaattcgaac caccattatt 660 tcacccgaat gtgtaccctt cggggacagt gtgcctgtcc atcttagagg aggacaagga 720 ctggaggcca gccatcacaa tcaaacagat cctattagga atacaggaac ttctaaatga 780 accaaatatc caagacccag ctcaagcaga ggcctacacg atttactgcc aaaacagagt 840 ggagtacgag aaaagggtcc gagcacaagc caagaagttt gcgccctcat aagcagcgac 900 cttgtggcat cgtcaaaagg aagggattgg tttggcaaga acttgtttac aacatttttg 960 caaatctaaa gttgctccat acaatgacta gtcacctggg ggggttgggc gggcgccatc 1020 ttccattgcc gccgcgggtg tgcggtctcg attcgctgaa ttgcccgttt ccatacaggg 1080 tctcttcctt cggtcttttg tatttttgat tgttatgtaa aactcgcttt tattttaata 1140 ttgatgtcag tatttcaact gctgtaaaat tataaacttt tatacttggg taagtccccc 1200 aggggcgagt tcctcgctct gggatgcagg catgcttctc accgtgcaga gctgcacttg 1260 gcctcagctg gctgtatgga aatgcaccct ccctcctgcc gctcctctct agaaccttct 1320 agaacctggg ctgtgctgct tttgagcctc agaccccagg tcagcatctc ggttctgcgc 1380 cacttccttt gtgtttatat ggcgttttgt ctgtgttgct gtttagagta aataaactgt 1440 ttatataaag gttttggttg cattattatc attgaaagtg agaggaggcg gcctcccagt 1500 gcccggccct ccccacccac ctgcagcccc accgcgggcc aggaccaggc tctccatctg 1560 cttcggatgc acgcaggctg tgaggctctg tcttgccctg gatctttgta aacagggctg 1620 tgtacaaagt gctgctgagg tttctgtgct ccccgcatct gcgggctgta gagcgctggg 1680 cagctaagat ctgcataggt cgggattggc atcgagaccc tggcaactgc accggtgcca 1740 gctgtcttgg gggccacaag gccaggtcca gaccagggct gggggctgcc tgaggactcc 1800 tatccgggca gcctgctggc gggggttccc ctcttcagtg gccaggtcac agggatggag 1860 ctgcgctgtg catagggtgc cacctcaggt gtctgtccct tgtgtcctca ggaggcagcc 1920 ttgctaccac ccgtggcaaa cgccaggtgc tttttctggg agagcccaca gccgtggccc 1980 tccagggctt ccccgaccct tagcgccagg tagagggccc tgggcagcct gtgtctggaa 2040 ttcttcgtcc tgaggccacc tgagtgtggt ctgtcctggg gaggctgtgc gcctcagcag 2100 ccgtcctgac gctgagccct ctgcaaaggt tgggccggcc aggcctcttg gggctgcctg 2160 agccactgca ggaagtggcc tggctgggaa gttgggtgcc ggtcacctcc cagcaggaag 2220 gcacagtgga cagagatggg aagccctggg ggacacagcc cggtgctccc agccctccaa 2280 cctctggctc ccaacccagt ctccccatcc tagcgagctt ggccctcctc agtttcgttt 2340 caagccttgg ggctggagct ggccctgctg ccctggcacc ccccggtggc tggagctggg 2400 tccccgtggc ccaagtgcag ggtcccaaga gggcagggcg gggctcccca aaggagcaaa 2460 gaatgcaggg agggcggtcc agggccctgg gaaggggagc tcggcaccct ccaggtccgt 2520 gtgggactcc agccgctgtt ggctgggaat cgaagttaga ggtgacttcc aaaggccccc 2580 cgagccggca gtgcccccca ccacccctcc agcgactctg cggtgccagt gccttgttgg 2640 cttttccggc tacgcaccct gcagtcactg agctctcggt ctgacgtctg atgtttgtgg 2700 tttgtttata acacggggcc ttacctgggg aattcagctg gtttgaatat ttgtagcccg 2760 ctcccagaat gtcttatttt gtaatgactg aactacattt agtaatagtt acacatgtat 2820 atggttaata catatggaaa ttcaatatat tttgtagtta acgtattctg aagtaacgga 2880 tgtttctcgc caatcgtagt gacttcagct aacgaaatgt tcttttgtag taccacggtc 2940 ctcggcctaa cgaaggacgt gaaccttgta agaggagagc tctgaaacgc ggtcaccttt 3000 gtttagtgga agggaaagtg tgttcccggc atgaggtgcc tcggaattag taaagaattg 3060 tgggcaatgg attaaccact gtatctaaga atccaccatt aaagcatttg cacagacaaa 3120 aaaaaaaa 3128 <210> 153 <211> 158 <212> PRT <213> Homo sapiens <400> 153 Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp 1 5 10 15 Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro 20 25 30 Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys 35 40 45 Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe 50 55 60 Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro 65 70 75 80 Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile 85 90 95 Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile 100 105 110 Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro 115 120 125 Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr 130 135 140 Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser 145 150 155 <210> 154 <211> 2991 <212> DNA <213> Homo sapiens <400> 154 aactcgcggg agcgtcaccg tcctgcgacg cttcagagga tccttaggcc tcagtggtct 60 ttgacccccg gccccaggac ctgaccccaa ggaaacctcc gggacctgtg gctggagagg 120 tgaccgccag gcatccgggg agcctttgga gatctcggct tcctttttcc cccgctgctt 180 gccggcgtgt cctcgggtgg acgcgggcag cccgaagggg agtttacaga cgctccctca 240 catcggggac gcggctcctt taagggcgga ctttgaacat gtcggggatc gccctcagca 300 gactcgccca ggagaggaaa gcatggagga aagaccaccc atttggtttc gtggctgtcc 360 caacaaaaaa tcccgatggc acgatgaacc tcatgaactg ggagtgcgcc attccaggaa 420 agaaagggac tccgtgggaa ggaggcttgt ttaaactacg gatgcttttc aaagatgatt 480 atccatcttc gccaccaaaa tgtaaattcg aaccaccatt atttcacccg aatgtgtacc 540 cttcggggac agtgtgcctg tccatcttag aggaggacaa ggactggagg ccagccatca 600 caatcaaaca gatcctatta ggaatacagg aacttctaaa tgaaccaaat atccaagacc 660 cagctcaagc agaggcctac acgatttact gccaaaacag agtggagtac gagaaaaggg 720 tccgagcaca agccaagaag tttgcgccct cataagcagc gaccttgtgg catcgtcaaa 780 aggaagggat tggtttggca agaacttgtt tacaacattt ttgcaaatct aaagttgctc 840 catacaatga ctagtcacct gggggggttg ggcgggcgcc atcttccatt gccgccgcgg 900 gtgtgcggtc tcgattcgct gaattgcccg tttccataca gggtctcttc cttcggtctt 960 ttgtattttt gattgttatg taaaactcgc ttttatttta atattgatgt cagtatttca 1020 actgctgtaa aattataaac ttttatactt gggtaagtcc cccaggggcg agttcctcgc 1080 tctgggatgc aggcatgctt ctcaccgtgc agagctgcac ttggcctcag ctggctgtat 1140 ggaaatgcac cctccctcct gccgctcctc tctagaacct tctagaacct gggctgtgct 1200 gcttttgagc ctcagacccc aggtcagcat ctcggttctg cgccacttcc tttgtgttta 1260 tatggcgttt tgtctgtgtt gctgtttaga gtaaataaac tgtttatata aaggttttgg 1320 ttgcattatt atcattgaaa gtgagaggag gcggcctccc agtgcccggc cctccccacc 1380 cacctgcagc cccaccgcgg gccaggacca ggctctccat ctgcttcgga tgcacgcagg 1440 ctgtgaggct ctgtcttgcc ctggatcttt gtaaacaggg ctgtgtacaa agtgctgctg 1500 aggtttctgt gctccccgca tctgcgggct gtagagcgct gggcagctaa gatctgcata 1560 ggtcgggatt ggcatcgaga ccctggcaac tgcaccggtg ccagctgtct tgggggccac 1620 aaggccaggt ccagaccagg gctgggggct gcctgaggac tcctatccgg gcagcctgct 1680 ggcgggggtt cccctcttca gtggccaggt cacagggatg gagctgcgct gtgcataggg 1740 tgccacctca ggtgtctgtc ccttgtgtcc tcaggaggca gccttgctac cacccgtggc 1800 aaacgccagg tgctttttct gggagagccc acagccgtgg ccctccaggg cttccccgac 1860 ccttagcgcc aggtagaggg ccctgggcag cctgtgtctg gaattcttcg tcctgaggcc 1920 acctgagtgt ggtctgtcct ggggaggctg tgcgcctcag cagccgtcct gacgctgagc 1980 cctctgcaaa ggttgggccg gccaggcctc ttggggctgc ctgagccact gcaggaagtg 2040 gcctggctgg gaagttgggt gccggtcacc tcccagcagg aaggcacagt ggacagagat 2100 gggaagccct gggggacaca gcccggtgct cccagccctc caacctctgg ctcccaaccc 2160 agtctcccca tcctagcgag cttggccctc ctcagtttcg tttcaagcct tggggctgga 2220 gctggccctg ctgccctggc accccccggt ggctggagct gggtccccgt ggcccaagtg 2280 cagggtccca agagggcagg gcggggctcc ccaaaggagc aaagaatgca gggagggcgg 2340 tccagggccc tgggaagggg agctcggcac cctccaggtc cgtgtgggac tccagccgct 2400 gttggctggg aatcgaagtt agaggtgact tccaaaggcc ccccgagccg gcagtgcccc 2460 ccaccacccc tccagcgact ctgcggtgcc agtgccttgt tggcttttcc ggctacgcac 2520 cctgcagtca ctgagctctc ggtctgacgt ctgatgtttg tggtttgttt ataacacggg 2580 gccttacctg gggaattcag ctggtttgaa tatttgtagc ccgctcccag aatgtcttat 2640 tttgtaatga ctgaactaca tttagtaata gttacacatg tatatggtta atacatatgg 2700 aaattcaata tattttgtag ttaacgtatt ctgaagtaac ggatgtttct cgccaatcgt 2760 agtgacttca gctaacgaaa tgttcttttg tagtaccacg gtcctcggcc taacgaagga 2820 cgtgaacctt gtaagaggag agctctgaaa cgcggtcacc tttgtttagt ggaagggaaa 2880 gtgtgttccc ggcatgaggt gcctcggaat tagtaaagaa ttgtgggcaa tggattaacc 2940 actgtatcta agaatccacc attaaagcat ttgcacagac aaaaaaaaaa a 2991 <210> 155 <211> 158 <212> PRT <213> Homo sapiens <400> 155 Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp 1 5 10 15 Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro 20 25 30 Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys 35 40 45 Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe 50 55 60 Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro 65 70 75 80 Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile 85 90 95 Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile 100 105 110 Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro 115 120 125 Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr 130 135 140 Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser 145 150 155 <210> 156 <211> 2843 <212> DNA <213> Homo sapiens <400> 156 aactcgcggg agcgtcaccg tcctgcgacg cttcagagga tccttaggcc tcagtggtct 60 ttgacccccg gccccaggac ctgaccccaa ggaaacctcc gggacctgtg gctggagagg 120 gactttgaac atgtcgggga tcgccctcag cagactcgcc caggagagga aagcatggag 180 gaaagaccac ccatttggtt tcgtggctgt cccaacaaaa aatcccgatg gcacgatgaa 240 cctcatgaac tgggagtgcg ccattccagg aaagaaaggg actccgtggg aaggaggctt 300 gtttaaacta cggatgcttt tcaaagatga ttatccatct tcgccaccaa aatgtaaatt 360 cgaaccacca ttatttcacc cgaatgtgta cccttcgggg acagtgtgcc tgtccatctt 420 agaggaggac aaggactgga ggccagccat cacaatcaaa cagatcctat taggaataca 480 ggaacttcta aatgaaccaa atatccaaga cccagctcaa gcagaggcct acacgattta 540 ctgccaaaac agagtggagt acgagaaaag ggtccgagca caagccaaga agtttgcgcc 600 ctcataagca gcgaccttgt ggcatcgtca aaaggaaggg attggtttgg caagaacttg 660 tttacaacat ttttgcaaat ctaaagttgc tccatacaat gactagtcac ctgggggggt 720 tgggcgggcg ccatcttcca ttgccgccgc gggtgtgcgg tctcgattcg ctgaattgcc 780 cgtttccata cagggtctct tccttcggtc ttttgtattt ttgattgtta tgtaaaactc 840 gcttttattt taatattgat gtcagtattt caactgctgt aaaattataa acttttatac 900 ttgggtaagt cccccagggg cgagttcctc gctctgggat gcaggcatgc ttctcaccgt 960 gcagagctgc acttggcctc agctggctgt atggaaatgc accctccctc ctgccgctcc 1020 tctctagaac cttctagaac ctgggctgtg ctgcttttga gcctcagacc ccaggtcagc 1080 atctcggttc tgcgccactt cctttgtgtt tatatggcgt tttgtctgtg ttgctgttta 1140 gagtaaataa actgtttata taaaggtttt ggttgcatta ttatcattga aagtgagagg 1200 aggcggcctc ccagtgcccg gccctcccca cccacctgca gccccaccgc gggccaggac 1260 caggctctcc atctgcttcg gatgcacgca ggctgtgagg ctctgtcttg ccctggatct 1320 ttgtaaacag ggctgtgtac aaagtgctgc tgaggtttct gtgctccccg catctgcggg 1380 ctgtagagcg ctgggcagct aagatctgca taggtcggga ttggcatcga gaccctggca 1440 actgcaccgg tgccagctgt cttgggggcc acaaggccag gtccagacca gggctggggg 1500 ctgcctgagg actcctatcc gggcagcctg ctggcggggg ttcccctctt cagtggccag 1560 gtcacaggga tggagctgcg ctgtgcatag ggtgccacct caggtgtctg tcccttgtgt 1620 cctcaggagg cagccttgct accacccgtg gcaaacgcca ggtgcttttt ctgggagagc 1680 ccacagccgt ggccctccag ggcttccccg acccttagcg ccaggtagag ggccctgggc 1740 agcctgtgtc tggaattctt cgtcctgagg ccacctgagt gtggtctgtc ctggggaggc 1800 tgtgcgcctc agcagccgtc ctgacgctga gccctctgca aaggttgggc cggccaggcc 1860 tcttggggct gcctgagcca ctgcaggaag tggcctggct gggaagttgg gtgccggtca 1920 cctcccagca ggaaggcaca gtggacagag atgggaagcc ctgggggaca cagcccggtg 1980 ctcccagccc tccaacctct ggctcccaac ccagtctccc catcctagcg agcttggccc 2040 tcctcagttt cgtttcaagc cttggggctg gagctggccc tgctgccctg gcaccccccg 2100 gtggctggag ctgggtcccc gtggcccaag tgcagggtcc caagagggca gggcggggct 2160 ccccaaagga gcaaagaatg cagggagggc ggtccagggc cctgggaagg ggagctcggc 2220 accctccagg tccgtgtggg actccagccg ctgttggctg ggaatcgaag ttagaggtga 2280 cttccaaagg ccccccgagc cggcagtgcc ccccaccacc cctccagcga ctctgcggtg 2340 ccagtgcctt gttggctttt ccggctacgc accctgcagt cactgagctc tcggtctgac 2400 gtctgatgtt tgtggtttgt ttataacacg gggccttacc tggggaattc agctggtttg 2460 aatatttgta gcccgctccc agaatgtctt attttgtaat gactgaacta catttagtaa 2520 tagttacaca tgtatatggt taatacatat ggaaattcaa tatattttgt agttaacgta 2580 ttctgaagta acggatgttt ctcgccaatc gtagtgactt cagctaacga aatgttcttt 2640 tgtagtacca cggtcctcgg cctaacgaag gacgtgaacc ttgtaagagg agagctctga 2700 aacgcggtca cctttgttta gtggaaggga aagtgtgttc ccggcatgag gtgcctcgga 2760 attagtaaag aattgtgggc aatggattaa ccactgtatc taagaatcca ccattaaagc 2820 atttgcacag acaaaaaaaa aaa 2843

Claims

생물학적 시스템의 조절 인자 식별 방법에 있어서,
(1) 상기 생물학적 시스템을 위한 모델로부터 제1데이터 집합을 얻는 단계, 여기서 상기 모델은 상기 생물학적 시스템과 연관된 세포를 포함하고, 여기서 상기 제1데이터 집합은 상기 생물학적 시스템과 연관된 세포 내의 단백질체의 전역적 변화를 나타낸다;
(2) 상기 생물학적 시스템을 위한 모델로부터 제 2 데이터 집합을 획득하는 단계, 여기서 상기 제 2 데이터 집합은 상기 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 여기서, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 상기 생물학적 시스템에 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함한다;
(3) 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 프로그래밍된 컴퓨터 시스템을 사용하여 상기 제 1 및 제 2 데이터 집합만을 기반으로 하나 이상의 인과 관계의 베이지안 네트워크에 기반한 제1인과 관계 네트워크 모델을 생성하는 단계, 여기서 상기 제1인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는다;
(4) 상기 제1인과 관계 네트워크 모델로부터 분별 인과 관계 네트워크를 생성하고 제어 세포 데이터에 기반한 제2인과 관계 네트워크 모델을 생성하는 단계; 및
(5) 상기 인과 관계 네트워크로부터 상기 생물학적 시스템에 고유한 분별 인과 관계를 식별하는 단계, 여기서 상기 고유한 인과 관계에 연관된 적어도 하나의 효소는 상기 생물학적 시스템의 조절 인자로서 식별되는 방법.
질병 과정의 조절 인자 식별 방법에 있어서,
(1) 상기 질병 과정을 위한 모델로부터 제1데이터 집합을 얻는 단계, 여기서 상기 모델은 상기 질병 관련 세포를 포함하고, 여기서 상기 제1데이터 집합은 상기 질병 관련 세포 내의 단백질체의 전역적 변화를 나타낸다;
(2) 상기 질병 과정을 위한 모델로부터 제 2 데이터 집합을 획득하는 단계, 여기서 상기 제 2 데이터 집합은 상기 질병 과정과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 여기서, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 상기 질병 관련 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함한다;
(3) 상기 세포의 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 프로그래밍된 컴퓨터 시스템을 사용하여 상기 제 1 및 제 2 데이터 집합만을 기반으로 하나 이상의 인과 관계의 베이지안 네트워크에 기반한 제1인과 관계 네트워크 모델을 생성하는 단계, 여기서 상기 제1인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는다; 및
(4) 상기 제1인과 관계 네트워크 모델로부터 분별 인과 관계 네트워크를 생성하고 제어 세포 데이터에 기반한 제2인과 관계 네트워크 모델을 생성하는 단계; 및
(5) 상기 인과 관계 네트워크로부터 상기 질병 과정에 고유한 분별 인과 관계를 식별하는 단계, 여기서, 상기 고유한 인과 관계에 연관된 적어도 하나의 효소는 상기 질병 과정의 조절 인자로서 식별되는 방법.
삭제
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제 1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징 지우는 지질체 데이터를 더 포함하는 것을 특징으로 하는 방법.
제4항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 단백질체의 전역적 변화, 지질체 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 적어도 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 포함하며,
선택적으로, 여기서 상기 제1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 포함하는 방법.
제6항에 있어서,
상기 제1인과 관계 네트워크 모델은 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 여기서 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 적어도 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며;
선택적으로 여기서 상기 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함하며;
선택적으로 여기서 상기 고유 인과 관계와 연관된 상기 적어도 하나의 키나아제는 상기 생물학적 시스템 또는 상기 질병 과정의 조절 인자로 식별되는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함하는 것을 특징으로 하는 방법.
제6항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며,
상기 세포의 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향 중 적어도 어느 하나를 포함하며, 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포 외 기질 퇴화, 분출, ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함하는 것을 특징으로 하는 방법.
제2항에 있어서,
상기 질병 과정은 암, 당뇨, 비만, 심장병, 노화 관련 황반 변성, 당뇨성 망막증, 또는 감염성 질병; 또는
여기서 상기 질병 과정은 신생 혈관 생성을 포함; 또는
여기서 상기 질병 과정은 간세포 암종, 폐암, 유방암, 전립선암, 흑색종, 암종, 육종, 림프종, 백혈병, 비늘형의 세포암종, 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광암, 신장암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종, 또는 약제 저항형 암; 또는
여기서 상기 질병 과정의 특징적 측면은 저산소 상태 조건, 고혈당 조건, 젖산 풍부 배양 조건, 또는 이들의 조합을 포함하는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 생물학적 시스템 또는 상기 질병 과정의 모델은 상기 생물학적 시스템 또는 상기 질병 관련 세포의 생체 외 배양을 포함하며, 선택적으로 제어 세포 또는 정상 세포의 합치되는 생체 외 배양을 더 포함하는 것을 특징으로 하는 방법.
제12항에 있어서,
상기 생물학적 시스템 또는 상기 질병 관련 세포의 생체 외 배양은 환경적 교란을 겪으며, 합치되는 상기 제어 세포의 상기 생체 외 배양은 환경적 교란을 겪지 않은 동일한 세포를 포함하는 것을 특징으로 하는 방법.
제13항에 있어서,
상기 환경적 교란은 생체 작용 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함; 또는
여기서 상기 환경적 교란은 세포와 효소 활성 억제 인자와의 접촉을 포함, 선택적으로, 상기 환경적 교란은 상기 세포와 CoQ10과의 접촉을 더 포함; 또는
여기서 상기 상기 효소 활성 억제 인자는 키나아제 억제 인자; 또는
여기서 상기 환경적 교란은 상기 세포와 CoQ10과의 접촉을 포함하는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 단계 (3)은,
베이지안 파편 목록 처리를 통해 상기 제1데이터 집합 및 제2데이터 집합에 기반한 네트워크 파편의 라이브러리를 생성;
시도 네트워크의 앙상블을 생성, 각 시도 네트워크는 상기 라이브러리 내의 상기 네트워크 파편의 다른 부분 집합으로부터 만들어진다; 및
국지적 변환을 통해 상기 각 시도 네트워크를 진화시켜 상기 시도 네트워크의 앙상블을 최적화;를 포함하는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 생성 단계에서 수립된 상기 제1인과 관계 네트워크 모델은 상기 제1인과 관계 네트워크 모델 내의 하나 또는 그 이상의 인과 관계의 예측에 대한 신뢰 수준을 제공하기 위해, 상기 식별 단계 이전에, 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량되는 것을 특징으로 하는 방법.
제12항에 있어서,
상기 고유한 인과 관계는 상기 생물학적 시스템 또는 상기 질병 관련 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 상기 분별 인과 관계 네트워크의 일부로서 식별되고; 또는
상기 고유한 인과 관계는 환경적 교란을 겪은 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 상기 분별 인과 관계 네트워크의 일부로서 식별되는 것을 특징으로 하는 방법.
삭제
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제어 세포 데이터는 상기 제어 세포의 단백질체의 전역적 변화를 나타내는 제1제어 데이터 집합과 상기 제어 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제2제어 데이터 집합을 포함하며, 여기서 상기 하나 또는 그 이상의 제어 세포의 기능적 활성 또는 세포 반응은 전역적 효소 활성 및 상기 제어 세포 내의 효소 대사 물질 또는 기질에 미치는 영향 중 적어도 어느 하나를 포함한다; 및
여기서 상기 단계 (3) 이후에 프로그램된 컴퓨터 장치를 이용하여 상기 제1제어 데이터 집합 및 상기 제2제어 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응과 관련된 상기 제2인과 관계 네트워크 모델을 생성하는 단계를 더 포함하며, 여기서 상기 제2인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 제어 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 것을 특징으로 하는 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계로 식별; 또는
여기서 상기 고유한 인과 관계는 지질의 수준, 유전자의 발현 및 하나 또는 그 이상의 기능성 활성으로 이루어지는 군으로부터 선택되는 2개 사이의 관계로 식별되며, 여기서 상기 기능적 활성은 전역 키나아제 활성인 것을 특징으로 하는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 시도 네트워크의 앙상블을 진화시켜 생성된 합치 인과 관계 네트워크에 기반한 방법
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 인과관계의 베이지안 앙상블에 기반한 방법.
제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 관계에 대한 정량적 확률적 방향 정보를 포함하는 인과 관계의 베이지안 네트워크를 포함하는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제